16 marca 2020 roku o godzinie 21.26 otrzymałem pilny e‑mail od mojego przyjaciela DJ Patila. Pisał do mnie z kalifornijskiego centrum dowodzenia kryzysowego. Chciał walczyć z COVID‑19 w najlepszy znany mu sposób – za pomocą danych.
Dhanurjay „DJ” Patil był głównym ekspertem ds. danych w Białym Domu, szefem działu technologii w Devoted Health, starszym współpracownikiem Belfer Center w Harvard Kennedy School oraz doradcą w Venrock Partners. Nie pełni się równocześnie tylu ważnych funkcji, chyba że jest się w czymś dobrym. Dla DJ‑a tym „czymś” są matematyka i informatyka.
W swoim mailu DJ wyjaśnił, że współpracuje z gubernatorami z całego kraju, aby opracować model potencjalnego wpływu COVID‑19 na planowanie scenariuszy. Chciał pomóc w odpowiedzeniu na ważne pytania, takie jak: „Ile łóżek szpitalnych będziemy potrzebować?”, „Czy możemy zmniejszyć rozprzestrzenianie się wirusa, jeśli tymczasowo zamkniemy miejsca, w których gromadzą się ludzie?” i „Czy powinniśmy wydać nakaz pozostania w domu i na jak długo?”. Choć nikt nie jest w stanie przewidzieć przyszłości, modelowanie wirusa za pomocą wszystkich znanych czynników okazało się najlepszą szansą na pomoc przywódcom w podejmowaniu świadomych decyzji, które miały wpłynąć na życie setek tysięcy osób. W tym celu DJ zebrał zespół wolontariuszy, który składał się z najbystrzejszych umysłów zarówno z Doliny Krzemowej, jak i pozostałych części kraju. Niczym po wezwaniu do broni ci profesjonaliści zebrali się osobiście, aby walczyć z COVID‑19 w najlepszy znany im sposób, czyli z wykorzystaniem danych.
Walka z czasem kontrolowanym przez wirusa
Dobra wiadomość jest taka, że mieli model. I to nie byle jaki model. DJ i jego zespół pracowali na tym, który został opracowany przede wszystkim przez naukowców ze światowej sławy Johns Hopkins Bloomberg School of Public Health (JHSPH). Model ten, który jest projektem typu open source, wykorzystuje dane o ludności stanu lub powiatu (wraz z danymi dotyczącymi transportu) do modelowania liczby osób, które potencjalnie mogłyby być narażone, zakażone i/lub hospitalizowane. Uwzględnia również rozprzestrzenianie się wirusa na podstawie różnych interwencji niefarmaceutycznych, w tym zamykaniu szkół i parków oraz wydawaniu nakazów kwarantanny.
Niemniej ów model funkcjonował w lokalnej strukturze JHSPH i nie mógł być skalowalny w celu uruchomienia dużej liczby scenariuszy jednocześnie, aby zaspokoić potrzeby kraju (i potencjalnie świata). Był on również zbyt wolny. Aby uzyskać wymaganą skalę i szybkość, DJ i jego zespół musieli uruchomić model w chmurze, więc przenieśli swój lokalny kod do Amazon Web Services (AWS). Doprowadziło to do kolejnego wyzwania, ponieważ skrypt ten nie został początkowo napisany z myślą o chmurze, więc nie mógł w pełni wykorzystać skali i optymalizacji możliwych dzięki AWS. W rezultacie zespół DJ‑a spędził tydzień na przenoszeniu i uruchamianiu jednego scenariusza dla Kalifornii, który wciąż nie był wystarczająco szybki. Wyobraźcie sobie teraz, ile czasu zajęłoby skalowanie tego procesu dla 49 kolejnych stanów. Wymagałoby to co najmniej miesięcy pracy, a dodanie wielu scenariuszy z różnymi zmiennymi jeszcze bardziej by go opóźniło. Ekipa DJ‑a nie miała tyle czasu, bo jak mówi dr Anthony Fauci, dyrektor Narodowego Instytutu Alergii i Chorób Zakaźnych: „To nie ty kontrolujesz czas. To wirus go kontroluje”