Короткостроковий прогноз COVID-19

 Короткостроковий прогноз поширення COVID-19 (25.05.20 - 30.05.20) на основі Back Propagation Neural Network

Дата публікації 25.05.2020

З метою перевірки правдоподібності результатів прогнозування, при виконанні цього дослідження застосовано два різні математичні інструменти:

  1. Багатошарова нейронна мережа Back Propagation для короткострокового прогнозування розповсюдження пандемії коронавірусу на часовому відрізку (26.05.20 - 30.05.20);
  2. Метод подібності в математичному моделюванні на основі кореляційного і регресійного аналізу для прогнозування розповсюдження пандемії коронавірусу на часовому відрізку (26.05.20 - 04.06.20).

Перевірка правдоподібності результатів прогнозування полягала в порівнянні прогнозних даних, отриманих з використанням двох різних, незалежних один від одного методів.

1. Короткостроковий прогноз (26.05.20 - 30.05.20) на основі нейронної мережі Back Propagation 

Результати короткострокового прогнозного моделювання кількості хворих на COVID-19 в Україні і м. Києві на 26.05.20 – 30.05.20 (рис.1-10; табл. 1,2) отримано з використанням багатошарової нейронної мережі Back Propagation на основі механізму «ковзного вікна» з кількістю точок даних для навчання нейронної мережі - 12. Бачимо, що для України на дванадцятиденному відрізку часу (18.05.20 – 30.05.20) характер розвитку пандемії набуває більш чіткого лінійного характеру з рівнем «плато» - (300-450) нових інфікованих на день (рис. 2). За результатами прогнозного моделювання команди проєкту «ФОРСАЙТ COVID-19» такий характер розвитку процесу може продовжитися до кінця травня 2020 року. Після чого, пандемія ймовірно може піти на спад (кількість щоденно інфікованих буде стійко нижчою кількості щоденно видужалих людей).

Для міста Києва, протягом дванадтиденного відрізку часу (18.05.20 – 30.05.20) процес розвитку пандемії поступово переходить від нестаціонарним до більш лінійного з ймовірним зниженням його волатильності і набуттям більш чіткого лінійного характеру на наступному тижні з рівнем «плато» - (35-60) нових інфікованих на день (рис. 5, 6).

Середня абсолютна похибка у відсотках виконаного прогнозу не перевищує MAPE = 1.64% для України і МАРЕ = 2.03% для м. Києва (Рис. 9, 10, Табл. 3, 4). Зазначимо, що на більших обсягах даних (як це ми маємо для України у порівнянні з м. Києвом) нейронна мережа Back Propagation є менш чутливою до короткотермінових збурень та сплесків і дозволяє отримати меншу похибку прогнозу.

З рис. 11 та 12 бачимо, що кількість щоденно видужалих людей в Україні наближається до кількості щоденно інфікованих людей (19-20.05.20 цей баланс (Δ) був навіть позитивним). Команда проекту очікує, що на початку червня цей баланс Δ ймовірно може стати стійко позитивним, що засвідчить початок спаду пандемії.  

 

2. Прогнозування розвитку пандемії COID-19 з використанням методу подібності в математичному моделюванні на часовому відрізку (26.05.20 - 04.06.20)

На першому кроці застосування цього методу здійснювався вибір країни (країн) – прототипів, характер розвитку пандемії в яких є найбільш наближеним до характеру розвитку цього процесу в Україні. З цією метою було застосовано кореляційно-регресійний аналіз для порівняння головних показників України з відповідними показниками країн Європи. Країни для порівняння вибиралися виходячи з наступних показників:

  • Населення, обраної для порівняння країни має бути не меншим 15 млн. людей;
  • Густина населення має бути співмірною з густиною населення України і коливатися в діапазоні (1-2,5) у порівнянні з густиною населення України.

В результаті застосування цих критеріїв для порівняння з Україною було обрано 16 країн Європи (таблиця 5).

Таблиця 5. Кореляційно-регресійний аналіз

Країна Коеф. кореля-ції за P1 (r1.j) Коеф. кореляції за P2(r2.j) Коеф. кореляції за P3 (r3.j) Коеф. кореляції за P4 (r4.j) Коеф. для P5 (r5.j) Індекс подібності (Ij) Населен-ня (млн) Щільність населен-ня (осіб/км2) Кількість зроблених тестів (% від кількості населення) Кількість хворих лікарів
(% від загальної кількості хворих)
Ukraine             42 73,8 0,6106 19,39%
Poland 0,984 0,991 0,860 0,932 0,858 0,925 38,4 123 1,842  
Greece 0,946 0,973 0,843 0,916 0,911 0,918 10,8 82 1,3816  
Romania 0,998 0,997 0,709 0,953 0,865 0,904 19,4 84,4 1,779 12,2%
Hungary 0,994 0,992 0,678 0,929 0,884 0,895 9,8 105,1 1,6124  
Netherlands 0,993 0,991 0,682 0,893 0,867 0,885 17,4 421 1,7652  
Sweden 0,998 0,977 0,864 0,749 0,831 0,884 10,3 20,3 2,0798  
Austria 0,910 0,987 0,884 0,907 0,570 0,852 9 106 4,3384  
United Kingdom 0,837 0,949 0,979 0,936 0,545 0,849 67,9 270,7 4,5552  
Czechia 0,941 0,978 0,746   0,653 0,830 10,6 134 3,6157  
Belgium 0,993 0,984 0,932 0,898 0,335 0,828 11,5 376 6,3807  
Spain 0,985 0,983 0,770 0,919 0,321 0,796 47,1 92 6,4977 20%
Italy 0,987 0,988 0,733 0,806 0,452 0,793 60,3 201,3 5,3635 10%
Belarus 0,943 0,983 0,659   0,578 0,791 9,5 45,8 4,2672  
Portugal 0,972 0,989 0,740 0,923 0,291 0,783 10,3 114,5 6,7619  
France 0,864 0,791 0,473 0,925 0,826 0,776 67,1 104 2,1218  
Germany 0,866 0,776 0,230 0,885 0,575 0,667 83,1 232 4,2923  

 Розглянуто такі набори даних:

  • Кількість зареєстрованих випадків COVID-19 (P1);
  • Кількість зареєстрованих летальних випадків COVID-19 (P2);
  • Кількість зареєстрованих випадків одужання від COVID-19 (P3);
  • Коефіцієнт мобільності (P4);
  • Кількість зроблених тестів на 1000 осіб (P5).

Дослідження спрямовувалось на оцінювання подібності даних для України до даних 11 країн Європи, обраних для порівняння. Для показників  P1-P4 обраховано відповідні коефіцієнти кореляції ri,jде i=1..4; j=1..11; значення Pнормовано відносно значення показника для України за формулою:

З використанням наявних даних і введених критеріїв P1-P5 було обраховано індекс подібності:  (таблиця 5).

На основі використання обрахованого індексу подібності та групи таких показників, як населення країни, густина населення країни, територіальна наближеність країни Європи до України, в якості країн-прототипів для виконання прогнозного моделювання було обрано Польщу та Румунію. Для наведених країн та України на рис. 12, 13 та 14 представлено кількість зареєстрованих випадків COVID-19, смертельних випадків та видужалих людей від COVID-19 відповідно.


Зображення

Рисунок 12. Кількість зареєстрованих випадків в Україні та країнах прототипах


Зображення

Рисунок 13. Кількість смертельних випадків в Україні та країнах прототипах


Зображення

Рисунок 14. Кількість видужалих людей в Україні та країнах прототипах

На основі використання середньозважених значень розглянутих величин в країнах-прототипах (Румунії та Польщі) побудовано наступні прогнозні моделі для України:

Кількість зареєстрованих випадків

Зображення

де t =1 - номер дня, коли в Україні було зареєстровано 10 випадків.

Кількість смертельних випадків

Зображення

де t =1 - номер дня, коли в Україні було зареєстровано 10 випадків смерті.

Кількість видужалих людей

Зображення

де t =1 - номер дня, коли в Україні було зареєстровано 45 випадків.

Результати прогнозного моделювання подальшого розвитку коронавірусу в Україні наведені в таблиці 6.

Таблиця 6. Результати прогнозного моделювання подальшого розвитку коронавірусу в Україні на основі порівнянь з країнами-прототипами

Дата Кількість зареєстрованих випадків Кількість смертельних випадків Кількість видужалих Кількість активних випадків
Історичні дані Результати прогнозного моделювання Відсоток похибки Історичні дані Результати прогнозного моделювання Відсоток похибки Історичні дані Результати прогнозного моделювання Відсоток похибки
01.05.2020 10861 10906 0,41 272 269 1,16 1413 1475 4,38 9448
02.05.2020 11411 11356 0,48 279 281 0,61 1498 1633 9,04 9913
03.05.2020 11913 11807 0,89 288 293 1,65 1548 1800 16,26 10365
04.05.2020 12331 12258 0,59 303 305 0,67 1619 1974 21,93 10712
05.05.2020 12697 12709 0,09 316 318 0,48 1875 2156 15,00 10822
06.05.2020 13184 13159 0,19 327 330 0,98 2097 2346 11,88 11087
07.05.2020 13691 13610 0,59 340 343 0,92 2396 2544 6,18 11295
08.05.2020 14195 14061 0,94 361 356 1,32 2706 2750 1,62 11489
09.05.2020 14710 14512 1,35 376 370 1,60 2909 2964 1,88 11801
10.05.2020 15232 14962 1,77 391 389 0,43 3060 3185 4,09 12172
11.05.2020 15648 15413 1,50 408 408 0,05 3288 3415 3,85 12360
12.05.2020 16023 15864 0,99 425 427 0,39 3373 3652 8,27 12650
13.05.2020 16425 16315 0,67 439 445 1,30 3716 3897 4,87 12709
14.05.2020 16847 16765 0,48 456 462 1,40 4143 4150 0,17 12704
15.05.2020 17330 17216 0,66 476 480 0,77 4473 4411 1,38 12857
16.05.2020 17858 17667 1,07 497 497 0,08 4906 4680 4,61 12952
17.05.2020 18291 18118 0,95 514 513 0,15 5116 4957 3,12 13175
18.05.2020 18616 18568 0,26 535 529 1,03 5276 5241 0,66 13340
19.05.2020 18876 19019 0,76 548 545 0,47 5632 5534 1,75 13244
20.05.2020 19230 19470 1,25 564 561 0,52 5955 5834 2,03 13275
21.05.2020 19706 19921 1,09 579 576 0,44 6227 6142 1,36 13479
22.05.2020 20148 20371 1,11 588 592 0,60 6585 6458 1,92 13563
23.05.2020 20580 20822 1,18 605 606 0,22 6929 6782 2,12 13651
24.05.2020 20986 21273 1,37 617 621 0,63 7108 7114 0,09 13878
25.05.2020 21245 21724 2,25 623 635 1,95 7234 7454 3,04 14011
26.05.2020   22174     649     7802   14373
27.05.2020   22625     663     8157   14468
28.05.2020   23076     677     8521   14555
29.05.2020   23527     690     8892   14635
30.05.2020   23977     703     9271   14706
31.05.2020   24428     716     9658   14770
01.06.2020   24879     729     10053   14826
02.06.2020   25330     741     10456   14874
03.06.2020   25780     754     10866   14914
04.06.2020   26231     766     11285   14946

На рис. 15 та 16 наведені графіки головних характеристик пандемії коронавірусу за результатами прогнозного моделювання (табл. 6).


Зображення

Рисунок 15. Головні характеристики пандемії коронавірусу за результатами прогнозного моделювання (накопичувальні дані)


Зображення

Рисунок 16. Головні характеристики пандемії коронавірусу за результатами прогнозного моделювання (щоденні дані)

З рисунків 15, 16 бачимо, що протягом наступного місяця, з 26.05.20 по 04.06.20 розповсюдження короновірусу в Україні ймовірно буде мати строго лінійний характер і зберігатися на рівні “плато” 400-450 нових інфікованих на день. В той же час, протягом цього-ж відрізку часу кількість щоденно видужалих людей буде монотонно зростати і поступово наближатися до кількості щоденно інфікованих людей. Це вказує на поступове наближення пандемії до фази повільного затухання.

Окремі різкі зменшення кількості інфікованих людей 5, 12, 19, 25 травня 2020 року пояснюються зниженням активності роботи системи охорони здоров’я у вихідні дні напередодні вказаних дат (зниження рівня ослуговування людей), що потягло за собою зменшення кількості зареєстрованих хворих у вказані дні.

Порівняння прогнозних даних, отриманих з використанням двох різних методів на часовому відрізку (26.05.20-30.05.20) вказує на близькість отриманих результатів, що підтверджує їх правдоподібність.  

 

Науковий керівник проекту: М.З. Згуровський.

Команда проекту: О.С. Войтко, Н.В. Горбань, І.М. Джигирей, Б.Р. Дудка, К.В. Єфремов, Ю.П. Зайченко, П.О. Касьянов, М.М. Перестюк, І.О. Пишнограєв, В.В. Путренко, В.М. Синєглазов.

 
© World Data Center
    for Geoinformatics and Sustainable Development
    May 25, 2020