Короткостроковий прогноз поширення COVID-19 (25.05.20 - 30.05.20) на основі Back Propagation Neural Network
Date of publication 25.05.2020
З метою перевірки правдоподібності результатів прогнозування, при виконанні цього дослідження застосовано два різні математичні інструменти:
- Багатошарова нейронна мережа Back Propagation для короткострокового прогнозування розповсюдження пандемії коронавірусу на часовому відрізку (26.05.20 - 30.05.20);
- Метод подібності в математичному моделюванні на основі кореляційного і регресійного аналізу для прогнозування розповсюдження пандемії коронавірусу на часовому відрізку (26.05.20 - 04.06.20).
Перевірка правдоподібності результатів прогнозування полягала в порівнянні прогнозних даних, отриманих з використанням двох різних, незалежних один від одного методів.
1. Короткостроковий прогноз (26.05.20 - 30.05.20) на основі нейронної мережі Back Propagation
Результати короткострокового прогнозного моделювання кількості хворих на COVID-19 в Україні і м. Києві на 26.05.20 – 30.05.20 (рис.1-10; табл. 1,2) отримано з використанням багатошарової нейронної мережі Back Propagation на основі механізму «ковзного вікна» з кількістю точок даних для навчання нейронної мережі - 12. Бачимо, що для України на дванадцятиденному відрізку часу (18.05.20 – 30.05.20) характер розвитку пандемії набуває більш чіткого лінійного характеру з рівнем «плато» - (300-450) нових інфікованих на день (рис. 2). За результатами прогнозного моделювання команди проєкту «ФОРСАЙТ COVID-19» такий характер розвитку процесу може продовжитися до кінця травня 2020 року. Після чого, пандемія ймовірно може піти на спад (кількість щоденно інфікованих буде стійко нижчою кількості щоденно видужалих людей).
Для міста Києва, протягом дванадтиденного відрізку часу (18.05.20 – 30.05.20) процес розвитку пандемії поступово переходить від нестаціонарним до більш лінійного з ймовірним зниженням його волатильності і набуттям більш чіткого лінійного характеру на наступному тижні з рівнем «плато» - (35-60) нових інфікованих на день (рис. 5, 6).
Середня абсолютна похибка у відсотках виконаного прогнозу не перевищує MAPE = 1.64% для України і МАРЕ = 2.03% для м. Києва (Рис. 9, 10, Табл. 3, 4). Зазначимо, що на більших обсягах даних (як це ми маємо для України у порівнянні з м. Києвом) нейронна мережа Back Propagation є менш чутливою до короткотермінових збурень та сплесків і дозволяє отримати меншу похибку прогнозу.
З рис. 11 та 12 бачимо, що кількість щоденно видужалих людей в Україні наближається до кількості щоденно інфікованих людей (19-20.05.20 цей баланс (Δ) був навіть позитивним). Команда проекту очікує, що на початку червня цей баланс Δ ймовірно може стати стійко позитивним, що засвідчить початок спаду пандемії.
2. Прогнозування розвитку пандемії COID-19 з використанням методу подібності в математичному моделюванні на часовому відрізку (26.05.20 - 04.06.20)
На першому кроці застосування цього методу здійснювався вибір країни (країн) – прототипів, характер розвитку пандемії в яких є найбільш наближеним до характеру розвитку цього процесу в Україні. З цією метою було застосовано кореляційно-регресійний аналіз для порівняння головних показників України з відповідними показниками країн Європи. Країни для порівняння вибиралися виходячи з наступних показників:
- Населення, обраної для порівняння країни має бути не меншим 15 млн. людей;
- Густина населення має бути співмірною з густиною населення України і коливатися в діапазоні (1-2,5) у порівнянні з густиною населення України.
В результаті застосування цих критеріїв для порівняння з Україною було обрано 16 країн Європи (таблиця 5).
Таблиця 5. Кореляційно-регресійний аналіз
Країна | Коеф. кореля-ції за P1 (r1.j) | Коеф. кореляції за P2(r2.j) | Коеф. кореляції за P3 (r3.j) | Коеф. кореляції за P4 (r4.j) | Коеф. для P5 (r5.j) | Індекс подібності (Ij) | Населен-ня (млн) | Щільність населен-ня (осіб/км2) | Кількість зроблених тестів (% від кількості населення) |
Кількість хворих лікарів (% від загальної кількості хворих) |
Ukraine | 42 | 73,8 | 0,6106 | 19,39% | ||||||
Poland | 0,984 | 0,991 | 0,860 | 0,932 | 0,858 | 0,925 | 38,4 | 123 | 1,842 | |
Greece | 0,946 | 0,973 | 0,843 | 0,916 | 0,911 | 0,918 | 10,8 | 82 | 1,3816 | |
Romania | 0,998 | 0,997 | 0,709 | 0,953 | 0,865 | 0,904 | 19,4 | 84,4 | 1,779 | 12,2% |
Hungary | 0,994 | 0,992 | 0,678 | 0,929 | 0,884 | 0,895 | 9,8 | 105,1 | 1,6124 | |
Netherlands | 0,993 | 0,991 | 0,682 | 0,893 | 0,867 | 0,885 | 17,4 | 421 | 1,7652 | |
Sweden | 0,998 | 0,977 | 0,864 | 0,749 | 0,831 | 0,884 | 10,3 | 20,3 | 2,0798 | |
Austria | 0,910 | 0,987 | 0,884 | 0,907 | 0,570 | 0,852 | 9 | 106 | 4,3384 | |
United Kingdom | 0,837 | 0,949 | 0,979 | 0,936 | 0,545 | 0,849 | 67,9 | 270,7 | 4,5552 | |
Czechia | 0,941 | 0,978 | 0,746 | 0,653 | 0,830 | 10,6 | 134 | 3,6157 | ||
Belgium | 0,993 | 0,984 | 0,932 | 0,898 | 0,335 | 0,828 | 11,5 | 376 | 6,3807 | |
Spain | 0,985 | 0,983 | 0,770 | 0,919 | 0,321 | 0,796 | 47,1 | 92 | 6,4977 | 20% |
Italy | 0,987 | 0,988 | 0,733 | 0,806 | 0,452 | 0,793 | 60,3 | 201,3 | 5,3635 | 10% |
Belarus | 0,943 | 0,983 | 0,659 | 0,578 | 0,791 | 9,5 | 45,8 | 4,2672 | ||
Portugal | 0,972 | 0,989 | 0,740 | 0,923 | 0,291 | 0,783 | 10,3 | 114,5 | 6,7619 | |
France | 0,864 | 0,791 | 0,473 | 0,925 | 0,826 | 0,776 | 67,1 | 104 | 2,1218 | |
Germany | 0,866 | 0,776 | 0,230 | 0,885 | 0,575 | 0,667 | 83,1 | 232 | 4,2923 |
Розглянуто такі набори даних:
- Кількість зареєстрованих випадків COVID-19 (P1);
- Кількість зареєстрованих летальних випадків COVID-19 (P2);
- Кількість зареєстрованих випадків одужання від COVID-19 (P3);
- Коефіцієнт мобільності (P4);
- Кількість зроблених тестів на 1000 осіб (P5).
Дослідження спрямовувалось на оцінювання подібності даних для України до даних 11 країн Європи, обраних для порівняння. Для показників P1-P4 обраховано відповідні коефіцієнти кореляції ri,j, де i=1..4; j=1..11; значення P5 нормовано відносно значення показника для України за формулою:
З використанням наявних даних і введених критеріїв P1-P5 було обраховано індекс подібності: (таблиця 5).
На основі використання обрахованого індексу подібності та групи таких показників, як населення країни, густина населення країни, територіальна наближеність країни Європи до України, в якості країн-прототипів для виконання прогнозного моделювання було обрано Польщу та Румунію. Для наведених країн та України на рис. 12, 13 та 14 представлено кількість зареєстрованих випадків COVID-19, смертельних випадків та видужалих людей від COVID-19 відповідно.
Рисунок 12. Кількість зареєстрованих випадків в Україні та країнах прототипах
Рисунок 13. Кількість смертельних випадків в Україні та країнах прототипах
Рисунок 14. Кількість видужалих людей в Україні та країнах прототипах
На основі використання середньозважених значень розглянутих величин в країнах-прототипах (Румунії та Польщі) побудовано наступні прогнозні моделі для України:
Кількість зареєстрованих випадків |
де t =1 - номер дня, коли в Україні було зареєстровано 10 випадків. |
Кількість смертельних випадків |
де t =1 - номер дня, коли в Україні було зареєстровано 10 випадків смерті. |
Кількість видужалих людей |
де t =1 - номер дня, коли в Україні було зареєстровано 45 випадків. |
Результати прогнозного моделювання подальшого розвитку коронавірусу в Україні наведені в таблиці 6.
Таблиця 6. Результати прогнозного моделювання подальшого розвитку коронавірусу в Україні на основі порівнянь з країнами-прототипами
Дата | Кількість зареєстрованих випадків | Кількість смертельних випадків | Кількість видужалих | Кількість активних випадків | ||||||
Історичні дані | Результати прогнозного моделювання | Відсоток похибки | Історичні дані | Результати прогнозного моделювання | Відсоток похибки | Історичні дані | Результати прогнозного моделювання | Відсоток похибки | ||
01.05.2020 | 10861 | 10906 | 0,41 | 272 | 269 | 1,16 | 1413 | 1475 | 4,38 | 9448 |
02.05.2020 | 11411 | 11356 | 0,48 | 279 | 281 | 0,61 | 1498 | 1633 | 9,04 | 9913 |
03.05.2020 | 11913 | 11807 | 0,89 | 288 | 293 | 1,65 | 1548 | 1800 | 16,26 | 10365 |
04.05.2020 | 12331 | 12258 | 0,59 | 303 | 305 | 0,67 | 1619 | 1974 | 21,93 | 10712 |
05.05.2020 | 12697 | 12709 | 0,09 | 316 | 318 | 0,48 | 1875 | 2156 | 15,00 | 10822 |
06.05.2020 | 13184 | 13159 | 0,19 | 327 | 330 | 0,98 | 2097 | 2346 | 11,88 | 11087 |
07.05.2020 | 13691 | 13610 | 0,59 | 340 | 343 | 0,92 | 2396 | 2544 | 6,18 | 11295 |
08.05.2020 | 14195 | 14061 | 0,94 | 361 | 356 | 1,32 | 2706 | 2750 | 1,62 | 11489 |
09.05.2020 | 14710 | 14512 | 1,35 | 376 | 370 | 1,60 | 2909 | 2964 | 1,88 | 11801 |
10.05.2020 | 15232 | 14962 | 1,77 | 391 | 389 | 0,43 | 3060 | 3185 | 4,09 | 12172 |
11.05.2020 | 15648 | 15413 | 1,50 | 408 | 408 | 0,05 | 3288 | 3415 | 3,85 | 12360 |
12.05.2020 | 16023 | 15864 | 0,99 | 425 | 427 | 0,39 | 3373 | 3652 | 8,27 | 12650 |
13.05.2020 | 16425 | 16315 | 0,67 | 439 | 445 | 1,30 | 3716 | 3897 | 4,87 | 12709 |
14.05.2020 | 16847 | 16765 | 0,48 | 456 | 462 | 1,40 | 4143 | 4150 | 0,17 | 12704 |
15.05.2020 | 17330 | 17216 | 0,66 | 476 | 480 | 0,77 | 4473 | 4411 | 1,38 | 12857 |
16.05.2020 | 17858 | 17667 | 1,07 | 497 | 497 | 0,08 | 4906 | 4680 | 4,61 | 12952 |
17.05.2020 | 18291 | 18118 | 0,95 | 514 | 513 | 0,15 | 5116 | 4957 | 3,12 | 13175 |
18.05.2020 | 18616 | 18568 | 0,26 | 535 | 529 | 1,03 | 5276 | 5241 | 0,66 | 13340 |
19.05.2020 | 18876 | 19019 | 0,76 | 548 | 545 | 0,47 | 5632 | 5534 | 1,75 | 13244 |
20.05.2020 | 19230 | 19470 | 1,25 | 564 | 561 | 0,52 | 5955 | 5834 | 2,03 | 13275 |
21.05.2020 | 19706 | 19921 | 1,09 | 579 | 576 | 0,44 | 6227 | 6142 | 1,36 | 13479 |
22.05.2020 | 20148 | 20371 | 1,11 | 588 | 592 | 0,60 | 6585 | 6458 | 1,92 | 13563 |
23.05.2020 | 20580 | 20822 | 1,18 | 605 | 606 | 0,22 | 6929 | 6782 | 2,12 | 13651 |
24.05.2020 | 20986 | 21273 | 1,37 | 617 | 621 | 0,63 | 7108 | 7114 | 0,09 | 13878 |
25.05.2020 | 21245 | 21724 | 2,25 | 623 | 635 | 1,95 | 7234 | 7454 | 3,04 | 14011 |
26.05.2020 | 22174 | 649 | 7802 | 14373 | ||||||
27.05.2020 | 22625 | 663 | 8157 | 14468 | ||||||
28.05.2020 | 23076 | 677 | 8521 | 14555 | ||||||
29.05.2020 | 23527 | 690 | 8892 | 14635 | ||||||
30.05.2020 | 23977 | 703 | 9271 | 14706 | ||||||
31.05.2020 | 24428 | 716 | 9658 | 14770 | ||||||
01.06.2020 | 24879 | 729 | 10053 | 14826 | ||||||
02.06.2020 | 25330 | 741 | 10456 | 14874 | ||||||
03.06.2020 | 25780 | 754 | 10866 | 14914 | ||||||
04.06.2020 | 26231 | 766 | 11285 | 14946 |
На рис. 15 та 16 наведені графіки головних характеристик пандемії коронавірусу за результатами прогнозного моделювання (табл. 6).
Рисунок 15. Головні характеристики пандемії коронавірусу за результатами прогнозного моделювання (накопичувальні дані)
Рисунок 16. Головні характеристики пандемії коронавірусу за результатами прогнозного моделювання (щоденні дані)
З рисунків 15, 16 бачимо, що протягом наступного місяця, з 26.05.20 по 04.06.20 розповсюдження короновірусу в Україні ймовірно буде мати строго лінійний характер і зберігатися на рівні “плато” 400-450 нових інфікованих на день. В той же час, протягом цього-ж відрізку часу кількість щоденно видужалих людей буде монотонно зростати і поступово наближатися до кількості щоденно інфікованих людей. Це вказує на поступове наближення пандемії до фази повільного затухання.
Окремі різкі зменшення кількості інфікованих людей 5, 12, 19, 25 травня 2020 року пояснюються зниженням активності роботи системи охорони здоров’я у вихідні дні напередодні вказаних дат (зниження рівня ослуговування людей), що потягло за собою зменшення кількості зареєстрованих хворих у вказані дні.
Порівняння прогнозних даних, отриманих з використанням двох різних методів на часовому відрізку (26.05.20-30.05.20) вказує на близькість отриманих результатів, що підтверджує їх правдоподібність.
Науковий керівник проекту: М.З. Згуровський.
Команда проекту: О.С. Войтко, Н.В. Горбань, І.М. Джигирей, Б.Р. Дудка, К.В. Єфремов, Ю.П. Зайченко, П.О. Касьянов, М.М. Перестюк, І.О. Пишнограєв, В.В. Путренко, В.М. Синєглазов.
for Geoinformatics and Sustainable Development
May 25, 2020