Инфодемия и ковидометрия: заблуждения эпохи пандемии
Эпидемия коронавируса представляет собой одно из тех экспоненциально масштабируемых событий, которые зачастую потрясают общественные связи и устои, вызывая значительные перемены и радикальные повороты развития цивилизации. Таким событиям обычно сопутствуют информационные всплески, слухи, взрывной рост различных домыслов и фейков, что усиливает общее смятение умов рядовых граждан, еще более склонных симметрично заблуждаться. Сейчас все это мы можем наблюдать в ежедневном режиме.
И далеко не всегда домыслы и недостоверная информация оказываются продуктом умышленных деяний фейкометов. Гораздо с большей частотой заблуждения формируются в силу особенностей человеческой психологии, подсознания, реагирования на массовое поведение и формирования личностного восприятия событий, приводящих к многочисленным когнитивным ошибкам, которые свойственны людям. Вот лишь некоторые примеры, которые обусловлены пандемией COVID-19.
«От нас скрывают правду, которая ужасна»
Это самое распространенное суждение, которое можно слышать от многих, кто вполне искренне переживает распространение нового вируса. Человек в принципе склонен сгущать краски, особенно тогда, когда речь заходит о негативных процессах или явлениях, и приукрашивать положительные и благоприятные моменты жизни. В результате он совершает ошибки, так как в одном случае практически не замечает позитивных сигналов и новых обнадеживающих возможностей, а в другом — недооценивает риски и опасности, впадая в эйфорию. В ситуации со статистикой заболеваний COVID-19 скорее обнаруживаются когнитивные ошибки первого типа. На это есть свои объективные причины.
Крайне негативной особенностью пандемии нового коронавируса в России стало ее совпадение с достаточно высоким уровнем заболеваний внебольничной пневмонией, как указывают сами врачи, предположительно вирусной этиологии. По данным Роспотребнадзораза 2018 и 2017 гг., число заболевших этим недугом в России с 2016 по 2018 гг. выросло с 611 до 722 тыс. человек, то есть на 18%. Более поздняя статистика на сайте ведомства пока не представлена, однако она просачивается в прессу. В частности, в конце апреля этого года русская служба ВВС со ссылкой на Роспотребнадзор опубликовала данные за 2019 и начало 2020 гг. по Москве, указывающие на рост случаев заболевания. Проверены эти цифры на достоверность или нет, сказать сложно, поэтому обратимся к дополнительным индикаторам.
Косвенным подтверждением если не цифр, то тренда, может быть статистика поисковых запросов «пневмония» в русскоязычном сегменте Google. Оперируя данными поисковых запросов, можно предположить, что частота обращений к поиску симптомов болезни в интернете указывает и на частоту самих заболеваний. На графике 1 видно, как росла из года в год популярность таких запросов, достигнув пика в апреле 2020 года. Этот интерес, несомненно, был вызван и пандемией, ведь одним из самых распространенных осложнений заболевания вирусом COVID-19 является именно пневмония. Но при этом нужно понимать, что и без вируса число заболеваний существенно выросло.
Все это не могло не сказаться на общем увеличении числа пациентов больниц, а также количества больных с тяжелыми формами болезни, осложнениями и обострениями хронических заболеваний и, что самое печальное, летальных исходов, многие из которых могли и не иметь отношения непосредственно к COVID-19.
Окончательные результаты пандемии можно будет подвести через относительно длительный период времени. Учитывая схожесть симптомов болезней, нельзя исключать, что в общую статистику выявленных случаев заражения могли попасть больные с внебольничными пневмониями, не связанными с новым вирусом. В этом смысле скорее общая статистика болезней имеет тенденцию к завышению, нежели занижению. Однако число летальных исходов больных, непосредственно зараженных вирусом, на этом фоне воспринимается многими как умышленное манипулирование статистикой — психология обывателя ищет подтверждений подозрениям, что от него скрывают реальные масштабы бедствия.
Нельзя не отметить и другой важный момент — рост удельного веса людей, не имеющих симптомов заражения. В настоящее время и за рубежом, и в России проводятся исследования на выявление скрытых случаев болезни, а также тех, кто уже переболел ею. В частности, в США были проведены так называемые серологические исследования жителей двух округов в штате Калифорнии Санта Клара и Лос-Анджелес, в общей сложности охватившие свыше 4 тыс. человек, которые показали, что удельный вес лиц с антителами в популяции достигает 2–4%. Это означает, что реальное число людей, столкнувшихся с вирусом, в десятки (!) раз превышает данные официальной статистики. Подобные исследования представляют совершенно иную картину распространения вируса, причем с учетом их выводов нуждается в переоценке и статистика летальности. На этом фоне ее показатели будут ниже.
Возможно, для обеспечения необходимого уровня осторожности граждан, их ответственности, соблюдения мер самоизоляции и социальной дистанции недоверие к цифрам, как и пессимистическая оценка реальной ситуации, были бы полезны, если бы они не приводили к масштабированию негатива и перенесению его на социально-политические отношения. Все-таки объективная картина происходящего, обрисованная профессионалами, как и своевременная публикация официальными органами данных по типам болезней были бы лучшими средствами профилактики от всевозможных спекуляций.
«Невероятно быстрые» выздоровления
Это еще одно распространенное суждение, которое можно встретить в социальных сетях и Telegram-каналах. Причем за этим обычно следуют размышления на тему вероятных плебисцитов и иных политических событий в стране. Люди с завидным воодушевлением любят разговаривать о политике, здоровье и погоде. В нынешнем году эти темы буквально слились воедино, масштабировав число доморощенных политологов-вирусологов, видимо, испытывающих еще и дискомфорт от климатических капризов. Тем не менее, пускаясь в конспирологию, всем нам нужно понимать: статистические данные трудно подделать так, чтобы соблюсти все внутренние пропорции и корреляции данных. «Рисованные» цифры обязательно проявятся при статистическом анализе.
Что касается числа завершившихся случаев болезни (выздоровевшие и умершие), то оно достаточно стабильно следует за общим числом заболеваний (график 2). Средний интервал между значениями — три недели, то есть в среднем 22–23 дня. Это означает, что суммарное число выздоровевших и умерших в день Х примерно соответствует числу выявленных случаев болезни в день Х минус 23 дня. В начале эпидемии этот интервал был около 14–15 дней, но по мере увеличения числа больных, различий в характере течения болезни и многих других факторов произошло увеличение указанного интервала.
Как сообщали представители системы здравоохранения и Москвы, и России, много людей, зараженных вирусом, находилось и находится на амбулаторном лечении, то есть не госпитализированы в больницы. Это означает, что тесты на наличие вируса, а затем и выписка выздоровевших осуществляется по месту жительства. Практически на всем двухмесячном интервале с конца марта по конец мая наблюдалась одна устойчивая статистическая особенность: в выходные дни и праздники число выздоровевших (выписанных), как правило, сокращалось по сравнению с буднями. Это, вероятно, можно объяснить также графиком работы районных поликлиник. Поскольку май богат на выходные дни, соответственно, и число выписываемых пациентов постоянно задерживалось, но сразу после праздников или выходных наблюдался рост числа выздоровевших.
Представленный график в целом указывает на то, что существенного искажения цифр выздоровевших, а также умерших не наблюдается. Опираясь на эти зависимости, можно прогнозировать, что, к сожалению, в дальнейшем число летальных случаев будет расти, «догоняя» предыдущий экспоненциальный рост количества больных, но также совершенно очевидно, что и число выздоровевших будет прирастать на все более заметные величины.
Иллюзия нормального распределения
Этой иллюзии подвержены и простые граждане, и лица, облеченные полномочиями. На практике такие события, как пандемии, отличаются многофакторностью и неопределенностью. Очень многие причины и импульсы, определяющие динамику показателей, иллюстрирующих такие процессы, скрыты от глаз наблюдателей. В этих условиях было бы весьма самонадеянно пытаться экстраполировать те или иные тенденции, пытаться увидеть симметрию между, например, темпами роста числа новых случаев и темпами их снижения. Наиболее подходящей иллюстрацией таких процессов является так называемое распределение статистических значений с признаками «толстого хвоста» (fat-tailed distribution), причем с явно выраженной асимметрией. Асимметричность показателей пандемии COVID-19 в большинстве стран выражается в том, что рост числа болезней происходит по экспоненте в течение относительно короткого времени, а вот снижение числа новых случаев после достижения пика заболеваемости растягивается.
Например, в Италии с начала распространения болезни до пикового значения новых случаев прошел примерно месяц (22 февраля — 21 марта), но вот уже как два месяца идет постепенное снижение ежедневного прироста новых больных. То есть отношение между периодом активного роста заражений и периодом снижения заражений составляет как минимум 1 к 2. Примерно такая же картина в Испании, Франции, Германии и в целом ряде других стран.
В США распределение случаев заражения еще более растянуто: с 29 февраля по 4 апреля (примерно 1,5 месяца) прирост новых случаев болезни увеличился с 5 до 34 500 человек в день. После этого были еще два пика прироста заболевших — 24 апреля (почти 39 тыс.) и 1 мая (36 тыс.). К третьей декаде мая в США фиксировалось около 20 тыс. новых случаев в день. Таким образом, выход из пандемии оказывается гораздо более длительным, чем хотелось бы предположить, исходя из гипотезы о нормальном распределении случайных статистических данных.
А в такой стране, как Швеция, где не вводили ограничений, кривая новых случаев болезни, однажды поднявшись до пиковых значений, почти два месяца колеблется относительно условного «плато», и как долго это «плато» будет длиться, прежде чем число новых случаев заражений начнет устойчиво сокращаться, сказать крайне сложно.
Эти свидетельства имеют очень важное значение для оценки возможных действий властей по постепенному выходу из режимов самоизоляции и карантина, для выработки точных критериев и показателей для принятия ими соответствующих решений. Простых подходов здесь нет. В этой связи хотелось бы обратить внимание на следующее.
Роспотребнадзор сформулировал критерии постепенного, трехэтапного снятия ограничений. Один из них — достижение определенного значения коэффициента распространения инфекции Rt, который, по методологии ведомства, рассчитывается путем деления суммы числа больных, зарегистрированных в течение последних 4-х суток, на сумму числа больных, зарегистрированных за предыдущие 4 суток. Согласно указаниям, для перехода на первый этап снятия ограничений Rt должен быть менее 1, для перехода на второй этап — менее 0,8, на третий этап — менее 0,5. Но для того чтобы коэффициент устойчиво стремился к искомым целевым значениям, темпы снижения количества новых заражений изо дня в день должны быть устойчиво такими же, какими были темпы роста новых случаев на подъеме эпидемии, только с другим знаком. Это и есть иллюзия нормального распределения. Практика говорит о другом.
Возьмем для примера 5 первых европейских стран по числу заболевших, которые бы удовлетворяли двум условиям:
- распространение болезни в них хронологически совпало;
- эпидемия находится в завершающей стадии, число активных случаев болезни менее 8% от общего числа выявленных больных.
В эту группу попадают: Германия (180,3 тыс. заболевших, 6% продолжают болеть), Швейцария (30,8, 2%), Ирландия (24,6, 8%), Австрия (16,5, 5%), Дания (11,4, 8%). На графике 3 представлена динамика показателя Rt с конца марта (рассчитан по указанной выше методике).
Как видно на графике, показатель Rt оказывался меньше 0,5 эпизодически и далеко не во всех 5 странах, причем к концу распространения вируса он превысил 1. А вот в Швеции, где вообще не было ограничений, на том же временном интервале показатель Rt несколько раз опускался не только ниже 1, но и ниже 0,8. Эти примеры свидетельствуют не только о растянутом во времени выходе из эпидемии.
Дело в том, что на стадии роста коэффициент распространения болезни действительно способен показать высокий темп распространения заражений, но этот метод плохо учитывает факт растянутого во времени снижения темпов, а также является нейтральным к абсолютным значениям. Поэтому он может быть равен и больше 1, когда в начале эпидемии изо дня в день число новых случаев насчитывает несколько тысяч и когда на этапе завершения эпидемии ежедневно выявляется по одному-два случаю.
Если же мы перейдем к медианным значениям Rt за весь период, то сразу увидим разницу. В Германии медианное значение коэффициента составило 0,84, Австрии — 0,78, Швейцарии — 0,8, Ирландии — 0,91, в Дании — 0,92. А вот в Швеции — 1,04. То есть в среднем в пятерке стран эпидемия явно идет на убыль, хотя и разными темпами, а в Швеции — продолжается.
Все это надо иметь в виду и у нас. Так как за показателями, предложенными Роспотребнадзором, пристально следят СМИ, и любое повышение значения Rt выше порогового может восприниматься и подаваться как ухудшение ситуации, что всех будет вводить в заблуждение. Вероятно, ведомству стоит подумать над тем, как учесть данное обстоятельство в своих рекомендациях, избегая следования иллюзии нормального распределения.
В целом же нынешняя пандемия войдет в историю и будет исследоваться самыми разными специалистами: и медиками, и психологами, и экономистами, и многими другими. Эти исследования важны, чтобы лучше понять механизм развертывания непредсказуемых событий, научиться оценивать такие события и выявлять их, а также принимать точные и эффективные решения в условиях неопределённости.