- PVSM.RU - https://www.pvsm.ru -
Для начала, давайте разберемся с двумя важнейшими эпидемиологическими понятиями: смертностью и летальностью. Сразу оговорюсь, что в википедии (как русской, так и английской) приведено ошибочное определение летальности, которое сбивает с толку.
Летальность — это вероятность умереть, если у пациента диагностирована болезнь. Вот цитата из научной статьи [1]:
one of the most important epidemiologic quantities to be determined is the case fatality ratio—the proportion of cases who eventually die from the disease.
Смертность — это отношение числа умерших от болезни к размеру популяции за какой-то промежуток времени. Обычно, считают сколько смертей на 100 тыс. населения за единицу времени. Смертность непосредственно связана с летальностью: это произведение вероятности заболеть (за определенный временной период) на летальность. В самом деле, для того, чтобы умереть от болезни надо сначала ей заразиться, а потом уж, если не повезет…
Высокая летальность не означает автоматически, что смертность тоже высокая. Например, болезнь убивает с вероятностью 1, но поражает всего 0.1% населения, скажем, за год (похожим образом ведет себя вирус Эболы, к примеру). Тогда смертность составит всего 1/1000. В то время как болезнь с летальностью в сто раз меньше (0.01) может иметь в 10 раз более высокую смертность (1/100), если поражает все население за тот же период.
Смертность явно зависит от времени — со временем количество инфицированных, как правило, увеличивается, поэтому и смертность растет. Летальность же от времени не зависит явным образом, но, например, может снизиться со временем, если найдут/изобретут лекарство.
Можно еще сказать, что летальность это условная вероятность смерти при условии болезни, а смертность — это вероятность умереть от болезни за какой-то временной промежуток.
Летальность, в свою очередь, подразделяется на Case Fatality Ratio (CFR) и Infection Fatality Ratio (IFR):
CFR — это летальность, рассчитанная по подтвержденным случаям. У этого показателя есть подводный камень: в первую очередь обычно тестируют тех, у кого ярко выражены симптомы. Поэтому можно сказать, что в первом приближении CFR — это вероятность смерти при условии наличия болезни и выраженных симптомов.
IFR — это и есть летальность, то есть вероятность смерти при наличии болезни. Этот показатель включает также легкие и бессимптомные случаи болезни и поэтому может быть намного меньше чем CFR. Точно рассчитать этот показатель практически невозможно, потому что мало кто станет тестировать все население, чтобы учесть и бессимптомных носителей тоже, но его можно оценить.
В эпидемиологии крайне важно уметь в начале эпидемии оценить летальность, чтобы иметь возможность принять меры, сообразные тяжести заболевания. К сожалению, сделать это чрезвычайно сложно и сейчас мы узнаем почему.
Одним из наиболее популярных методов оценки летальности является простая формула: Deaths / Cases, то есть количество смертей от болезни поделить на общее число инфицированных к текущему моменту. К сожалению, эта весьма популярная оценка (называемая также наивным методом) обладает врожденным недостатком, который иллюстрируется следующим примером:
Пусть некая болезнь убивает ровно за 1 месяц с вероятностью 1. Пусть также количество заболевших удваивается каждые 10 дней. Допустим, в первый месяц умерло х человек. Но заболевших, которые еще не умерли, в 7 раз больше! Просто потому, что за месяц произойдет три удвоения исходной популяции больных (а это увеличение в 8 раз). Поэтому метод, когда делят количество умерших на количество диагностированных оценит летальность всего лишь в раз!
Эта недооценка наивного метода приводит к ложным спекуляциям. Например, во время эпидемии SARS наивная оценка росла со временем, порождая слухи о том, что вирус эволюционирует, превращаясь в более смертоносного убийцу. А причиной этого является простая математика: рост количества заболевших замедляется, что уменьшает недооценку летальности наивным эстиматором.
Таким образом, можно сказать, что наивный метод недооценивает летальность, уменьшая ее в раз, где — это время от заражения до смерти, а b — параметр, характеризующий время удвоения количества зараженных. Но, к сожалению, такая поправка плохо работает в реальной жизни, потому что пациенты умирают не строго через определенный промежуток времени организованными группами, а случайным образом. Давайте учтем это и выведем формулу поправки, которая будет применима в реальной жизни.
А теперь давайте посчитаем сколько же человек из заболевших в первый день умрет ко дню n:
Теперь посчитаем количество смертей для заболевших в другие дни (до дня n включительно) и сложим их:
Где (это следует из того, что количество кейсов растет по экспоненте). С учетом всего вышенаписанного:
Отсюда можно выразить bias-corrected летальность:
Таким образом, наивный эстиматор занижает реальную летальность в раз.
А теперь попробуем оценить этот bias для оценки летальности в ранний период развития эпидемии коронавирусной инфекции в китайском городе Ухань. Для этого воспользуемся следующими предположениями: время удвоения числа заболевших равно 5 дням, а среднее время от регистрации до смерти равно 18 дням.
Еще предположим, что день смерти имеет распределение Пуассона [4]:
Подставив значения в формулу, получим, что наивный метод занижает летальность примерно в 9 раз. Таким образом, CFR по подтвержденным случаям составляет около 18%! Подчеркиваю, что CFR не включает недокументированных пациентов, количество которых оценили [5] китайские ученые: по их модели, 86% случаев были не зарегистрированы. Это позволяет нам вычислить IFR: IFR = 0.14*CFR = 2.5%. Эти оценки для прекрасно согласуются с оценками CFR (18%, 11%-81%), и IFR (1%, 0.5%-4%), которые были получены [2] специалистами Imperial College London.
Важно понимать, что значение IFR не следует использовать для оценки вероятности умереть от болезни, так как вероятность умереть от болезни зависит от множества факторов:
— возраста
— наличия сопутствующих заболеваний
— загруженности больниц
— вирусной нагрузки
— и т. д.
Тогда для чего же так важно знать IFR хотя бы приблизительно? Это нужно знать для того, чтобы иметь возможность сравнить с известными заболеваниями. Например, летальность (IFR) гриппа составляет [6] 0.01%, что, как минимум, в десятки раз ниже. С учетом того, факта, что коронавирус более заразный (R0 > 2 против примерно 1.3 у гриппа), это может привести к десяткам миллионов смертей по всему миру, так как грипп может уносить до 650 000 жизней в год. Поэтому ни в коем случае не стоит считать, что «это просто грипп».
Автор: afedintsev
Источник [7]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/matematika/350699
Ссылки в тексте:
[1] научной статьи: https://academic.oup.com/aje/article/162/5/479/82647
[2] отсюда: https://www.imperial.ac.uk/media/imperial-college/medicine/sph/ide/gida-fellowships/Imperial-College-COVID19-severity-10-02-2020.pdf
[3] Здесь: https://institutefordiseasemodeling.github.io/nCoV-public/analyses/first_adjusted_mortality_estimates_and_risk_assessment/2019-nCoV-preliminary_age_and_time_adjusted_mortality_rates_and_pandemic_risk_assessment.html
[4] распределение Пуассона: https://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5_%D0%9F%D1%83%D0%B0%D1%81%D1%81%D0%BE%D0%BD%D0%B0
[5] оценили: https://science.sciencemag.org/content/early/2020/03/13/science.abb3221.full
[6] составляет: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3809029/
[7] Источник: https://habr.com/ru/post/491058/?utm_campaign=491058&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.