2020-02-03 19:32:51 +0000 2020-02-03 19:32:51 +0000
28
28

COVID-19的死亡率是41%吗?

根据约翰-霍普金斯大学冠状病毒追踪器的数据,截至2020年2月3日,全球共有17491例COVID-19确诊病例,536例痊愈,362例死亡。根据我的非专家计算,这意味着死亡率为:

(Nd / (Nd + Nr)) * 100 = 41%

,其中:

Nd是死亡总人数,Nr是完全康复的总人数。

这与公开传播的2%的死亡率形成了鲜明的对比,所以我的计算或假设有误,还是说COVID-19的危险性比一般的说法要大得多?

[经过评论中的有益讨论,'死亡率'不是正确的说法,我应该说’病例死亡率’]**。

答案 (4)

39
39
39
2020-02-04 16:36:16 +0000

你给出的死亡率的定义与我所熟悉的任何实际定义都不一致。 * 当人们谈论一种疾病的死亡率时,他们通常指的是病例死亡率死亡与病例比,其简单定义为Nd / _Ni,其中Nd是在给定时间段内归因于该疾病的死亡人数,Ni是同一时间段内观察到的该疾病新病例总数。按照这个定义,根据你引用的数据,目前2019-nCov的病例死亡率为362 / 17491≈2.07%。

(自从你提出问题后,追踪器似乎已经更新,现在列出了总共20679例确诊病例和427例死亡病例,CFR为427 / 20679≈2.06%。)

*) 作为死亡率的理论定义,从长远来看,当所有感染者要么死亡要么康复时,它可以有点意义。但这样一来,它就相当于通常的病例死亡率的定义。


要与你对 “死亡率 "的定义(如Nd / (Nd + Nr),其中Nr是指从疾病中康复的个体数量)进行比较,我们需要先观察到,"从疾病中康复 "的含义并没有一个普遍而明确的定义。常用的定义往往是类似于 "在X天内没有症状 "和/或 "在X天内病毒载量低于N颗粒/毫升",或者干脆是 "当医生宣布你恢复健康并让你出院时"。

现在,让我们假设我们使用的是一个(有点)客观的康复定义,比如 "两天内没有可检测的症状"。第一个观察结果是,根据你的定义,任何首次观察到的不到两天的疫情都会不可避免地有100%的死亡率,因为到目前为止,没有一个被感染的人有时间被认为是绝对康复了。(这是假设至少有一个人因感染而死亡,否则分子和分母都将为零,因此死亡率无法定义。)

此外,即使在一些最早的病例已经没有症状的时间足够长,可以被算作康复后,你的定义仍然会对流行病早期的 "真实 "长期死亡率产生一个高度向上的偏差估计,因为在这个阶段,每天的新病例数量仍然在增加。这是因为,对于大多数传染病来说,任何死亡通常都发生在疾病最严重的状态下,而那些幸存下来的人则会随着他们的免疫系统成功地阻止和逆转感染的进展而使症状逐渐下降。


举个例子,让我们考虑一个假设的疾病,其理论上的长期平均CFR为1%–也就是说,在所有(可识别的)感染者中,恰好有1%的人将死于这种疾病。让我们进一步假设,这种疾病从最初出现可识别的症状到达到最大严重程度的状态通常需要两天的时间,也就是大多数死亡发生的时候。在这之后,假设患者能存活下来,在随后的三天内,症状会逐渐下降。由于缓解是可能的(但很少见),医生一般会在病人至少两天没有症状后才认为病人已经康复。因此,一个典型的病例会有如下进展。

出现症状→症状加重(2天)→严重程度达到顶峰→症状减轻(3天)→无症状→观察(2天)→正式康复(总时间:从发病开始约7天)

或者,对于1%的致命性疾病患者:

出现症状→症状加重(2天)→死亡(总时间:从发病开始约2天)

出现症状→症状加重(2天)→死亡。

现在,我们假设,在流行初期,当感染还在成倍地扩散时,新病例的数量每3天增加10倍。因此,在这一时期,每天的新病例、康复者和死亡人数可能会大致增长如下(为了举例,假设每天确诊的病人中有1%,四舍五入,两天后死亡)。

| cases | recovered | deaths | | |  
day | new | total | new | total | new | total | Nd / Ni | Nd/(Nd+Nr) |
----+-------+-------+-------+-------+-------+-------+---------+------------+
  1 | 1 | 1 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  2 | 2 | 3 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  3 | 5 | 8 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  4 | 10 | 18 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  5 | 20 | 38 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  6 | 50 | 88 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  7 | 100 | 188 | 0 | 0 | 0 | 0 | 0.00% | N/A |
  8 | 200 | 388 | 1 | 1 | 0 | 0 | 0.00% | 0.0% |
  9 | 500 | 888 | 2 | 3 | 1 | 1 | 0.11% | 25.0% |
 10 | 1000 | 1888 | 5 | 8 | 2 | 3 | 0.16% | 27.3% |
 11 | 2000 | 3888 | 10 | 18 | 5 | 8 | 0.21% | 30.8% |
 12 | 5000 | 8888 | 20 | 38 | 10 | 18 | 0.20% | 32.1% |

正如你从上表中看到的,在这个指数增长期间,天真地将病例死亡率计算为(死亡总数)/(病例总数),确实低估了真正的长期CFR,由于感染和死亡之间有两天的滞后时间,因此(在这种情况下)大约5的系数。另一方面,使用您的公式(总死亡人数)/(总死亡人数+痊愈人数)将高估真实的CFR约30倍!您的公式是:(总死亡人数)/(总死亡人数+痊愈人数)。

同时,让我们假设,在最初的12天后,疫情增长达到饱和,每天新增10,000例。现在的总人数 数字会像这样。

| cases | recovered | deaths | | |  
day | new | total | new | total | new | total | Nd / Ni | Nd/(Nd+Nr) |
----+-------+-------+-------+-------+-------+-------+---------+------------+
 13 | 10000 | 18888 | 50 | 88 | 20 | 38 | 0.20% | 30.2% |
 14 | 10000 | 28888 | 99 | 187 | 50 | 88 | 0.30% | 32.0% |
 15 | 10000 | 38888 | 198 | 385 | 100 | 188 | 0.48% | 32.8% |
 16 | 10000 | 48888 | 495 | 880 | 100 | 288 | 0.59% | 24.7% |
 17 | 10000 | 58888 | 990 | 1870 | 100 | 388 | 0.66% | 17.2% |
 18 | 10000 | 68888 | 1980 | 3850 | 100 | 488 | 0.71% | 11.2% |
 19 | 10000 | 78888 | 4950 | 8800 | 100 | 588 | 0.74% | 6.3% |
 20 | 10000 | 88888 | 9900 | 18700 | 100 | 688 | 0.77% | 3.5% |
 21 | 10000 | 98888 | 9900 | 28600 | 100 | 788 | 0.80% | 2.7% |

正如你所看到的,这两个死亡率的衡量标准 随着疫情增长的放缓,最终开始趋于一致。事实上,从长远来看,由于大多数病人要么康复,要么死亡,它们最终都会趋近于1%的 "真正 "长期病例死亡率。但到那时,疫情就基本结束了。

即使在疫情的早期指数增长阶段,也有各种方法可以获得更准确的长期死亡率估计。其中一种方法是观察同时诊断出的单组病人的结果。对于我们假设的流行病例子,例如只观察第10天诊断出的1000名患者,我们只需将该队列中的10名死亡者除以队列中的患者总数,就可以得到第12天的CFR的准确估计。此外,通过观察多个队列,我们可以很好地了解诊断后需要等待多长时间,每个队列的估计病例死亡率才会接近最终的真实值。

不幸的是,为2019-nCov进行这种队列分析需要比你链接到的跟踪器提供更详细的信息。即使是追踪器链接到的时间序列电子表格也没有直接提供如此详细的队列数据,尽管通过对疾病的典型进展做出一些或多或少的合理假设,可能会从中获得更好的估计。


补充:一些我上面描述的那种初步队列研究似乎确实已经发表了2019-nCoV。

特别是, "A novel coronavirus outbreak of global health concern”由Wang et al. “Clinical features of patients infected with 2019 novel coronavirus in Wuhan, China”由Huang _et al. _,均于1月24日发表在《柳叶刀》上,指出在武汉市2020年1月2日前确诊为2019-nCoV的首批41名患者中,到1月22日已有6人死亡(28人已出院,剩下7人住院),因此这批患者的病例死亡率为14.6%。

然而,他们确实建议谨慎对待这个数字,并指出了一些原因(除了检查的病例数量少),为什么它可能无法完全反映最终的长期CFR:

“然而,这两个[CFR]估计[的14。 6%的41名患者队列和2.9%的2.9%的所有835个病例证实在写作时]_应该非常谨慎对待,因为不是所有的患者已经结束了他们的疾病(即,恢复或死亡),真正的感染数量和完整的疾病谱是未知的。重要的是,在新出现的病毒感染暴发中,由于病例检测高度偏重于较严重的病例,因此早期的病例死亡率往往被高估。随着关于轻度或无症状感染谱系的进一步数据的出现(Chan及其同事记录了其中一例),病例死亡率可能会降低。 _”

还有一篇后来的论文,名为 “Epidemiological and clinical characteristics of 99 cases of 2019 novel coronavirus pneumonia in Wuhan, China: a descriptive study”,作者为Chen et al.,发表于1月30日,研究了99例在1月1日到1月20日之间诊断的患者队列,并报道在这个队列中CFR为11%。然而,该研究只对这些患者进行了跟踪调查,直至1月25日,此时其中一半以上的患者(99人中有57人)仍在住院治疗。

19
19
19
2020-02-03 20:17:53 +0000

你使用的死亡率方程只有在非常长期的已知疾病中才真正有用,那时大多数病例已经痊愈。

在短期内,当绝大多数病例既没有死亡也没有康复时,它的信息量并不大。

现在,绝大多数被诊断出的人病情轻微,死亡的可能性很小,但要把他们列入 “康复 "的行列,需要很长的时间。此外,许多已经死亡的人特别脆弱。来自WHO。

与其他呼吸道疾病一样,感染2019-nCoV会引起轻微的症状,包括流鼻涕、喉咙痛、咳嗽和发烧。对某些人来说,它可能更严重,并可能导致肺炎或呼吸困难。更为罕见的是,这种疾病可能是致命的。老年人和已有疾病(如糖尿病和心脏病)的人似乎更容易受到病毒的严重影响。

您在新闻中看到的死亡率估计可能是基于死亡/病例,或者是基于专家对过去流行的冠状病毒株的比较和对典型病程的了解。

此外,我们不知道这些数字有多准确,尤其是病例。可能还有很多轻度病例没有被报告。

在更多时间过去之前,我们不会对实际死亡率有很好的估计,即使在这种情况下,单一的数字也不可能有很大的参考价值。相反,风险会因年龄和其他因素而不同。好的信息来源,比如WHO,不会报告死亡率:他们目前只报告病例和死亡情况。

一些好的信息来源。 https://www.who.int/emergencies/diseases/novel-coronavirus-2019 https://www.cdc.gov/coronavirus/2019-nCoV/summary.html https://www.nhs.uk/conditions/wuhan-novel-coronavirus/

11
11
11
2020-02-04 15:34:55 +0000

我想在这里解释一下问题中提供的计算方法到底错在哪里,而不是只说 “这是一个错误的公式"。了解这个谬误的 "原因 "很重要。所以我试着从数学的角度回答你的问题

TL;DR:这个谬论的根本原因是,恢复的时间比死亡的时间长得多.

(Nd / (Nd + Nr)) * 100 = 41% 其中。Nd是死亡的总人数, Nr是完全康复的总人数。

这个公式(以及背后的逻辑)是正确的,只要NdNr都是指同一批固定的人。也就是说,如果我们选取了N感染者,等待他们全部达到最终状态(康复或死亡),然后把这些NrNd放到上面的公式中–那么是的,它将给出该组的统计死亡率。但该群体中的所有感染者的最终结果尚不清楚。每天的Nd只指所有感染者中的一个亚群(不包括那些未知的人),明白吗?所以,你不能把NrNd从WHO的报告中拿出来,然后把这些数字放到那个公式中–那将是苹果和橙子…..

为了说明这一点,可以考虑一个严重简化的假想情况: 有一种疾病可能在第3天就会导致死亡,而其余的感染者在第15天就会完全康复。在这种情况下,官方报告中的Nr将包括3天前及之前的所有感染者,而Nd将包括15天前及之前的所有感染者。考虑到每天都有大量的新确诊病例出现,这两组病例之间的差异是巨大的:这是所有在12天内被感染的人!

在我们的实际情况中,这个差异远远大于NrNr的总和,这意味着忽略这个差异带来的误差使计算完全没有用处。(嗯,它作为一个绝对的上限是有用的,但已经没有了)。

3
3
3
2020-02-06 10:30:02 +0000

根据前面的回答,在2019-nCoV这个早期阶段,Nd/(Nd+Nr)是高估者,Nd/Nc是低估者。

由于目前被调侃的速率与低估者Nd/Nc相匹配,所以你说2019-nCoV比通常所说的更 “危险 "是正确的。我用了引号,因为危险一个别扭的词。

注意到Nd/Nc在疫情结束后等于Nd/(Nd+Nr),更好的估计是跟踪这两个商在一段时间内的情况,并将它们的曲线外推到它们的相遇点。这仍然会是一个有偏差的估计,但比任何一个单独的估计都要小。我猜测还有更复杂的估计器,偏度更小,我把这个问题贴在这里了。 2019年nCoV死亡率的精密估算是什么?