随着新型冠状病毒肺炎病例的不断上升,不少科学家对此次疫情的发展前景作出自己的预测。例如,1月21日,德国哥廷根大学教授于晓华就在社交平台上称,自己做了一个简单SIR模型,用SARS参数模拟武汉肺炎传播途径。他得出的结论认为:
从病毒暴发后的大概90天到达高峰。第一例发现在12月8日,50天左右开始集中暴发(1月20日左右,比较吻合),90天左右达到高峰(预计在3月上旬),4个月左右接近尾声(四月上旬),5月上旬疫情结束。从目前来看,这个模型预测还是吻合疫情发展情况的。
科学家是如何用模型来推算病毒的传播?传染病的传播过程是怎样的呢?不同传染病的传播过程是一样的吗?什么情况下,传染病的扩散会停止?每个人的传染程度相等吗?
在《模型思维》这本书中,圣密歇根大学复杂性研究中心“掌门人”斯科特·佩奇为我们理解传染病的传播规律提供了3种简单的模型工具。下文经授权节选自《模型思维》部分章节的内容。
《模型思维》,斯科特·佩奇著,贾拥民译,湛庐文化
浙江人民出版社年11月版
撰文丨斯科特·佩奇
广播模型
本章中介绍的所有模型都要假设存在一个相关人群,用NPOP表示。相关人群包括那些可能患上传染病、了解信息或采取行动的人。相关人群所指的并不是一个城市或国家的全部人口。如果我们要为连续主动脉缝合法的扩散建模,那相关人群就是指心脏外科医生,而不是居住在费城的所有人。
在任何时候,总会有些人患上了某种传染病、了解特定信息或采取了一定行动。我们将这些人称为感染者或知情者(用It表示),相关人群中除了感染者或知情者之外的其余成员则是易感者(用St表示)。这些易感者可能会感染传染病、了解信息或采取行动。相关人群的总人数等于感染者或知情者人数加上易感者人数的总和:NPOP=It+St。
广播模型刻画了思想、谣言、信息或技术通过电视、广播、互联网等媒体进行的传播。大多数时事新闻都是通过广播形式传播的。这个模型的目标是描述一个信息源传播信息的过程,可以是政府、企业或报纸。它也适用于通过供水系统传播污染的情况。但是,这个模型不适用于在人与人之间传播的传染病或思想。由于广播模型更适合描述思想和信息的传播(而不是传染病的传播),所以我们在这里说知情者的人数,而不说感染者的人数。
在给定时间段内,知情者人数等于前一期的知情者人数加上易感者听到信息的概率乘以易感者人数。按照惯例,初始人口全部由易感者组成。要计算未来某期的知情者人数,只需要将知情者人数和易感者人数代入上述方程即可。由此得到的将是一个r形采用曲线。
想象一下:某个拥有万居民的城市的市长宣布了一项新的税收政策。在他宣布之前,没有人知道这项政策。假设某人在任何一天听到这个新闻的概率等于30%(即,Pbroad=0.3),那么第一天会有30万人听到这个新闻。在第二天,剩下的70万人中有30%的人,即21万人会听到这个新闻。在每一个时期,知情者的人数都会增加,并且以一个递减的速度增加,如图11-1所示。
在广播模型中,相关人群中的每一个人最终都会知悉信息。如果有适当的数据,就可以估计出相关人群的规模。假设一家企业为练习太极拳的人推出了新设计的运动鞋,并在第一个星期就收到了双鞋的订单。如果在第二个星期收到了双鞋的订单,那么我们可以大致估计出他们最终的总销售量,也就是相关人群的规模为000。
当然,对于根据仅有的两个数据点估计出来的任何结果,我们都不应该抱以太大的信心。这个模型无疑遗漏了许多现实世界的特征。人们既可能通过传媒获悉相关消息,也可能通过口耳相传听到消息,而且有些人可能会购买不止一双鞋子,或者可能存在针对潜在消费者的广告,等等。如果把这些因素都包括进去,估计出来的结果肯定会有所不同。尽管必须牢记这个注意事项,但是这个模型确实提供了一个粗略的估计。这个企业不应该期望能够卖出万双鞋,但是应该有信心可以卖出不止000双鞋。随着更多数据的出现,估计结果是可以得到改进的。如果第三个星期的销售额是双(这等于模型预测的数量),那么这个企业对当初的预测可以寄予更大的信心。
扩散模型
大多数传染病,以及关于产品、思想和技术突破的信息,都是通过口口相传而传播开来的,扩散模型刻画了这些过程。扩散模型假设,当一个人采用了某种技术或患上了某种传染病时,这个人有可能将之传递或传染给与他接触的人。在传染传染病的情况下,个人的选择不会在其中发挥任何作用。一个人患上某种传染病的概率取决于诸如遗传、病毒(细菌),甚至环境温度等因素。在炎热潮湿的季节,疟疾的传播速度要比在寒冷干燥的季节快得多。
技术的传播则与采用者的选择有关,因此更有用的技术被采用的概率更高。但是在这里,我们并没有在模型中明确将这种情况选择考虑在内。这样一来,苹果智能手表的新潮性就发挥了与流感病毒同样的作用。
在这里,我们更看重的是信息的传播,因此我们将人们分为知情者或不知情的新人。如果新人与知情者相遇且信息在他们之间传播,那么新人就会变成知情者。这种事件的发生,因环境而异。生活在城市中的人,相遇的概率可能比生活在农村的人更高,同时也有更高的接触概率。非常吸引人眼球的新闻也比一般的新闻被分享的概率更高,例如,关于外星人降临登陆的新闻被分享的概率比关于M&M公司的椒盐卷饼重新上市的新闻更容易被分享。因此,我们可以将扩散概率(diffusionprobability)定义为接触概率(contactprobability)和分享概率(sharingprobability)的乘积。我们可以根据扩散概率来构建模型,但是在估计或应用模型时,必须独立地跟踪接触概率和分享概率。
扩散模型假定随机混合(randommixing)。随机混合的含义是,相关群体中任何两个人接触的可能性都相同。对于这个假设,我们应该保持警惕。就描述幼儿园内传染病传播的扩散模型而言,这可能是一个准确的假设,因为幼儿园里儿童之间的相互接触是高频率的。但是,如果将它应用于城市人口则是有问题的。在城市中,人们并不是随机混合的。人们在一定的社区中生活,在一定的场所内工作,他们属于工作团队、家庭和社会团体,他们的互动主要发生在这些群体中。但是同时也不要忘记,一个假设要成为有用模型的一部分,其实不一定非得十分准确不可。因此,我们将继续使用这个假设,同时保持开放的心态,在需要改变的时候随时改变这个假设。
在这个模型中,与在传播模型中一样,从长期来看,相关人群中的每个人都会掌握信息。不同的是,扩散模型的采用曲线是S形的。最初,几乎没有人知情,I0很小。因此,能够与知情者接触的易感者人数也必定很小。随着知情者人数的增加,知情者与不知情者之间接触的机会增加,这又使知情者的人数更快地增多。当相关人群中几乎每个人都成了知情者时,新知情的人数会减少,从而形成了S形的顶部。技术的采用曲线通常也具有这种形状。例如,杂交种子的采用曲线虽然因州而异(艾奥瓦州采用杂交种子的速度比亚拉巴马州更快),但是所有州的采用曲线都是S形的。
在广播模型中,根据数据估算相关人群规模是一件相当简单的事情。采用者的初始数量与相关人群规模密切相关。与此相反,利用扩散模型的数据估计相关群体的规模可能会非常困难。产品销售量的增加,可能是由于一个很小的相关人群内部的高扩散概率,也可能是由于一个很大的相关人群中的低扩散概率。
图11-2显示了两个假想的智能手机应用程序的相关数据。在第一天,每个应用程序都有人购买。在接下来的5天中,应用程序1拥有更高的总销量和更快的销量增长。如果没有模型,我们很可能会预测应用程序1拥有更大的市场。但是,用模型拟合这两组数据的结果表明,事实与我们猜想的恰恰相反。
应用程序1拟合的扩散概率为40%,相关人群规模为0人;而应用程序2的扩散概率为30%,相关人群规模为万人。4事实上,只要再过几天,我们就会观察到应用程序2的相关人群更大。但是,如果没有模型,如果不能根据前5天的数据来进行分析,我们就可能会对总销售额给出不正确的推断。
在使用扩散模型来指导行动的时候,我们必须将扩散概率分解为分享概率和接触概率的乘积。为了提高应用程序的销售速度,开发人员既可以设法提高人们相互接触的概率,也可以设法加大他们分享关于应用程序信息的概率。要想改变第一个概率是很困难的。为了增大第二个概率,开发人员可以为带来了新注册用户的老用户提供一些激励,事实上,许多开发人员都是这样做的,比如游戏开发者可能会给带来了新注册玩家的老玩家奖励游戏积分。虽然这样做能够增加扩散速度,但是并不会影响总销量,至少根据这个模型来看不会有影响。如上所述,总销量等于相关人群的规模,而与分享概率高低无关,提高销售速度不会带来长期的影响。
大多数消费品和信息都是通过广播和扩散传播的。而巴斯模型则将这两个过程组合在一起了。5巴斯模型中的差分方程等于广播模型和扩散模型中的差分方程之和。在巴斯模型中,扩散概率越大,采用曲线的S形就越显著。电视、收音机、汽车、电子计算机、电话机和手机的采用曲线形状都是r形和S形的组合。
SIR模型
到目前为止,在我们已经讨论过的模型中,一旦有人采用了一项技术,则永远不会放弃它。对于电力、洗碗机和电视等技术来说,确实如此:一旦采用之后,一般永远不会不采用。但这并不适用于所有通过扩散传播的事物,例如我们患上了某种传染病之后不久就会恢复健康,或者当我们采用了某种流行款式或参加了某项潮流运动之后(例如,某种时装或舞蹈),是以放弃的。遵循惯例,我们将放弃所采用的某种事物的人称为痊愈者。由此产生的模型,即SIR模型(易感者、感染者、痊愈者),在流行病学中占据了中心位置。
由于这个模型起源于流行病研究领域,同时也因为考虑传染病的痊愈更为自然,因此我们以传染病的传播为例来描述SIR模型。为了避免过于复杂的数学计算,我们假设治愈传染病的人会重新进入易感人群,也就是说治愈传染病并不会产生未来对传染病的免疫力。
流行病学家对接触概率和传播概率会进行单独跟踪,我们也会这样做。接触概率取决于传染病如何从一个人传播到另一个人。艾滋病通过性接触传播;白喉通过唾液传播;流感病毒通过空气传播。因此,流感的接触概率高于白喉,白喉的接触概率又高于艾滋病。而且,在发生接触后,各种传染病的传播概率也会有所不同。白喉比SARS更容易传染给另一个人。
SIR模型会产生一个临界点,就是所谓的基本再生数R0,也就是接触概率乘以扩散概率与痊愈概率之比。某种传染病,如果R0大于1,那么这种传染病就可以传遍整个人群,而R0小于1的传染病则趋于消失。在这个模型中,信息(或者,在这个例子中是传染病)并不一定会传播到整个相关人群。能不能做到这一点取决于R0的值。因此,像疾病控制中心这样的政府机构必须依据对R0的估计来指导政策制定。
如表11-1所示,麻疹可以通过空气传播,因而它的再生数高于艾滋病,艾滋病只能通过性接触和共用针头传播。对R0的估计假设人们不会为了应对传染病而改变行为。
然而,当学校里虱子肆虐时,家长的反应可能是让孩子待在家中,以降低接触概率,还可能会剃光孩子的头发,减少接触发生时传播的可能性。这两种行为变化都会降低虱子传播的R0。在没有疫苗的情况下,检疫是一个选择,但是成本很高。如果存在疫苗,那么疫苗接种可以预防传染病传播。即便做不到每个人都接种疫苗,也可以预防传染病传播。必须接种疫苗的人的比例,即疫苗接种阈值(vaccinationthreshold),可以通过公式VR求出。我们可以从上述模型中推导出这个公式。
疫苗接种阈值随R0的增加而提高。例如,脊髓灰质炎的R0为6,因此为了防止脊髓灰质炎的传播,疫苗必须覆盖5/6的人群。而麻疹的R0为15,为了阻止麻疹的传播,疫苗必须覆盖14/15的人口。疫苗接种阈值的数学推导也为决策者提供了指引,如果接种疫苗的人数太少,这种传染病就会传播开来,因此政府接种疫苗的次数会超过模型估计的阈值。对于麻疹和脊髓灰质炎等R0非常高的传染病,政府将努力保证所有人都接种疫苗。
有些人担心疫苗有副作用,选择不参加疫苗接种计划。如果这些人只占人口的一小部分,那么其他人接种疫苗也可以防止这些人感染这种传染病,流行病学家将这种现象称为群体免疫力。选择不接种疫苗的人事实上是搭了其他接种疫苗的人的便车。
作者丨斯科特·佩奇
摘编丨李永博
编辑丨徐悦东
校对丨翟永军