董恩生(右)和杜宏如(左)在约翰霍普金斯大学疫情追踪图的背后投入了大量的心血和心血。(照片由受访者提供)

美国约翰·霍普金斯大学的新冠肺炎肺炎疫情跟踪地图每天在全球平均有10亿次点击。它的核心团队是两位风华正茂的中国年轻人和他们年轻的女导师。董恩生,30岁;25岁的杜宏如是去年秋天进入约翰·霍普金斯大学的一年级博士生

作为中国学生,董恩生和杜宏如比大多数美国科学家更早地对新冠肺炎疫情表示担忧和关注。正是这种专业敏感度和对疫情信息敏感度的叠加,让他们更早的认识到制作世界疫情地图的意义和价值

东部时间5月7日,美国约翰霍普金斯大学疫情追踪图显示,全球确诊SARS-CoV-2感染病例375万余例,死亡26万余人;美国确诊病例超过122万,死亡人数超过7.3万。

地图背景黑暗,疫情红色。数字简单抽象,每一刻钟更新一次,不断变大,大到让人不知所措。它们是沉重、刺痛的眼睛。

SARS-CoV-2已经造成超过26万人死亡,其中大部分是沉默和孤独的。在垂死的病房里,病人看不到亲人,死后没有葬礼,他们的生活故事也不会出现在报纸上。死亡人数太多就像一个黑洞,让死者失去了名字和面孔。

然而,数字仍然很重要。它不仅对政府和公共卫生机构的决策者很重要,而且对制定风险评估和疫情趋势预测模型、进行社会人口分析和其他领域的研究人员也很重要,对疫情阴影下的所有人也很重要。

这份疫情图,目前还在充实和细化中,全球日均点击率为10亿次,最大日点击率为45亿次。它是政府、研究人员和主流媒体引用最多的流行病数据源。这个疫情图也带动了美国各州以及世界上很多国家的政府或者非政府组织制作类似的疫情图,提高了数据的准确性,从而增强了民众的知情权。

地图后面

但很多人直到最近才知道,这款风靡全球的疫情追踪地图的核心团队,是两位风华正茂的中国年轻人和他们年轻的导师。

董恩生,30岁;杜宏如,25岁。都是去年秋天进入约翰霍普金斯大学的一年级博士生。两人名字里都有儒家文化。

他们的导师是劳伦.加德纳,一名副教授,只有35岁,研究建筑。去年在约翰·霍普金斯大学任教之前,她是澳大利亚悉尼新南威尔士大学土木工程的高级讲师。目前,她只从中国带了这两个学生。

他们的部门叫做土木工程和系统工程系,似乎和流行病学和病毒学没有关系。但是没有什么事情是突然发生的。

董恩生说,这是世界上第一张实时更新的疫情地图,创意的正式创作来自于1月21日上午他和导师在图书馆喝咖啡,这是师生见面交流的一种常规方式。两个人想法都一样,“一拍即合”。

在和导师见面之前,他已经开始收集资料,做准备。“一开始是为了学术研究的目的,很简单。”

那天晚上,董恩生花了七八个小时输入数据,制作描图,一直到凌晨三四点。经过复习、修改等程序,导师于1月22日首次在社交媒体Twitter上发布了第一版疫情世界地图,刚好赶上北京时间1月23日武汉宣布“闭城”。

董恩生说刚开始几乎没有现成的模板可以申请,一直在输入数据和坐标。当数据在世界地图上一一呈现时,他逐渐意识到这是第一次在全球范围内实时更新疫情地图。

和导师喝一杯咖啡,开七八个小时的夜车,开始一项世界首创。就这么简单易行吗?

在美国总统选举中,政客们在为一个候选人背书时,有一句俗话,就是称赞候选人“为此准备了一辈子”。董恩生和杜宏如都很年轻,但是以他们的学习和工作经验来说,真的可以套用这句话。

董恩生表示,毕业于重庆西南大学地理系,2012年赴美留学。获得硕士学位后,曾在美国地方政府的it与卫生部门、软件公司、电力公司、电信公司实习。

他接受过地理学和统计学方面的正规学术培训,目前的研究领域包括网络科学、移动性建模、机器学习、空分析和可视化以及传染病的跨学科研究。在新冠肺炎疫情爆发前,他曾参与预测美国和太平洋岛国和地区的麻疹风险以及斯里兰卡的登革热。

杜宏如也有跨学科背景。他是天津大学化学工程学院2017届毕业生。他在爱丁堡大学学习化学材料科学,在威斯康星-麦迪逊大学学习工业工程和运筹学。

擅长数学建模和路径优化,主要研究兴趣包括流行病学大数据处理、网络优化和数学建模,以研究和预测全球流行病的发展。2月1日加入疫情地图团队,他写了自动数据更新的代码。

他说,病毒传播不妨认为是一种网络,所有的县都是网络节点,每个节点之间的人口流动构成了一种联系。无论是通过数学建模预测疫情趋势,还是分析人口社会学,系统科学都非常重要。

作为中国学生,董恩生和杜宏如比大多数美国科学家更早地对新冠肺炎疫情表示担忧和关注。正是这种专业敏感度和对疫情信息敏感度的叠加,让他们更早的认识到制作世界疫情图的意义和价值。有了之前的学术训练和经验积累,他们不仅可以在大脑中“思考”,也自然有了“做”的能力。

但是“做”并不比“想”容易。从1月下旬到现在,董恩生和杜宏如投入了大量的精力和劳动,对疫情图进行升级、完善和维护,对疫情数据进行相关研究。

在手动输入阶段,他们每天工作10个小时左右。3月中旬过渡到自动数据更新期间,每天工作量达到十五六个小时,导师陪着他们一直工作到凌晨三四点。即使在团队扩大到50人左右,数据实时自动更新后,每天也只需要五六个小时,甚至十个小时就可以对数据进行审核和纠正。

恶魔往往隐藏在细节中。4月13日,约翰·霍普金斯大学新冠肺炎疫情统计网站制造了一起乌龙事件,误报全球确诊人数超过200万。原因是佛罗里达州的实际病例数被误填为123,019例,导致误差超过100,000例。但不久之后,他们将数字调整回190万左右。

在疫情图的维护中,检查数据以确保其准确性很重要。杜宏如表示,由于美国疾控中心的数据比较滞后,他们主要依靠在推特上捕捉美国当地媒体和各州卫生官员报道的数据,而其他国家和地区的疫情则基于世界计量仪和当地媒体等网站。由于更新时间早于官方数据,团队会在电脑自动更新后的第二天用各州疾控中心的数据核对美国疫情数据,其他国家和地区的数据用WHO的数据核对。

[科学技术]绘制全球疫情实时地图的中国留学生

董恩生说,为了保证数据的准确性,他们还采取了四项措施,一是保留数据的原始记录,每次更新都有追溯记录,二是汇总时间序列表,三是列出所有的更正记录,四是组织人工验证。

值得一提的是,在约翰霍普金斯大学的疫情地图背后,活跃着更多的中国年轻人。

据董恩生、杜宏如介绍,目前运营团队约有50人,其中数据验证团队的志愿者主要是来自各个部门的中国留学生。中国提供的疫情数据为国际研究做出了不可磨灭的贡献。应对新冠肺炎疫情为中国开展跨学科国际传染病研究、加强全球公共卫生参与、提高政府部门和研究机构疫情数据的可视化和国际化提供了新的机遇。

突出

在董恩生和杜宏如看来,约翰霍普金斯大学的疫情地图脱颖而出,得益于诸多因素,主要有以下八点原因:

一是早,世界领先一步,与后来出现的其他疫情图相比,数据更准确更快捷;二是在流行病学上更专业。美国疫情精确到县级,对科研人员和公众都有很大用处;三是地图绘制中的专业性;四是数据公开透明,所有数据上传到github,为全球所有政府决策部门和研究人员提供开源数据;五是保证及时更新,用户参与度高。德国、法国、意大利等非英语国家的很多用户会主动举报当地媒体报道的最新疫情,比等待官方审核渠道确认数量要快得多;第六,疫情图的设计有很高的黑红对比,构成很强的视觉冲击力;第七,约翰·霍普金斯大学在全球医学和公共卫生领域享有很高的声誉,使得疫情图从一开始就具有权威性,这是普通大学仅靠学校声誉难以获得的;第八,从最初的导师推特到各国媒体报道,产生了社交网络和媒体传播的雪球效应。

[科学技术]绘制全球疫情实时地图的中国留学生

从日内瓦的世界卫生组织总部,到纽约的联合国总部,到华盛顿白宫的疫情会议,甚至《纽约时报》等美国主流媒体,大部分也在使用他们的统计数据。

但董恩生指出,疫情图和数据并不能完全反映一个国家抗击疫情的能力。目前,国际社会缺乏关于疫情报告的全球指导文件和统一的报告标准。各国各地区统计标准不同,病毒检测水平不同,人们对疫情的看法也不同。

在欧洲和美国,也有许多统计混乱、缺失和重叠的现象。比如美国监狱系统分为联邦监狱和地方监狱。联邦监狱的疫情是否包含在各州县的统计中,不得而知。由于犯人隐私和相关法律,很多地方不愿意公布监狱疫情。在州县交界地区,出院或转院的病人经常跨州,如何统计也是一个难题。另外,考虑到可能的重复计算,美军疫情在疫情图中并未统计。

[科学技术]绘制全球疫情实时地图的中国留学生

世界上有时候会有一个“数据参考周期”,即相关网站的数据可能来自约翰霍普金斯大学的疫情图,因此需要仔细筛选,不断提高直接获取数据的能力。

董恩生认为,虽然美国疫情严重,但从科研和大数据创新的角度来看,很多做法值得借鉴。

比如各种疫情预测模型的分析层出不穷,相关研究可谓“八仙过海,各显神通”。无论面对学术界还是公众,这种数学模型分析都是非政治化的。无论预测是对是错,都可以营造一个公共卫生对策的讨论空间,催生许多新的思路和新的对策。

追求多学科情报整合,“跨界”特色突出。在美国,本科可以跨专业选择。董恩生在美国获得理学硕士并攻读工学博士并不少见。要避免疫情图的单一呈现,需要地理、计算机、疾病传播的学术背景。

事实上,约翰霍普金斯大学系统科学与工程中心是去年更名的,此举本身就凸显了“跨界”的色彩。董恩生说,系统工程本身在美国是一个新领域。除了疾病传播,它还与公共卫生学院和美国医院系统合作,包括ct扫描、人工智能等项目。

另外,在科研领域,我们不讨论资历,这样有能力的人才能相对顺利的脱颖而出。培养科研创新氛围也很重要。董恩生、杜宏如和他们的导师加德纳都是去年进入约翰霍普金斯大学的“新人”。他们推出的疫情图在资金、服务器维护、图书馆资源、运营团队建设等多方面得到了学校的迅速支持。

约翰·霍普金斯大学在全球公共卫生领域的声誉给了他们一个优越的平台,但他们作为“新血液”所带来的生机、活力和动力反过来又为学校品牌增添了黄金。

董恩生和杜宏如都对他们的导师加德纳副教授既敬佩又赞赏。据他们说,这位年轻的女导师经常在凌晨两三点工作,审查和指导学生的工作,处理错误的反馈电子邮件,与有关方面协调,并向政府和国会报告...虽然她有很高的学术热情和专业敏锐度,但加德纳不否认学生的工作和贡献,为学生提供很多机会,注重帮助和保护学生。

[科学技术]绘制全球疫情实时地图的中国留学生

更难能可贵的是,他们“很有原则”,坚持数据公开,拒绝疫情图商业化。一些一流的美国公司提供高额资本和慷慨的合作条件,看似“双赢”,但团队依然拒绝,坚持公开分享,反对与业务过度联动。正是这个原理,使得约翰霍普金斯大学的疫情追踪图获得了更广泛的公众影响力。

五月转眼就到了。现在约翰霍普金斯大学的疫情追踪图已经有了几个版本的升级,数据分类更加丰富详细。在世界疫情地图上,不仅有180多个国家和地区的确诊人数,还有各州、各省的确诊人数。除了累计确诊人数外,还有未痊愈患者人数、发病率、确诊病例死亡率、检出率、住院率等重要数据。在美国的疫情图中,不仅有各州确诊人数、人口比例、死亡率,还有美国确诊人数最多的50个县,死亡人数最多的20个县。

[科学技术]绘制全球疫情实时地图的中国留学生

此外,还有专门的章节分析一系列判断疫情的重要数据,包括美国各州疫情的种族分布;每10万人口中确诊病例和死亡人数的全球比较;在全球疫情最严重的10个国家中,决定疫情曲线如何拉平的每日新增病例数据等...

杜宏如说,可靠的数据是研究和决策的基础。从约翰·霍普金斯大学疫情追踪图的大量访问中,我们可以看到对可靠客观信息的巨大需求。随着疫情图影响力的扩大,他感受到了更多的压力,对数据的更新和核对也更加谨慎。这是全世界面临的重大公共卫生事件,疫情图的意义超出学术研究本身。

董恩生说,疫情爆发以来,他一直忙于更新数据,升级疫情图,“忘记生活是什么样子的”。“对我来说,工作从来没有停止过,越来越多,而且越来越重。有时候突然一抬头,看到疫情就在身边,世界真的变化这么快。”

相信董恩生和杜宏如一定会被疫情中的青年深深打动。疫情终将过去,世界变化的步伐不会放缓。祝福两位中国年轻人越走越远。(记者许)

标题:[科学技术]绘制全球疫情实时地图的中国留学生

地址:http://www.heliu2.cn/xw/10295.html