上线两个多月,全球用户每日点击频次近乎达到20亿次,这个由两名中国留学生完全一手搭建起来的新冠疫情数据地图,究竟是凭借何种缘由比世卫组织以及美国疾控中心更受信赖呢?1月21日,当导师向正在攻读博士学位的董恩盛提出建构一个类似船员仪表盘的新冠数据展示图的建议时,当时根本没人能够想到这个学术辅助工具最终会变成全球疫情数据的权威来源。
从一人手动到全球协作
1月底,董恩盛开始做这个数据图,那时完全是独自纯手工更新数据,每天盯着各国官方网站发布的信息,手动录入信息。然而,随着被感染的国家和地区不断增多,数据精细度要求持续提高,一个人称渐渐应付不来。到了3月初,团队成员杜鸿儒等人陆续加入,数据收集从手工操作转为半自动化,才勉强应对日均12亿次的使用量。
数据更新比世卫快一天
一天仅更新一回的是世卫组织的数据,几乎实时更新的则是约翰斯·霍普金斯大学的数据。杜鸿儒进行过一次对比,发觉总是在第二天世卫的数字才追上前一天所发布的数据。就像4月3日,当世卫组织全球确诊人数尚无百万之数时,他们的数据表明已然突破百万大关。
精度达到郡县级
相比其他机构的数据,JHU的数据精度更高,在美国达到了郡县级。众多美国民众给团队写邮件,对他们让自己看到生活区域疫情真实状况表达感谢。董恩盛解释称,他们的数据主要源自各国官方网站,举例来说,中国的数据来自国家卫健委与丁香园 ,世卫组织和美国疾控中心的数据主要起到核查作用。
每天收到上千封邮件
项目火了以后,团队的公共邮箱每日会收到一两千封有关数据图的邮件,杜鸿儒的个人邮箱同样会收到二三十封。然而压力也跟着来了,此项目极为特殊,数据不能停止更新,一旦更新出现故障,会对全世界的用户造成影响。学校为此特意建立了新冠研究中心网站,将所有相关资源聚合在一起。
收集数据比建模更紧迫
团队起初计划基于收集到的数据来构建流行病学模型,进而剖析疫情发展趋向。然而,数据采集的数量着实太过庞大,致使工作重点不得不从建模分析转变为数据收集。并且,制作模型所需的人口流动数据,诸多国家由于隐私保护的缘故而难以获取,举例来讲,若要证实中国封城举措的成效,就需要高铁、航空等方面的人员流动数据。
开放数据助力全球科研
团队研究结果初步发表之后,并未针对受影响地区逐个提出建议,而是将数据予以开放,以供全球科学家基于此展开分析。董恩盛察觉到中国国内诸多科学家借助这些数据发表了不少期刊文章,他觉得这些分析尽早发布更为有利,能够助力决策者更明晰地洞悉疫情严重程度,进而提供可行的方案建议。
倘若下次再有全球性公共卫生事件出现的时候,看到此处的我,想问大家这么一个问题,你是更倾向于相信官方机构所给出的数据,还是像JHU这般的学术团队所提供的数据这类情况,欢迎在评论区去分享你针对此的看法哟,点赞并转发以此让更多的人能够参与到讨论当中来。






