27岁的中国年轻人一战成名!创建美国新冠疫情最新预测模型,一人翻转专业机构,彭博:Superstar-量子比特

以27岁的年轻年龄被彭博评价为「新型冠状病毒数据超级明星」。为什么?凭借一个人的力量,仅用一周时间就建成的新冠预测模型,在精度方面已经碾压了数十亿美元、拥有数十年经验的专业机构。

他是YouyangGu,MIT电工和计算机科学硕士学位,并拥有数学学位。但值得注意的是,他在医学和流行病学等方面是清白的。他的模型,也是著名的数据科学家,“fast.ai”的创始人“Jeremy Howard”,不仅如此,他的模型被“美国疾控中心”所采用,评价很高。到底是什么样的预测模型呢。时间可以追溯到去年年初。当时疫情已经蔓延到全世界,公众试图建模,预测下一次疫情的影响。很多人的目光都指向了总部位于西雅图的健康指标评价研究所(IHME)的2个专门机构构建的预测系统“伦敦帝国理工学院”。但两个机构给出的预测结果却是天差地别。伦敦帝国理工学院:到了夏天,美国因新型冠状病毒死亡的人数将达到200万人。IHME:8月之前死亡人数预计将达到6万人。(根据后来的事实,死亡人数为16万人。)两个专门机构得出的预测数据为何差距如此之大。当时26岁的YouyangGu备受瞩目。

◆YouyangGu他没有任何医学和流行病经验,但他相信数据预测在这个时候是有用的。因此4月中旬左右,YouyangGu在自己家仅仅一周,构筑了能够显示自己的预测器和相关信息的网站。

?虽然是Youyang(Gu、制作的网站,但是Gu在这个过程中使用的方法并不那么高级,反而比较简单。他首先想到的是新冠病毒的检出数、住院人数与其他因素的关系,但在这一过程中,Gu发现州或联邦政府提供的数据并不一致。这个时候,问题来了。什么样的数据值得信赖呢。Gu最可靠的数据似乎是每天的死亡人数:关于其原因,Gu解释为“将其作为唯一的输入,有助于在噪音中过滤信号”。那么,预测结果如何呢。可以说相当正确吧。在模型刚完成时,他预测5月9日美国将有8万人死亡,当天实际死亡人数为79926。同样来自IHME的预测数据显示“2020年的年死亡人数不超过8万人”。Gu另外,5月18日,预计死亡人数将达到9万人,5月27日,死亡人数将达到10万人。事实证明,他的这两次预测再次“押中”!除了准确的数字预测之外,Gu根据许多州从封锁状态逐渐转变为开放状态,预测第二波大规模感染和死亡。并且Gu做出这样的预测的当天,特朗普说了的言词「IHME预测了的6万人的死亡人数,表示疫病马上结束的事」……。也许正因为Gu的模型预测精巧,越来越多的人关注他的作品。Twitter中,Gu不仅让各方记者@,还让流行病学专家发短信确认自己的数据。

去年4月底,华盛顿大学著名生物学家卡尔贝尔格斯特罗姆在Twitter上发表了Gu的模型。

不久美国疾病控制和预防中心,那个新冠预测网站也发表了Gu的数据。不仅如此,随着感染的扩大,来自中国的移民Gu也参加了美国专家组的定期会议,每个人都想更好地改善他的模式。他对网站的访问也爆发性地增加,每天有数百万人来看他的数据。通常,该模型预测的数据在大约几周后到达,并且非常接近实际死亡人数。随着类似预测模型的增加,阿默斯特马萨诸塞大学生物统计学和流行病学系副教授Nicholas Reich统计了50个这样的模型。但是,到了去年11月,Gu做出了意外的决定。结束他的预测任务。对此,Reich评价说:“在Gu决定停止事业的前一个月,11月1日的死亡人数预计将达到231000人,但实际死亡人数为230995人。”。但IHME的Chris Murray表示,对此,Gu并未回应该模型的评价,相反,休息一段时间后,Gu再次投入该项目。

这次要预测“美国有多少人感染了新型冠状病毒”、“疫苗的上市速度有多快”、“美国什么时候可能达到集体免疫”等。据他预测,截至今年6月,美国约61%的人口无论是疫苗还是过去的感染,都应该获得某种免疫力。……Gu我一直希望找到一份既能避免政治、偏见,又能避免大型机构有时所承担的负担,又能对社会产生巨大影响的工作。他想:谁是YouyangGu?出生于美国华裔移民家庭,在伊利诺伊州和加利福尼亚州长大。Gu从小就喜欢数学和科学,直到高中毕业,才真正接触计算机科学。他之所以能进入这个行业,是因为他的父亲是一名计算机运营商。

?正在进行化学实验的GuYouyang(照片是克拉克奖学金项目2010)Gu本科硕士都在MIT就读,在那里取得了计算机科学和数学的二学士学位,还有计算机科学的硕士学位。毕业后,他在以“MIT”闻名的CSAIL实验室NLP集团持续研究了一年,同年在EMNLP2016上发表了论文。

这也是他第一次接触大数据,从而建立了统计模型来预测数据。但他并没有因此继续进行学术研究,而是进入了产业界。在远离MIT之后,进入金融行业,为高频交易系统创建算法。于是,他的数据建模能力得到了进一步的磨练。因为在金融交易中,数据必须非常定量并且尽可能准确。之后,他还进入了体育界,继续研究大数据。这为他提供了丰富的校际经验,使他能够成功地进入新的领域,了解如何更准确地建模。

用他自己的话来说,他的专业是使用机器学习来理解数据,分离信号和噪声来做出准确的预测。在建立新冠死亡模型时,他首先考虑了确诊数、住院数与其他因素的关系。然后他发现各州和联邦政府报告的数据不一致,最可靠的数字是一天的死亡人数。Gu如果输入数据的质量低,则认为数据越多输出的性能降低。一周内根据死亡数据建立了一个简单的模型,使预测网站上线。自去年4月以来,Gu已自主投入该项目数千小时,而且是无偿的。在医学网站Medscape总编辑埃里克托波尔的采访中,Gu透露了现在全职投入新冠预测网站,既没有打工也没有收入,靠过去的积蓄生活

▲GuYouyang接受了Medscape主编埃里克托波尔视频的采访,这种公益性项目遭到了一些Twitter网友的指责,但他坚持了这一点。从12月开始,covid19-projections.com接受网友捐赠,目前已完成5万美元的筹资目标。

除了感染人数之外,Gu的新型冠状病毒网站还出现了新的功能。从去年12月开始,covid19-projections.com开始追踪和模拟疫苗接种情况和群体免疫途径。本月,Gu又将“集体免疫”改为“恢复常态”。根据他的模型预测,美国不太可能在2021年达到理论上的集体免疫。

未来的路怎么走。疫情结束后,Gu的职业规划是?他说还为时尚早,他现在的工作是预测疫情的发展,但他很难预测自己在三个月或一年后会做什么。为了这份工作,世界各地的大学和企业纷纷抛出橄榄枝。参考链接:https://www.bloomberg.com/news/articles/2021-02-19/covid-pandemic-how-youyang-Gu-used-ai-and-data-to-make-most-accurate-prediction https://youyangGu.com/ https://Twitter.com/youyangGu https://covid19-projections.com/ https://www.medscape.com/viewarticle/944778

返回列表
上一篇:
下一篇:

文章评论