工商百科
邬贺铨:大数据助力疫情防控
发布时间 : 2021-01-29 18:15:43
近日,中国信息化百强委员会顾问、中国工程院院士、中国咨询委员会互联网学会理事吴作为主讲人,围绕“大数据助力疫情防控”这一主题,深入分析了大数据在支持和服务疫情防控工作中的重要作用。
中国信息化百强委员会顾问、中国工程院院士、中国互联网协会顾问委员会主任吴和珍
以下是演讲稿的终稿:
大数据有助于追踪和监控疫情
各位网友晚上好。今天我想讲讲“大数据有助于疫情防控”。Xi总书记指出,要利用大数据等手段加强疫情追踪监测,这是对大数据作用的肯定,也是对互联网界的要求。
手机成了另一张“身份证”
现在手机成了我们的另一张身份证。2018年中国移动通信普及率为112%,而全球普及率为106%,也就是说扣除一人以上,中国普及率为82%,接近发达国家水平,移动互联网普及率高于全球平均水平。可以说,我国几乎所有有独立行动能力的人都有手机,我国实行手机用户实名制,让手机用户可以识别持证人的身份。
移动电话可以与持有者的位置相关联
一般手机待机时,用户会从一个小区移动到另一个小区,此时手机会不断接收基站发送的测量信号。读取基站发送的重选小区参数,选择最优小区,实际上是在不待机时切换。因为用户可能在移动,并且小区半径相对密集,所以更新时间相对较快。目前的更新是二级,可以说是实时的。
手机是基于什么的?主要使用基站,有几种方法可以提高基站的定位。如果用更好的方法,定位精度可以几十米,目前一般可能一两百米。5G基站越密集,定位精度越高。
全球导航卫星+数字地图可以提高定位精度
当然,除了基站定位,我们还可以利用全球导航卫星和数字地图进行定位。现在智能手机的比例已经很高了,占手机用户的890%,智能手机配备了全球导航卫星接收的能力。定位精度一般在几十米,以米为单位可以更好,但是无法定位室内用户。另外,数字地图公司有一些扫描这条街道的方法,所以它甚至可以定位每一栋建筑。
一般来说,如果手机用户下载数字地图APP并打开,启用定位功能,就会改变新的位置,向GPS发送信息。所以,你可以知道你在哪里。当然,它的定位精度比基站好得多。但仅限于拥有数字地图APP的用户。我们有一家知名的数字地图公司,目前用户数为7亿(下载),占全国移动用户不到一半,只有43%,所以覆盖面有限。但是,电信运营商虽然覆盖的用户越来越多,但精度不一定比数字地图公司好。
这里给出了一个数字地图公司的大数据地图,可以追溯到武汉春节前近500万人去过的地方,这里可以给出一个不错的走势。
有了这些数据,如何分析疫情的蔓延?国际上通常使用一种叫做SEIR的模型。它把人群分成了什么?就是已经感染了疾病的人,e是密切接触者,s目前是健康的,r是康复的人最后的手术结果,有一套规则。中国学者提出了改进的C-SEIR,增加了P和Q,P为疑似人群,Q为确诊人群。现在我国分为四类,从中可以计算出疫情传播模型。
我们可以看到,这是一个1月到2月9日的全国性疫情传播模型。我们可以看到传播的情况。目前我国修订后的模型考虑了政府的措施和公众的防疫意识,但以上模型仍然是以城市中的感染者和未感染者为基础,包括全部,这是一个常数,也就是说不考虑城市中的流入和流出。事实上,通过使用电信大数据,可以考虑一些进出的人,这可以使这个模型更加准确。
大数据可视化——“疫情”
当然,有了模型,很多大数据需要有一个可视化的表示。这里有一个可视化的方式。每个方框代表每个省。比如右下角的盒子——湖北,它的底色比其他的都深,就是感染者多。其中绿色是治愈率,黑色是死亡率。可见治愈率低于其他省份,但死亡率还是比较高的。可见这是一种直观的看法。
我们有关于这种行为的大数据,可以精确到每个细胞。左图为百度,以上海为例,右图为腾讯。以深圳为例,可以以一个APP的形式发布,普通人可以使用,下载查询,甚至可以查到哪个小区的具体位置,离你家有多远,有多少确诊病例。事实上,其中一家公司表示,它已经覆盖了200多个城市。
现在已经开始复工了,2月10号,放假后第一天复工。人流的增加也给疫情防控带来了一些新的压力。给出了疫情期间的城市热图,可以细化到每个县,让我们知道哪里人最多,尽量避开人口密集。
下面是一个确诊患者的行程追踪。从底层看,1月21日离开武汉,乘坐高铁,到达一个地方,1月21日换到另一个地方,直到24日才发现症状。当然他的行程还得继续,27号去了另一个地方,30号去了下一个地方,31号诊断。根据确诊患者的旅行痕迹,我们可以很好地知道他去过哪里。目前有些地方依靠流行病学调查来询问患者你去的时间和地点,一个是他记不住,一个是不确定,利用你手机的大数据就能很好的知道。同时,通过计费数据,你也可以知道他平时的亲密接触,也可以知道他是否是亲密接触。
以卫建委+交通+工业信息的数据寻找亲密接触者
结合卫健委的数据,交通系统的数据,工业和信息化部的数据,可以找出密切的联系。比如,卫健委可以知道确诊患者的姓名和身份证号,然后通过交通部,可以给出这个患者半个多月内乘坐的航班数。卫健委要求工业和信息化部询问这些人的手机号码是多少?根据手机号,当地政府可以找到关系密切的联系人,当然这是从官方搜索的。其实平台也是可以打开的,同行可以在同行查询平台上查到我的航班、车次、车厢,公交车上是否有确诊患者,可以很好的找到亲密接触者。
电信疫情大数据平台用于个人自证和无疫出行
目前是该下班回家的时候了。有些人向疫区隐瞒自己的经历。当他们回家回到村子时,他们仍然四处走动。虽然看似没有症状,但可能已经感染,传染性很强,导致疫情扩散,导致数十人甚至数百人被隔离或感染。通过手机定位,可以知道这个用户是来自疫区还是去过疫区,但这类数据不能直接提供给街道、社区、城镇。因为隐私保护的原因,如果我们向他们开放,可能不需要检查患者,但可能会用于其他目的,所以不能这样做。
现在该怎么办?我们知道,根据《个人信息保护法》,我可以查询自己的信息。因此,工业和信息化部现在协调三家运营商,为用户出行提供服务。当用户提出来的时候,你可以问问自己14天前去过哪里。当时工信部提出停留4小时以上。这个时候如果你有名单,可以去当地的用人单位,街道,社区证明你没有去过疫区。这是自我认证。目前,此事已开放询问数千万人。
现在面临复工,一些地方的疫情防控措施甚至有所扩大。对于一些确诊疫情数量较大的省份,要求所有人不准回来。严控不能失控,硬核不能混乱,所以其实回程有些巡查是必须的,当然会对行程有一定影响。这里举个例子,以高德地图为例,他给了一个人从济南到上海。列出沿途经过城市的疫情。还列出了上海对进入上海的人有哪些管理和要求,包括高速公路出入口的交通流量,以及需要多长时间才能列出行程。
电力大数据在疫情防控中的作用
除了电信和互联网公司的大数据,其实还有其他大数据。我这里说的是电力大数据。有人在家不在家可以根据用电量来区分。因此,国家电网杭州公司收集了1000多万条数据,开发了一种大数据分析算法,可以很好地知道是否有独居或独居的人,社区可以据此判断是否提供有针对性的服务。利用用电状态,还可以了解复工状态。从用电量来看,广东在2月14日已经用掉了正常用电量的60%,也就是复工率差不多60%。浙江2月14日的复工率不到1/3,尤其是疫情严重的温州,复工率仅为12%。这些都是可以宏观把握的复工趋势。
医学大数据有助于智能诊断
大数据不仅用来跟踪人,还可以帮助智能诊断。从目前的统计来看,COVID-19中只有30%的肺炎患者核酸检测呈阳性。虽然是病人,但确诊的只有30%。原因是什么?采样来自口腔。其实这里感染不严重,但是肺部严重。所以判断要以CT为依据,很难从一个肺扫描几百张这样的CT照片。通过使用大数据,我们可以利用人工智能技术将其还原为3D肺,更容易看到是否有纤维化,肺是否变成磨砂玻璃。同时,根据医疗经验,我们可以为肺炎患者的CT图像开发一个大数据分析和评估系统,这是医生不必看到的。这些CT照片可以放到系统上进行分析,可以帮助医生分析病灶。在过去,医生可能要看五个多小时,但现在他们可以在几分钟内完成,因为它把数百张纸变成了一张。
大数据在SARS-CoV-2肺炎新药和疫苗开发中的作用
大数据本身也将在新冠肺炎新型肺炎药物和疫苗的开发中发挥作用。总的来说,新药开发的过程比较漫长,在临床上还有很多工作要做,如新药的筛选、活性评价、药理分析、安全性评价等。目前没有特效药,所以另一种方法是用旧药换新药,重新检查一些过去的抗艾滋病和流感药物,看看是否有可能对新冠肺炎肺炎有效。众所周知,市场上和临床试验中的药物有近万种。一个个筛选需要很长时间,现在积累数据也不容易。如果能积累更多的数据就更好了。这里以清华大学药学研究所为例,它的人工智能药物研发大数据平台,已经收集了以往冠状病毒研究涉及的900多个小分子的实验信息,利用这些信息可以加快药物筛选的速度。
大数据优化了医疗短缺物资的生产组织和调度
大数据对于优化医疗紧缺物资的生产组织和调度也很有用。海尔开发了疫情医疗物资信息共享资源采集平台,一方面连接医院和780多家医院;另一方面,它接触了有需要的社区和500多家能够生产这些医用材料的企业,并发布了5000多万件这种需求。此外,其采购不仅限于中国,还面向全球,实现了抗疫资源的精准对接。湖北有一个志愿者开发的医疗物资需求平台。它在网上抓取数据,按照城市医院的类型进行分类,列出需求、交通、联系方式。四川还开发了应急物资防控管理系统,整合了物资的入库、调度、审批、库存和日常消耗需求,提高了应急物资调配的调度效率。当然,这些数据都是从网上获取的。
现在有什么问题?我们的卫健委并没有得到所有医院的床位数据,因为过去没有联网,这让我们无法实时了解哪些床位是过剩的,哪些是可以调度的。因此,这也表明我们过去在这方面的工作是不够的。
相关数据的融合会得到更有价值的结果
另外,数据需要合并。现在很多小区都实行封闭式管理。现在有网上专门的筛选应用,不需要手工注册,用手机扫描身份证,报体温,自动连接数据。也可以记录下去药店买药发烧咳嗽的人的实名数据,因为有的人已经病了,自己不去医院买药,其实风险很大。我们也可以结合公交卡和网络车的数据。这次疫情也考验了我们联合防控的协调调度机制,包括跨部门大数据的协调能力。
大数据合作企业复工
现在该回去工作了。许多企业需要工人,但人员的密集流动有风险,因此企业面临困境。杭州采用绿、红、黄三卫生代码管理模式,可以区分用户是否接触过确诊患者或疑似患者,是否来自重点疫区,隔离时间长短。但是,你会担心报告是不是真的。这里健康码要和云挂钩,和网上掌握的数据匹配。大数据可以找出虚假信息。
大数据和隐私保护
大数据是把双刃剑,如何保护隐私。电信的大数据其实只考虑信令和计费,不包括通信内容,但尽管如此,患者的行为数据也是敏感的。电信大数据目前仅限于疫情控制,疫情结束后不会保留相关原始数据。现在需要注意的是,除国务院卫生部门依法授权的机构外,任何单位和个人不得以疫情防控和治疗为由,未经被采集人同意,采集用户的个人信息。这里很难。我们必须保护个人信息,使用大数据进行预防和控制。我们做什么呢一种方式是原始数据是可用的,不可见的。什么是可用的,什么是不可见的?相关部委、卫健委、交通部、公安部、工信部等。可以报告数据样本,帮助疫情大数据分析和调试平台调试我们的算法和程序。程序调试完成后,会分发给相关部委,在各自领域运行,产生效果。最后上报给上面的结果都不是原始数据。这样不改变数据的所有权和存储位置,只带走没有敏感数据的分析结果。
流行病大数据系统的信息安全保护
流行病大数据也需要特殊的安全保护。从右上角的图可以看出,绿色是健康数据,健康数据是黑客关注的焦点。甚至在2014年,我国的网站受到医疗卫生网站攻击最多。据美国统计,被黑客泄露的医疗数据损失非常高,疫情大数据不仅是商业利益问题,还关系到国家政治和社会问题。我们以为疫情大数据系统是内网,其实内网也会被攻击。在疫情大数据系统中,要定义访问权限和流程审核,使用各种安全措施来保证安全。
为什么新冠肺炎的大数据流行的晚
为什么新冠肺炎疫情的大数据来得晚?它显示谷歌在一年中的某个时候患了流感,谷歌比疾控中心提前一周报告了流感,相似度为97%。可以提前预警,但是中国疫情的大数据基本起不到预警作用。为什么?网上的人说,你讲的这么好,怎么不早说?原因是网上的信息很多,传染病根本没有被列为互联网社区的重点。此外,在发现不明原因肺炎之初,医疗机构信息中心未能对十余例疾病进行分析,无法掌握病毒控制的主动权。应该说很遗憾,我们的信息技术人员不够敏感。
大数据取决于真实数据的开放性
另一个更重要的原因是数据披露不及时。当发现原生动物为传染源时,病例较少,难以触发疫情大数据分析。电信和互联网公司的人类行为轨迹的大数据,当它从一个人发展到另一个人时,将是有用的。我们知道,武汉重症从发病到住院平均等了近10天,有的等不到住院。整个信息延迟了10天,病毒传播了一个多月,潜伏期14天左右。此外,官方媒体还发布了一些错误信息,如“无人类传播”、“可预防和可控制”。真实信息被视为谣言,疫情数据未发布。当公众知道病毒可以在人与人之间传播时,已经错过了防控的黄金时间,导致武汉疫情的爆发长期失控。这种数据发布不仅仅是为了大数据分析。华盛顿大学进行的一项研究,“当媒体报道量增加10倍时,感染疾病的数量将减少33.5%”,所以应该更有用。
大数据的应用需要法律保障
另外,大数据的应用需要法律保障。《传染病防治法》规定,有关部门应当对疫情进行报告和监测,但不清楚哪些地方政府有权收集当地经营者的疫情相关数据,政府应当公开哪些数据和信息。因此,我们建议颁布《传染病防治法实施细则》,明确省、市政府收集疫情防治数据的权限以及政府各部门和相关企业提供疫情防治数据的职责。
电信大数据有用但不足以疫情防控
电信大数据对于疫情防控有用,但不够。因为用户的信令数据是广泛的、实时的。其实每个用户平均每天有200条左右的信令数据,应该很好,也很详细。基站的定位精度只有100米左右。事实上,在100米的半径范围内,根据这个来确定密切接触者是不准确的,因为有许多人相隔100米和10米。卫星导航+数字地图的定位精度优于电信基站,但对用户覆盖不够,两者结合可能更好。电信大数据在疫情防控方面起到了非常好的作用,但仍然有限。所以光靠电信大数据是不够的,需要和相关部委整合。
大数据是一种方法和辅助工具
大数据本身就是一种方法,整个医疗不仅仅是在医院,还涉及到院前、院后、院内管理,涉及到很多环节。大数据不仅是智能医疗的唯一方法,还应该与其他信息技术和医学专业知识相结合,这需要信息技术和医学界的密切合作。
标签
最后,与17年前的非典疫情相比,这次疫情是更严峻的考验。但现在,先进的医疗技术、大数据等新一代信息技术被用于科学预防和精确决策。在党中央的坚强领导下,在疫情防控的人民战争中,大数据应用环境将进一步优化,在精准联防联控政策中发挥更大作用。我们一定会打赢人民战争、总战和制止疫情的战争。
上一篇:不注册商标的后果有哪些 下一篇:注册一个商标什么时候能下来?