Data61使用机器学习来跟踪澳大利亚的人类传染病
联邦科学与工业研究组织(CSIRO)的Data61已经开发出一种工具来跟踪传染病,以及它们具体是如何传播到澳大利亚的。该工具使用贝叶斯推断(Bayesianinference),一种统计机器学习方法,用来了解一个地区向其他地区传播疾病的倾向。
该工具使用来自昆士兰登革热病毒暴发的数据作为案例研究,识别和跟踪澳大利亚新感染病例的原始来源,并将疾病如何在人与人之间传播联系起来。
根据Data61计算机科学家RajaJurdak的说法,传统的追踪感染路径的方法往往依赖于耗时的现场调查或与感染患者的旅行路径相关的访谈。
Data61已与昆士兰卫生部门合作,获取了15年来报告的登革热病例的完全匿名记录。Jurdak告诉ZDNet,这些记录是用来训练模型的基础事实。
他解释说:我们使用多种有关人员流动的信息来源,包括航班乘客数据、带有地理标记的社交媒体和游客调查,以了解人们如何在不同地区之间流动。
以人类运动趋势为出发点,我们的方法了解疾病如何在区域间传播,并使用实际报告的病例来验证结果。
Jurdak说,这种方法使Data61能够回顾过去,确定感染源,并预测未来疾病的潜在传播。
了解感染一旦到达澳大利亚后如何传播将为预测疫情何时何地可能发生提供机会,使医院和生物安全机构尽可能做好准备。
然而,该项目面临的一个挑战是,Data61处理的是不覆盖所有人口的移动数据。
Jurdak告诉ZDNet:这就是为什么我们选择结合多个数据源来研究人们的移动方式,这样一个数据集的任何偏差都可以被其他数据集抵消。因为我们使用了实际报告的案例来训练和验证我们的模型,所以我们相信该模型对单个数据集的限制是稳健的。
该工具是更广泛的疾病网络和移动(DiNeMo)项目的一部分,该项目旨在开发针对人类传染病的实时警报和监测系统。Data61预计它将为人类疾病传入澳大利亚的行为提供新的见解。
Jurdak表示,该工具可用于监测和跟踪其他疾病暴发,包括人、动物之间的传播,或通过寄生虫、病毒和细菌等媒介传播的疾病。
因为我们使用人和动物的运动作为底层驱动的疾病的传播,我们可以运用我们的方法广泛的暴发,我们有一些信息代理人类和动物的运动参与传播的过程,他补充道。
该工具的其他应用实例包括疟疾,它也通过蚊子传播,以及动物的口蹄疫。