计算生物学的未来

   2023-09-23 17:46:30 50
核心提示:研究人类基因组需要对数十亿个碱基对进行测序。追踪一种流行病需要复杂的计算机模拟,其中包含多个影响其传播方式的变量。这项研究有一个共同点,没有强大的计算机,这一切都不可能实现。今天,生物学通常涉及大量的数据,而这些数据只能由超级计算机来分析。这种类型的大数据研究已经变得如此普遍,以至于在2015年,一组研

研究人类基因组需要对数十亿个碱基对进行测序。追踪一种流行病需要复杂的计算机模拟,其中包含多个影响其传播方式的变量。这项研究有一个共同点,没有强大的计算机,这一切都不可能实现。今天,生物学通常涉及大量的数据,而这些数据只能由超级计算机来分析。这种类型的大数据研究已经变得如此普遍,以至于在2015年,一组研究人员提出了一个问题:生物学中是否有任何领域不涉及计算?越来越多地答案似乎是一个响亮的“不”。生物学家不仅在野外工作,也在实验室工作;他们同样也使用计算机作为研究生活世界的工具。

生物学和计算机科学的结合改变了我们作为现代人理解自己在世界上位置的方式。想想看,在2016年,计算机模型是如何被用来探索从古代骨骼中提取的遗传信息,以探索现代人、尼安德特人和丹尼索瓦人之间的杂交程度。计算机,连同基因和解剖信息,帮助研究人员发现了关于人类进化的新见解。

近20年前,研究人员便预测了这一变化,并主张增加计算机资源。有时生物学家称之为“网络基础设施”。资助机构开始提供资助,帮助开发一套新的工具来改变生物学的面貌。开发数据共享、数据存储和高性能计算,以方便处理大型数据集。然而,随着工具的丰富出现了一个重要的问题:这个领域的人真的知道如何使用这项技术吗?

研究团队进行了一项调查:世界上顶级生物学研究人员正在做的以及他们的数据,如何处理,他们是否认为计算处理已经在生物学的各个领域十分普遍。

2017年发布的一项调查结果令人震惊。在704名参与调查的研究人员中,近90%的人正在处理或即将处理大型数据集。他们用各种各样的数据来回答生命科学中的问题,包括DNA和RNA序列数据、图像、表型信息,甚至从样本的微观检验中收集的数据。超过四分之三(77%)的人在研究中使用了不止一种数据。

很明显,生物学家现在真正需要的不是更多的工具。相反,他们需要能帮助他们发展利用现有资源方面的专业知识。简言之,他们最想要的是培训:关于如何使用多种类型的数据得出结论的培训,关于如何对TB级数据进行分析的培训,以及关于如何最好地使用云计算进行高性能计算的培训。

一方面研究人员提倡进行更多的计算机培训,另一方面,许多人已经开始将他们现有的技能整合到本科教育中。根据2009年美国国家科学基金会和美国科学促进会的一份报告,教育工作者把生物学看作是真正的跨学科科学,利用计算机科学来改进生物学课程。

为了继续推进生物研究,我们需要提供机会,从高中开始磨练每个层次的计算技能。然而,将大数据纳入课堂只是一个开始。需要广泛提供面对面和在线的专业发展机会,以帮助发展和保持职业生涯中后期研究人员从事生物研究的必要技能,特别是在人工智能等计算工具不断发展的情况下。

今天的生物学家作为一个群体,需要更多的培训来提高他们作为21世纪计算机研究人员的技能。好消息是,新的培训方法正在不断开发和改进,包括社区驱动的培训和“黑客周”,以帮助科学家更好地进行数据科学研究。

进一步的训练不仅会使新研究成为可能,而且还有一个不应该被忽视的好处。如果今天的生物学家在计算生物学方面得到适当的训练,他们将能够有效地为下一代研究人员做好准备,而下一代研究人员的工作可能更加依赖计算机和云计算等信息化基础设施。

 
举报 0 收藏 0 打赏 0评论 0
标签: sdf

免责声明:本站部份内容系网友自发上传与转载,不代表本网赞同其观点。如涉及内容、版权等问题,请在30日内联系,我们将在第一时间删除内容!

在线
客服

在线客服服务时间:8:30-5:30

选择下列客服马上在线沟通:

客服
热线

微信
客服

微信客服
顶部