机器学习算法有助于整理蛋白质研究的大量数据

   日期:2024-09-30     来源:本站    作者:admin    浏览:106    

  

  

  对大量数据进行分类是蛋白质研究的瓶颈,而蛋白质研究对于利用基因编辑技术CRISPR和充分了解癌症、阿尔茨海默病和帕金森病等疾病至关重要。现在,哥本哈根大学的研究人员已经成为世界上第一个使用人工智能来完成这项繁重工作的人——而且这样做的方式可以确保共同的国际标准,同时使先进的蛋白质科学更容易获得。

  UCPH的研究人员利用人工智能解决了一个问题,到目前为止,这个问题一直是癌症、阿尔茨海默氏症和帕金森病等疾病背后的重要蛋白质研究的绊脚石,也是可持续化学和新基因编辑技术发展的绊脚石。

  当研究人员使用显微镜和smFRET技术来观察蛋白质如何移动并与周围环境相互作用时,分析研究人员收集的大量数据集一直是一项耗时且具有挑战性的任务。同时,这项任务需要高水平的专门知识。因此,填充服务器和硬盘驱动器的数量激增。现在,化学系、纳米科学中心、诺和诺德基金会蛋白质研究中心和哥本哈根大学尼尔斯玻尔研究所的研究人员已经开发出一种机器学习算法来完成这项繁重的工作。

  该算法已经学会了识别蛋白质的运动模式,使其能够在几秒钟内对数据集进行分类——这一过程通常需要专家几天才能完成。

  “到目前为止,我们一直在处理成千上万种模式形式的原始数据。我们以前都是手动检查,一次检查一个。这样一来,我们就成了自己研究的瓶颈。即使对专家来说,一次又一次地进行一致的工作并得出相同的结论也是困难的。毕竟,我们都是容易疲劳、容易犯错的人,”西蒙·博·詹森说。

  UCPH研究人员对蛋白质运动与功能之间关系的研究是国际公认的,对了解人体功能至关重要。例如,包括癌症、阿尔茨海默氏症和帕金森症在内的疾病都是由蛋白质聚集或改变其行为引起的。今年获得诺贝尔化学奖的基因编辑技术CRISPR也依赖于蛋白质切割和剪接特定DNA序列的能力。当UCPH的研究人员,如Guillermo Montoya和Nikos Hatzakis研究这些过程是如何发生的时,他们使用了显微镜数据。

  “在我们能够治疗严重疾病或充分利用CRISPR之前,我们需要了解蛋白质这种最小的构建模块是如何工作的。这就是蛋白质运动和动力学发挥作用的地方。这就是我们的工具发挥巨大作用的地方,”诺和诺德基金会蛋白质研究中心教授吉列尔莫·蒙托亚说。

  似乎世界各地的蛋白质研究人员都缺少这样一种工具。几个国际研究小组已经表示有兴趣使用该算法。

  “这个人工智能工具对整个领域来说是一个巨大的好处,因为当世界各地的研究人员需要比较数据时,它提供了以前没有的共同标准。以前,很多分析都是基于对哪些模式有用的主观看法。这些可能因研究小组而异。现在,我们配备了一种工具,可以确保我们都得到同样的结论,”研究主任Nikos Hatzakis解释说,他是化学系副教授,也是诺和诺德基金会蛋白质研究中心的副教授。

  他补充说,该工具也提供了不同的视角:

  虽然分析蛋白质运动的编舞仍然是一个小众领域,但随着所需的先进显微镜变得越来越便宜,它已经获得了越来越多的基础。然而,分析数据需要高水平的专业知识。我们的工具使更多的生物学和生物物理学研究人员可以使用这种方法,即使是那些没有特定专业知识的研究人员,无论是研究冠状病毒还是开发新药或绿色技术。”

 
打赏
 
更多>同类文章

推荐图文
推荐文章
点击排行