基于深度学习的蛋白质设计新方法

理解蛋白质——比如那些控制癌症、COVID-19和其他疾病的蛋白质——的关键很简单:确定它们的化学结构,并找到哪些其他蛋白质可以与它们结合。...

Deep learning for new protein design

理解蛋白质——比如那些控制癌症、COVID-19和其他疾病的蛋白质——的关键很简单:确定它们的化学结构,并找到哪些其他蛋白质可以与它们结合。但这里有个问题。

“蛋白质的搜索空间是巨大的,”华盛顿大学蛋白质设计研究所和霍华德休斯医学研究所的研究科学家布莱恩考文垂说。

他的实验室研究的蛋白质通常由65种氨基酸组成,每个位置有20种不同的氨基酸选择,就有65的20次方次方的结合组合,这个数字比宇宙中原子的估计数量还要大。

考文垂是2023年5月发表在《自然通讯》杂志上的一项研究的合著者。

在这项研究中,他的团队使用深度学习方法在“从头开始”(从头开始)计算蛋白质设计中增强现有的基于能量的物理模型,结果在实验室中验证了将设计的蛋白质与其目标蛋白质结合的成功率提高了10倍。

“我们表明,通过结合深度学习方法来评估氢键形成或疏水相互作用的界面质量,你可以显著改善管道,”研究合著者纳撒尼尔·贝内特(Nathaniel Bennett)说,他是华盛顿大学蛋白质设计研究所的博士后学者。

“这与试图一一列举所有这些能量是相反的,”他补充说。

读者可能熟悉深度学习应用程序的流行示例,例如语言模型ChatGPT或图像生成器DALL-E。

深度学习使用计算机算法从数据模式中分析和推断,对算法进行分层,逐步从原始输入中提取更高级别的特征。在这项研究中,使用深度学习方法来学习蛋白质序列和可能结构的表示的迭代变换,这些变换非常迅速地收敛于非常准确的模型上。

作者开发的深度学习增强的从头蛋白质粘合剂设计协议包括机器学习软件工具AlphaFold 2和由蛋白质设计研究所开发的RoseTTA折叠。

该研究问题非常适合在Frontera上并行化,因为蛋白质设计轨迹彼此独立,这意味着当计算作业运行时,信息不需要在设计轨迹之间传递。

“我们只是拆分了这个问题,其中有200万到600万个设计,并在Frontera的庞大计算资源上并行运行所有这些设计。它上面有大量的CPU节点。我们给每个cpu分配一个设计轨迹,这样我们就可以在可行的时间内完成大量的设计轨迹。”

作者使用RifDock对接程序生成了600万个蛋白质“对接”,或潜在结合的蛋白质结构之间的相互作用,将它们分成大约10万个块,并使用Linux实用程序将每个块分配给Frontera的8000多个计算节点之一。

这10万个码头中的每一个都将被分成100个工作,每个工作有1000个蛋白质。一千个蛋白质进入计算设计软件Rosetta,在那里,这一千个蛋白质首先以十分之一秒的尺度进行筛选,而那些存活下来的蛋白质则以几分钟的尺度进行筛选。

此外,作者使用蛋白质设计研究所开发的软件工具ProteinMPNN,进一步提高了生成蛋白质序列神经网络的计算效率,比以前最好的软件快200倍以上。

他们在建模中使用的数据是酵母表面显示结合数据,所有这些数据都是由蛋白质设计研究所公开收集的。在这个实验中,数万条不同的DNA链被命令编码一种不同的蛋白质,这是科学家们设计的。

然后将DNA与酵母结合,使每个酵母细胞在其表面表达一种设计好的蛋白质。然后将酵母细胞分为结合细胞和不结合细胞。反过来,他们使用人类基因组测序计划的工具来找出哪些DNA有效,哪些DNA无效。

考文垂表示,尽管研究结果表明,设计结构与目标蛋白质结合的成功率提高了10倍,但仍有很长的路要走。

“我们已经上升了一个数量级,但我们还有三个数量级要做。研究的未来是进一步提高成功率,并转向更困难的新目标,”他说。病毒和癌症的t细胞受体就是最好的例子。

改进计算设计的蛋白质的方法是使软件工具更加优化,或者取样更多。

考文垂说:“我们能找到的电脑越大,我们就能制造出越好的蛋白质。我们正在研发未来抗癌药物的工具。我们制造的许多单独的粘合剂可能会成为拯救人们生命的药物。我们正在努力使这些药物变得更好。”

本文来自作者[盼香]投稿,不代表思达普立场,如若转载,请注明出处:https://cn.cdstartup.cn/wiki/202505-525.html

(4)

文章推荐

  • 共和党参议员反对同性婚姻的原因十分明确

    同性婚姻是政治如何迅速转变的一个比较显著的例子。十年前,人们对允许同性伴侣结婚的看法各占一半;几乎每个州都禁止在法律上承认同性婚姻。在那之后,人们的态度迅速转变。支持同性婚姻的人越来越多,2015年6月,最高法院下令给予同性婚姻与男女婚姻同等的保护。反对派基本上瓦

    2025年05月06日
    0
  • 这次疫情得多久过去(这次疫情得多长时间能结束)

    肺炎疫情什么时候结束1、2022年12月9日,国家卫生健康委员会宣布,经过全球抗击新冠肺炎疫情的艰苦努力,疫情正式结束。这场疫情自2019年底开始,持续了近三年时间。自2022年12月9日起,随着疫情的结束,人们的生活逐步恢复正常。国家正式解除疫情管理措施

    2025年05月06日
    0
  • 研究揭示,网络事件成为英国首席执行官的重大隐患

    一份报告发现,在大多数公司报告称去年遭受了网络攻击后,英国老板们开始担心网络攻击对其业务的潜在影响。在对包括安永(EY)和JDSports在内的500多名英国企业高管进行的一项调查中,约85%的公司表示,他们在过去一年经历了一场危机。根据咨询公司F

    2025年05月06日
    0
  • 疫情身上痒吗(疫情症状皮肤会痒吗)

    新冠潜伏期会嗓子痒吗?如果患者近期到了高风险地区或者接触了疑似、确诊的新冠病毒感染者,出现喉咙痒、咳嗽,就有可能是新冠病毒感染导致的,可以进行核酸或者抗体检查。由于新冠病毒具有一段时间的潜伏期,在此期间,需要对患者进行有效的隔离。经过反复多次核酸或者抗体检查

    2025年05月06日
    0
  • 专家提醒:加州安全措施保障海滩游客远离鲨鱼威胁

    加州长滩——加州一个著名的鲨鱼研究中心面临关闭的危险,因为该州取消了对一个防止鲨鱼袭击的项目的资助。加州州立大学长滩鲨鱼实验室主任克里斯·洛告诉福克斯新闻数字频道,该项目监测南加州海岸线上的大白鲨。“2018年,我们从加利福尼亚州获得资金,启动了加州

    2025年05月06日
    0
  • 疫情都需要买什么(疫情要买什么生活用品)

    因疫情需要居家隔离,一个三口之家居家生活用品和食物准备多少合适?_百度...1、牙膏(一管可用两周以上):准备足够的牙膏,以满足家庭成员的口腔卫生需求。卫生巾(夜用三片一包+日用两包):为女性家庭成员准备适量的卫生巾。食物:-蔬菜:土豆6个,西红柿6个

    2025年05月06日
    0
  • 基准研究助力科学家解析空间转录组学数据

      范德比尔特大学的一组研究人员发布了一项新的基准研究,旨在帮助科学家选择最有效的方法来分析空间转录组学(ST)数据。该研究由生物医学工程和计算机科学助理教授周昕迈兹领导,评估了空间转录组学(ST)中的

    2025年05月06日
    0
  • 美国疫情在哪里看(帮我查一下美国的疫情)

    全球每年重大传染病感染或者死亡人数的数据在哪里可以找到1、根据世界卫生组织(WHO)的最新数据,全球每年重大传染病的感染和死亡人数是可以找到的。例如,对于新冠病毒(COVID-19),全球累计确诊病例已超过5亿,死亡人数超过636万,死亡率约为17%。在中

    2025年05月06日
    0
  • Qiagen向卫生部赠送3000份潜伏性肺结核筛查测试

    吉隆坡,9月5日——Qiagen今天宣布向马来西亚卫生部(MoH)捐赠3000份QuantiFERON-TBGoldPlus检测试剂盒,作为潜伏性结核感染(LTBI)筛查的诊断工具。这种筛查的重点是协助检查免疫功能低下患者,这是结核病(TB)疾病的关键风险群体,作为Qiagen

    2025年05月06日
    0
  • 国际家庭暴力组织(IHOP)创始人迈克·比克尔被指控性侵

    迈克·比克尔,堪萨斯城国际家庭暴力协会(IHOPKC)的创办人,组织acusações性暴力协会和精神健康协会,组织váriasmulheres。比克尔,68岁,《关于性行为的调查》,《关于性行为的调查》,《关于性行为的调查》,《关于性行为的调查》,《关于性行

    2025年05月06日
    0

发表回复

本站作者后才能评论

评论列表(4条)

  • 盼香
    盼香 2025年05月05日

    我是思达普的签约作者“盼香”!

  • 盼香
    盼香 2025年05月05日

    希望本篇文章《基于深度学习的蛋白质设计新方法》能对你有所帮助!

  • 盼香
    盼香 2025年05月05日

    本站[思达普]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 盼香
    盼香 2025年05月05日

    本文概览:理解蛋白质——比如那些控制癌症、COVID-19和其他疾病的蛋白质——的关键很简单:确定它们的化学结构,并找到哪些其他蛋白质可以与它们结合。...

    联系我们

    邮件:思达普@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们