发布于2023-10-02 阅读(0)
扫一扫,手机访问
需要重新书写的内容是:鱼羊发自凹非寺
量子位 | 公众号 QbitAI
基因突变会如何影响人类健康,很大程度上还是个未解之谜。
不过现在,人类可以借AI之力来研究这件事儿了:
谷歌DeepMind在AlphaFold的基础上,训练出了专门预测人类基因组中错义突变致病性的AlphaMissense。
今天,一篇论文被发表在《科学》杂志上
“错义突变”是DNA序列的一种非同义替换。简单来说,就是DNA原本的字母(碱基对)被替换掉了。
这就意味着,对应生成的蛋白质里的氨基酸也会发生异化,这可能会让蛋白质失去原本的功能,导致疾病的产生。
AlphaMissense出山第一步,就是对全部7100万种可能的错义突变进行了分类。
AI成功将这些变异中的89%准确分类为“可能致病”和“可能良性”。与此相比,人类专家目前的准确率仅为0.1%
使用人工智能来预测基因突变的致病性
一句话总结,AlphaMissense的主要能力,就是预测人类基因组中所有可能的错义突变是致病性的还是良性的。
如何实现——
AlphaMissense基于DeepMind的蛋白质结构预测模型AlphaFold打造。
研究人员对AlphaFold进行了微调,使用了人类和灵长类变异频率数据库。具体来说,常见的自然界变异被视为对生物无害的变异,而数据库中未出现的变异则被视为“致病变异”训练数据
这种训练策略,可以避免人工标注带来的偏见。
需要重新写的内容是:AlphaMissense无法预测突变后蛋白质结构的变化以及突变对蛋白质稳定性的其他影响
AlphaMissense在输入一种错义突变后,会结合蛋白质的结构上下文和蛋白质语言模型,对突变进行一个0-1分的评分,以此大致判断这种突变是否会导致疾病
△AlphaMissense+AlphaFold效果
那么问题来了,AlphaMissense的这种分类,真的可靠吗?
经过实验验证,研究人员对此进行了验证
在遗传学权威数据库ClinVar中,AlphaMissense显示出比其他计算方法更强大的分类性能
在18924个变异数据中,AlphaMissense的ROC曲线下面积(auROC)为0.94。这个数字越接近于1,就意味着模型越能够准确地区分正样本和负样本
值得注意的是,上图中,以灰色显示的计算方法是在ClinVar上训练的,可能存在过拟合。
AlphaMissense在预测准确率方面也达到了SOTA水平。通过调整分类阈值,AlphaMissense能够将样本准确地分类为“可能致病”或“可能良性”,其期望精确度均达到了90%
DeepMind表示:
我们期待AlphaMissense能够帮助解决基因组学和生物科学领域中尚未解决的问题
为此,他们已经把AlphaMissense的预测结果和模型代码开源了出来。
DeepMind还分享了一个包含超过19000种人类蛋白质的数据集,其中包含了2.16亿个可能的单氨基酸序列置换预测数据
重写内容,不改变原意,需要改写成中文。不需要出现原句
[1]论文地址:https://www.science.org/doi/10.1126/science.adg7492
需要重写的内容是:[2]https://www.deepmind.com/blog/alphamissense-catalogue-of-genetic-mutations-to-help-pinpoint-the-cause-of-diseases
[3]https://github.com/deepmind/alphamissense
— 完—
需要进行改写的内容是:最大的模型 | 专栏文章
如何一键压缩数亿个参数?如何在兼顾大型模型的性能和安全性方面取得平衡?如何通过一行代码来优化和加速模型?本文将介绍关于大型模型的技巧,并手把手教你如何加速大型模型的推理过程!
请点击下方的图片以跳转到专栏文章页面
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店