当前位置: 网站首页 >AI教程资讯 >正文

Evo 2 – Acr研究所联合英伟达、斯坦福等推出的生物学AI模型

来源:爱论文 时间:2025-03-14 17:49:07

Evo 2是什么

Evo 2 是美国弧形研究所、英伟达、斯坦福大学等机构合作推出的DNA语言模型,用于基因组建模和设计,覆盖生命的所有领域。Evo 2 基于 StripedHyena 2 架构开发,以单核苷酸分辨率处理长达100万个碱基对的上下文长度。Evo 2 用 OpenGenome2 数据集进行自回归预训练,数据集包含来自生命所有领域的8.8万亿个标记,支持长序列建模、DNA序列生成和嵌入向量提取等功能,提供多个模型检查点满足不同需求。Evo 2 推动基因组学研究和应用,为生物医学和合成生物学等领域提供强大的工具支持。

Evo 2

Evo 2的主要功能

长上下文建模:处理长达 100 万个碱基对 的 DNA 序列,支持高精度的基因组建模。DNA 序列生成:根据给定的提示生成新的 DNA 序列,适用于合成生物学和基因编辑。嵌入向量提取:提取 DNA 序列的嵌入向量,用于下游分析,如基因功能预测和变异效应分析。零样本预测:支持零样本学习,例如预测基因变异对功能的影响(如 BRCA1 基因变异效应预测)。序列评分:计算 DNA 序列的似然分数,评估序列的稳定性和功能潜力。

Evo 2的技术原理

大规模数据训练:基于超过 9.3 万亿个核苷酸的数据进行训练的,据来自超过 12.8 万个基因组,涵盖细菌、古菌、真核生物等多个生命领域的生物。独特的 AI 架构:基于 StripedHyena 2 架构,处理长达 100 万个核苷酸的基因序列,理解基因组中相距较远部分之间的关系。深度学习与生成生物学:基于深度学习技术,像理解语言一样理解核酸序列。用学习进化过程中形成的生物序列模式,预测基因突变的影响并生成新的基因组。强大的计算支持:Evo 2 的训练利用英伟达的 DGX Cloud AI 平台和超过 2000 个 H100 GPU,展示了强大的计算能力和高效的模型训练。

Evo 2的项目地址

项目官网:https://arcinstitute.org/news/blog/evo2GitHub仓库:https://github.com/ArcInstitute/evo2HuggingFace模型库:https://huggingface.co/arcinstitute技术论文:https://arcinstitute.org/manuscripts/Evo2

Evo 2的应用场景

疾病预测:识别基因突变是否致病,辅助疾病诊断。基因治疗:设计细胞特异性基因治疗工具,减少副作用。合成生物学:设计新基因组,助力人工生命研究。进化研究:识别基因序列模式,研究生物进化。生物工具开发:设计生物传感器等工具,推动生物技术发展。
上一篇:Indic Parler-TTS – 开源多语言TTS模型,专注于合成印度语和英语
相关资讯 更多+
  • Evo 2 – Acr研究所联合英伟达、斯坦福等推出的生物学AI模型
    Evo 2 – Acr研究所联合英伟达、斯坦福等推出的生物学AI模型

    Evo 2 是美国弧形研究所、英伟达、斯坦福大学等机构合作推出的DNA语言模型,用于基因组建模和设计,覆盖生命的所有领域。Evo 2 基于 StripedHyena 2 架构开发,以单核苷酸分辨率处理长达100万个碱基对的上下文长度。

    AI教程资讯 2023-04-14

  • Indic Parler-TTS – 开源多语言TTS模型,专注于合成印度语和英语
    Indic Parler-TTS – 开源多语言TTS模型,专注于合成印度语和英语

    Indic Parler-TTS 是 Hugging Face 和 AI4Bharat 团队合作推出的多语言文本到语音(TTS)模型,专门用于印度语言和英语的语音合成。Indic Parler-TTS 是 Parler-TTS Mini 的扩展版本,支持 20 种印度语言和英语,拥有 69 种独特语音,能生成自然、清晰且富有情感的语音输出。

    AI教程资讯 2023-04-14

  • GRUtopia 2.0 – 上海 AI Lab 推出的通用具身智能仿真平台
    GRUtopia 2.0 – 上海 AI Lab 推出的通用具身智能仿真平台

    GRUtopia 2 0(桃源2 0)是上海人工智能实验室发布的通用具身智能仿真平台。平台在GRUtopia 1 0的基础上进行了全面升级,具备三大核心创新:通用模块化框架、场景资产自动化生成和高效数据采集系统。

    AI教程资讯 2023-04-14

  • BioMedGPT-R1 – 清华联合水木分子推出的多模态生物医药大模型
    BioMedGPT-R1 – 清华联合水木分子推出的多模态生物医药大模型

    BioMedGPT-R1 是清华大学AI产业研究院(AIR)与北京水木分子生物科技有限公司联合推出的升级版多模态生物医药开源大模型。BioMedGPT-R1基于 DeepSeek R1 技术,更新文本基座模型和跨模态特征对齐,实现生物模态(如分子、蛋白质)与自然语言的统一融合。

    AI教程资讯 2023-04-14

最新录入 更多+
确定