应用办公生活信息教育商业
投稿投诉
商业财经
汽车智能
教育国际
房产环球
信息数码
热点科技
生活手机
晨报新闻
办公软件
科学动态
应用生物
体育时事

MIT神谕模型登Nature封面!破译DNA的前世今生和未来

  编辑:好困拉燕【新智元导读】一个模型即可破译非编码DNA的进化历史和未来?
  今天,机器学习再次登上Nature的封面!
  这次,来自麻省理工学院和英属哥伦比亚大学等机构的研究人员构建了一个深度学习神经网络模型神谕。
  利用数亿次实验观测结果进行训练之后,神谕可以预测酵母中的非编码DNA序列的突变会如何影响基因表达。
  论文链接:https:www。nature。comarticless41586022045066Abs1
  此外,研究人员还提出了一种独特的方法,可以在两个维度表示适应度地形,从而让理解酵母之外的生物体更加轻松。甚至还能设计出一种通用的基因表达模式,用于推进基因治疗和工业化应用。
  非编码DNA是什么?
  虽然我们每个人体细胞都包含大量基因,但是所谓的编码DNA仅仅占我们所有基因的1。而剩下的99,都不是具备编码能力的DNA,不能通过这些DNA生成蛋白质。
  这种非编码DNA(戏称垃圾DNA),有一个重要功能。即,控制基因的开或关,以及生成的蛋白质的数量。
  随着时间的推移,细胞会复制DNA以生长和分裂。在这些非编码区,突变时常会发生,包括功能上的微调,或是改变控制基因表达的方式。
  很多突变都是不值一提的,甚至还有一些突变是有好处的。然而,这些突变偶尔也会增加一些常见疾病(比如2型糖尿病)的患病几率,或者更严重的一些疾病(比如癌症)的患病几率。
  基因表达在进化中的可塑性
  为更好的了解这种突变带来的影响,研究人员一直在进行对数学图谱的研究,从而观察生物体的基因组,预测哪些基因会被表达,并确定该种表达会如何影响生物体可观察的特征。
  这些图谱被称作适应度地形,大约一个世纪以前,适应度地形被提出,目的是理解基因组成如何影响生物体的适应型,尤其是繁殖成功率。早期的图谱比较简单,只关注少量的突变。
  适应度地形
  如今,研究人员拥有更为丰富的数据库,但他们仍然需要额外的工具来描述这些复杂的数据,并实现数据的可视化。
  这种能力一方面可以让研究人员更好地理解一个单独的基因是如何随着时间的推移进化,另一方面还可以帮助预测未来可能出现的基因序列和基因表达的变化。
  AI在生物学领域的又一次突破
  麻省理工学院的研究生EeshitDhavalVaishnav、共同一作CarldeBoer,还有他们的同事们,为了实现这一目标,构建了一个神经网络模型来预测基因表达。
  他们通过在酵母中输入上百万个完全随机的非编码DNA序列组成的数据集训练模型,来观察每一个随机序列是如何影响基因表达的。
  首先,研究人员在一大群酵母细胞中测量了编码黄色荧光蛋白(YFP)基因的表达情况。
  其中,不同的细胞会携带不同的启动子。这些启动子位于一小块环状DNA上靠近YFP基因的地方,作为蛋白质的结合位点,启动子可以控制附近基因的表达。
  具体来说,研究人员使用了3000多万个不同的启动子,每个启动子的长度是80个碱基对,并对每个含有这些启动子之一的细胞产生的YFP进行量化。
  基因调控DNA的进化、可进化性和工程化
  随后,研究人员将得到的表达数据输入到卷积神经网络之中,并训练该网络从数据中预测基因表达。
  为了验证其有效性,研究人员合成了数千个未用于训练的启动子序列,并测量了它们驱动基因表达的能力。
  结果表明,神经网络非常准确地预测了每个启动子序列驱动基因表达的程度。
  此外,研究人员还向该网络提供了随机的起始序列,结果同样证明了,AI从序列中预测基因表达的能力可以用于将这些起始序列转化为极端YFP表达的启动子序列。
  最后,研究人员又合成了500个这些序列,并测量了它们驱动YFP表达的能力。结果表明计算机模拟的序列确实可以驱动非常高和非常低的表达。
  为了搞清楚最基础的进化问题,Vaishnav和他的同事们查阅了各类论文,甚至还把一个现有的研究中所有的数据集全放到了模型里进行尝试。
  而想构建一个强大到可以探测任何基因的工具,还需要找到一种办法来预测非编码序列的进化模式,哪怕没有完整的数据集。
  为了实现这个目标,他们设计出了一种计算技巧,可以把预测从框架里插到二维图像上。
  如此一来便可以使用简单的方式,了解任何一个非编码的DNA蓄力了是如何影响基因表达和基因的适应性的,且无需在实验室耗时耗力的做任何实验。
  有什么意义?
  50多年来,生物学家们都在试图通过非编码DNA序列来准确预测基因表达的强度。然而基因表达的生化机制是非常复杂的,即便是学界尽了最大的努力也没有实现这一目标。
  在这项研究发表以前,研究人员大多只能使用已知的突变来训练模型(充其量有些微小的变化)。
  然而,Regev的小组迈出了更大的一步。他们构建的无偏模型,能够预测生物体的适应性和基因表达,这基于任何可能的DNA序列,哪怕有些基因序列从来没有见到过。
  实验证明,对于大多数起始序列,3、4个突变足以使序列演化出非常高或非常低的表达。而大约70的酵母基因在其表达上为稳定选择(有利于不会导致表达发生巨大变化的突变的选择)。
  此外,受稳定选择影响的基因对非编码DNA突变的抵抗力更强。也就是说,其启动子的突变在较小程度上改变了基因的表达。
  神谕的出现和其他诸如预测蛋白质折叠的深度学习应用一样,为科学家们探索和解释更加广泛的领域来带了一种新的方法。
  此外,神谕也能让研究人员出于制药目的控制细胞,这包括最新的治疗癌症和自身免疫失调的疾病。
  麻省理工学院的生物学博士,同时也是哈佛大学和麻省理工学院博德研究所的核心成员的AvivRegev说:现在,我们有一个神谕,我们可以向它请教很多问题,比如,如果我们把序列里所有的突变全部尝试一遍会怎样、或是我们应该设计出什么样的新序列才能得到我们想要的基因表达。
  她表示,科学家们现在可以使用模型来解决各自的生物进化课题,和为了预期的基因表达设计基因序列的相关问题等等。
  爱丁堡大学医学研究委员会人类遗传学部门的教授MartinTaylor表示,该研究充分说明了,人工智能不仅可以预测非编码DNA的变化,还能揭示数百万年生物进化的底层逻辑。
  研究的局限性
  尽管如此,在苏黎世大学从事进化生物学和环境研究的AndreasWagner表示,神谕也有其明显的局限性。
  其一,研究人员只改变了启动子只是可能影响基因表达的几种类型的序列中的一种。它没有考虑到周围DNA变化的影响,包括可能影响基因表达的蛋白质编码区的变化。
  其二,它是为酵母而开发的,在酵母中,基因调控的复杂性远低于人类。例如,酵母的调控DNA通常位于被调控基因的几百个碱基对内,而动物的调控DNA可能位于数百万个碱基对之外。因此,目前还不清楚这个方法是否能扩展到更复杂的基因调控。
  最后,就像神话中的神谕一样,这个模型可以进行预测但无法解释。
  它没有告诉我们为什么一个启动子有高表达或低表达,哪些转录因子在启动子上结合,或者它们如何相互作用。
  换句话说,它在阐明基因表达的调控逻辑方面作用不是很大。
  不过,我们依然可以保持谨慎的乐观。
  尽管用于训练的3000万个序列只是DNA的4个核苷酸可能形成的所有480种序列的一小部分(约21041),但该方法还是非常成功的。
  由此也可以推断出,即便是在序列空间进行稀疏采样,也大概率不会成为模型的障碍。
  作者介绍
  麻省理工学院的博士生EeshitDhavalVaishnav是这项研究的第一作者。
  他共发表过8篇顶刊论文。分别是Nature3篇,子刊NatureMedicine、NatureBiotechnology、NatureCommunications各1篇,以及Cell1篇。
  此前在印度理工学院获得计算机科学与工程和生物科学与生物工程双学位。
  英属哥伦比亚大学生物医学工程学院助理教授CarldeBoer博士是共同一作。
  他于2008获得滑铁卢大学计算机科学和生物信息学学士学位,并于2014年获得多伦多大学分子遗传学博士学位,此后便一直从事博士后研究。2020年进入英属哥伦比亚大学成为助理教授。
  麻省理工学院的生物学教授AvivRegev博士是这项研究的资深研究员。
  她分别于1997年和2003年在特拉维夫大学获得硕士和博士学位,是麻省理工学院和哈佛大学Broad研究所的核心成员以及麻省理工学院生物系的教授,也是GenentechResearch和EarlyDevelopment的负责人。曾与SarahTeichmann一起创立并领导了人类细胞图谱项目。
  她的研究方向是生物网络、基因调控和进化。工作重点是剖析复杂的分子网络,以确定它们在面对遗传和环境变化时,以及在分化、进化和疾病期间是如何运作和演变的。
  参考资料:
  https:www。nature。comarticless41586022045066
  https:news。mit。edu2022oraclepredictingevolutiongeneregulation0311
  https:www。nature。comarticlesd41586022003840

零售新时代,实体门店如何掘金即时零售?行为改变专家、NLP大师级实践者安迪拉梅奇在其知名著作《即时满足:让人嗨起来的动机心理学》中对棉花糖实验提出全新见解,为即时满足正名。他指出,即时满足就是要尽早满足自己的要求。……比亚迪元PLUS海豹海豚正式进入日本市场,三个理由会大卖前言:7月21日,比亚迪股份有限公司日本分公司在东京召开发布会,宣布正式进入日本乘用车市场,并且推出了元PLUS、海豚和海豹三款车。三款车型都是定位纯电动汽车,其中,比亚迪元P……京东总裁徐雷接替刘强东,网友满满的社会气息,以后还会买吗?刘强东套现身退的事情,想必大家都知道了吧,而由谁来接替他,也被大家所关注,如今这也已经不是什么秘密了,接替的人为京东总裁徐雷,当大家看到这个人的面相和风格之后,立刻就感受到了满……何建明戈壁深处有对甜咸孪生湖烈日炎炎之中,我想去拥抱雪山因为那一定太惬意终于到了新疆。意外的是,走到天山北边辽阔的准噶尔戈壁沙漠盆地上才发现,这里除了乱石飞滚的戈壁和一望无际的大沙滩外,根本见不着任……多次常规赛MVP至少六次进总决赛,库里成历史第八人在今日的西部决赛中,勇士主场120110大胜独行侠,大比分41淘汰对手,晋级总决赛。赛后NBA宣布,勇士后卫斯蒂芬库里获得首届西部决赛MVP奖杯。库里在本次西部决赛……您知道马踏飞燕吗?关于中国旅游标志您知道中国旅游标志是什么吗?可能有多半人是不知道的再问这知道的少数人,您知道它来自哪里吗?何地出土吗?可能又会有多半人数被问住。铜奔马马踏飞燕当图片出现……日村水总管空调开一夜要用多少电?夏至过后,气温是越来越高了,很多人都在感叹空调已经到整夜都得开的地步了。但是也有一部分人秉持着勤俭节约的原则,选择了空调的定时模式,然后在下半夜被热醒。那整夜开空调耗电量是多少……人体为何要以星换斗易筋经中医趣味故事(5)导读:少林易筋经源于生活实践,与中医有着深刻的渊源,本篇文章,我们来讲讲少林易筋经一式动作摘星换斗的中医小故事。北斗七星去西安旅游时,导游会告诉你西安古称长安,又叫……为何人到中年,鼻毛总是往外窜?这是暗示了什么?早知早受益鼻毛是人体毛发的一种,起到保护鼻腔粘膜,湿润鼻腔的作用,鼻毛的存在,能够很好的阻挡细菌和灰尘的入侵,降低鼻腔炎症的发生率。夏方养生指南正所谓存在即合理,鼻毛的存在一定有它……大户型选什么路由器?2022年Mesh路由器选购推荐本内容来源于什么值得买APP,观点仅代表作者本人作者:进击的德莱文对大户型、楼房、别墅甚至是公司的来说,解决WiFi的覆盖率是一个头疼的问题。无论路由器放在哪个位置,总有……FAN动态丨和爱豆学发型韩国女爱豆的造型变化之快,一向是女孩子们争相模仿的潮流风向标。今天就看看女爱豆的夏季流行发型参考吧。金艺琳夏天披头散发也太热了,麻花辫在发型中属于固定头发比较牢固的……55岁王志文老得真快,穿一身黑老态尽显,同框儿子不像父子像爷男人的帅气有很多种,男人只有在成为一个真正的爸爸后才会变得更具魅力,加上同样帅气的孩子,就会变得帅上加帅。之前,王志文的新片在上海上映的时候,王志文和14岁的儿子王冠杰一……
亚足联技术授权代表一行来温考察温州奥体中心场馆建设工作【来源:温州市体育局群众体育】4月5日,亚足联技术授权代表一行来温考察温州奥体中心场馆建设工作,温州赛事分指挥部竞赛工作组副组长卢峰、温州奥体中心场馆群运行团队常务副指挥……搭上ChatGPT概念股价暴涨的万兴科技,又发布了AIGC出界面新闻记者戈振伟ChatGPT人工智能聊天机器人的大热,也带动了AIGC(AIGeneratedContent,即AI生成内容)相关概念股股价暴涨,其中万兴科技(300……19962000年环球小姐,有你喜欢的吗好内容我来评19962000年环球小姐,有你喜欢的吗在90年代后期,时尚潮流受到垃圾,朋克和嘻哈风格的混合影响。受欢迎的服装是宽松的裤子、九分上衣、牛仔夹克、法兰绒衬衫和……北京君正利润增长1160,可股价下跌70!是陷阱还是馅饼?财经新势力新春季北京君正年度利润增长11倍,可是他的股票价格在二级市场上下跌的幅度却高达70!是陷阱还是馅饼?北京君正归属母公司的净利润达到了9。26亿元,增长的幅度高达……胎宝宝最怕的辐射,原来是它苏博士母婴胎宝宝最怕的辐射,原来是这个!胎儿最怕的辐射源不是手机,不是安检仪不是WiFi。这些都属于非电离辐射,基本不会影响到孕妇和正常人的健康。其实胎儿最害怕的辐射源很常见……忽冷忽热时节,跳出儿童咳嗽五大误区冬春交替忽冷忽热,是小儿最容易生病的时期,最常见的疾病就是感冒、咳嗽。一些体质较弱、抵抗力较差的孩子更容易患病。日常生活中,小儿咳嗽常见五大误区,来看看你中了吗?误区1……高萌预警,萌兔乐园撸兔兔你是否喜欢这样的画面阳光、草地、花海、游艺如果还有一群小兔子追着你跑那大概是梦里的样子。。。4月1日起武汉黄陂野村谷萌兔乐园浪漫来袭世界上最……QVariantMap和QVariantQVariant类型的放入和取出必须是相对应的,你放入一个int就必须按int取出,不能用toString(),Qt不会帮你自动转换。数据核心无非就是一个union,和一……赛为智能连续3天20CM涨停深交所发函关注有无机器人业务每经记者:王晶每经编辑:杨夏近日,受我国连续九年成为全球最大工业机器人消费国消息影响,A股机器人概念股表现活跃。其中,赛为智能(SZ300044,股价5。62元,市值43……快船击败奇才,残阵篮网逆转步行者,骑士三人20力克雷霆北京时间12月11日NBA最新资讯:小卡、乔治出战奇才,沃尔面对老东家并在赛前与比尔拥抱致意,最终快船114:107战胜奇才止住两连败的同时,送给奇才六连败。残阵篮网136:1……一位是秦志戬的得意弟子,一位是王皓力捧的对象,谁更有发展空间秦志戬和王皓一位是前任的中国男乒主教练,另一位是新上任的男乒主教练,两人做教练的风格完全不同,秦志戬培养了温文尔雅、实力深不可测的马龙,王皓培养了球风刚硬、打法暴力的樊振东来,……白色透明短裙隐隐约约,时尚美女美丽大方!在一个阳光明媚的早晨,他们第一次相遇了。她穿着一袭白色的裙子,拎着一个大大的书包,脸上带着纯真而灿烂的笑容;而他则站在不远处,目光深邃而温柔。自此之后,他们开始了每天都见……
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网