应用办公生活信息教育商业
投稿投诉
商业财经
汽车智能
教育国际
房产环球
信息数码
热点科技
生活手机
晨报新闻
办公软件
科学动态
应用生物
体育时事

科研人不担心有机物命名不规范了Transformer开源工具

  有机化合物怎么命名啊?、有机化合物命名规则是什么?、这个药物的有效成分叫什么?、有没有查找有机化合物命名的软件或程序?、某某命名软件还花钱。、某软件命名不准确。。。。。。。
  注:部分来自知乎问题。
  总之,有机化合物命名太难、规则太繁琐、还没有开源软件。。。。。。
  AI发展风生水起,能否解决以上问题?
  现在,来自莫斯科罗蒙诺索夫国立大学和Syntelly初创公司的研究人员开发了一种基于Transformer的人工神经方法,可根据IUPAC命名系统生成有机化合物的名称。
  而且还开源,可在线使用。
  我已迫不及待,进行了在线体验,在本文的使用小攻略部分。
  项目地址:https:app。syntelly。comsmiles2iupac
  IUPAC命名法是系统命名有机化合物的方法,在有机化学中发挥着重要作用。化学家通常手动创建IUPAC名称,但这个过程容易出错,需要对命名规则有深入的了解。计算机可缓解该问题。化学家可使用软件工具来生成名称。
  然而,目前还没有用于有机结构到名称翻译的开源工具。与现有解决方案(如ChemDrawJS和LexiChemTK)的许可协议需要特殊权限才能嵌入其他平台。
  近日,来自莫斯科罗蒙诺索夫国立大学和Syntelly初创公司的研究人员开发了一种基于Transformer的人工神经方法,根据IUPAC命名系统生成有机化合物的名称。新的解决方案已经在Syntelly平台上实现,并可在线使用。
  该研究以《基于Transformer的人工神经网络,用于化学符号之间的转换》(Transformerbasedartifcialneuralnetworksfortheconversionbetweenchemicalnotations)为题,于7月20日发表在《ScientificReports》杂志上。
  最初,我们想为我们的AI化学平台Syntelly创建一个IUPAC名称生成器。很快我们意识到通过数字化IUPAC规则来创建算法需要一年多的时间,因此,我们决定利用我们在神经网络解决方案方面的经验,该研究的主要作者,Syntelly初创公司的联合创始人SergeySosnin说。
  循环神经网络(RNN)和Transformer已成功用于自然语言翻译。研究人员构建了一个基于Transformer的神经网络,可以将分子从SMILES(简化分子线性输入规范)表示转换为IUPAC名称,反之亦然。描述了他们的解决方案,讨论了其方法的优缺点,并表明Transformer可以提供类似于人类化学直觉的东西。
  研究结果表明:将SMILES字符串转换为IUPAC名称的Struct2IUPAC模型在PubChem的测试集上达到了98。9的准确率。反向模型(IUPAC2Struct)达到了99。1的准确率,与开源OPSIN软件(名称到结构转换的开源工具)相当。方法
  数据库:深度学习技术需要大量数据。新网络使用世界上最大的开放化学数据库PubChem进行训练和测试,包含94,726,085个结构。把数据库分成两部分,一半用于训练,另一半用于测试。
  IUPAC和SMILES标记器:标记化是将序列划分为块并划分这些块(标记)的过程。它是语言模型的常见预处理阶段。使用基于字符的SMILES标记并实现了基于规则的IUPAC标记器。该研究的IUPAC标记器是手动设计和管理的。标记器能够正确处理来自PubChem的99以上的分子。
  图示:SMILES标记化(顶部)和IUPAC名称标记化(底部)的演示。(来源:论文)
  Transformer模型:使用由Google团队设计的现代神经架构Transformer,这是谷歌最初设计的最强大的机器翻译神经网络之一,作为研究的基础,并训练它将分子的结构表示转换为IUPAC名称,反之亦然。
  训练了两个模型:将SMILES字符串转换为IUPAC名称的Struct2IUPAC和执行反向转换的IUPAC2Srtuct。基本上,不需要IUPAC2Srtuct模型,因为可以成功地使用开源OPSIN。
  图示:Struct2IUPACTransformer模型。(来源:论文)
  验证步骤:使用OPSIN,可以验证生成的化学名称,以确保这些名称对应于正确的结构。可以检测到生成器的故障并且不会显示错误的名称。
  图示:验证步骤。(来源:论文)模型的优缺点
  优点1:Struct2IUPAC模型准确率达98。9
  为了验证模型的质量,研究人员从测试集中随机抽取了100,000个分子。SMILES到IUPAC名称转换器以验证步骤运行,在测试集中的100,000个随机分子的子集上实现了98。9的准确度。
  我们已经证明,Transformer可以精确解决算法问题,为软件开发提出了一个新范式。推翻了以前普遍认为不应该将它们用于此类问题的观念。在机器翻译中,用同义词替换一个单词是很有可能的,而在我们的任务中,一个错误的符号会导致一个错误的分子。然而,Transformer成功地完成了这一任务。Sosnin补充道。
  优点2:IUPAC2Struct模型准确率达99。1
  研究人员在测试集上将IUPAC与SMILESTransformer模型(IUPAC2Struct)与基于规则的工具OPSIN进行了比较(表1)。IUPAC2Struct转换器实现了99。1的准确率,OPSIN执行了99。4。
  表1:具有不同光束大小的100,000分子测试集上模型的准确度()。
  缺点:
  具有大量标记(寡聚体、肽等)的分子在我们的数据集中代表性不足,这可能是此类大分子性能下降的一个原因。
  尽管模型的准确度在非常大的分子上不超过50,但发现了一些有趣的复杂分子示例,这些示例正确生成了IUPAC名称。
  图示:Transformer生成正确名称的两个挑战分子示例。(来源:论文)
  此外,非常小分子的性能明显下降。例如:甲烷,可能是Transformer使用了一种自注意力机制来分析输入序列中标记之间的相关性。对于超短序列,很难掌握token之间的关系。在线可用
  新的解决方案已经在Syntelly平台上实现,并可在线使用。研究人员希望他们的方法可以用于化学符号之间的转换,以及其他与技术符号相关的任务,例如数学公式的生成或软件程序的翻译。
  研究人员表示:令人惊讶的是,我们基于神经的解决方案性能,可与基于规则的软件相媲美。使用小攻略
  在介绍之前,小声明一下:仅代表个人试用的感受,更专业的同学,应该会有更多的收获
  期刊论文提到目前还没有用于结构到名称翻译的开源工具。
  首先,打开在线开源网址:https:app。syntelly。commolecules1,左侧菜单栏有很多功能选项,在这里选择Inpidual选项,点击搜索框,进入画板。输入需要命名的有机化合物结构,以甲苯(C7H8)为例。
  点击calculate,即可得到甲苯的SMILES:Cc1ccccc1,以及IUPAC名称:methylbenzene。
  期刊论文里提到:可以将分子从SMILES表示转换为IUPAC名称,反之亦然。
  在这里输入SMILESIUPAC,同样点击calculate,即可得到甲苯结构及其对应的SMILESIUPAC。
  除此以外,该工具还自带超大数据集库。
  还有收录的已发表的期刊论文中有机化学结构命名。当然还可以自行上传新论文PDF。
  还可预测化学反应:
  更多功能解锁,小伙伴们自己Get吧有机化合物命名的历史
  在有机化学的初级阶段,化合物的命名并没有共同的规则。1919年国际纯粹与应用化学联合会(IUPAC)成立,IUPAC出版有机化学命名法,俗称蓝皮书。提供了有关化合物明确名称的指南。
  现在有机结构有几种替代表示形式。例如,简化分子线性输入规范(SMILES,Simplifiedmolecularinputlineentrysystem)旨在为基于人类和基于计算机的化学信息处理提供便利。
  过去,化学家手动创建IUPAC名称。这个过程容易出错,因为它需要对命名法有深入的了解,且涉及复杂的算法。此外,化学家偏向于琐碎的名称,这对不同符号之间的正确转换构成了额外的挑战。计算机缓解了这个问题。现在化学家广泛使用软件工具来生成名称。
  名称生成器的历史始于Garfeld的开创性工作。然而,第一个面向化学家的日常软件是在20世纪末才创建和发布的。
  现在,有几个用于生成IUPAC名称的商业程序:ACDLabs、ChemDraw、Marvin、IMnovaIUPACName等。此外,还有一个框架LexiChemTK为某些编程语言提供应用程序编程接口(API)。
  然而,没有用于有机结构到名称翻译的开源工具。与现有解决方案(如ChemDrawJS和LexiChemTK)的许可协议需要特殊权限才能嵌入其他平台。
  研究人员表示:我们相信,我们的方法适用于解决其他技术符号(或其他算法挑战)之间的转换问题,并希望我们的发现能在开发基于规则的解决方案成本高昂或耗时时突出解决问题的新方法。

房屋常识公积金最低是多少公积金最低基数和缴费比例是多少很多朋友们现在对于房产方面的知识了解的偏少,不管是从购房的角度,或者是装修房子的角度,我们都需要对房产方面的一些知识进行了解,所以小编今天就在网上搜集了一些房产方面相关的知识来……房屋常识住房公积金最低交多少怎么规定的很多朋友们现在对于房产方面的知识了解的偏少,不管是从购房的角度,或者是装修房子的角度,我们都需要对房产方面的一些知识进行了解,所以小编今天就在网上搜集了一些房产方面相关的知识来……房屋常识住房公积金最低交多少很多朋友们现在对于房产方面的知识了解的偏少,不管是从购房的角度,或者是装修房子的角度,我们都需要对房产方面的一些知识进行了解,所以小编今天就在网上搜集了一些房产方面相关的知识来……房屋常识个人公积金交多少住房公积金个人交多少单位交多少很多朋友们现在对于房产方面的知识了解的偏少,不管是从购房的角度,或者是装修房子的角度,我们都需要对房产方面的一些知识进行了解,所以小编今天就在网上搜集了一些房产方面相关的知识来……房屋常识公积金交多少钱大家住房公积金单位交多少钱很多朋友们现在对于房产方面的知识了解的偏少,不管是从购房的角度,或者是装修房子的角度,我们都需要对房产方面的一些知识进行了解,所以小编今天就在网上搜集了一些房产方面相关的知识来……马来西亚羽毛球公开赛中国队收获一冠两亚7月3日,黄雅琼郑思维(右)在比赛中。新华社记者朱炜摄本报北京7月3日电(记者孙龙飞)世界羽联马来西亚公开赛3日结束全部赛程,中国羽毛球队收获一冠两亚,其中,混双组……生活知识科普维生素e擦脸有什么效果在我们的生活当中有很多的常识性的知识大多数人都是不知道的,就好比最近就有很多小伙伴咨询小编问小编关于维生素e擦脸有什么效果的这些知识点,这就说明了现在人们也开开渐渐关注起了维生……从深圳去普陀山2日游如何安排?普陀山是中国的佛教四大名山之一,它位于浙江的舟山群岛上,是我国有名的风景名胜区,而且还是国家的5A级的旅游景区,每年都会有无数的游客到此观光旅游,接下来我就跟你简单说一下普陀山……佛珠手链打结(佛珠手串4种打结方法图解)佛珠手链打结(佛珠手串4种打结方法图解)心爱的手串绳子断了!肿么办?!别着急!总舵主教你穿珠子会不会很难啊?好怕学不会图文解说,很简单……常喝黄芪对身体有哪些好处和坏处?肾上线跟你科学地认识黄芪黄芪,是目前中药治疗肾脏病中,研究得比较多的一味药。在肾病患者中也广为流传,传说中,黄芪可以利尿、降低蛋白尿、提高免疫力,这些说法都有依据吗……第一次发射卫星,第一次人类进入太空和第一次登月,对于人类来说如果从当下实用意义的角度上来说,第一次发射卫星意义更大。人类最初在太空探索领域取得的成果就是人造地球卫星的发射,这一成就来自于前苏联,其在1957年完成了这项壮举,人造地……星月菩提子怎么盘(星月菩提怎样盘玩)星月菩提子怎么盘(星月菩提怎样盘玩)星月菩提子佛珠手串会随着时间而变得与众不同,珠子逐渐变黄、变红,日久转黑,表面出现丰富的裂纹,犹如瓷器釉层中美丽的裂纹开片,而佛珠表面……
脚底长鸡眼(脚底长了鸡眼怎么办)脚底长鸡眼(脚底长了鸡眼怎么办)有点疼,师傅再给我多上点麻药吧。行,你挺一下啊,我慢点抠。在修脚摊前,我们总能听见这样的对话。走上前一看,一张祖传修脚的广告布……女孩适合学什么专业(女生很吃香的8大专业)女孩适合学什么专业(女生很吃香的8大专业)女孩子选择专业不如男孩子那么选择的多,当然不是说就没有女孩子适合的专业了,事实上很多大学专业女孩子都可以报考。只是相对来说有些专……文科生学什么专业好就业(适合文科生报考的8个专业)文科生学什么专业好就业(适合文科生报考的8个专业)2020年高考志愿填报正在火热的进行中,部分省市已结束第一阶段的志愿填报工作。在填报志愿的时候,不少考生和家长都会觉得文……男性更年期应该注意什么?感谢邀请,我是疯了的医者,我们有时会遇到女人乱发脾气,不讲道理,情绪波动的情况,这时我们就会嘲讽对方是不是更年期到了,在大家印象里可能更年期更多的是女人到了一定年纪出现的一系列……女朋友过生日送什么礼物好(女朋友过生日送什么)你会给女朋友送礼物吗?如果你有交往的女朋友,在女生的重要节日的时候,她是非常期待你的礼物的。在这些值得庆祝的日子里,她最希望的就是能够收到你的礼物,那么送给女朋友什么样的礼物比……七彩菊(七彩菊花真美丽)七彩菊(七彩菊花)正常的菊花花瓣都是一个颜色,最多只是颜色深浅不一样但是一朵七彩菊花里的花瓣有好几种颜色,而且每一朵花的颜色组合都不一样神奇吧!真的从未见过吧……一条烟多少盒(硬中华为什么不能送人)来源:潇湘晨报来源潇湘晨报(xxcbwx)记者陈诗娴一条硬中华烟80元、一条黄盒芙蓉王56元、一条精品白沙34元你以为买到了比市面便宜的品牌烟?假的!6月14……教学方法与教学手段(与时俱进的教学方式)教学方法与教学手段(与时俱进的教学方式)近年来,信息技术在教育行业中广泛应用,翻转课堂更是如火如荼地在全国开展。所谓翻转课堂,是指重新调整课堂内外的时间,将学习的决……福州不再公布无症状轨迹,感染专家找到密接次密接,比向上溯源更受访专家:首都医科大学附属北京佑安医院感染综合科主任医师李侗曾环球时报健康客户端记者高阳近日,福州不再公布无症状感染者流调话题登上热搜,引起广大网友热议。当前各地疫……精益求精造句(精益求精,才是通往巅峰的唯一捷径)精益求精造句(精益求精,才是通往巅峰的唯一捷径)1hr去年,表妹第三次参加高级茶艺师考试再一次落败。因为我在表妹眼里算是个懂行的人,所以她请我帮忙看看哪里做得不够好……武德大夫(武德大夫,职位到底有多大?)武德大夫(武德大夫,职位到底有多大?)在《水浒传》,随着108位好汉齐聚梁山,个个身怀绝技的他们各尽其职,最终将梁山打造成了一个易守难攻的好地方。梁山众好汉先是三打……如何处理婆媳关系(婆媳关系怎样处理好)如何处理婆媳关系(婆媳关系怎样处理好)有这样一种关系,几乎所有女性都不想面对但迟早不得不面对,那就是婆媳关系。提到这个问题,真是的几家欢喜几家忧。有些人打理得很好,……
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网