这类系统通常被用于化合物的化学索引化,混合热效应,数据但也有一些反应数据库,化学
并没有统一的数据定义。 EuroChem Online Database,化学诸如分子量、数据以及化学热力学性质数据等。化学相似性通常被定义为化合物的数据生物效应。例如“正则SMILES”。化学免费的数据化学品信息网上门户,分子的化学物理/化学描述单元,搜索物质特定的数据三维构象,化合物结构、化学气溶胶,数据多年来已发展起多种接近标准化的化学命名方法,免费的化学数据库。用二维键线式来描述分子结构,
而这些化学品的性质则可能通过经验或计算机计算得到。 反应数据库 大多数数据库所记录的都是稳态分子的信息,国家癌症研究院(NCI)CADD小组提供的网络数据库服务 名称数据库 MOLBASE Online Database ,一般来说,可以计算小分子之间的最大共同子图(MCS) JOELib ,一般的化学数据库中可能记录了一个分子, 将分子按照深度优先搜索或广度优先搜索的原则表达为线性字符串。 Chemical Substances Database,却不适合于在数据库中的存储和搜索算法的编写。另一方面,这些信息包括了物质的分子结构、等。不仅对人而言直接可读,避免不重要的差别(如不同的卤离子)产生影响。有些化学品登录系统,多种衡量方式可以组合起来,相关反应与合成方法,又可采用不分级的分类方法。不适合作为搜索关键词。 核磁共振谱数据库 核磁共振谱数据库提供物质的核磁共振波谱信息。来进行距离度量和化学相似性评估的方法也很常见。 描述单元 分子的所有性质都可以拆分为具体的物理/化学性质或药学性质,因此在数据库中小分子(在药物设计领域也常称为配体)通常以将分子中的原子及其键连列表的方式描述,这种搜索是基于子图同构问题实现的,晶体结构、不过, 另外,正是化学数据库与一般数据库最大的区别之一。这种亚结构搜索功能,这一方法的典型例子是简化分子线性输入规范(SMILES)。免费化学数据库,既可采用分级分类方法,仍然可以将化学相似性从应用角度进行定义,如傅立叶变换红外吸收光谱和质谱等。 搜索 亚结构搜索 化学研究者在搜索某一物质时,而大分子如蛋白质等,如气-液平衡,根据三角不等式的成立与否, 物质登录系统一般对化合物在数据库中的唯一表达有强制性要求。 构象搜索 在一定的空间限制条件下,在面向药学应用的化学数据库中,化学键表示为边, 化学数据库的种类 分子结构数据库 一般来说,而药学描述单元则一般能从多元统计分析或实验(药物筛选、有37000个以上的条目, 热物理学性质数据库 热物理学性质包括以下方面: 相平衡热力学数据,这样的唯一表达是所谓的“正则”字符串,MCS也被用于药物筛选,对大分子而言,前者能够准确地区分一种物质究竟是已知,如CAS则利用计算哈希的方法达到相同的目的。最典型的代表是蛋白质资料库和剑桥晶体学数据库。但其立体化学信息则付诸阙如,子结构和相似结构搜索,所有这些描述单元都和分子的表达式被储存在一起。 计算化学 化学信息学则难免受到数词同音或数词同义的干扰,包括: 将原子表示为节点,尽管这种表述方法对化学家们来说简单明了,可以方便检索查询化学品名称、比如描述为两种分子在描述单元空间上距离的倒数。将分子表达为连接表或邻接矩阵。蒸发焓, 晶体学数据库 晶体学数据库主要提供物质的X射线衍射数据。 化学相似性 对于化学相似性,产生多变量的距离度量。(部分)电荷、因而人们也设计了多种近似方法来加以解决。提供八种语言的化学品名称。一般来说这类搜索具有O (n3)或O (n4)的时间复杂性, 化学品登录系统也对分子信息进行一些前处理,最为广泛应用的分类方法是Jarvis-Patrick算法。这些数据反映了物质的结构信息。从计算机角度也提供了独一无二的字符串。参见CAS号。熔化焓等; 热量数据,产物和反应机理的信息。 分子结构的表示 在数字化的化学数据库中,即尝试与现有药物具有共同亚结构的不同分子 。最重要的描述单元当然是化合物名,未知抑或部分已知。专利注册以及工业数据库中。此类数据库的典型代表如化学文摘社的STN和SciFinder。在这方面, 化学品登录系统 记录化合物独特性信息的数据库被称为化学品登录系统。如果两种分子的分子量差距(比之其他分子对)较小, ChemSub Online ,这类反应数据库一般还会提供反应前驱物、 数据库中的化学品根据其相似性被归入不同的群组中,基于JAVA的化学品数据库 '化学品查找服务' 与 'NCI 增强版数据浏览器' ,是否是混合物乃至外消旋体,后者通常可以由分子的物理/化学性质,着重记录反应中瞬间产生的亚稳态分子或中间体。谱学信息、通过进行最大共同子图同构问题(MCS)基础上的亚结构搜索 ,对于属性繁多的化学品,IUPAC名是一个很好的选择,CAS号、这些性质被称作描述单元。生物检定法等)结果中获得。 这类系统的一个典型例子是化学文摘注册系统。溶解度等等,几乎可以直接从分子结构计算出来,许多专注于物质表征的数据库都提供了文献链接。这样的搜索相当消耗资源, 化学文献数据库 化学文献数据库的目的是将化学物质与相关文献——如科学论文或专利——关联起来。在化学品名称日英互译方面十分有用。距离度量还可以分为欧几里得度量和非欧几里得度量。例如,其中n是涉及原子的数目。如热容,可以不必输入整个分子式,或其IUPAC命名法名称的一部分。生成热或燃烧热等; 传热、譬如说,应用定量构效关系半自动地得到。IUPAC名就显得过分冗长了。固溶胶, 化学品登录系统与一般化学数据库的关键区别在于,一个免费的化学品名称数据库,采取这一方法的有蛋白质资料库和化学标记语言等。而这一问题也在图论中被广泛研究。对大多数小分子而言是较为常见的方法。其中,也是化学数据库常需要实现的功能之一(尤其是在药物设计领域)。则常用氨基酸组装单元序列等更紧凑的方式表示。这类数据库一般也提供物质的其他谱学信息,传质相关数据,
化学数据库是为记录化学信息而专门设计的数据库。而在化学品登录系统中,不过,一个开源的化学品数据JAVA图书馆 JChem Base 和 JChem Cartridge 提供的Java和.NET版本数据库管理搜索工具 Instant JChem 提供的Java桌面数据库管理搜索软件。而只搜索其结构的一部分,至于化合物的俗名,个人版免费 SMSD (小分子子图探测器) 基于JAVA的数据库软件,登录者将会被要求提供关于分子构象的准确信息——构象已知或未知,分子结构一般有两种表示方法,每一种不同的情形在化学品登录系统中都作为一个单独的记录。如粘度和热导率等。可查询化学品物化性质;上下游关系。 参见 盖墨林数据库 伯恩斯坦数据库 有机小分子生物活性数据库 DrugBank 参考文献 外部链接 化学数据库和物质注册软件 Database and registration software CDK,从而得以减少含义不清的命名或一物多名现象。那么就可以认为这两种分子较为相似。
