扫二维码与项目经理沟通
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流
如何理解OMIM数据库,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。
建网站原本是网站策划师、网络程序员、网页设计师等,应用各种网络程序开发技术和网页设计技术配合操作的协同工作。创新互联专业提供网站建设、成都网站制作,网页设计,网站制作(企业站、响应式网站、电商门户网站)等服务,从网站深度策划、搜索引擎友好度优化到用户体验的提升,我们力求做到极致!
OMIM 全称叫做Online Mendelian Inheritance in Man, 是一个不断更新的人类孟德尔遗传病的数据库。这个数据库主要关注人类基因变异和表型性状之间的关系。
数据库中的每一条记录,都会有一个唯一的由6位数字组成的OMIM 编号,不同数字开头的编号含义不同,其中:
数字1和2 开头的,代表常染色体上的相关位点和表型(1995年之前创建的)
数字3开头的,代表X染色体上的相关位点和表型
数字4开头的,代表Y染色体上的相关位点和表型
数字5开头的,代表线粒体上的相关位点和表型
数字6开头的,代表常染色体上的相关位点和表型(1995 年之后创建的)
对于等位基因,每一条记录都有一个唯一的MIM 编号,由点号分隔的两部分构成,点号之前是突变位点对应的OMIM 编号,点号之后是一个由4位数字构成的唯一ID, 用来记录等位基因。
以IX 基因为例,对应的等位基因有 300746.0001 和 300746.0101 两个MIM 编号。
这个数据库是不断更新的,截止到2018年5月29号,数据库中的数据记录如下:
数据库中的记录,分成了5个类别。
这种记录以”*”开头,主要记录基因的相关信息,比如100640
这种记录以+
开头,描述了基因和表型之间的关联,比如100650
在网页上,会给出基因和表型之间的关联
这种记录以#
开头,描述了分子机制清楚的表型信息,比如100100
在Text
字段中,会给出详细的和该表型相关的基因突变信息
这种记录以%
开头,描述了分子机制不清楚的表型信息,通常都有由多种遗传因素控制的疾病,相关突变位点较多,比如100070
其他类型的记录,这部分记录之前没有任何前缀,比如10050
目前该网站的完整数据只面向科研机构开放下载,下载页面的链接如下
https://omim.org/downloads/
其中的mim2gene.txt
是大家都可以下载的,里面有数据库所有记录的编号。
第一列的ID就是omim编号,知道编号之后,可以快速得到对应的页面,链接格式如下
https://omim.org/entry/100640
虽然不能下载到完整的数据库,但是只需要根据编号,也可以快速得到想要的信息。如果你编程能力够强,也可以抓取所有的网页,构建一个本地版的数据库。
关于如何理解OMIM数据库问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注创新互联行业资讯频道了解更多相关知识。
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流