中国马业综合数据库建立及马基因组序列 猜测

更新时间:2024-02-28 点赞:19585 浏览:84228 作者:用户投稿原创标记本站原创

现代生物学的发展促进了生物信息学的产生。生物信息学是将信息学的理论技术应用于生物数据的管理和分析,是数学、物理学、计算机科学、化学、生命科学等多学科的交叉学科。生物信息学研究的范围十分广泛,其中数据库的构建就是一个重要方面。如何用理论和计算的方法识别和猜测内含子和外显子也是目前生物信息学研究工作的重要任务。本课题通过自编程序建立了以中国马品种资源为主的中国马业综合数据库www.chinahorse.org.cn。并在建立数据库的基础上,初步实现了数据库应用,包括基于Web的文献数据库的网络化查询等。它将为建立马品种资源的科学研究平台打下基础。本研究的主要内容及结果如下:1.建立了专一化、系统化、完整化的马业科学数据库。序列数据库中以基因数据库和蛋白质数据库为主,非序列数据库以文献数据库和图片数据库为主。其中,马的基因数据库中的记录量超过了2万,马的蛋白质数据库的记录超过3万。2.建立了中国马物种资源数据库。涉及品种的外貌、类型、典型特征等多个性状,为从事中国物种品种遗传资源的利用与保护提供了参考。3.建立了马生物信息学研究平台。可以对基因和蛋白质进行相关生物信息学研究,对于进行科研和教学具有一定价值。4.建立了马业科学实验室网站与马业论坛。可以通过互联网进行数据库的检索,提高了数据库的应用效率。网站的建设还可以为数据库的更新带来方便,也为本研究领域内的交流与合作起到桥梁作用。本研究还通过对已发表的马全基因组序列的子使用频率做了初步的统计分析工作并对内含子和外显子进行了猜测。基于各种序列组分的不同和序列首尾段的守旧|英语教学论文|性,本研究利用离散增量结合支持向量机的方法对马基因组内含子和外显子序列进行识别。基于单碱基、二联体和三联体使用频率,我们能正确猜测91%以上的内含子和外显子。【关键词】:马马业科学生物信息学数据库基因组序列内含子外显子的猜测
【论文提纲】:摘要3-4Abstract4-121绪论12-301.1马业科学简介12-181.1.1马属动物及其分类12-151.1.2马业科学及其研究内容15-181.2生物信息学概述18-211.2.1生物信息学的定义及其主要研究内容18-201.2.2生物信息学的发展20-211.2.3生物信息学的重要性211.3生物学数据库21-271.3.1数据库基本知识22-231.3.2数据库管理系统(DBMS)23-241.3.3数据库处理系统与文件处理系统的区别241.3.4关于数据库定义的说明24-251.3.5生物数据库的分类及其基本数据库25-271.4本研究的目的与意义27-301.4.1本研究的目的27-281.4.2本研究的意义28-302研究一中国马业综合数据库的建立30-712.1引言30-352.1.1www.chinahorse.org.cn—马业科学数据库的网络化实践302.1.2ASP30-312.1.3IIS31-322.1.4超文本传输协议32-332.1.5ASP访问数据库33-342.1.6MicrosoftSQLServer34-352.2材料与方法35-622.2.1中国马业综合数据库的栏目分类35-362.2.2马文献资料数据库的建立36-442.2.3马基因和蛋白质信息库数据库的建立44-512.2.4中国马遗传资源数据库的建立51-592.2.5中国马业综合数据库网站的建立59-622.3结果与分析62-672.3.1马业科学数据库大小622.3.2中国马遗传资源资源数据库62-632.3.3马业科学数据库的录入632.3.4马业科学数据库的检索系统63-642.3.5马业科学实验室网站64-652.3.6马生物信息学研究平台65-662.3.7马业论坛662.3.8数据的网络更新和提交66-672.4讨论67-702.4.1与此数据库的前身www.mayekexue.com.cn的比较672.4.2马业科学数据库的安全67-682.4.3马业科学数据库的可扩展性和可维护性68-692.4.4马业科学数据库的应用远景|教学论文范文|及其功能作用692.4.5需要进一步研究和解决的问题69-702.5小结70-713研究二马染色体中碱基使用频率的分析及内含子和外显子序列特征分析与猜测71-923.1数据集72-773.1.1马全基因序列的数据库的构建723.1.2马基因组内含子和外显子序列特征分析与猜测数据集72-773.2碱基使用频率研究方法77-783.2.1单碱基使用频率定义773.2.2二联体使用频率定义773.2.3三联体使用频率定义773.2.4子偏好性定义77-783.3内含子和外显子猜测方法78-813.3.1离散量与离散增量78-793.3.2支持向量机79-803.3.3猜测成功率评价指标80-813.4结果81-903.4.1马染色体中碱基使用频率的分析81-903.4.2内含子和外显子猜测结果903.5讨论90-913.5.1子的使用频率90-913.5.2关于马基因组内含子和外显子的猜测913.6小结91-92致谢92-93参考文献93-101作者简介101
相关文章
推荐阅读

 发表评论

共有3000条评论 快来参与吧~