期刊文献+
共找到55篇文章
< 1 2 3 >
每页显示 20 50 100
利用全长转录本优化柞蚕基因组注释 被引量:1
1
作者 李莹 雷煜宇 +5 位作者 梁世梅 章贤 杜杰 杨新峰 李闪闪 段建平 《昆虫学报》 CAS CSCD 北大核心 2021年第11期1244-1251,共8页
【目的】优化柞蚕Antheraea pernyi基因组注释,更好地扩展其在比较基因组学及品种改良研究中的应用。【方法】对柞蚕进行全长转录组测序分析;经全长转录本与参考基因组比对,鉴定新基因及新转录本,并对这些新基因和新转录本进行功能注释... 【目的】优化柞蚕Antheraea pernyi基因组注释,更好地扩展其在比较基因组学及品种改良研究中的应用。【方法】对柞蚕进行全长转录组测序分析;经全长转录本与参考基因组比对,鉴定新基因及新转录本,并对这些新基因和新转录本进行功能注释及长链非编码RNAs(lncRNAs)预测。利用大量的蛋白质编码转录本和lncRNAs对柞蚕基因组中基因结构进行修订。最后创建矫正后的柞蚕基因组基因注释。【结果】新发现1997个蛋白编码基因和3399个lncRNA基因,分别由2402个和3574个全长转录本数据支持。发现柞蚕基因组含25021个基因,其中19825个基因是蛋白编码基因,包括7个保幼激素酸甲基转移酶基因。【结论】本研究促进了对柞蚕基因组基因注释信息的认识,为柞蚕及相关物种功能基因组及比较基因组学研究提供了很有用的数据资源。 展开更多
关键词 柞蚕 基因组注释 全长转录组 蛋白编码基因 lncRNA 保幼激素酸甲基转移酶基因
在线阅读 下载PDF
烟草基因组知识篇:3.基因组注释 被引量:1
2
作者 刘贯山 《中国烟草科学》 CSCD 北大核心 2010年第3期82-83,共2页
在完成序列的拼接后,得到的是很长的DNA序列、甚至可能是整个基因组的序列。这些序列中包含许多未知的基因,将基因从这些序列中找出来是基因组注释的主要内容。基因组DNA序列可分为两大部分:基因及其相关序列、基因间序列。以起始密码... 在完成序列的拼接后,得到的是很长的DNA序列、甚至可能是整个基因组的序列。这些序列中包含许多未知的基因,将基因从这些序列中找出来是基因组注释的主要内容。基因组DNA序列可分为两大部分:基因及其相关序列、基因间序列。以起始密码子开始、终止密码子结束、称之为开放阅读框(open readingframe,ORF)的序列为基因序列,它们可编码蛋白质和RNA(非编码RNA),所以又称为编码序列;基因相关序列包括拟(假)基因(pseudogene)、基因片段、内含子、非翻译区(untranslated region,UTR)等。基因间序列主要是一些重复序列,它们是所有基因组尤其是真核生物基因组共同的重要特征。 展开更多
关键词 基因组注释 DNA序列 知识 烟草 相关序列 起始密码子 终止密码子 开放阅读框
在线阅读 下载PDF
微生物基因组注释系统MGAP 被引量:6
3
作者 禹胄 李涛 +2 位作者 蔡涛 赵进东 罗静初 《微生物学报》 CAS CSCD 北大核心 2003年第6期805-808,共4页
利用生物信息学方法和工具开发了微生物基因组注释系统 (Microbialgenomeannota tionpackage ,MGAP) ,并用于蓝细菌PCC70 0 2的基因组注释。该系统由基因组注释系统和基于Web的用户接口程序两部分组成。基因组注释系统整合多个基因识别... 利用生物信息学方法和工具开发了微生物基因组注释系统 (Microbialgenomeannota tionpackage ,MGAP) ,并用于蓝细菌PCC70 0 2的基因组注释。该系统由基因组注释系统和基于Web的用户接口程序两部分组成。基因组注释系统整合多个基因识别、功能预测和序列分析软件 ;以及蛋白质序列数据库、蛋白质资源信息系统和直系同源蛋白质家族数据库等。用户接口程序包括基因组环状图展示、基因和开放读码框在染色体上的分布图 ,以及注释信息检索工具。该系统基于PC微机和Linux操作系统 ,用MySQL作数据库管理系统、用Apache作Web服务器程序 ,用Perl脚本语言编写应用程序接口 ,上述软件均可免费获得。 展开更多
关键词 微生物 基因组 基因组注释 生物信息学 蓝细菌 数据库
在线阅读 下载PDF
弱后酸化保加利亚乳杆菌KLDS1.1011的筛选及其全基因组注释研究 被引量:5
4
作者 王成凤 李柏良 +4 位作者 岳莹雪 陈紫育 闫芬芬 霍贵成 李艾黎 《食品工业科技》 CAS 北大核心 2021年第6期103-110,共8页
为了研究影响保加利亚乳杆菌后酸化的关键基因,为酸奶发酵剂的开发提供分子水平的理论基础。本实验以实验室现有的8株保加利亚乳杆菌作为出发菌株,通过对其生长性能以及对酸敏感性筛选出KLDS1.0207、KLDS1.0205、KLDS1.1001、KLDS1.101... 为了研究影响保加利亚乳杆菌后酸化的关键基因,为酸奶发酵剂的开发提供分子水平的理论基础。本实验以实验室现有的8株保加利亚乳杆菌作为出发菌株,通过对其生长性能以及对酸敏感性筛选出KLDS1.0207、KLDS1.0205、KLDS1.1001、KLDS1.1011产酸差异性明显的4株保加利亚乳杆菌,通过对4株保加利亚乳杆菌单菌株发酵乳的凝乳时间、滴定酸度、乳糖消耗进行检测,分析得到菌株KLDS1.1011后酸化能力最弱。通过Illumina HiSeq与Illumina MiSeq测序平台对菌株菌株KLDS1.1011进行基因组测序,得到KLDS1.1011基因组全长1887491 bp,平均G+C含量为39.83%,基因组中共预测出2098个CDS,其总长度为1622760 bp,编码区域总长度占全基因组比例85.97%,编码基因的平均长度为773 bp;利用同源聚类分析方式比较保加利亚乳杆菌KLDS1.1011和KLDS1.0207基因组,发现两者有1631个共有基因,KLDS1.1011有353个特有基因,KLDS1.0207有320个特有基因,进而通过对特有基因进行KEGG通路的注释以及后酸化相关通路的分析得到6个与后酸化相关的基因,1.1011_GM000805、1.1011_GM002068、1.1011_GM000803、1.1011_GM000804四个基因是关于生物膜的形成,菌株的物质转运、1.1011_GM000260基因属于丙酮酸代谢通路,是乳酸生成过程的重要通路、1.1011_GM000194基因是蛋白水解的关键酶基因。在基因水平上为菌株KLDS1.1011较弱的后酸化特性提供了重要的理论依据。 展开更多
关键词 保加利亚乳杆菌 筛选 后酸化 基因组注释 特有基因
在线阅读 下载PDF
草地贪夜蛾基因组注释及分析 被引量:12
5
作者 叶昕海 杨义 +2 位作者 梅洋 肖花美 李飞 《环境昆虫学报》 CSCD 北大核心 2019年第4期706-717,共12页
草地贪夜蛾 Spodoptera frugiperda 近年来在我国迅速扩散,造成了重大的经济损失,引起社会关注。草地贪夜蛾基因组序列对深入研究其迁飞、入侵和抗药性等特性具有十分重要的作用。目前,已有5个版本的基因组序列被公开报道,但3个版本无... 草地贪夜蛾 Spodoptera frugiperda 近年来在我国迅速扩散,造成了重大的经济损失,引起社会关注。草地贪夜蛾基因组序列对深入研究其迁飞、入侵和抗药性等特性具有十分重要的作用。目前,已有5个版本的基因组序列被公开报道,但3个版本无基因组注释信息。除以 Sf 9细胞系为DNA来源的基因组版本外,其他版本的scaffold N50过小,拼接质量偏低。为此,本研究选取了scaffold N50最大的草地贪夜蛾 Sf 9细胞系基因组进行了蛋白编码基因注释。该版本的基因组重复序列占比28.1%。CEGMA评估显示该本版本基因组可覆盖93.6%的核心基因,BUSCO评估显示可覆盖90.8%的核心基因。利用OMIGA注释流程预测到25 699个蛋白质编码基因,详细的基因序列可从InsectBase网站获得(http://www.insect-genome.com/FAW/),其中具有GO注释的基因为 15 623个,具有KEGG注释的基因共有9 213个。选取了12个鳞翅目昆虫进行比较基因组学分析,发现草地贪夜蛾与斜纹夜蛾的亲缘关系最近,两者分化时间大约在1 284万年前。对12个鳞翅目昆虫蛋白质编码基因进行同源分析,在草地贪夜蛾中发现了2 490个单拷贝基因、891个鳞翅目特有基因、2 360个物种特异扩增基因和 4 180个物种特异基因。GO富集分析显示,2 360个物种特异扩增基因主要参与DNA整合、代谢相关的生物过程;4 180个物种特异基因主要参与酶活性、光感受、糖代谢等,KEGG通路富集发现草地贪夜蛾特异基因主要参与氨基酸代谢、糖代谢和Wnt信号通路。本研究结果丰富了草地贪夜蛾的基因信息,对进一步了解其生物学特性、开发新型绿色防控方法具有指导意义。 展开更多
关键词 草地贪夜蛾 基因组注释 比较基因组 基因家族 进化
在线阅读 下载PDF
文本挖掘在基因组注释中的应用 被引量:2
6
作者 周永称 崔雷 《中华医学图书情报杂志》 CAS 2017年第3期15-19,共5页
为了解生物医学文本挖掘技术在基因组注释方面的基本应用,以Web of Science(WOS)数据库中收录的关于生物医学文本挖掘技术在基因组注释方面的基本应用的文献作为来源文献,利用书目共现分析软件提取文献中的高被引论文,形成来源文献——... 为了解生物医学文本挖掘技术在基因组注释方面的基本应用,以Web of Science(WOS)数据库中收录的关于生物医学文本挖掘技术在基因组注释方面的基本应用的文献作为来源文献,利用书目共现分析软件提取文献中的高被引论文,形成来源文献——高被引文献词篇矩阵,利用聚类软件对高被引论文进行同被引聚类分析,最后得到生物医学文本挖掘技术在基因组注释方面的基本应用,主要包括权威工具的使用、文本挖掘工具和算法的开发、文本挖掘工具的检验。 展开更多
关键词 文本挖掘 基因组注释 应用 聚类分析
在线阅读 下载PDF
利用蛋白质序列模式识别改善谷氨酸棒杆菌基因组注释
7
作者 周大为 李炜疆 《工业微生物》 CAS CSCD 2014年第3期70-76,共7页
即使细菌基因组的基因结构较为简单,但在注释过程中也可能出现基因遗漏的现象。当潜在基因在高质量数据库中没有显著同源序列时,基于知识库的基因预测方法就会遇到困难。本文希望通过系统扫描基因组所有可能ORF的蛋白质序列模式来搜索... 即使细菌基因组的基因结构较为简单,但在注释过程中也可能出现基因遗漏的现象。当潜在基因在高质量数据库中没有显著同源序列时,基于知识库的基因预测方法就会遇到困难。本文希望通过系统扫描基因组所有可能ORF的蛋白质序列模式来搜索遗漏基因。为验证该方法的可行性,作者系统分析了重要的工业发酵微生物谷氨酸棒杆菌的基因组,发现了25个候选疑似基因。它们具有显著的蛋白质序列模式,但在Swiss-Prot中元显著同源序列,并且在GenBank中仍未注释。深入分析发现,25个候选疑似基因中19个为可能基因,3个为可能假基因,3个为疑似基因序列。这些结果说明本文的分析方法可以有效地用于无显著同源序列基因的搜索。 展开更多
关键词 蛋白质序列模式 谷氨酸棒杆菌 基因组注释
在线阅读 下载PDF
面向大规模人群的基因组注释系统
8
作者 闫贞磊 国宏哲 《生物信息学》 2022年第1期11-19,共9页
基因组注释是识别出基因组序列中功能组件的过程,其可以直接对序列赋予生物学意义,由此方便研究者探究和分析基因组功能。基因组注释可以帮助研究从三个层次上理解基因组,一种是在核苷酸水平的注释,主要确定DNA序列中基因、RNA、重复序... 基因组注释是识别出基因组序列中功能组件的过程,其可以直接对序列赋予生物学意义,由此方便研究者探究和分析基因组功能。基因组注释可以帮助研究从三个层次上理解基因组,一种是在核苷酸水平的注释,主要确定DNA序列中基因、RNA、重复序列等组件的物理位置,包括转录起始,翻译起始,外显子边界等具体位置信息。同时可以注释得到变异在不同人群中的变异频率差异,这是解读不同人群表型差异的图谱基础。第二种是蛋白水平的注释,主要解读基因或变异的可能功能异常,评估变异所在基因位置、变异类型等对蛋白质改变的影响。第三种是生物学功能/过程注释,主要解读不同基因相互作用的对生物学过程和通路的影响,可以从系统生物学角度解释基因或调控元件对生命生化过程或功能的影响。自从人类基因组计划完成之后,各国陆续启动了基因组测序计划,完成绘制了人类基因详尽的基因多态性谱图,记录了不同表型群体的变异分布和频率差异情况等注释信息。我们结合已有的注释数据库知识,开发了具有高准确性和高效的面向大规模人群的基因组注释系统,实现对大规模的人群变异数据进行全自动化的功能性注释分析计算,进一步助力未来人群遗传变异分布等方面的研究。 展开更多
关键词 人群基因组 基因组注释 基因组变异
在线阅读 下载PDF
英表观基因组注释技术揭示胰腺发育不全病因
9
《生物学教学》 2014年第5期78-78,共1页
据中国科技网2013年11月11日援引报道,英国埃克塞特大学医学院和伦敦帝国学院的一个合作研究小组利用来自全世界11个胰腺发育不全病人的样本,结合“表观基因组注释”技术对人类胚胎干细胞生成的胰腺前细胞进行了全基因组测序转译,
关键词 基因组注释 发育不全 胰腺 技术 表观 人类胚胎干细胞 病因 基因组测序
在线阅读 下载PDF
安捷伦科技充分利用水稻基因组注释数据库,推出新一代全基因组水稻微阵列
10
《现代仪器》 2008年第2期79-79,共1页
2008年1月30日,安捷伦科技公司宣布推出一款新的水稻寡核苷酸微阵列44K RAP-DB。该微阵列以日本国家农业生物科学研究所(NIAS)编制的基因组信息为基础。NIAS由日本农林水产省资助建立,设立水稻基因资源中心以帮助研究者探索改良这... 2008年1月30日,安捷伦科技公司宣布推出一款新的水稻寡核苷酸微阵列44K RAP-DB。该微阵列以日本国家农业生物科学研究所(NIAS)编制的基因组信息为基础。NIAS由日本农林水产省资助建立,设立水稻基因资源中心以帮助研究者探索改良这种主要的农作物的基因组学方法。 展开更多
关键词 寡核苷酸微阵列 安捷伦科技公司 基因组注释 水稻 基因组 数据库 基因组学方法 基因组信息
在线阅读 下载PDF
细点石斑鱼的基因组注释及比较基因组学分析
11
作者 王垚鑫 贾磊 +5 位作者 尚晓迪 于燕光 王钢 刘厚孚 陈春秀 李翔 《水产研究》 2025年第1期10-19,共10页
细点石斑鱼(Epinephelus cyanopodus),隶属于鲈形目、鮨科、石斑鱼属,是一种栖息于暖水礁区的肉食性鱼类。目前国内已实现人工养殖,但在苗种生产过程中面临雄性亲本获取困难的问题,性别调控的关键基因尚不明确。本试验通过转录组测序、... 细点石斑鱼(Epinephelus cyanopodus),隶属于鲈形目、鮨科、石斑鱼属,是一种栖息于暖水礁区的肉食性鱼类。目前国内已实现人工养殖,但在苗种生产过程中面临雄性亲本获取困难的问题,性别调控的关键基因尚不明确。本试验通过转录组测序、近缘物种比对及从头预测等方法,对细点石斑鱼进行了基因组注释,共获得26,743个编码基因。在此基础上,联合近缘物种开展了比较基因组学分析,揭示了细点石斑鱼与赤点石斑鱼(Epinephelus akaara)之间的基因组差异及基因家族变化情况,同时定位到与性别调控相关的褪黑素(Melatonin, MT)合成基因aanat,为今后的性别调控研究奠定了数据基础。Epinephelus cyanopodus, belonging to the order Perciformes, family Serranidae, and genus Epinephelus, is a carnivorous fish that inhabits warm-water reef areas. At present, artificial breeding has been achieved in China. However, in the process of seed production, there is a problem of difficulty in obtaining male parents, and the key genes for sex control are still unclear. In this study, strategies such as transcriptome sequencing data, genome comparison with closely related species, and de novo prediction were adopted to complete the genome annotation work, and a total of 26,743 coding genes were identified. Based on this, a comparative genomics analysis was further conducted in combination with closely related species, revealing the quantity and distribution characteristics of various variations in the genome of Epinephelus cyanopodus, as well as the changing trends of gene families during evolution. Moreover, the key gene aanat related to sex regulation and melatonin (MT) synthesis was successfully located, establishes the data foundation for future studies on gender regulation. 展开更多
关键词 细点石斑鱼 比较基因组 褪黑素 性别调控 基因组注释
在线阅读 下载PDF
蛋白质基因组学:运用蛋白质组技术注释基因组 被引量:4
12
作者 张昆 王乐珩 +11 位作者 迟浩 卜德超 袁作飞 刘超 樊盛博 陈海丰 曾文锋 罗海涛 孙瑞祥 贺思敏 谢鹭 赵屹 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2013年第4期297-308,共12页
随着高通量DNA测序技术的飞速发展,越来越多的物种完成了基因组测序.定位编码基因、确定编码基因结构是基因组注释的基本任务,然而以往的基因组注释方法主要依赖于DNA及RNA序列信息.为了更加精确地解读完成测序的基因组,我们需要整合多... 随着高通量DNA测序技术的飞速发展,越来越多的物种完成了基因组测序.定位编码基因、确定编码基因结构是基因组注释的基本任务,然而以往的基因组注释方法主要依赖于DNA及RNA序列信息.为了更加精确地解读完成测序的基因组,我们需要整合多种类型的组学数据进行基因组注释.近年来,基于串联质谱技术的蛋白质组学已经发展成熟,实现了对蛋白质组的高覆盖,使得利用串联质谱数据进行基因组注释成为可能.串联质谱数据一方面可以对已注释的基因进行表达验证,另一方面还可以校正原注释基因,进而发现新基因,实现对基因组序列的重新注释.这正是当前进展较快的蛋白质基因组学的研究内容.利用该方法系统地注释已完成测序的基因组已成为解读基因组的一个重要补充.本文综述了蛋白质基因组学的主要研究内容和研究方法,并展望了该研究方向未来的发展. 展开更多
关键词 蛋白质基因组 基因组注释 蛋白质组学 质谱技术
在线阅读 下载PDF
后基因组时代的基因组功能注释 被引量:33
13
作者 解涛 梁卫平 丁达夫 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2000年第2期166-170,共5页
基因组功能注释是后基因组时代功能基因组学研究的热点领域 .从基因组功能注释的研究内容与研究手段出发 ,重点综述了生物信息学在该领域方法学上的研究进展 ,并展望了今后的发展前景 .
关键词 基因组功能注释 基因组时代 人类基因组计划
在线阅读 下载PDF
人3p24-p25478kb完全基因组序列的注释
14
作者 丁克越 张以琳 +1 位作者 陈立宏 沈岩 《中国医学科学院学报》 CAS CSCD 北大核心 2002年第3期259-263,共5页
目的对我国承担的人类基因组测序项目中的3p24-p25478kb完全基因组序列进行注释。方法采用从头预测、数据库相似性比较和全长或部分mRNA序列与基因组序列的比对等手段,识别基因组序列中的编码蛋白质的基因,并采用EMBOSS软件包分析基因... 目的对我国承担的人类基因组测序项目中的3p24-p25478kb完全基因组序列进行注释。方法采用从头预测、数据库相似性比较和全长或部分mRNA序列与基因组序列的比对等手段,识别基因组序列中的编码蛋白质的基因,并采用EMBOSS软件包分析基因组序列的组分特征。结果识别出该区域中的两个编码蛋白质的已知基因,即SLC6A1和SLC6A11(其中后者在基因组草图序列中未被定位);对这段基因组序列中组分特征预测分析结果显示,该基因组序列的平均GC含量为47%,并存在3个假想的CpG岛,其中两个CpG岛分别位于130685~131516bp及307090~307870bp,另一个位于415585~416308bp。结论采用上述方法对基因组序列3p24-p25478kb进行了正确的注释,揭示了基因组序列中的有关的基因结构、GC含量、CpG岛等信息。 展开更多
关键词 人类基因组计划 基因组注释 3p24-p25基因组 基因结构 GC含量 CPG岛
在线阅读 下载PDF
借助野生黄瓜与栽培黄瓜的共线性分析改善基因组注释
15
作者 谭涛 马明月 《基因组学与应用生物学》 CAS CSCD 北大核心 2017年第10期4339-4344,共6页
近缘物种基因组间保留了祖先的大量信息,具有较好的保守性。通过比较近缘物种的基因组序列可以获得大片段的共线性区域,而这些区域内包含了丰富的同源信息,可用来发现未知基因、改善基因组注释的质量。本研究中,首先,借助同样的基因组... 近缘物种基因组间保留了祖先的大量信息,具有较好的保守性。通过比较近缘物种的基因组序列可以获得大片段的共线性区域,而这些区域内包含了丰富的同源信息,可用来发现未知基因、改善基因组注释的质量。本研究中,首先,借助同样的基因组注释平台对它们进行了基因组注释。其次,通过比较两个全基因组序列获得共线性信息,然后基于共线性信息对他们的基因组注释进行改善。最终,在野生黄瓜中新注释出了909个基因,栽培黄瓜中新注释出了853个基因。结合野生与栽培黄瓜的转录组信息,在野生黄瓜中发现了87例开放阅读框(ORF)较长的基因被错误注释成多个ORF短基因,40例多个ORF较短的基因被过度预测成单个长ORF基因;相应地在栽培黄瓜中分别确定了166例和36例错误注释。 展开更多
关键词 野生黄瓜 栽培黄瓜 基因组注释 共线性
原文传递
现代基因组注释
16
作者 Dmitrij Frishman(著) 刘科科 《国外科技新书评介》 2010年第3期7-8,共2页
基因组工程第一次成功地揭开了生命的蓝图。在距DNA三维结构发现仅仅50年的今天,我们可以在短短几天的时间内就完成一株细菌的全基因组测序工作。随着新测序技术的快速发展,基因组测序工作变得越来越简单、廉价,每天都会有大量的序... 基因组工程第一次成功地揭开了生命的蓝图。在距DNA三维结构发现仅仅50年的今天,我们可以在短短几天的时间内就完成一株细菌的全基因组测序工作。随着新测序技术的快速发展,基因组测序工作变得越来越简单、廉价,每天都会有大量的序列信息被公布。 展开更多
关键词 基因组注释 测序工作 基因组工程 三维结构 基因组 测序技术 序列信息 DNA
原文传递
应用蛋白质组学方法完善福氏志贺菌基因组注释的研究
17
作者 赵丽娜 郑金金 +4 位作者 贺宝玲 李巍伟 唐红梅 胡芬 高爽 《基因组学与应用生物学》 CAS CSCD 北大核心 2016年第6期1437-1442,共6页
常规的应用计算机软件注释基因存在缺陷,目前对基因组的准确注释依然是一项富有挑战性的任务本研究旨在应用蛋白质基因组学(proteogenomics)方法完善福氏志贺菌的基因组注释。提取福氏2a志贺菌301株(Sf2a301)的全菌蛋白,胰蛋白酶水解的... 常规的应用计算机软件注释基因存在缺陷,目前对基因组的准确注释依然是一项富有挑战性的任务本研究旨在应用蛋白质基因组学(proteogenomics)方法完善福氏志贺菌的基因组注释。提取福氏2a志贺菌301株(Sf2a301)的全菌蛋白,胰蛋白酶水解的肤混合物经二维液相色谱分离、在线ESI串联质谱分析,质谱数据检索Sf2a301的6个读码框数据库,鉴定结果进一步经过生物信息学分析和实验验证。本研究共验证了729个Sf2a301已注释基因的蛋白编码产物,鉴定蛋白在分子量、等电点和疏水性等理化性质方面的分布与Sf2a301基因组已注释蛋白的趋势一致。共发现了6个未注释的新基因,新基因得到了RT-PCR在转录水平上的进一步验证。蛋白质基因组学能够有效的完善志贺菌的基因组注释,不仅验证了已注释基因,而且能够发现新的基因补充其原有基因组注释库,这种策略有望被推广到其他经过测序的生物体基因组注释工作中。 展开更多
关键词 福氏志贺菌 蛋白质基因组 基因组注释 液质联用
原文传递
基于RNA-Seq技术的毕赤酵母基因组重注释及新型强启动子的发现与序列分析 被引量:4
18
作者 亓飞 蔡孟浩 +1 位作者 周祥山 张元兴 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第2期167-175,共9页
使用RNA-Seq技术,对毕赤酵母进行了转录组测序。基于测序结果,对现有毕赤酵母基因组进行了重注释,修正了基因组序列中的错误位点861处,发现了新转录本249个及可变剪切现象83个,并更正了553个转录本的错误注释。经过表达谱分析,在毕赤酵... 使用RNA-Seq技术,对毕赤酵母进行了转录组测序。基于测序结果,对现有毕赤酵母基因组进行了重注释,修正了基因组序列中的错误位点861处,发现了新转录本249个及可变剪切现象83个,并更正了553个转录本的错误注释。经过表达谱分析,在毕赤酵母中发现了2个新型强启动子,分别命名为P437和P1431,其驱动的转录本的最高转录水平分别为AOX1基因的1.78倍和3.40倍。序列分析显示,P437和P1431序列中存在着多个酵母转录因子的结合位点。 展开更多
关键词 毕赤酵母 RNA-SEQ 基因组注释 启动子
在线阅读 下载PDF
人类基因组结构注释数据库系统存储优化
19
作者 祝凯 《软件导刊》 2007年第9期125-126,共2页
在构建了人类基因组结构注释数据库系统的实体关系模型,明确交互式的基因组可视化浏览是其最重要和最核心的查询事务的基础上,通过对数据库实施逻辑结构设计和物理设计两个方面的优化措施,使数据库面向基因组可视化浏览的查询访问效率... 在构建了人类基因组结构注释数据库系统的实体关系模型,明确交互式的基因组可视化浏览是其最重要和最核心的查询事务的基础上,通过对数据库实施逻辑结构设计和物理设计两个方面的优化措施,使数据库面向基因组可视化浏览的查询访问效率提高了约30%,实现了对web检索访问、可视化浏览访问以及计算存取等的有效支持。 展开更多
关键词 人类基因组结构注释数据库 存储优化 可视化浏览
在线阅读 下载PDF
基于PacBio三代测序的高质量汶上芦花鸡基因组的组装 被引量:2
20
作者 薛倩 邢伟杰 +6 位作者 李国辉 周成浩 张会永 殷建玫 蒋一秀 朱云芬 韩威 《中国畜牧兽医》 CAS CSCD 北大核心 2023年第10期3869-3881,共13页
【目的】汶上芦花鸡为中国唯一的芦花羽地方鸡品种资源,芦花基因可伴性遗传,芦花羽性状可用于雏鸡的自别雌雄。试验旨在丰富家鸡基因组信息,获取汶上芦花鸡全基因组序列,为鸡伴性芦花羽分子机制研究提供材料。【方法】以汶上芦花鸡为试... 【目的】汶上芦花鸡为中国唯一的芦花羽地方鸡品种资源,芦花基因可伴性遗传,芦花羽性状可用于雏鸡的自别雌雄。试验旨在丰富家鸡基因组信息,获取汶上芦花鸡全基因组序列,为鸡伴性芦花羽分子机制研究提供材料。【方法】以汶上芦花鸡为试验动物,基于BGI MGISEQ构建小片段文库进行基因组特征评估,利用PacBio三代测序技术、Hi-C技术组装及构建汶上芦花鸡全基因组信息数据库,利用生物信息学方法对获得的基因组序列进行组装和功能注释。【结果】试验共获得BGI二代测序数据量59.70 Gb;获得PacBio三代测序数据量31.13 Gb,reads平均长度为15362 bp;获得Hi-C数据量95.37 Gb;拼接和初步组装得到基因组大小为1.12 Gb,经Hi-C辅助组装后,共有1.07 Gb的序列挂载到41条染色体上,挂载率95.62%,基因组contigs N50为9.61 Mb,scaffold N50为91.29 Mb,BUSCO评估为98.50%,基因组连续性和完整度良好;预测基因组有22.57%的重复序列,有426个tRNAs、56个rRNAs、260个miRNAs和308个snRNAs;共预测得到蛋白编码基因17338个,其中96.00%的基因在数据库中得到了功能注释;组装获得汶上芦花鸡Z染色体长度约88.23 Mb,预测并注释到蛋白编码基因742个,这些基因显著富集于氨基酸、脂肪等代谢相关通路,在汶上芦花鸡Z染色体上准确定位了TYRP 1、CDKN 2 A、SLC 45 A 2等羽色相关基因。【结论】研究获得了汶上芦花鸡高质量染色体水平基因组,丰富了家鸡基因组遗传信息,准确定位了Z染色体上一些羽色相关基因。研究结果可为从全基因组水平挖掘汶上芦花鸡优异性状调控机制奠定基础。 展开更多
关键词 汶上芦花鸡 基因组组装 PacBio三代测序技术 基因组注释 Z染色体 伴性芦花羽
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部