首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到11条相似文献,搜索用时 796 毫秒
1.
目的:获得广金钱草Desmodium styracifolium(Osb.)Merr.全长转录组数据,深入挖掘其功能基因。方法:采用PacBio Sequel测序平台,对广金钱草的根、茎、叶3个部位混合样品进行全长转录组测序及分析。结果:共获得转录本140069条,N50长度为1542 nt,其中118906个(84.89%)转录本被成功注释。非冗余蛋白(NR)数据库注释中,与广金钱草最相近的物种是豆科植物密花豆Spatholobus suberectus Dunn;真核生物相邻类的聚簇(KOG)数据库注释中,比对到一般功能预测的转录本最多,有18064个;基因本体(GO)数据库注释中,86459个转录本分布于生物学过程、细胞组成和分子功能三大类45个功能组;京都基因与基因组百科全书(KEGG)注释中,参与广金钱草生物合成和其他次生代谢转录本3721个。在基因结构分析中,共得到74174个编码序列、3663个转录因子。简单序列重复(SSR)分析表明,40456个SSR中腺嘌呤和鸟嘌呤(AG)/胞嘧啶和胸腺嘧啶(CT)、AAG/CTT分别是二碱基、三碱基中优势重复类型。结论:获得了广金钱草全长转录本,为其后续的分子研究提供数据支持。  相似文献   

2.
目的:获得菝葜Smilax china L.全长转录组数据,深入挖掘其功能基因。方法:采用PacBio Sequel测序平台,分别提取菝葜根、茎、叶3个部位的RNA,将样品等量混合后进行全长转录组测序及分析。结果:共获得转录本122324个,N50长度为1400 nt,鸟嘌呤和胞嘧啶(GC)占比为45.32%,其中92878个(75.93%)转录本在七大数据库中注释。非冗余蛋白(NR)注释中,与菝葜最相近的物种是海枣Phoenix dactylifera L.,匹配程度达17.39%;真核生物相邻类的聚簇(KOG)数据库注释中,比对到一般功能预测的转录本最多,有17875个;基因本体(GO)数据库注释中,66001个转录本分布于生物学过程、细胞组成和分子功能三大类的45个功能组;京都基因与基因组百科全书(KEGG)注释中,参与菝葜生物合成和其他次生代谢转录本4286个,其中参与黄酮类化合物生物合成的转录本1478个、参与皂苷生物合成的转录本162个、参与芪类化合物生物合成的转录本4个、参与其他有机化合物合成的转录本2642个。在基因结构分析中,共得到64612个编码序列、2003个转录因子。此外,简单序列重复(SSR)分析表明,33118个SSR中最多的优势重复单元为腺嘌呤(A)G/C胸腺嘧啶(T),同时还预测到44580个长链非编码RNA和28229个mRNA。结论:获得了菝葜全长转录组数据,可为深入研究菝葜生长发育、相关代谢途径、胁迫响应及生物遗传多样性提供数据支持。  相似文献   

3.
目的:利用高通量测序技术获得马鞭草Verbena officinalis L.的全长转录组基因信息。方法:通过PacBio Sequel高通量测序平台,对马鞭草根、茎、叶3个部位的混合样品进行全长转录组测序,并基于序列同源性对转录本进行功能注释,得到马鞭草全长转录组的遗传信息。结果:测序数据经过质控后获得197542个高质量的转录本及169063条环形一致性序列(CCS),检测出4955个转录因子。其中161062个(81.53%)转录本在非冗余蛋白(NR)、真核生物相邻类的聚簇(KOG)数据库、京都基因与基因组百科全书(KEGG)、基因本体(GO)数据库、蛋白家族(Pfam)数据库和SwissProt蛋白序列数据库中均得到注释。MISA分析发现54063个简单重复序列(SSR)位点,还预测到70050个长链非编码RNAs(lncRNAs)和45499个信使核糖核酸(mRNAs),并在马鞭草全长转录组中共鉴定到了60个转录本可能参与单萜类化合物的生物合成。结论:利用高通量测序技术和生物信息学分析获得了马鞭草的全长转录组信息特征,可为后期开展马鞭草功能基因鉴定、解析萜类化合物次生代谢途径及其调控机制提供参考。  相似文献   

4.
目的:获得天仙藤全长转录组数据库,挖掘天仙藤功能基因。方法:采用PacBio SequeⅠ高通量测序系统,对天仙藤的茎、叶、果3个部位的混合样品进行全长转录组测序及分析。结果:共获得176354条环形一致性序列(CCS),获得184439个高质量isoforms,并注释了139826个isoforms,检测出3058个转录因子和135527个简单序列重复(SSR)位点,还预测到76862个长链非编码RNA(lncRNA)和36204个mRNAs。结论:获得了较可靠的天仙藤全长转录组数据,可为深入研究天仙藤基因组、生物学特性、相关代谢途径、信号通路及其分子机制提供数据支持。  相似文献   

5.
目的:获取广西莪术的全长转录组信息,了解其转录组的整体水平,挖掘姜黄素类生物合成通路基因。方法:利用Pacbio Sequel测序平台对广西莪术根、茎、叶、花4个部位的混合样品进行全长转录组测序,结合生物信息学等方法进行功能注释、代谢通路分析、简单序列重复(SSR)分析。结果:共获得原始数据14.47 Gb,经纠错、过滤、去冗余得到高质量一致性序列151218条。对所有转录本在非冗余蛋白(NR)、核苷酸序列(NT)、基因本体(GO)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、京都基因与基因组百科全书(KEGG)和SwissProt七大功能数据库进行注释及分类,结果有128414个基因被注释,占比84.92%。共有325个基因参与姜黄素的生物合成,编码4-香豆酸-辅酶A连接酶、苯丙氨酸解氨酶、姜黄素合成酶、二酮-辅酶A合成酶、肉桂酸-4-羟化酶和咖啡酰辅酶A-O-甲基转移酶6个关键酶。MISA分析共发现32459个SSR位点,以单核苷酸重复数量最多,占全部重复类型的38.63%;1~3个核苷酸重复序列占主导位置,占总SSR位点的93.58%。结论:在高通量全长转录组水平对广西莪术进行研究,对姜黄素合成相关基因进行了挖掘,为后续阐明广西莪术姜黄素生物合成分子机制提供依据,为进一步研究广西莪术的分子标记和优良基因挖掘提供数据基础。  相似文献   

6.
目的:构建药用植物青葙全长转录组,旨在为青葙功能基因组学研究提供遗传信息。方法:基于PacBio Sequel平台对青葙的根、茎、叶、花、果5个部位的混合样本进行高通量测序,对原始数据进行校正、筛选、聚类、去冗余、过滤、功能注释和结构分析,获得青葙全长转录组数据。结果:经质量控制后获得高质量测序reads数据量为13.46 Gb,拼接去冗余后获得155300条循环一致性序列(CCS),研究共获得521928个高质量isoforms和210189个转录本。利用非冗余蛋白(NR)、核苷酸序列(NT)、SwissProt、京都基因与基因组百科全书(KEGG)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、基因本体(GO)7个数据库进行全长序列的功能注释,结果显示共有158562个转录本被成功注释。GO注释结果显示,转录本共富集在包含生物学过程、细胞组成和分子功能三大类的47个条目中。KEGG分析显示,转录本注释到代谢通路中的基因较多,其次是基因信息过程。基因结构分析结显示,共得到8350条蛋白质编码序列(CDS)、88574条lncRNA、45535个简单序列重复(SSRs),其中单核苷酸重复的占比最大,为52.94%,此外预测得到57类转录因子,如常见的MADS、WRKY、AP2-EREBP、bHLH等类型。结论:获得了青葙的全长转录组数据,为该植物后续分子功能研究提供了遗传信息和基础数据。  相似文献   

7.
何海  郭继云  马毅平  周梦春  王沫  舒少华 《中草药》2015,46(23):3558-3563
目的分析茯苓转录组中简单重复序列(SSR)信息,以及含SSR的基因功能,为开发茯苓新型分子标记奠定基础。方法利用MISA软件搜索转录组Unigene及基因组scaffold中SSR,对含SSR的Unigene使用Blast X比对nr及KEGG数据库,注释其功能,并聚类分析。结果在转录组序列中发现4.57%的Unigene序列含有2 075个SSR,平均17 010条Unigene出现1个SSR,SSR的平均长度19.59 bp;而基因组中SSR的平均密度54.00个/Mb,平均长度20.74 bp。在转录组中发现的241种碱基重复模式中,以(CG/CG)n比例最高(10.97%);以六核苷酸类重复数量最多(35.64%),以(ACCACG/CGTGGT)14最长(84 bp)。在1 887条含SSR的Unigene中,115条能被基因本体(GO)分类注释到细胞代谢进程、核酸结合等;1 223条Unigene能被注释到219个KEGG通路图中,其中314条注释到新陈代谢,297条注释到遗传信息处理。结论茯苓转录组SSR的类型丰富、多态性潜能较高,关联功能相关基因的SSR开发对茯苓目的性状的分子标记辅助育种具有巨大潜力。  相似文献   

8.
目的:获得岗梅全长转录组数据库,为深入挖掘岗梅功能基因奠定基础。方法:采用基于PacBio Sequel平台的单分子实时测序技术获取岗梅的根、茎、叶样品的转录组数据,并利用非冗余蛋白(NR)、核苷酸序列(NT)、SwissProt蛋白序列数据库、京都基因与基因组百科全书(KEGG)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、基因本体(GO)进行注释,分析并鉴定编码三萜皂苷生物合成的关键酶的转录本。结果:全长转录组共获得89629个转录本,其中81313个在公共数据库进行了注释。KEEG代谢通路富集分析表明,623个转录本参与岗梅中三萜皂苷合成相关的3条代谢通路,其中263个转录本编码了三萜皂苷生物合成途径的21个关键酶。此外,还预测了2471个转录因子、40421个简单重复序列位点、22119个长链非编码RNA(lncRNA)和29131个mRNA。结论:丰富了岗梅的转录组数据,并为鉴定参与三萜皂苷和其他次生代谢物生物合成的候选基因提供参考,促进其分子生物学和基因组学的研究。  相似文献   

9.
目的:获得天冬Asparagus cochinchinensis(Lour.)Merr.全长转录组数据库,为探索其活性成分生物合成提供参考。方法:利用RNA-Seq技术对天冬的根、茎、叶进行转录组测序并分析。结果:从天冬转录组中共获得169319条isoforms,最终有147762条isoforms在公共数据库中注释成功。非冗余蛋白(NR)数据库结果显示,天冬与石刁柏Asparagus officinalis L.同源性最高;真核生物相邻类的聚簇(KOG)功能注释信息334380条,可分为25个基因功能大类;京都基因与基因组百科全书(KEGG)通路富集分析显示,代谢相关的通路分布最多,为74095条。在注释到的54个转录因子家族中,MYB家族数目最多,共309条。在所有isoform中共检测到48042个简单重复序列位点,从单核苷酸到六核苷酸重复单元均有分布。结论:获得了较为可靠的天冬全长转录组数据,可为深入研究天冬生物学特性、相关代谢途径、信号通路及其分子机制提供数据支持。  相似文献   

10.
目的:获得越南槐Sophora tonkinensis Gagnep.全长转录组数据,为深入挖掘越南槐功能基因提供参考。方法:采用PacBio Sequel高通量测序系统,对越南槐根、茎、叶、果4个部位的混合样品进行全长转录组测序及分析。结果:共获得214159条环形一致性序列(CCS),获得208156个高质量isoforms,并在非冗余蛋白(NR)、核苷酸序列(NT)、基因本体(GO)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、京都基因与基因组百科全书(KEGG)和SwissProt数据库中共注释了170150个isoforms,检测出4055个转录因子和38445个简单重复序列,预测到80041个长链非编码RNAs(lncRNAs)和39817个mRNAs。结论:获得了较为可靠的越南槐全长转录组数据,可为深入研究越南槐生物学特性、相关代谢途径、信号通路及其分子机制提供数据支持。  相似文献   

11.
目的:获得九里香Murraya exotica L.Mant.全长转录组数据库,为深入挖掘其全长基因信息提供参考。方法:利用Pacino Sequel平台的第三代测序技术,对九里香的根、茎、叶、花、果混合样品进行全长转录组测序,并对原始转录组数据进行分析。结果:共获得94435个转录本,平均长度为76476.23 bp,80583条环形一致性序列,通过聚类、校正和去冗余后最终得到108443个高质量的isoforms,其中在非冗余蛋白(NR)、核苷酸序列(NT)、基因本体(GO)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、京都基因与基因组百科全书(KEGG)和SwissProt共注释了100219个isoforms,同时检测出34182个简单序列重复(SSR)位点,其中18482个单核苷酸数量占主导位置;检测了2574个转录因子,29592个长链非编码RNAs(lncRNAs)和30322个mRNAs。结论:获得了较为可靠的九里香全长转录组数据,为深入研究九里香的生长发育、相关代谢途径、功能基因利用、基原物种鉴定等提供数据参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号