首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到13条相似文献,搜索用时 281 毫秒
1.
目的:构建药用植物青葙全长转录组,旨在为青葙功能基因组学研究提供遗传信息。方法:基于PacBio Sequel平台对青葙的根、茎、叶、花、果5个部位的混合样本进行高通量测序,对原始数据进行校正、筛选、聚类、去冗余、过滤、功能注释和结构分析,获得青葙全长转录组数据。结果:经质量控制后获得高质量测序reads数据量为13.46 Gb,拼接去冗余后获得155300条循环一致性序列(CCS),研究共获得521928个高质量isoforms和210189个转录本。利用非冗余蛋白(NR)、核苷酸序列(NT)、SwissProt、京都基因与基因组百科全书(KEGG)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、基因本体(GO)7个数据库进行全长序列的功能注释,结果显示共有158562个转录本被成功注释。GO注释结果显示,转录本共富集在包含生物学过程、细胞组成和分子功能三大类的47个条目中。KEGG分析显示,转录本注释到代谢通路中的基因较多,其次是基因信息过程。基因结构分析结显示,共得到8350条蛋白质编码序列(CDS)、88574条lncRNA、45535个简单序列重复(SSRs),其中单核苷酸重复的占比最大,为52.94%,此外预测得到57类转录因子,如常见的MADS、WRKY、AP2-EREBP、bHLH等类型。结论:获得了青葙的全长转录组数据,为该植物后续分子功能研究提供了遗传信息和基础数据。  相似文献   

2.
目的:获得岗梅全长转录组数据库,为深入挖掘岗梅功能基因奠定基础。方法:采用基于PacBio Sequel平台的单分子实时测序技术获取岗梅的根、茎、叶样品的转录组数据,并利用非冗余蛋白(NR)、核苷酸序列(NT)、SwissProt蛋白序列数据库、京都基因与基因组百科全书(KEGG)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、基因本体(GO)进行注释,分析并鉴定编码三萜皂苷生物合成的关键酶的转录本。结果:全长转录组共获得89629个转录本,其中81313个在公共数据库进行了注释。KEEG代谢通路富集分析表明,623个转录本参与岗梅中三萜皂苷合成相关的3条代谢通路,其中263个转录本编码了三萜皂苷生物合成途径的21个关键酶。此外,还预测了2471个转录因子、40421个简单重复序列位点、22119个长链非编码RNA(lncRNA)和29131个mRNA。结论:丰富了岗梅的转录组数据,并为鉴定参与三萜皂苷和其他次生代谢物生物合成的候选基因提供参考,促进其分子生物学和基因组学的研究。  相似文献   

3.
【目的】 利用高通量测序技术获得大青的转录组信息特征。【方法】 通过高通量测序平台Illumina HiSeqTM 2500 对大青进行转录组测序,采用Trinity软件de novo组装获得Unigene,并基于序列同源性对Unigene 进行功能注释,得到大青转录组的遗传信息。【结果】 测序数据经过质控后共获得26 394 223个高质量的Reads,通过de novo组装获得100 191个Unigene,N50长度为1 055 bp,平均长度724.4 bp。其中59 690个(59.58%)Unigene 在NR、SwissProt、KOG、GO、KEGG数据库中均得到注释。其中KEGG数据库注释到38 260个Unigene,涉及136条代谢通路。在大青转录组中共鉴定到407个Unigene参与萜类化合物的生物合成,165个Unigene 涉及类黄酮生物合成,29个Unigene参与黄酮和黄酮醇生物合成,37个Unigene参与异黄酮生物合成,同时,还鉴定到210类转录因子。MISA分析发现6 680个Unigene 包含8 640个简单重复序列。【结论】 利用高通量测序技术和生物信息分析获得了大青的转录组信息特征,这些数据可为后期开展功能基因鉴定、解析黄酮类化合物次生代谢途径及其调控机制奠定研究基础。  相似文献   

4.
5.
目的:获得菝葜Smilax china L.全长转录组数据,深入挖掘其功能基因。方法:采用PacBio Sequel测序平台,分别提取菝葜根、茎、叶3个部位的RNA,将样品等量混合后进行全长转录组测序及分析。结果:共获得转录本122324个,N50长度为1400 nt,鸟嘌呤和胞嘧啶(GC)占比为45.32%,其中92878个(75.93%)转录本在七大数据库中注释。非冗余蛋白(NR)注释中,与菝葜最相近的物种是海枣Phoenix dactylifera L.,匹配程度达17.39%;真核生物相邻类的聚簇(KOG)数据库注释中,比对到一般功能预测的转录本最多,有17875个;基因本体(GO)数据库注释中,66001个转录本分布于生物学过程、细胞组成和分子功能三大类的45个功能组;京都基因与基因组百科全书(KEGG)注释中,参与菝葜生物合成和其他次生代谢转录本4286个,其中参与黄酮类化合物生物合成的转录本1478个、参与皂苷生物合成的转录本162个、参与芪类化合物生物合成的转录本4个、参与其他有机化合物合成的转录本2642个。在基因结构分析中,共得到64612个编码序列、2003个转录因子。此外,简单序列重复(SSR)分析表明,33118个SSR中最多的优势重复单元为腺嘌呤(A)G/C胸腺嘧啶(T),同时还预测到44580个长链非编码RNA和28229个mRNA。结论:获得了菝葜全长转录组数据,可为深入研究菝葜生长发育、相关代谢途径、胁迫响应及生物遗传多样性提供数据支持。  相似文献   

6.
目的:获得广金钱草Desmodium styracifolium(Osb.)Merr.全长转录组数据,深入挖掘其功能基因。方法:采用PacBio Sequel测序平台,对广金钱草的根、茎、叶3个部位混合样品进行全长转录组测序及分析。结果:共获得转录本140069条,N50长度为1542 nt,其中118906个(84.89%)转录本被成功注释。非冗余蛋白(NR)数据库注释中,与广金钱草最相近的物种是豆科植物密花豆Spatholobus suberectus Dunn;真核生物相邻类的聚簇(KOG)数据库注释中,比对到一般功能预测的转录本最多,有18064个;基因本体(GO)数据库注释中,86459个转录本分布于生物学过程、细胞组成和分子功能三大类45个功能组;京都基因与基因组百科全书(KEGG)注释中,参与广金钱草生物合成和其他次生代谢转录本3721个。在基因结构分析中,共得到74174个编码序列、3663个转录因子。简单序列重复(SSR)分析表明,40456个SSR中腺嘌呤和鸟嘌呤(AG)/胞嘧啶和胸腺嘧啶(CT)、AAG/CTT分别是二碱基、三碱基中优势重复类型。结论:获得了广金钱草全长转录本,为其后续的分子研究提供数据支持。  相似文献   

7.
目的:获得九里香Murraya exotica L.Mant.全长转录组数据库,为深入挖掘其全长基因信息提供参考。方法:利用Pacino Sequel平台的第三代测序技术,对九里香的根、茎、叶、花、果混合样品进行全长转录组测序,并对原始转录组数据进行分析。结果:共获得94435个转录本,平均长度为76476.23 bp,80583条环形一致性序列,通过聚类、校正和去冗余后最终得到108443个高质量的isoforms,其中在非冗余蛋白(NR)、核苷酸序列(NT)、基因本体(GO)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、京都基因与基因组百科全书(KEGG)和SwissProt共注释了100219个isoforms,同时检测出34182个简单序列重复(SSR)位点,其中18482个单核苷酸数量占主导位置;检测了2574个转录因子,29592个长链非编码RNAs(lncRNAs)和30322个mRNAs。结论:获得了较为可靠的九里香全长转录组数据,为深入研究九里香的生长发育、相关代谢途径、功能基因利用、基原物种鉴定等提供数据参考。  相似文献   

8.
目的:获得越南槐Sophora tonkinensis Gagnep.全长转录组数据,为深入挖掘越南槐功能基因提供参考。方法:采用PacBio Sequel高通量测序系统,对越南槐根、茎、叶、果4个部位的混合样品进行全长转录组测序及分析。结果:共获得214159条环形一致性序列(CCS),获得208156个高质量isoforms,并在非冗余蛋白(NR)、核苷酸序列(NT)、基因本体(GO)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、京都基因与基因组百科全书(KEGG)和SwissProt数据库中共注释了170150个isoforms,检测出4055个转录因子和38445个简单重复序列,预测到80041个长链非编码RNAs(lncRNAs)和39817个mRNAs。结论:获得了较为可靠的越南槐全长转录组数据,可为深入研究越南槐生物学特性、相关代谢途径、信号通路及其分子机制提供数据支持。  相似文献   

9.
目的:获得天仙藤全长转录组数据库,挖掘天仙藤功能基因。方法:采用PacBio SequeⅠ高通量测序系统,对天仙藤的茎、叶、果3个部位的混合样品进行全长转录组测序及分析。结果:共获得176354条环形一致性序列(CCS),获得184439个高质量isoforms,并注释了139826个isoforms,检测出3058个转录因子和135527个简单序列重复(SSR)位点,还预测到76862个长链非编码RNA(lncRNA)和36204个mRNAs。结论:获得了较可靠的天仙藤全长转录组数据,可为深入研究天仙藤基因组、生物学特性、相关代谢途径、信号通路及其分子机制提供数据支持。  相似文献   

10.
目的:获得广州相思子Abrus pulchellus subsp.cantoniensis(Hance)Verdc.全长转录本。方法:利用PacBio Sequel测序平台,通过对广州相思子的根、茎、叶3个部位混合样品开展三代全长转录组测序,并对测序数据进行生物信息学分析。结果:共获得原始测序数据14.55 Gb,最终获得转录本序列172829条,N50长度为1572 nt,鸟嘌呤和胞嘧啶(GC)占比为40.86%。基因注释中,共有158888(91.93%)个转录本被成功注释;基因本体(GO)数据库注释中,102457个(59.28%)转录本分为生物学过程、细胞组成和分子功能三大类46个功能组;真核生物相邻类的聚簇(KOG)数据库注释中,一般功能预测的转录本最多,为22461个;信号转导机制、翻译后修饰、蛋白反转和分子伴侣亦为其主要功能途径;京都基因与基因组百科全书(KEGG)注释到转录本有99847个,其中参与广州相思子生物合成和其他次生代谢有4530个。基因结构分析中,共得到92344条编码序列,4800个转录因子隶属于59个转录因子家族。此外,简单序列重复(SSR)标记分析表明,40050处SSR位点中单碱基重复的SSR数目最多,其次是包含腺嘌呤(A)G/C胸腺嘧啶(T)的二碱基重复SSR。结论:获得的广州相思子全长转录组数据可为后续基因功能、代谢通路调控及分子标记开发等研究提供数据支撑。  相似文献   

11.
目的克隆山茱萸关键酶基因1-脱氧-D-核酮糖5-磷酸还原酶(CoDXR)的全长cDNA序列,为山茱萸的进一步研究提供依据。方法以本实验室获得的山茱萸转录组数据中的转录本序列c147202_g1为模板,通过Primer Premier 5.0设计特异性引物,利用RT-PCR技术克隆CoDXR基因的全长cDNA序列,并通过相关的生物信息学软件对其进行相关的生物信息学分析和功能预测。结果 CoDXR基因长度为1 505 bp,ORF长度是729 bp,编码242个氨基酸。而通过SignalP4.0Server和HMMTOP对CoDXR蛋白预测分析结果可知,该蛋白不具有信号肽和跨膜区,为疏水性蛋白。系统进化树分析结果表明CoDXR蛋白与野茶树(Camelliasinensis)的DXR蛋白序列相似性最高。结论在山茱萸果实和叶片转录组测序的基础上成功克隆了山茱萸萜类合成途径中的关键酶基因CoDXR,对其进行相关的生物信息学分析,为深入研究CoDXR基因在山茱萸萜类合成途径中的功能奠定了基础。  相似文献   

12.
目的:获得天冬Asparagus cochinchinensis(Lour.)Merr.全长转录组数据库,为探索其活性成分生物合成提供参考。方法:利用RNA-Seq技术对天冬的根、茎、叶进行转录组测序并分析。结果:从天冬转录组中共获得169319条isoforms,最终有147762条isoforms在公共数据库中注释成功。非冗余蛋白(NR)数据库结果显示,天冬与石刁柏Asparagus officinalis L.同源性最高;真核生物相邻类的聚簇(KOG)功能注释信息334380条,可分为25个基因功能大类;京都基因与基因组百科全书(KEGG)通路富集分析显示,代谢相关的通路分布最多,为74095条。在注释到的54个转录因子家族中,MYB家族数目最多,共309条。在所有isoform中共检测到48042个简单重复序列位点,从单核苷酸到六核苷酸重复单元均有分布。结论:获得了较为可靠的天冬全长转录组数据,可为深入研究天冬生物学特性、相关代谢途径、信号通路及其分子机制提供数据支持。  相似文献   

13.
廖小庭  马新业  马庆  韩正洲  詹若挺 《中草药》2020,51(14):3777-3784
目的获得三叉苦Melicope pteleifolia转录组信息特征。方法以三叉苦幼苗根、茎、叶混合样品为对象,采用二代高通量测序平台Illumina HiSeq~(TM) 2000进行转录组测序并进行系统的生物信息学分析。结果转录组测序分析共获得47 045 040条高质量序列(clean reads),Trinity de novo组装获得67 956条unigenes,平均长度787 nt。BLAST分析显示分别有42 749(61.92%)、31 152(45.84%)、26 563(39.0 9%)、17 481(25.72%)条unigenes在NR、Swiss-port、KOG、KEGG数据库得到注释信息,参与生物过程、细胞组分和分子功能3个GO类别的47个小组,共9807条unigenes注释到130个KEGG代谢通路中,筛选到19条次生代谢通路,KOG功能分类分析获得25个不同的KOG功能类群。预测共有高等植物转录因子56个家族;借助MISA软件发现7 748个SSRs,三碱基重复SSRs数量最丰富,有4 117个,出现频率为53.1%,五碱基重复SSRs相对较少,占2.2%。结论利用高通量测序技术和生物信息分析获得三叉苦转录组信息特征,为后续三叉苦功能基因的挖掘、次生代谢途径解析及其调控机制研究奠定基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号