首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到14条相似文献,搜索用时 265 毫秒
1.
目的:获得越南槐Sophora tonkinensis Gagnep.全长转录组数据,为深入挖掘越南槐功能基因提供参考。方法:采用PacBio Sequel高通量测序系统,对越南槐根、茎、叶、果4个部位的混合样品进行全长转录组测序及分析。结果:共获得214159条环形一致性序列(CCS),获得208156个高质量isoforms,并在非冗余蛋白(NR)、核苷酸序列(NT)、基因本体(GO)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、京都基因与基因组百科全书(KEGG)和SwissProt数据库中共注释了170150个isoforms,检测出4055个转录因子和38445个简单重复序列,预测到80041个长链非编码RNAs(lncRNAs)和39817个mRNAs。结论:获得了较为可靠的越南槐全长转录组数据,可为深入研究越南槐生物学特性、相关代谢途径、信号通路及其分子机制提供数据支持。  相似文献   

2.
目的:获得天仙藤全长转录组数据库,挖掘天仙藤功能基因。方法:采用PacBio SequeⅠ高通量测序系统,对天仙藤的茎、叶、果3个部位的混合样品进行全长转录组测序及分析。结果:共获得176354条环形一致性序列(CCS),获得184439个高质量isoforms,并注释了139826个isoforms,检测出3058个转录因子和135527个简单序列重复(SSR)位点,还预测到76862个长链非编码RNA(lncRNA)和36204个mRNAs。结论:获得了较可靠的天仙藤全长转录组数据,可为深入研究天仙藤基因组、生物学特性、相关代谢途径、信号通路及其分子机制提供数据支持。  相似文献   

3.
目的:获得广州相思子Abrus pulchellus subsp.cantoniensis(Hance)Verdc.全长转录本。方法:利用PacBio Sequel测序平台,通过对广州相思子的根、茎、叶3个部位混合样品开展三代全长转录组测序,并对测序数据进行生物信息学分析。结果:共获得原始测序数据14.55 Gb,最终获得转录本序列172829条,N50长度为1572 nt,鸟嘌呤和胞嘧啶(GC)占比为40.86%。基因注释中,共有158888(91.93%)个转录本被成功注释;基因本体(GO)数据库注释中,102457个(59.28%)转录本分为生物学过程、细胞组成和分子功能三大类46个功能组;真核生物相邻类的聚簇(KOG)数据库注释中,一般功能预测的转录本最多,为22461个;信号转导机制、翻译后修饰、蛋白反转和分子伴侣亦为其主要功能途径;京都基因与基因组百科全书(KEGG)注释到转录本有99847个,其中参与广州相思子生物合成和其他次生代谢有4530个。基因结构分析中,共得到92344条编码序列,4800个转录因子隶属于59个转录因子家族。此外,简单序列重复(SSR)标记分析表明,40050处SSR位点中单碱基重复的SSR数目最多,其次是包含腺嘌呤(A)G/C胸腺嘧啶(T)的二碱基重复SSR。结论:获得的广州相思子全长转录组数据可为后续基因功能、代谢通路调控及分子标记开发等研究提供数据支撑。  相似文献   

4.
目的:构建药用植物青葙全长转录组,旨在为青葙功能基因组学研究提供遗传信息。方法:基于PacBio Sequel平台对青葙的根、茎、叶、花、果5个部位的混合样本进行高通量测序,对原始数据进行校正、筛选、聚类、去冗余、过滤、功能注释和结构分析,获得青葙全长转录组数据。结果:经质量控制后获得高质量测序reads数据量为13.46 Gb,拼接去冗余后获得155300条循环一致性序列(CCS),研究共获得521928个高质量isoforms和210189个转录本。利用非冗余蛋白(NR)、核苷酸序列(NT)、SwissProt、京都基因与基因组百科全书(KEGG)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、基因本体(GO)7个数据库进行全长序列的功能注释,结果显示共有158562个转录本被成功注释。GO注释结果显示,转录本共富集在包含生物学过程、细胞组成和分子功能三大类的47个条目中。KEGG分析显示,转录本注释到代谢通路中的基因较多,其次是基因信息过程。基因结构分析结显示,共得到8350条蛋白质编码序列(CDS)、88574条lncRNA、45535个简单序列重复(SSRs),其中单核苷酸重复的占比最大,为52.94%,此外预测得到57类转录因子,如常见的MADS、WRKY、AP2-EREBP、bHLH等类型。结论:获得了青葙的全长转录组数据,为该植物后续分子功能研究提供了遗传信息和基础数据。  相似文献   

5.
目的:利用高通量测序技术获得马鞭草Verbena officinalis L.的全长转录组基因信息。方法:通过PacBio Sequel高通量测序平台,对马鞭草根、茎、叶3个部位的混合样品进行全长转录组测序,并基于序列同源性对转录本进行功能注释,得到马鞭草全长转录组的遗传信息。结果:测序数据经过质控后获得197542个高质量的转录本及169063条环形一致性序列(CCS),检测出4955个转录因子。其中161062个(81.53%)转录本在非冗余蛋白(NR)、真核生物相邻类的聚簇(KOG)数据库、京都基因与基因组百科全书(KEGG)、基因本体(GO)数据库、蛋白家族(Pfam)数据库和SwissProt蛋白序列数据库中均得到注释。MISA分析发现54063个简单重复序列(SSR)位点,还预测到70050个长链非编码RNAs(lncRNAs)和45499个信使核糖核酸(mRNAs),并在马鞭草全长转录组中共鉴定到了60个转录本可能参与单萜类化合物的生物合成。结论:利用高通量测序技术和生物信息学分析获得了马鞭草的全长转录组信息特征,可为后期开展马鞭草功能基因鉴定、解析萜类化合物次生代谢途径及其调控机制提供参考。  相似文献   

6.
目的:获得广金钱草Desmodium styracifolium(Osb.)Merr.全长转录组数据,深入挖掘其功能基因。方法:采用PacBio Sequel测序平台,对广金钱草的根、茎、叶3个部位混合样品进行全长转录组测序及分析。结果:共获得转录本140069条,N50长度为1542 nt,其中118906个(84.89%)转录本被成功注释。非冗余蛋白(NR)数据库注释中,与广金钱草最相近的物种是豆科植物密花豆Spatholobus suberectus Dunn;真核生物相邻类的聚簇(KOG)数据库注释中,比对到一般功能预测的转录本最多,有18064个;基因本体(GO)数据库注释中,86459个转录本分布于生物学过程、细胞组成和分子功能三大类45个功能组;京都基因与基因组百科全书(KEGG)注释中,参与广金钱草生物合成和其他次生代谢转录本3721个。在基因结构分析中,共得到74174个编码序列、3663个转录因子。简单序列重复(SSR)分析表明,40456个SSR中腺嘌呤和鸟嘌呤(AG)/胞嘧啶和胸腺嘧啶(CT)、AAG/CTT分别是二碱基、三碱基中优势重复类型。结论:获得了广金钱草全长转录本,为其后续的分子研究提供数据支持。  相似文献   

7.
目的:获得岗梅全长转录组数据库,为深入挖掘岗梅功能基因奠定基础。方法:采用基于PacBio Sequel平台的单分子实时测序技术获取岗梅的根、茎、叶样品的转录组数据,并利用非冗余蛋白(NR)、核苷酸序列(NT)、SwissProt蛋白序列数据库、京都基因与基因组百科全书(KEGG)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、基因本体(GO)进行注释,分析并鉴定编码三萜皂苷生物合成的关键酶的转录本。结果:全长转录组共获得89629个转录本,其中81313个在公共数据库进行了注释。KEEG代谢通路富集分析表明,623个转录本参与岗梅中三萜皂苷合成相关的3条代谢通路,其中263个转录本编码了三萜皂苷生物合成途径的21个关键酶。此外,还预测了2471个转录因子、40421个简单重复序列位点、22119个长链非编码RNA(lncRNA)和29131个mRNA。结论:丰富了岗梅的转录组数据,并为鉴定参与三萜皂苷和其他次生代谢物生物合成的候选基因提供参考,促进其分子生物学和基因组学的研究。  相似文献   

8.
目的:获得菝葜Smilax china L.全长转录组数据,深入挖掘其功能基因。方法:采用PacBio Sequel测序平台,分别提取菝葜根、茎、叶3个部位的RNA,将样品等量混合后进行全长转录组测序及分析。结果:共获得转录本122324个,N50长度为1400 nt,鸟嘌呤和胞嘧啶(GC)占比为45.32%,其中92878个(75.93%)转录本在七大数据库中注释。非冗余蛋白(NR)注释中,与菝葜最相近的物种是海枣Phoenix dactylifera L.,匹配程度达17.39%;真核生物相邻类的聚簇(KOG)数据库注释中,比对到一般功能预测的转录本最多,有17875个;基因本体(GO)数据库注释中,66001个转录本分布于生物学过程、细胞组成和分子功能三大类的45个功能组;京都基因与基因组百科全书(KEGG)注释中,参与菝葜生物合成和其他次生代谢转录本4286个,其中参与黄酮类化合物生物合成的转录本1478个、参与皂苷生物合成的转录本162个、参与芪类化合物生物合成的转录本4个、参与其他有机化合物合成的转录本2642个。在基因结构分析中,共得到64612个编码序列、2003个转录因子。此外,简单序列重复(SSR)分析表明,33118个SSR中最多的优势重复单元为腺嘌呤(A)G/C胸腺嘧啶(T),同时还预测到44580个长链非编码RNA和28229个mRNA。结论:获得了菝葜全长转录组数据,可为深入研究菝葜生长发育、相关代谢途径、胁迫响应及生物遗传多样性提供数据支持。  相似文献   

9.
目的:利用全长转录组测序技术挖掘药用大黄蒽醌类成分合成中的关键酶Ⅲ型聚酮合成酶(PKSⅢ家族基因。方法:利用PacBio SequelⅡ平台进行药用大黄全长转录组测序,数据通过非冗余蛋白(NR)、SwissProt、京都基因与基因组百科全书(KEGG)、真核生物相邻类的聚簇(KOG)、基因本体(GO)数据库进行功能注释。筛选PKSⅢ家族基因全长并进行编码蛋白生物信息特征分析,借助MEGA 6.0构建PKSⅢ家族基因系统发育进化树。结合RNA-Seq数据分析,运用TBtools计算PKSⅢ家族基因的相对表达量。结果:共获得原始数据55.50 GB,52 960条高质量转录本,平均长度1 712.56 bp;50 007条Isoforms在NR、Swiss-Prot、KEGG和KOG数据库中得到注释。GO分类注释到生物过程、细胞组分和分子功能3个类别的65个小组。KEGG代谢通路共有17 637条转录本被注释于137条通路中,其中标准次生代谢通路15条。筛选到16个含开放阅读框的Isoforms,编码8个PKSⅢ家族基因,包括RoALS1-3 (芦荟松合酶)、RoCHS1-3 (查耳酮合酶...  相似文献   

10.
目的:获得九里香Murraya exotica L.Mant.全长转录组数据库,为深入挖掘其全长基因信息提供参考。方法:利用Pacino Sequel平台的第三代测序技术,对九里香的根、茎、叶、花、果混合样品进行全长转录组测序,并对原始转录组数据进行分析。结果:共获得94435个转录本,平均长度为76476.23 bp,80583条环形一致性序列,通过聚类、校正和去冗余后最终得到108443个高质量的isoforms,其中在非冗余蛋白(NR)、核苷酸序列(NT)、基因本体(GO)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、京都基因与基因组百科全书(KEGG)和SwissProt共注释了100219个isoforms,同时检测出34182个简单序列重复(SSR)位点,其中18482个单核苷酸数量占主导位置;检测了2574个转录因子,29592个长链非编码RNAs(lncRNAs)和30322个mRNAs。结论:获得了较为可靠的九里香全长转录组数据,为深入研究九里香的生长发育、相关代谢途径、功能基因利用、基原物种鉴定等提供数据参考。  相似文献   

11.
廖小庭  马新业  马庆  韩正洲  詹若挺 《中草药》2020,51(14):3777-3784
目的获得三叉苦Melicope pteleifolia转录组信息特征。方法以三叉苦幼苗根、茎、叶混合样品为对象,采用二代高通量测序平台Illumina HiSeq~(TM) 2000进行转录组测序并进行系统的生物信息学分析。结果转录组测序分析共获得47 045 040条高质量序列(clean reads),Trinity de novo组装获得67 956条unigenes,平均长度787 nt。BLAST分析显示分别有42 749(61.92%)、31 152(45.84%)、26 563(39.0 9%)、17 481(25.72%)条unigenes在NR、Swiss-port、KOG、KEGG数据库得到注释信息,参与生物过程、细胞组分和分子功能3个GO类别的47个小组,共9807条unigenes注释到130个KEGG代谢通路中,筛选到19条次生代谢通路,KOG功能分类分析获得25个不同的KOG功能类群。预测共有高等植物转录因子56个家族;借助MISA软件发现7 748个SSRs,三碱基重复SSRs数量最丰富,有4 117个,出现频率为53.1%,五碱基重复SSRs相对较少,占2.2%。结论利用高通量测序技术和生物信息分析获得三叉苦转录组信息特征,为后续三叉苦功能基因的挖掘、次生代谢途径解析及其调控机制研究奠定基础。  相似文献   

12.
刘畅  俸婷婷  刘雄伟  丁晶鑫  石慧  潘婕  周英 《中草药》2021,52(5):1434-1447
目的对八爪金龙根进行转录组测序,挖掘次生代谢合成相关基因,探索八爪金龙次生代谢产物生物合成的分子基础。方法采用IlluminaHi Seq4000高通量测序技术,对八爪金龙根进行转录组测序。使用Trinity软件对获得的Unigenes数据进行过滤组装,运用KEGG数据库对Unigenes进行注释。结果共获得52249条Unigenes,其中31391条被公共数据库成功注释,1507条Unigenes被注释到次生代谢产物合成。通过对转录组数据深入挖掘发现,参与八爪金龙苯丙素生物合成的Unigenes共有126条,参与萜类化合物骨架生物合成的Unigenes数量为73条,参与黄酮类化合物生物合成Unigenes有58条,参与次生代谢后修饰的Unigenes共有253条。筛选出9条Unigenes编码4个与八爪金龙香豆素生物合成的关键酶,23条Unigenes编码8个与黄酮生物合成的关键酶,39条Unigenes编码19个与萜类生物合成的关键酶,140条CYP450基因和113条UGT基因可能参与次生代谢物的修饰。微卫星识别软件(microsatellite identification tool,MISA)分析发现八爪金龙转录组包含17 400个简单重复序列(simple sequence repeats,SSR)。结论通过高通量转录组测序,初步揭示了参与八爪金龙次生代谢产物合成相关的基因,为进一步研究八爪金龙次生代谢产物合成途径关键酶的功能及其调控机制奠定了基础。  相似文献   

13.
林懋怡  牛卉  刘晋杰  柳威  刘忠 《中草药》2017,48(15):3160-3167
目的获得华细辛Asarum sieboldii转录组数据库和差异表达基因,识别华细辛甲基丁香酚生物合成相关基因。方法以华细辛地下部分(根)和地上部分(叶片)2个样本作为供试材料,采用Illumina Hiseq 4000进行转录组测序,并从头拼接,对Unigene进行功能注释和差异性分析。结果共获得12.25 Gb数据,拼接得到129 003个Unigene,可归类于52个GO分类,涉及363条KEGG代谢通路。分析发现,共有439个差异表达基因,其中上调基因占38.3%,下调基因占61.7%,差异较大;136个Unigene与苯丙素类次生代谢途径相关,其中44个Unigene参与甲基丁香酚的生物合成过程。结论本研究得到大量华细辛转录本信息,所发掘的与甲基丁香酚生物合成相关的Unigene为相关基因的分离、功能验证及其表达调控机制的阐明提供了重要依据。  相似文献   

14.
彭亮  张岗  颜永刚  孙涛  王媚  李洁  罗露  曹福麟  胡本祥  杨冰月 《中草药》2018,49(8):1890-1896
目的获得茜草Rubia cordifolia转录组学信息及挖掘其蒽醌类化合物生物合成的关键酶基因,为茜草的功能基因克隆与分析提供参考。方法采用Illunima Hiseq TM 2000 150PE高通量测序技术对茜草进行转录组测序,使用Trinity软件完成Unigene的de novo拼接,基于BLAST实现Unigene的分类、功能注释、代谢通路分析和蛋白功能注释等。结果最终获得7.3 Gb数据,通过de novo拼接注释得到Unigene 66 646条,平均长度为1 424 bp,所有Unigene能被NCBI nonredundant protein sequences(NR)、NCBI nucleotide sequences(NT)、kyoto encyclopedia of genes and genomes(KEGG)、A manually annotated and reviewed protein sequence database(Swissprot)、gene ontology(GO)、eu Karyotic ortholog groups(KOG)和protein family(Pfam)数据库所注释,注释成功率100%,找到与茜草蒽醌类化合物生物合成相关的基因64条。结论首次对茜草转录组进行了分析,并获得了茜草蒽醌类化合物生物合成相关的候选基因,为茜草的分子生物学研究提供了丰富的数据资源,也为后期开展茜草蒽醌类化合物次生代谢途径解析奠定了基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号