首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到12条相似文献,搜索用时 265 毫秒
1.
目的:获得九里香Murraya exotica L.Mant.全长转录组数据库,为深入挖掘其全长基因信息提供参考。方法:利用Pacino Sequel平台的第三代测序技术,对九里香的根、茎、叶、花、果混合样品进行全长转录组测序,并对原始转录组数据进行分析。结果:共获得94435个转录本,平均长度为76476.23 bp,80583条环形一致性序列,通过聚类、校正和去冗余后最终得到108443个高质量的isoforms,其中在非冗余蛋白(NR)、核苷酸序列(NT)、基因本体(GO)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、京都基因与基因组百科全书(KEGG)和SwissProt共注释了100219个isoforms,同时检测出34182个简单序列重复(SSR)位点,其中18482个单核苷酸数量占主导位置;检测了2574个转录因子,29592个长链非编码RNAs(lncRNAs)和30322个mRNAs。结论:获得了较为可靠的九里香全长转录组数据,为深入研究九里香的生长发育、相关代谢途径、功能基因利用、基原物种鉴定等提供数据参考。  相似文献   

2.
目的:获得广金钱草Desmodium styracifolium(Osb.)Merr.全长转录组数据,深入挖掘其功能基因。方法:采用PacBio Sequel测序平台,对广金钱草的根、茎、叶3个部位混合样品进行全长转录组测序及分析。结果:共获得转录本140069条,N50长度为1542 nt,其中118906个(84.89%)转录本被成功注释。非冗余蛋白(NR)数据库注释中,与广金钱草最相近的物种是豆科植物密花豆Spatholobus suberectus Dunn;真核生物相邻类的聚簇(KOG)数据库注释中,比对到一般功能预测的转录本最多,有18064个;基因本体(GO)数据库注释中,86459个转录本分布于生物学过程、细胞组成和分子功能三大类45个功能组;京都基因与基因组百科全书(KEGG)注释中,参与广金钱草生物合成和其他次生代谢转录本3721个。在基因结构分析中,共得到74174个编码序列、3663个转录因子。简单序列重复(SSR)分析表明,40456个SSR中腺嘌呤和鸟嘌呤(AG)/胞嘧啶和胸腺嘧啶(CT)、AAG/CTT分别是二碱基、三碱基中优势重复类型。结论:获得了广金钱草全长转录本,为其后续的分子研究提供数据支持。  相似文献   

3.
目的:获得广州相思子Abrus pulchellus subsp.cantoniensis(Hance)Verdc.全长转录本。方法:利用PacBio Sequel测序平台,通过对广州相思子的根、茎、叶3个部位混合样品开展三代全长转录组测序,并对测序数据进行生物信息学分析。结果:共获得原始测序数据14.55 Gb,最终获得转录本序列172829条,N50长度为1572 nt,鸟嘌呤和胞嘧啶(GC)占比为40.86%。基因注释中,共有158888(91.93%)个转录本被成功注释;基因本体(GO)数据库注释中,102457个(59.28%)转录本分为生物学过程、细胞组成和分子功能三大类46个功能组;真核生物相邻类的聚簇(KOG)数据库注释中,一般功能预测的转录本最多,为22461个;信号转导机制、翻译后修饰、蛋白反转和分子伴侣亦为其主要功能途径;京都基因与基因组百科全书(KEGG)注释到转录本有99847个,其中参与广州相思子生物合成和其他次生代谢有4530个。基因结构分析中,共得到92344条编码序列,4800个转录因子隶属于59个转录因子家族。此外,简单序列重复(SSR)标记分析表明,40050处SSR位点中单碱基重复的SSR数目最多,其次是包含腺嘌呤(A)G/C胸腺嘧啶(T)的二碱基重复SSR。结论:获得的广州相思子全长转录组数据可为后续基因功能、代谢通路调控及分子标记开发等研究提供数据支撑。  相似文献   

4.
目的:利用高通量测序技术获得马鞭草Verbena officinalis L.的全长转录组基因信息。方法:通过PacBio Sequel高通量测序平台,对马鞭草根、茎、叶3个部位的混合样品进行全长转录组测序,并基于序列同源性对转录本进行功能注释,得到马鞭草全长转录组的遗传信息。结果:测序数据经过质控后获得197542个高质量的转录本及169063条环形一致性序列(CCS),检测出4955个转录因子。其中161062个(81.53%)转录本在非冗余蛋白(NR)、真核生物相邻类的聚簇(KOG)数据库、京都基因与基因组百科全书(KEGG)、基因本体(GO)数据库、蛋白家族(Pfam)数据库和SwissProt蛋白序列数据库中均得到注释。MISA分析发现54063个简单重复序列(SSR)位点,还预测到70050个长链非编码RNAs(lncRNAs)和45499个信使核糖核酸(mRNAs),并在马鞭草全长转录组中共鉴定到了60个转录本可能参与单萜类化合物的生物合成。结论:利用高通量测序技术和生物信息学分析获得了马鞭草的全长转录组信息特征,可为后期开展马鞭草功能基因鉴定、解析萜类化合物次生代谢途径及其调控机制提供参考。  相似文献   

5.
目的:获得越南槐Sophora tonkinensis Gagnep.全长转录组数据,为深入挖掘越南槐功能基因提供参考。方法:采用PacBio Sequel高通量测序系统,对越南槐根、茎、叶、果4个部位的混合样品进行全长转录组测序及分析。结果:共获得214159条环形一致性序列(CCS),获得208156个高质量isoforms,并在非冗余蛋白(NR)、核苷酸序列(NT)、基因本体(GO)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、京都基因与基因组百科全书(KEGG)和SwissProt数据库中共注释了170150个isoforms,检测出4055个转录因子和38445个简单重复序列,预测到80041个长链非编码RNAs(lncRNAs)和39817个mRNAs。结论:获得了较为可靠的越南槐全长转录组数据,可为深入研究越南槐生物学特性、相关代谢途径、信号通路及其分子机制提供数据支持。  相似文献   

6.
目的:利用全长转录组测序技术挖掘药用大黄蒽醌类成分合成中的关键酶Ⅲ型聚酮合成酶(PKSⅢ家族基因。方法:利用PacBio SequelⅡ平台进行药用大黄全长转录组测序,数据通过非冗余蛋白(NR)、SwissProt、京都基因与基因组百科全书(KEGG)、真核生物相邻类的聚簇(KOG)、基因本体(GO)数据库进行功能注释。筛选PKSⅢ家族基因全长并进行编码蛋白生物信息特征分析,借助MEGA 6.0构建PKSⅢ家族基因系统发育进化树。结合RNA-Seq数据分析,运用TBtools计算PKSⅢ家族基因的相对表达量。结果:共获得原始数据55.50 GB,52 960条高质量转录本,平均长度1 712.56 bp;50 007条Isoforms在NR、Swiss-Prot、KEGG和KOG数据库中得到注释。GO分类注释到生物过程、细胞组分和分子功能3个类别的65个小组。KEGG代谢通路共有17 637条转录本被注释于137条通路中,其中标准次生代谢通路15条。筛选到16个含开放阅读框的Isoforms,编码8个PKSⅢ家族基因,包括RoALS1-3 (芦荟松合酶)、RoCHS1-3 (查耳酮合酶...  相似文献   

7.
目的:获得岗梅全长转录组数据库,为深入挖掘岗梅功能基因奠定基础。方法:采用基于PacBio Sequel平台的单分子实时测序技术获取岗梅的根、茎、叶样品的转录组数据,并利用非冗余蛋白(NR)、核苷酸序列(NT)、SwissProt蛋白序列数据库、京都基因与基因组百科全书(KEGG)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、基因本体(GO)进行注释,分析并鉴定编码三萜皂苷生物合成的关键酶的转录本。结果:全长转录组共获得89629个转录本,其中81313个在公共数据库进行了注释。KEEG代谢通路富集分析表明,623个转录本参与岗梅中三萜皂苷合成相关的3条代谢通路,其中263个转录本编码了三萜皂苷生物合成途径的21个关键酶。此外,还预测了2471个转录因子、40421个简单重复序列位点、22119个长链非编码RNA(lncRNA)和29131个mRNA。结论:丰富了岗梅的转录组数据,并为鉴定参与三萜皂苷和其他次生代谢物生物合成的候选基因提供参考,促进其分子生物学和基因组学的研究。  相似文献   

8.
目的:获得菝葜Smilax china L.全长转录组数据,深入挖掘其功能基因。方法:采用PacBio Sequel测序平台,分别提取菝葜根、茎、叶3个部位的RNA,将样品等量混合后进行全长转录组测序及分析。结果:共获得转录本122324个,N50长度为1400 nt,鸟嘌呤和胞嘧啶(GC)占比为45.32%,其中92878个(75.93%)转录本在七大数据库中注释。非冗余蛋白(NR)注释中,与菝葜最相近的物种是海枣Phoenix dactylifera L.,匹配程度达17.39%;真核生物相邻类的聚簇(KOG)数据库注释中,比对到一般功能预测的转录本最多,有17875个;基因本体(GO)数据库注释中,66001个转录本分布于生物学过程、细胞组成和分子功能三大类的45个功能组;京都基因与基因组百科全书(KEGG)注释中,参与菝葜生物合成和其他次生代谢转录本4286个,其中参与黄酮类化合物生物合成的转录本1478个、参与皂苷生物合成的转录本162个、参与芪类化合物生物合成的转录本4个、参与其他有机化合物合成的转录本2642个。在基因结构分析中,共得到64612个编码序列、2003个转录因子。此外,简单序列重复(SSR)分析表明,33118个SSR中最多的优势重复单元为腺嘌呤(A)G/C胸腺嘧啶(T),同时还预测到44580个长链非编码RNA和28229个mRNA。结论:获得了菝葜全长转录组数据,可为深入研究菝葜生长发育、相关代谢途径、胁迫响应及生物遗传多样性提供数据支持。  相似文献   

9.
目的:获取广西莪术的全长转录组信息,了解其转录组的整体水平,挖掘姜黄素类生物合成通路基因。方法:利用Pacbio Sequel测序平台对广西莪术根、茎、叶、花4个部位的混合样品进行全长转录组测序,结合生物信息学等方法进行功能注释、代谢通路分析、简单序列重复(SSR)分析。结果:共获得原始数据14.47 Gb,经纠错、过滤、去冗余得到高质量一致性序列151218条。对所有转录本在非冗余蛋白(NR)、核苷酸序列(NT)、基因本体(GO)、真核生物相邻类的聚簇(KOG)、蛋白家族(Pfam)、京都基因与基因组百科全书(KEGG)和SwissProt七大功能数据库进行注释及分类,结果有128414个基因被注释,占比84.92%。共有325个基因参与姜黄素的生物合成,编码4-香豆酸-辅酶A连接酶、苯丙氨酸解氨酶、姜黄素合成酶、二酮-辅酶A合成酶、肉桂酸-4-羟化酶和咖啡酰辅酶A-O-甲基转移酶6个关键酶。MISA分析共发现32459个SSR位点,以单核苷酸重复数量最多,占全部重复类型的38.63%;1~3个核苷酸重复序列占主导位置,占总SSR位点的93.58%。结论:在高通量全长转录组水平对广西莪术进行研究,对姜黄素合成相关基因进行了挖掘,为后续阐明广西莪术姜黄素生物合成分子机制提供依据,为进一步研究广西莪术的分子标记和优良基因挖掘提供数据基础。  相似文献   

10.
目的:获得天冬Asparagus cochinchinensis(Lour.)Merr.全长转录组数据库,为探索其活性成分生物合成提供参考。方法:利用RNA-Seq技术对天冬的根、茎、叶进行转录组测序并分析。结果:从天冬转录组中共获得169319条isoforms,最终有147762条isoforms在公共数据库中注释成功。非冗余蛋白(NR)数据库结果显示,天冬与石刁柏Asparagus officinalis L.同源性最高;真核生物相邻类的聚簇(KOG)功能注释信息334380条,可分为25个基因功能大类;京都基因与基因组百科全书(KEGG)通路富集分析显示,代谢相关的通路分布最多,为74095条。在注释到的54个转录因子家族中,MYB家族数目最多,共309条。在所有isoform中共检测到48042个简单重复序列位点,从单核苷酸到六核苷酸重复单元均有分布。结论:获得了较为可靠的天冬全长转录组数据,可为深入研究天冬生物学特性、相关代谢途径、信号通路及其分子机制提供数据支持。  相似文献   

11.
目的:挖掘调控雪峰虫草生长发育的相关通路和基因,揭示其子座生长发育的内在分子机制。方法:采用转录组测序技术(RNA-Seq)对雪峰虫草子座菌丝体(MD1)、子座原基(PD2)和子座(SD3)生长发育3个不同阶段进行测序;数据通过非冗余蛋白(NR)、Swiss-Prot、Pfam、京都基因与基因组百科全书(KEGG)、真核生物相邻类的聚簇(KOG)、基因本体(GO)数据库进行功能注释。利用EdgeR软件进行差异表达基因分析,挖掘调控雪峰虫草子座生长发育的相关通路和基因。结果:测序结果显示,MD1、PD2、SD3分别获得了8.15、7.51、6.87 GB分析数据,拼接分析数据共获得34 218个转录本,平均长度为5502 bp,组装及去冗余后获得10 511条unigenes,平均长度为2470 bp。KOG功能注释和GO富集分析显示,细胞和细胞组分、新陈代谢过程、信号转导及碳代谢是雪峰虫草子座发育过程中的关键基因类别。对子座不同生长发育时期的基因进行差异表达分析发现,PD2和SD3相比差异表达基因最多,其中上调基因1073个,下调基因1036个,MD1和SD3相比差异表达基因最少,上调...  相似文献   

12.
彭亮  张岗  颜永刚  孙涛  王媚  李洁  罗露  曹福麟  胡本祥  杨冰月 《中草药》2018,49(8):1890-1896
目的获得茜草Rubia cordifolia转录组学信息及挖掘其蒽醌类化合物生物合成的关键酶基因,为茜草的功能基因克隆与分析提供参考。方法采用Illunima Hiseq TM 2000 150PE高通量测序技术对茜草进行转录组测序,使用Trinity软件完成Unigene的de novo拼接,基于BLAST实现Unigene的分类、功能注释、代谢通路分析和蛋白功能注释等。结果最终获得7.3 Gb数据,通过de novo拼接注释得到Unigene 66 646条,平均长度为1 424 bp,所有Unigene能被NCBI nonredundant protein sequences(NR)、NCBI nucleotide sequences(NT)、kyoto encyclopedia of genes and genomes(KEGG)、A manually annotated and reviewed protein sequence database(Swissprot)、gene ontology(GO)、eu Karyotic ortholog groups(KOG)和protein family(Pfam)数据库所注释,注释成功率100%,找到与茜草蒽醌类化合物生物合成相关的基因64条。结论首次对茜草转录组进行了分析,并获得了茜草蒽醌类化合物生物合成相关的候选基因,为茜草的分子生物学研究提供了丰富的数据资源,也为后期开展茜草蒽醌类化合物次生代谢途径解析奠定了基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号