首页 | 本学科首页   官方微博 | 高级检索  
检索        

组学大数据环境下的基因变异信息并行处理与分析
引用本文:黄芝准,王红强.组学大数据环境下的基因变异信息并行处理与分析[J].北京生物医学工程,2017,36(4).
作者姓名:黄芝准  王红强
作者单位:中国科学院合肥智能机械研究所 合肥 230031;中国科学技术大学 合肥 230026;中国科学院合肥智能机械研究所 合肥 230031
基金项目:国家自然科学基金,安徽省自然科学基金
摘    要:随着第二代测序技术的发展与应用,其产生的测序数据也呈现快速的增长趋势,如何有效、快速、稳定地对海量测序数据进行分析成为生物研究领域迫切的需求。目前许多传统的测序数据分析软件仅支持单一功能,并不具备完整的数据分析能力,应对海量的测序数据时其处理能力也显著不足。为了应对上述问题,本文设计了一款基于Hadoop框架的测序数据分析软件,整合了现今生物研究领域内常用的多款序列分析软件,从而实现了对测序序列数据的自动化分析。该软件输入原始的测序数据后,经过碱基质量控制、序列比对、SNP位点信息提取、突变基因信息生成等几个过程,最终输出详细的突变基因信息报告。该软件实现了自动化的数据分析,提高了数据分析的效率,极大减轻了数据分析人员的工作量。

关 键 词:第二代测序技术  Hadoop  序列数据分析  基因突变信息  单核苷酸多态性

Parallel information processing and analysis for mutant gene under large data environments
HUANG Zhizhun,WANG Hongqiang.Parallel information processing and analysis for mutant gene under large data environments[J].Beijing Biomedical Engineering,2017,36(4).
Authors:HUANG Zhizhun  WANG Hongqiang
Abstract:With the development and application of biomedical techniques such as second generation of sequencing technology,the output data show rapid and steady growth trend.Efficient,rapid and steady analyzation of the massive sequencing data becomes an urgent need in the field of biological research.At present,many of the traditional sequencing data analysis softwares support only a single function,without complete data analysis capabilities.In order to solve the problems,this paper designs a sequencing data analysis software based on Hadoop framework,which integrates many kinds of sequence analysis software commonly used in the field of biological research,and realizes the automatic analysis of sequencing data.After inputting the original sequencing data,the software outputs several detailed information of mutant genes after several processes such as base quality control,sequence alignment,SNP information extraction,generation of mutant genetic information and so on.The software realizes automatic data analysis and improves the efficiency of data analysis.
Keywords:next-generation sequencing  Hadoop  sequencing data analysis  mutant genetic information  single nucleotide polymorphism
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号