首页 | 本学科首页   官方微博 | 高级检索  
     

基于混合并行遗传聚类的文本特征抽取方法研究
引用本文:戴文华,焦翠珍,何婷婷. 基于混合并行遗传聚类的文本特征抽取方法研究[J]. 中国药品标准, 2008, 0(9)
作者姓名:戴文华  焦翠珍  何婷婷
基金项目:国家自然科学基金,国家社会科学基金,教育部科研项目,湖北省教育厅科研项目
摘    要:同义词和近义词现象以及强关联语义信息加大了文本向量的特征维数,对文本分类的效率和精度都会带来极大影响.为了有效降低文本向量的特征维数,提出一种基于混合并行遗传聚类的文本特征抽取方法.该方法首先使用K-means聚类算法进行特征词粗粒度聚类,然后采用混合并行遗传算法对各类特征词进行细粒度聚类,最后对各聚类中的特征词进行分析并压缩,得到最终能反映文本类别特征和语义信息的文本特征词集合.实验证明,该方法是一种有效的文本特征抽取方法,能切实提高文本分类的效率和精度.

关 键 词:并行遗传算法  K-means聚类  特征抽取  文本特征词

Research on Text Feature Extraction Based on Hybrid Parallel Genetic Algorithm
DAI Wen-hu,JIAO Cui-zhen,HE Ting-ting. Research on Text Feature Extraction Based on Hybrid Parallel Genetic Algorithm[J]. , 2008, 0(9)
Authors:DAI Wen-hu  JIAO Cui-zhen  HE Ting-ting
Abstract:
Keywords:
点击此处可从《中国药品标准》浏览原始摘要信息
点击此处可从《中国药品标准》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号