首页 | 本学科首页   官方微博 | 高级检索  
     

基于内容的短信分类技术
引用本文:陈功平,沈明玉,王红,张燕平. 基于内容的短信分类技术[J]. 医学教育探索, 2011, 0(6): 770-774
作者姓名:陈功平  沈明玉  王红  张燕平
作者单位:合肥工业大学计算机与信息学院,合肥 230009;六安职业技术学院信息工程系,安徽 六安 237158;合肥工业大学计算机与信息学院,合肥 230009;安徽大学计算机科学与技术学院,合肥 230039;六安职业技术学院信息工程系,安徽 六安 237158;安徽大学计算机科学与技术学院,合肥 230039
摘    要:
研究了一种基于改进贝叶斯算法的短信分类方法。对中文文本短信,采用文档频度(DF)的特征项提取方法,借助自建短信语料库对改进的贝叶斯分类器进行了实验测试。实验结果表明:改进的分类器可以提高正常短信的通过率,并可以根据新的训练集训练出个性化的分类器,适应短信变化,满足用户的个性化需求,还结合黑白名单过滤机制实现对短信的过滤,减少了正常短信的误判率。

关 键 词:短信分类; 贝叶斯算法; 特征提取; 向量空间模型
收稿时间:2011-04-13

SMS Classification Technology Based on Content
CHEN Gong-ping,SHEN Ming-yu,WANG-Hong and ZHANG Yan-ping. SMS Classification Technology Based on Content[J]. Researches in Medical Education, 2011, 0(6): 770-774
Authors:CHEN Gong-ping  SHEN Ming-yu  WANG-Hong  ZHANG Yan-ping
Abstract:
This paper researches the SMS classification technology based on the improved Bayesian method. For Chinese SMS, the document frequency (DF) was adopted for feature selection, and the self built corpus was utilized to test the classifier. The results show that the improved classifier can increase the normal pass rate of SMS. Moreover, by using new training dataset, the personalized classifier can be obtained to adapt the changes of short message and meet the user''s requirement. The proposed classifier can finish the filtering of message by combining black and white list filtering mechanism such that the error rate of normal SMS can be reduced.
Keywords:SMS classification   Bayesian method   feature selection   vector space model
点击此处可从《医学教育探索》浏览原始摘要信息
点击此处可从《医学教育探索》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号