基于表情符号的文本情感分析研究 |
| |
引用本文: | 阳庆玲,郑志伟,邱佳玲,郭山清,贾忠伟,宋超,顾菁,李菁华,郝元涛,郝春.基于表情符号的文本情感分析研究[J].现代预防医学,2019(9). |
| |
作者姓名: | 阳庆玲 郑志伟 邱佳玲 郭山清 贾忠伟 宋超 顾菁 李菁华 郝元涛 郝春 |
| |
作者单位: | 中山大学公共卫生学院医学统计与流行病学系;山东大学计算机科学与技术学院;北京大学中国药物依赖性研究所;电子科技大学计算机科学与工程学院大数据研究中心;中山大学公共卫生学院医学统计与流行病学系国家治理研究院全球卫生研究中心卫生信息研究中心广东省卫生信息学重点实验室;中山大学公共卫生学院卫生管理学系 |
| |
摘 要: | 目的提出一种基于表情符号的文本自动标注的方法,为文本情感分析提供方法学参考。方法从Blued软件抓取广东省用户的发帖文本,筛选出情感倾向明显的表情符号。基于筛选的表情符号生成训练集,并对含表情符号的训练文本进行自动标注。然后用机器学习的方法训练分类器,并在人工标注的测试集中验证,评估其分类效果。结果共选取标签表情符号174个,其中正向表情符号93个(53.5%),负向表情符号81个(46.5%)。纳入分析的文本共14.3万条,其中训练集13.0万条(90.9%),测试集1.3万条(9.1%)。朴素贝叶斯、逻辑回归、支持向量机、融合模型最高准确率分别为0.739、0.732、0.729、0.741。结论基于表情符号自动标注文本的方法可应用于文本情感分类。
|
本文献已被 CNKI 等数据库收录! |
|