作者:敦欣卉[1];张云秋[1];杨铠西[2]
作者机构:[1]吉林大学公共卫生学院,长春130021 [2]大连理工大学中日国际信息与软件学院,大连116620
出版物刊名:数据分析与知识发现 页码:61-72页
年卷期:2017年 第7期
主题词:微博 细粒度情感分析 药物
摘要:【目的】对微博进行细粒度情感分析,将情感分为8类,并计算其情感强度值,从而尽可能还原微博用户情感。【方法】通过微博语料分析构建疑问词词表,在大连理工大学情感词汇本体DUTIR的7类情感基础上,丰富一类情感“疑”,并利用点互信息法构建表情符号词典,还综合考虑否定词和程度副词对情感表达的影响,利用Python从新浪微博上获取数据,并用R语言的iiebaR包进行分词,对情感进行分类并计算其强度。【结果】得到微博用户对于糖尿病7类常用药物的8类情感占比及情感强度,并通过正确率、召回率、F值对结果进行验证,其中“怒”和“哀”的正确率最高,分别为85.73%和83.05%,而“乐”和“好”的召回率与F值均最高,为81%以—匕本文新增情感“疑”的正确率、召回率、F值分别为77.33%、78.58%、77.95%,均值在8类情感中排名前列,说明其情感识别较好。【局限】由于本文依赖于情感词典进行情感分析,因此为了更好的分析结果,情感词典仍需进一步完善。【结论】本方法具有较高的识别率和可靠性,能够更好地对微博上的情
感分类进行细粒度分析。
因篇幅问题不能全部显示,请点此查看更多更全内容