基于分类算法的反语特征识别研究开题报告
2020-02-11 00:38:34
1. 研究目的与意义(文献综述)
1.1选题的目的和意义
随着互联网的快速发展,用户在互联网平台上发表的评论、见解在舆论监测、社会调查、市场营销、决策支持有着重要的意义。而由于语言的灵活性和用户情感的复杂性,在社交媒体文本中出现了越来越多的特殊的修辞手法,如讽刺、反语、幽默等。这些特殊的修辞手法的运用往往会对用户情感分析的结果带来一些错误和偏差,其中反语修辞就是一个典型的例子。本文旨在以两种不同的方式提取的反语特征数据集为基础,对其分别采用朴素贝叶斯、支持向量机和决策树三种分类算法进行反语识别实验,根据实验得出的f值、召回率以及精度三项指标,综合分析归纳识别反语特征的规律。
在社交网络中,反语已成为一种普遍的语言表达方式,特别是在微博这类包含符号、图片和短文本等信息的分享传播平台,以及王者荣耀这类用户热衷于通过发表言论表达自己或欣喜、或不满情绪的游戏平台,用户常常使用反语表达如嘲弄或讽刺等强烈情感倾向,例如“结婚纪念日买到了假货,真是一个美好的纪念”,仅仅从字面上理解该语句可能会被认为是表达积极情感倾向的语句,但是该语句真正要表达的是一种无奈和嘲讽的消极情感倾向,而在用户反馈、舆论监测、决策支持中,这样的偏差可能将导致决策者无法真正了解到用户的需求和痛点,从而做出错误的决策。因此,如何自动识别反语语句已经变成了自然语言处理领域的一项挑战。而现阶段,反语识别的可计算化研究主要集中在以英文为代表的外文反语识别,但与英文反语识别相比,中文通常使用谐音词或歧义词等来表达反语情感,这也使得中文反语识别无法简单地直接运用针对外文反语识别的研究。所以,对于中文反语识别技术的研究具有非常深远的意义。
2. 研究的基本内容与方案
2.1.研究基本内容
根据内容、数量两个维度构造不同体系的反语特征数据集,分别采用朴素贝叶斯、支持向量机、决策树三种经典、有效分类算法进行反语识别实验,根据实验效果分析三种分类算法在不同反语特征体系有效性,以此为基础归纳分类算法识别反语特征的规律。
2.2.研究目标:
3. 研究计划与安排
第1-4周:收集和整理资料。
第5-6周:拟定提纲,提交开题报告。
第7-13周:撰写论文初稿和修改稿,保持与指导教师的沟通。
4. 参考文献(12篇以上)
[1] reyes a , rosso p , veale t . a multidimensional approach for detecting irony in twitter[j].language resources and evaluation, 2013, 47(1):239-268.
[2] reyes a , rosso p . making objective decisions from subjective data: detecting irony in customers reviews[j]. decision support systems, 2012, 53(4):754-760.
[3] 秦春秀, 祝婷, 赵捧未, et al. 自然语言语义分析研究进展[j]. 图书情报工作, 2014, 58(22):130-137.