中文垃圾短文本的识别方法研究任务书
2020-02-11 00:18:23
1. 毕业设计(论文)主要内容:
所谓短文本主要是指手机短信、微博、商品评论、论坛帖子等一类长度较短,字数有限的文本。在该类短文本中,往往存在着大量的违反信息交互平台使用规定的违法的垃圾类文本,例如垃圾短信、广告微博、虚假评论等。本课题要求研究短文本中文分词及特征提取方法,研究基于人工智能识别垃圾短文本的方法,并设计识别算法,编程验证。
2. 毕业设计(论文)主要任务及要求
- 调研,了解人工智能以及垃圾短文本识别的国内外研究现状,明确研究内容、技术路线,完成开题报告。阅读的参考文献不少于15篇(其中近五年外文文献不少于3篇)。
- 研究短文本中文分词及特征提取;
- 学习人工智能知识,掌握Python编程语言及人工智能平台的应用;
- 设计实现识别垃圾短文本的神经网络模型;
- 编程实现垃圾短文本识别并完成测试;
- 翻译不少于5000汉字(或20000英文印刷符)的与课题相关的英文资料。
- 撰写毕业论文,字数不少于1.2万字,图量不少于12个,并完成答辩的相关工作。
3. 毕业设计(论文)完成任务的计划与安排
1~3周:调研,完成开题报告。
4周:学习人工智能、python编程。
5~6周:研究设计短文本中文分词及特征提取方法。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
4. 主要参考文献
- Wesley chun.Python核心编程[M].人民邮电出版社,2016.05
- Eric Matthes.Python教程从入门到实践[M].人民邮电出版社,2016.07。
- 赖文辉,乔宇鹏.基于词向量和卷积神经网络的垃圾短信识别方法[J].计算机应用,2018,38(9):2469-2476。
- 江大鹏.基于词向量的短文本分类方法研究[D].浙江大学,2015。
- Mingxuan liu, Xinghua Fan. A Method for Chinese Short Text Classification Considering Effective Feature Expansion[J] . International Journal of Advanced Research in Artificial Intelligence . 2012 (1)
剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付