跨领域命名实体识别技术研究与实现任务书
2020-02-18 15:53:04
1. 毕业设计(论文)主要内容:
深入理解自然语言处理、机器学习、深度学习和迁移学习的基本概念,掌握现有命名实体识别模型的建模理论、优化策略、训练方法和评价方法,提出具有一定创新性的跨领域命名实体识别方法,实现跨领域的命名实体识别系统,完成训练及效果评价。
2. 毕业设计(论文)主要任务及要求
(1)查阅不少于15篇的参考文献,其中近五年外文文献不少于3篇,完成开题报告。
(2)研究研究无标注或者弱标注条件下命名实体识别方法和迁移学习方法,提出具有一定创新性的、工程上合理可行的跨领域命名实体识别系统设计方案,设计方案须综合考虑社会、健康、安全、法律、文化以及环境等有关因素。
(3)根据设计的方案,用python、c、c 等编程语言实现跨领域的命名实体识别系统,并完成系统测试和效果评价;对结果做归纳总结,得出有意义的结论,并展望后续的研究工作。
3. 毕业设计(论文)完成任务的计划与安排
第1周—第4周 搜集资料,撰写开题报告;第5周—第6周 论文开题,硬软件总体设计;
第7周—第13周 分步实施,实验及分析,撰写论文初稿;
第14周—第15周 修改完善论文;
4. 主要参考文献
[1] 林广和,张绍武,林鸿飞. 基于细粒度词表示的命名实体识别研究[j],中文信息学报,2018,32(11):62-71.[2] 朱景东,杨立志,丁温雪等.基于主题标签和crf的中文微博命名实体识别[j],华中师范大学学报(自然科学版),2018,52(3):316-321.
[3] yadav v, bethard s. asurvey on recent advances in named entity recognition from deep learning models[c]//proceedingsof the 27th international conference on computational linguistics. 2018:2145-2158.
[4] zhang y, yang j.chinese ner using lattice lstm[j]. arxiv preprint arxiv:1805.02023, 2018.