基于语境相容算法的跨语种文本搜索算法设计开题报告
2021-12-14 21:56:52
1. 研究目的与意义及国内外研究现状
本课题的研究目标是实现基于语境的日文情报资料分类与检索。
2. 研究的基本内容
本课题的研究内容主要包括以下方面:
1) 日文词汇对就于中文内涵的经验分布概率模型:这部分的研究内容主要是通过日语专业学生针对常用的日文词汇的中文内涵进行手工录入后,再基于算法实现日文词汇的中文内涵经验分布概率模型,并建立相关的模型数据库,作为日文词汇研究的成果。
3. 实施方案、进度安排及预期效果
1. 日文词汇的中文内涵经验分布概率模型的构建,这部分内容主要由日语专业的学生通过人工统计的方式来实现,且需要计算机专业的学生开发相应的软件系统,以便于日语专业的学生录入存储日文词汇的中文内涵,同时统计日文语料库中各日文词汇的中文内涵分布经验概率。
2. 开发实现基于词内涵相容的语境构建算法:这部分内容主要是由计算机专业的学生基于前述的日文词汇的中文内涵经验分布概率来实现中文/日文句子的分词,设计词内涵相容算法来实现中文/日文句子的语境构建算法,这部分需要基于大量的语料计算,主要通过构建分布式多线程计算架构来调用算法实现。
4. 参考文献
[1]王克非. 英汉/汉英语句对应的语料库考察[j]. 外语教学与研究,2003,12(06):30-33.
[2]濮建忠.英语词汇教学中的类联接、搭配及词块[j]. 外语教学与研究, 2003,34(06):45-
50.