面向中文-阿拉伯语机器翻译的分词与词对齐技术研究开题报告
2021-02-25 13:13:22
1. 研究目的与意义(文献综述)
机器翻译一个新的趋势是正在“实用化”,被应用到生活场景中。过去机器翻译像是一个“更智能的词典”,帮助人们阅读外文网页内容。现在随着语音和图像识别技术的进步,机器翻译可以更多地与生活场景结合。比如人们出国时可用百度翻译了解菜单、店名、商品信息,看美剧时可以用电脑进行字幕翻译,通过拍照直接翻译出一朵花的名字,再比如开头提到的机器人进行多语翻译采访等等。
相比人工翻译,机器翻译可以大幅节约翻译时间,提高翻译效率,满足诸如资讯等时效性要求较高或者海量文本的翻译需求,极大地降低了人力成本。而更重要的是,它让跨语言交流变成每个人都可以拥有的能力:出国、工作、学习很多时候不再求助于人,语言不通不再是人们获取信息和服务的障碍。
近些年来,随着大数据的涌现,机器翻译取得的进展有目共睹。通过对海量数据的汇聚、分析、组合,当数据无限多时,机器翻译也许根本不需要再去了解一个句子的意思,也可以翻译得相当漂亮。
2. 研究的基本内容与方案
设计的基本内容及目标:
1、 研究阿拉伯语与中文语料库,寻找现有高质量可以用于阿拉伯语与中文的语料库;
2、 研究不同预处理技术,特别是分词技术对机器翻译性能的影响;
3. 研究计划与安排
1. 第1周至第2周:查阅有关的参考资料并完成开题报告;翻译英文资料(不少于5000汉字),并交予指导教师检查。(2017.3.2)
2. 第3周至第6周:熟悉所选用的开发平台,运用所学的软件设计理论,完成整个系统的前期设计工作。(2017.4.10)
3. 第7周至第13周:进行系统的编码、调试、集成、测试工作。(2017.5.29)其中第10周左右(2017.5.4-7.8)进行毕业设计中期检查,需要提交论文前三章和毕业设计框架。
4. 参考文献(12篇以上)
参考文献: