文本关键词提取和自动分类算法的研究与实现开题报告
2020-07-02 22:57:59
1. 研究目的与意义(文献综述包含参考文献)
一.课题背景 随着互联网技术的飞速发展,网络中出现了巨大的信息资源,而中文文本信息在其中占有很大的比重,因此我们如何快速、准确地获取自己所需要的中文信息成为我们急需解决的课题。
而针对中文文本的数据挖掘技术可以帮助我们解决这一难题。
二.数据挖掘理论 数据挖掘[1][2][3][4](data mining)就是从大量的数据中提取出对用户真正有用或感兴趣的知识(knowledge),习惯上被称为数据库中知识发现(knowledge discovery in database,kdd)的同义词。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 研究的基本内容、问题解决措施及方案
一.研究的问题 本课题主要研究的问题是中文文本自动分类。
由于中文和英文的不同,中文词与词 之间没有空格,同时中文也是非结构化的数据。
针对这两个问题,在进行中文文本分类 之前,需要对文本进行预处理:对文本进行分词和将文本变换成计算机识别的数据输入。
剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付