文本关键词提取和自动分类算法的研究与实现开题报告

2020-07-02 22:57:59

1. 研究目的与意义（文献综述包含参考文献）

一.课题背景随着互联网技术的飞速发展，网络中出现了巨大的信息资源，而中文文本信息在其中占有很大的比重，因此我们如何快速、准确地获取自己所需要的中文信息成为我们急需解决的课题。

而针对中文文本的数据挖掘技术可以帮助我们解决这一难题。

二.数据挖掘理论数据挖掘[1][2][3][4](data mining)就是从大量的数据中提取出对用户真正有用或感兴趣的知识(knowledge)，习惯上被称为数据库中知识发现(knowledge discovery in database,kdd)的同义词。

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

一.研究的问题本课题主要研究的问题是中文文本自动分类。

由于中文和英文的不同，中文词与词之间没有空格，同时中文也是非结构化的数据。

针对这两个问题，在进行中文文本分类之前，需要对文本进行预处理：对文本进行分词和将文本变换成计算机识别的数据输入。

剩余内容已隐藏，您需要先支付 5元才能查看该篇文章全部内容！立即支付