面向用户个性化推荐的协同过滤算法研究毕业论文
2021-06-24 22:28:36
摘 要
随着互联网络的在全球的发展与普及,人们获取信息与各种服务功能更加便利且快速。在浩瀚的网络数据中,用户可能会无法直接获取大量所需要的内容,甚至有的用户因为缺乏信息筛选而无从下手,在这样的环境下推荐系统应运而生,推荐系统的主要功能就是针对不同用户的不同喜好,系统为每个用户提供个性化的推荐。与此同时网络上传输的数据量也愈来愈大,信息过载问题由此而生,面对如此庞大的数据量,传统的推荐系统已经无法满足用户需求,为了解决信息过载这一严重的问题,协同过滤算法由此成为了一种成功的方案,它被广泛运用于各种推荐系统当中。
本论文着力于研究基于协同过滤算法的推荐系统,首先详细地介绍算法的三个主要流程:评分建模模块、相似度计算模块和最近邻求取并产生推荐模块。然后利用MovieLens提供的大量数据设计并实现基于协同过滤算法的电影推荐系统,根据实验数据比对,推断出皮尔逊相似度比较精确,以及对该系统进行了各项不同方面的测试,以研究该系统有哪些问题所在。
关键词:信息过载;推荐系统;协同过滤;相似度
Abstract
With the development and popularity of the Internet in global area, the access to the information and various services become more convenient. In the vast ocean of network data, the user could not get a lot of required content directly, and even some users could not know how to start because of a lack of information filtering. So recommendation system arises at the historic moment, which main function is to provide each user targeted recommendations according to different preferences. At the same time the increased amount of data transfers over the Internet, which cause an information overload problem.. Traditional recommendation systems have been unable to meet the demand of users because of the huge amount of data, so the collaborative filtering algorithms as a solution to the problem of information overload has been widely used in the recommendation system.
The main work of this paper is studying recommendation system based on collaborative filtering which contains three parts: modeling the score, calculating the similarity, recommending nearest neighbor. Also according to the data of MovieLens, I designed a movie recommendation system based on collaborative filtering algorithm. According to the result of the experiment, Pearson Correlation Coefficient is better than the others in this article. And then the deficiencies and improvement of traditional collaborative filtering algorithms are described in this paper.
Key Words:information overload;recommendation system;collaborative filtering algorithm;similarity
目 录
第1章 绪论 1
1.1 研究背景及意义 1
1.2 国内外研究现状 2
1.2.1 推荐系统的发展历史 2
1.2.2 推荐系统的研究现状 2
1.3 本文主要工作 3
第2章 推荐系统及相关技术 4
2.1 推荐系统概述 4
2.1.1 推荐系统的分类 4
2.1.2 推荐系统的框架 4
2.2 主要推荐技术 5
2.2.1 基于内容的推荐 6
2.2.2 基于协同过滤的推荐 6
2.2.3 基于组合的推荐 7
2.3 协同过滤推荐算法分类 7
2.3.1 基于项目的协同过滤 7
2.3.2 基于用户的协同过滤 7
2.4 协同过滤推荐算法面临的主要问题 7
第3章 基于用户的协同过滤算法 9
3.1 问题描述与算法思想 9
3.2 评分描述 9
3.3 用户相似度计算 9
3.3.1 余弦相似度 9
3.3.2 皮尔逊相似度 10
3.3.3 修正余弦相似度 11
3.4 产生推荐结果 11
3.5 推荐质量评价标准 12
第4章 电影推荐系统的设计与实现 13
4.1 系统的需求分析 13
4.2 系统的设计 13
4.3 相似度计算方法的选取 13
4.3.1 实验一:不同数据集时MAE 13
4.3.2 实验二:改变最近邻数目的MAE 16
4.4 电影系统的实现 16
第5章 实验结果与分析 21
5.1 基于稀疏性的分析 21
5.2 基于冷启动的分析 22
5.3 基于扩展性的分析 23
5.4 基于准确度的分析 24
第6章 总结与展望 25
参考文献 26
附录A 相似度计算模块源代码 27
附录B 相似度比较模块源代码 28
附录C 推荐系统模块源代码 30