基于类型的电影推荐系统开题报告
2022-01-18 22:30:02
全文总字数:1739字
1. 研究目的与意义及国内外研究现状
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代。在这个时代,无论是信息消费者还是信息生产者都遇到了极大的挑战:对于信息的消费者,从大量信息中找到自己感兴趣的信息是一件非常困难的事情;对于信息生产者,让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。推荐系统就是解决这一矛盾的重要工具。基于类型的推荐系统主要的的处理方式在于利用用户已知的偏好、兴趣等属性和物品内容的属性相匹配,以此为用户推荐新的感兴趣的物品。本文以基于类型的推荐算法为应用背景,设计开发一个基于类型的推荐算法实现的电影推荐系统,实现一个基于类型的推荐算法实现的视频推荐系统,通过获取数据集,对数据集初始化提取出关键字得到物品的结构化描述,结合用户个人信息的结构化描述,运用算法处理数据,预测用户对视频的兴趣,从而实现推荐。国内外研究现状
鉴于推荐算法已成功应用到了诸多领域,国内外在此领域也有相当多的研究,伴随着推荐系统的发展,人们转而研究混合推荐模型,致力于通过不同的推荐方法来解决冷启动、数据极度稀疏等问题。国外近年由netflix发起netflix prize竞赛吸引了很多专业人士投身于推荐系统领域的研究工作,并将这项技术从学术圈拓展到了商业圈;国内近年结合混合推荐方法同时考虑各类因素来提高推荐算法的精确性,近年来机器学习和深度学习等领域的发展,为推荐系统提供了更多的方法指导。
基于类型的推荐系统中内容分析阶段目前主要处理方法有:数值型数据归一化、数值型数据二值化、非数值型数据词袋法转换为特征向量、tf-idf、word2vec。特征学习阶段主要方法有:最近邻方法、决策树算法、线下分类算法、 朴素贝叶斯算法。
2. 研究的基本内容
本课题主要实现一个基于类型推荐算法实现的电影推荐系统,通过获取数据集,对数据集初始化提取出关键字得到物品的结构化描述,结合用户个人信息的结构化描述,运用算法处理数据,预测用户对电影的兴趣,从而实现推荐。
具体到实现上,运用Python语言编写爬虫程序获取数据集,应用Beautiful Soup对数据集中的数据进行处理提取关键字向量,通过输入用户信息对用户个人信息的关键字向量进行收集,将两个关键字向量应用TF-IDF基于关键字向量空间模型计算出二者的余弦相似程度,对计算结果从高到低进行排序给出推荐列表从而实现推荐。
3. 实施方案、进度安排及预期效果
实施方案:通过查阅相关资料和动手实践,深入了解基于类型的推荐算法基本概念和原理以及各种开发工具的使用方法。先把相关概念、基本原理和使用方法了解透彻,再通过编写程序实现数据的抓取、解析以及数据展示。
进度安排:2019年1月-2月 查阅相关资料,学习有关基于类型推荐算法的理论知识以及开发软件的使用方法,并且把所要用到的开发软件安装好配置好。2019年2月-3月 根据前期准备,编写基于类型推荐算法的电影推荐系统程序,运行程序,检查并且完善程序。2019年4月-5月完善细节,完成毕业论文。
4. 参考文献
[1]ricci,fl,rokachb,shapirap,b,kantor.recommender systems handbook[m].北京:机械工业出版社,2015:51-68
[2]项亮.推荐系统实践[m].北京:人民邮电出版社,2012:35-43.
[3]jannach,dm,zankera,felfernigg,friedrich.recommender systems:an introduction[m].北京:人民邮电出版社,2013:32-49.