基于机器学习的电影推荐系统设计与开发开题报告
2020-02-18 19:27:14
1. 研究目的与意义(文献综述)
研究背景以及意义
随着信息时代的来临,如何在大量信息中搜寻、筛选和呈现所需给信息的需求者和提供者均带来不小挑战;另一方面,越来越多数据得不到有效利用,造成了资源浪费,例如占有全球资源量14%的中国数据利用了达不到0.4%,有许多数据信息有待利用和挖掘。
面对信息过载挑战,关于如何有效,只能地检索信息,提升用户体验,提高数据利用率的相关研究越来越多,网络搜索引擎在20世纪90年代投入使用后,称谓浏览者得到信息的有效途径,虽然这项技术发展以及比较成熟,但通用搜索引擎无法跟上信息增长的速度,输入一组关键字后甚至能返回数以亿计的信息,而确实有意义的信息只是占很小一部分。
2. 研究的基本内容与方案
研究设计基本内容
本设计主要研究电影项目个性化推荐算法,并且初步将理论算法应用到实际的电影推荐系统当中。本文主要研究工作如下:
(1)提出一种基于网站相关推荐聚合和电影本体知识的电影推荐方法。首先利用电影属性以及影人属性构建电影本体模型,通过用户历史记录获取用户当前兴趣模型,计算用户对不同属性的偏好权重。通过聚合技术获取若干网站对用户最近看过的电影的相关推荐作为待推荐电影源。利用多种方法(如Simrank等)和加权相似度计算电影与电影或者是用户兴趣模型之间的相似度,像用户推荐电影。传统的机器学习方法外,可以使用卷积神经网络进行语言处理,并利用MovieLens和tmdb电影数据集完成电影推荐的任务。
(2)提出一种基于二分图和用户聚类的评分预测方法。首先将用户对电影的行为记录用二分图来表示,通过二分图的路径信息得到用户之间的相似度,利用评分时间、评分差对相似度进行修正,挖掘用户之间的关联性。利用谱聚类算法将用户聚类成兴趣组,最后利用兴趣组中另据用户的评分信息预测用户对未知电影项目的评分。
(3)在完成了电影推荐方法的实现后,将上述推荐方法应用到个人电影推荐网站中,推荐形式应该包括:
1、指定用户和电影进行评分;
2、推荐同类型的电影;
3、推荐您喜欢的电影;
4、看过这个电影的人还看了(喜欢)哪些电影;
以及其他可能的形式。
研究目标
实现一个电影推荐网站,该网站能根据用户所选择标签,观影记录,给出适合游湖的影片简介,以及第三方的播放源,并精选部分第三方网站的评论以供用户进行参考。
拟采用的技术方案和措施
一、总体结构
系统功能结构图如图1所示,分为三个部分,主要技术难点在于电影推荐部分,且热门影片部分需要能根据影片上新自动更新,搜索影片部分要可以展示同时展示相同评分或者类别的电影。
|
二、实施路线
|
(1)使用tensorflow 1.1.2,numpy,skrlearn,pandas等库以及python3.7完成本项目的推荐系统算法部分的开发;
(2)使用python Django完成推荐网站的后端实现,并将找寻可用框架,减少前端实现的时间。
1. 进度安排
(1)2019/1/19—2019/2/28:确定选题,查阅文献,外文翻译和撰写开题报告;
(2)2019/3/1—2019/4/30:系统架构、程序设计与开发、系统测试与完善,考虑到三月份将进行研究时复试,进度可能有所拖延;
(3)2019/5/1—2019/5/25:撰写及修改毕业论文;
(4)2019/5/26—2019/6/5:准备答辩。
3. 研究计划与安排
(1)2019/1/19—2019/2/28:确定选题,查阅文献,外文翻译和撰写开题报告;
(2)2019/3/1—2019/4/30:系统架构、程序设计与开发、系统测试与完善,考虑到三月份将进行研究时复试,进度可能有所拖延;
(3)2019/5/1—2019/5/25:撰写及修改毕业论文;
4. 参考文献(12篇以上)
[1] negroponte, nicholas. "the architectural machine:toward a more human environment." (1970).
[2] goldberg, david, et al. "using collaborative filteringto weave an information tapestry." communications of the acm 35.12 (1992):61-71.