基于数据分析的音乐个性化推荐文献综述
2020-04-15 17:30:04
在互联网大数据时代,各类音乐网站和APP极大的方便了人们对于音乐的需求。大型音乐网站能够保存上千万首歌曲,面对如此海量庞大的音乐信息时,人们往往不易从中找到自己喜欢的歌曲。传统音乐网站的搜索引擎只适合应用在用户有明确的目标并且能够用关键词准确的表达出来的信息检索问题。同时,只有极少部分被用户喜欢且熟悉的歌曲会被用户下载,绝大部分音乐往往无人知晓。因此,个性化音乐推荐系统正是为了在没有明确需求的情况下,挖掘处于大部分无人知晓的音乐,帮助人们找到其喜爱的歌曲。
音乐个性化推荐系统在这些年也得到国内外学者的广泛关注,如Cano等[4]采用音频指纹技术来识别音乐的声学元数据进行推荐。Bogdanov等[5]首先对音频问价内进行声学特征抽取,使用基于内容的协同过滤推荐方法完成音乐推荐。国内学者对音乐个性化推荐的研究也形成了一系列的科研成果。Vignoli等人[6]结合用户分配的权值对音色、流派、节奏和情绪4个因素计算属性之间的相似度,以权重系数和属性相似度为参数构造计算歌曲相似度的混合距离函数,完成推荐。谭学清等人[7]使用参考文献分析的方法,利用差别策略完成不同角度的推荐算法,将音乐有关文献的各种描述进行分析获得其规律完成推荐。孔旭等[8]对音乐作品利用声谱图分析来得到其特征数据矩阵,计算保存的音乐与查询的数据相似度实现Top-N推荐。张燕等[9]使用分形的概念对音乐作品的属性进行处理构建音乐数据的特征集,使用新设计的相似度计算方法实现对音乐进行归类以完成推荐的过程。
个性化推荐系统一般应用在具有以下两个特点的领域:一是该领域有大量的信息或物品等,大大超过了人们能够接触、掌握的范围;二是用户在这个领域只有模糊的需求,没有非常明确的目标。音乐个性化推荐系统,正是符合这两个特点的一个典型领域。首先,当前大型的音乐门户类网站往往有上千万首音乐,这些音乐的种类非常丰富繁杂,而且每月都增加大量的国内外新歌曲,用户不可能听完所有的歌曲后再决定自己喜欢的音乐是什么;其次,用户往往是在做其它事情的时候同时听音乐,即音乐常作为一种背景声音,因此用户的需求往往是“一首或几首好听的歌曲”这类模糊的要求,与此同时,用户听一首音乐的时间成本较低,而且大多数在线音乐服务是免费的。音乐是一种非常适合推荐的物品,而且也是用户迫切需要、并且较为容易接受的功能。正是由于音乐的这些特征,个性化音乐推荐系统的研究与实现具有较大的实用价值。
{title}2. 研究的基本内容与方案
{title}本文的研究目标是通过将大数据分析技术与音乐推荐系统相结合,尽可能的发掘用户兴趣,提升推荐结果的个性化和满意度,最终实现一个基于大数据分析的音乐个性化推荐系统。本研究课题的主要研究内容是:
(1) 研究数据采集与预处理问题。
数据采集是如何利用用户大数据采集方法,获取与用户兴趣相关的全面数据,从而为实现个性化推荐奠定基础。数据预处理首先是如何将原始数据中包含的大量与用户兴趣无关的数据剔除,其次原始数据中由于大数据集采问题导致的数据缺失如何补充。最关键的是用户信息、音乐信息、行为信息和行为上下文信息是不同维度的数据,其中又包含多种数据类型,探索合适的方式将数据转化为能够计算的形式以及如何将数据合并是其中的研究重点。
(2)用户动态兴趣模型建立。
结合传统用户兴趣获取方法,分析音乐推荐中上下文对用户兴趣的影响。使用大数据分析获取用户兴趣,首先通过聚类将兴趣模式相同的用户数据归为一类,再分析不同属性对于用户兴趣的作用从而构建用户动态兴趣模型,获取用户偏好。同时需要研究基于数据的自主采样提高模型的泛化性能和防止过拟合,这是为推荐部分提供决策支持的先决条件。
(3)推荐候选集筛选。
针对传统的推荐算法候选集获取的局限性,从用户和音乐两种角度获取推荐候选集。既保证了候选集筛选对目标用户兴趣的考虑,也使得推荐结果具有一定的物品关联性,解决了候选集不能全面方位覆盖用户兴趣的问题。