歌词文本挖掘及检索系统的设计与实现毕业论文
2021-11-09 21:10:36
摘 要
本文借助设计和实现一个热门歌手歌词信息检索与信息抽取系统。该系统通过爬取热门歌手及每位歌手的热门歌词。根据输入的关键字,检索出相关性最高的10首歌,并能够从歌曲中抽取出歌名、演唱、作词、作曲、季节、情绪、个性化标签等结构化信息。分析所得信息与歌词文本联系起来,找出它们的内在联系,对智能写歌和按曲写歌以及及写歌又写曲有很大帮助。
论文主要研究了歌手所唱歌词与季节、情绪、个性化之间的联系。
研究结果表明:歌词中的特定文本与歌词所表现的季节,情绪,个性化有很大联系。
本文的特色:贴近了智能写歌的范畴,为智能写歌和智能写曲做出了一定的原理分析和基础。
关键词:人工智能;写歌;个性化分析;数据挖掘,自然语言处理
Abstract
This paper designs and implements a popular singer lyrics information retrieval and information extraction system. The system crawls popular singers and their popular lyrics. According to the input keywords, 10 songs with the highest correlation can be retrieved, and the structured information such as song name, singing, lyrics, composition, season, emotion, personalized tags can be extracted from the songs. The analysis of the information and lyrics text, find out their internal relations, intelligent song writing and song writing according to the song, and write songs and songs again.
This paper mainly studies the relationship between the lyrics sung by singers and
seasons, emotions and personalization.
The results show that: the specific text in the lyrics is closely related to the season, emotion and personalization of the lyrics.
The characteristics of this paper: close to the category of intelligent song writing, and make a certain principle analysis and foundation for intelligent song writing and intelligent music writing.
Key Words:Artificial intelligence; song writing; personalized analysis; data mining
natural language processing
目 录
第1章 绪论 6
□□1.1□市场需求及分析 6
□□1.2□系统的组成 6
□□1.3□系统的设计思路 6
第2章□系统的详细设计 7
□□2.1□系统的可行性分析 7
□□2.2□系统的技术实现分析 8
□□2.3□系统的流程设计 9
第3章□系统的测试结果 9
□□3.1□爬取歌词结果 10
□□3.2□歌词歌手排序结果 10
□□3.3□个性化标签显示结果 10
第4章□歌词个性化分析 11
□□4.1□歌手的情绪分析 11
第5章□结束语 11
参考文献 12
致谢 13
第1章 绪论
本文从歌词文本挖掘及检索系统的设计与实现的过程中,得到歌词文本中特殊词语与歌词所要表达出的个性化标签之间的关系,为人工智能写歌,写曲奠定基础。从歌词抓取到文本分析到个性化挖取,分析出所选歌词的个性化标签,在此基础上验证特定词语是否与歌词的个性化标签有联系,以及联系有多深。本文得出了特定词语的确与歌词的个性化有相当大的联系。
1.1 市场需求及分析
歌词文本挖掘及检索系统主要的功能是分析出特定词语和歌词之间的关系,这是为了人工智能写歌写曲做的基础,为了更好的实现智能写歌和写曲。而该系统还实现了歌手歌词信息检索与信息抽取系统,该系统面向大众用户,相比较现在流行的音乐软件而言,拥有比较大的优势,该系统可以较好的实现用户对于歌词歌手的检索,向用户提供歌词分析等信息。
随着人工智上升为国家战略, 如何在音乐领域应用人工智能技术变成一个新兴的研究领域。 在人工智能写歌和作曲这个邻域中,利用人工智能来创作特定风格的音乐是一个非常重要的研究方向。 这几年来有很多相关技术涌现并得到了应用,在这个应用过程中, 传统算法作曲的相关理论为人工智能技术在音乐创作中的 实现提供了基本的参考和大量的基础,而人工智能技术也在音乐的创作思维、制作流程等方面对传统理论产生了影响。
1.2 系统的组成
歌词文本挖掘及检索系统分为两个部分,第一个部分是歌词文本挖掘系统,这一部分主要是为了从网上爬取选定的特定的歌手的歌词。第二个部分是歌手歌词信息检索与信息抽取系统,这一部分是在第一部分系统得到的歌词文档的基础上进行分词处理,得到特定词语与相对应歌词的个性化标签之间的关系。并将结果显示在歌手歌词信息检索与信息抽取系统上面。
1.3 系统的设计思路
歌手歌词信息检索与信息抽取系统是为了验证特定词语与歌词的个性化标签有联系,以及之间的关系如何,所以歌手歌词信息检索与信息抽取系统首先要得到选定的特定歌手的歌词,之后使用检索系统对特定歌词进行分析,来找到其中的关联。
在选歌网站方面,选择的是网易云音乐,因为这个网站把歌手分为了许多类,我选择其中的民谣歌手和摇滚歌手进行分析。选定的歌手偏向于性格突出,有个人分格,个人特色,风格比较单一的歌手,这样做的话可以避免影响检索系统的性能,在得到相应的结果后会把歌词的选取范围扩大。选择歌手比较集中便于统计分析,容易得出结论。
歌手歌词信息检索与信息抽取系统首先使用分词系统得到特定歌词,然后计算每首歌词中每个词语的TF-IDF值,然后构建全部歌词的字典集。在此基础上用户输入查询数据时,系统可以构建查询向量,然后利用向量空间模型,计算查询向量和文档向量的相似度,选取排序靠前的十首歌曲。
歌手歌词信息检索与信息抽取系统在进行结构化信息抽取,抽取出歌词的歌名,演唱者,季节,情绪,个性化标签。