首页> 中文学位 >基于用户评论的自动化音乐分类方法
【6h】

基于用户评论的自动化音乐分类方法

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 音乐分类

1.2.2 中文分词

1.2.3 关键词提取

1.3 本文研究内容

1.4 本文组织结构

第2章 技术介绍

2.1 中文分词

2.1.1 MMSEG

2.1.2 N-gram

2.1.3 隐马尔可夫模型

2.1.4 条件随机场

2.1.5 社交网络分词

2.2 关键词提取

2.2.1 TFIDF

2.2.2 TextRank

2.3 聚类

2.3.1 K均值

2.3.2 层次聚类

2.3.3 谱聚类

2.4 本章小结

第3章 音乐分类算法

3.1 标签提取方案

3.2 音乐分类算法

3.2.1 数据爬取

3.2.2 预处理

3.2.3 音乐字典获取

3.2.4 分词

3.2.5 分合测试

3.2.6 标签提取

3.2.7 标签过滤

3.2.8 音乐分类

3.3 标签聚类

3.4 本章小结

第4章 算法的实现与优化

4.1 字典获取

4.2 中文分词

4.2.1 CRF模型的实现

4.2.2 MMSEG模型的实现

4.3 分合测试的实现与优化

4.4 标签提取的实现与优化

4.4.1 TFIDF实现与优化

4.4.2 TextRank实现

4.5 本章小结

第5章 实验和分析

5.1 分词模型实验

5.2 标签提取算法实验

5.3 音乐分类验证

5.4 系统展示

第6章 总结和展望

6.1 本文总结

6.2 未来工作展望

参考文献

致谢

在读期间发表的学术论文与取得的研究成果

展开▼

摘要

音乐分类作为音乐信息检索(Music Information Retrieval,MIR)领域的一个重要分支,常用于音乐检索和音乐推荐。现有的音乐分类方法从音乐的流派、感情、乐器、艺术家和标注五个角度进行分类。但是这些分类方法都过于局限,它们将音乐的类别限制在了一个固定的范围内,导致用户无法根据音乐的细节信息进行音乐检索。
  针对音乐分类类别固定、搜索内容过于局限的问题,本文提出了一种基于用户评论的自动化音乐分类方法。此方法不再局限于已有的音乐类别,可以得到更为多样化的分类结果,为用户提供更个性化的检索体验。该方法的出发点为用户对音乐的评论描述更为深入,这些详细的描述对音乐的分类有重要的参考价值。本文的主要工作如下:
  1)首先利用线性链条件随机场(linear Conditional Random Field,linear CRF)模型识别专业名词。然后使用N元词串提取和紧密度分析方法,利用种子生成的思想得到适合音乐语料分词的字典。此混合方法能获取较为准确和丰富的字典,降低基于统计的分词模型对标注语料的需求。
  2)使用linear CRF和上述的音乐字典进行分词。接着使用基于词汇紧密度分析的分合测试评估分词结果。接着使用MMSEG(Max Matching Segmentation)模型进行分词修正,使得修正后的分词结果拥有较高的准确率。
  3)对比多个关键词提取算法,选择TFIDF(Term Frequency-Inverse DocumentFrequency)算法并优化,削弱了词频在提取过程中的影响,提高了候选标签的准确性。然后再从全局角度对候选标签进行过滤,得到音乐的关联标签。
  4)建立音乐的多标签概率分类模型,对音乐进行分类。
  5)尝试对音乐标签按相似程度进行聚类,减小对音乐分类模型的影响。
  实验结果表明,该音乐分类方法准确率较高,可以无监督地获取音乐多个维度的标签,为个性化的音乐检索提供了保障。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号