Automatic Generation of Social Tags for Music Recommendation
[source] NIPS
[2007]
杂一篇
social tags 是用户产生的与资源相关的关键字
在音乐中,可用来产生播放列表(与用户兴趣有关的)等
此文预测social tags
1. CFR (CF for collaborative filtering, R for recommendation)
冷启动的问题,
缺乏推荐的透明性,
2.基于近似标签推荐
直接推导获得标签
An Autotagging Algorithm
AdaBoost ,扩展自MIREX 2005
优点:
1.基于特征最小化经验错误的能力选择特征
2.computation time scales linearly
1.Acoustic Feature extraction
标准声学特征
活动窗口(100ms with 25ms overlap)
众多特征处理为统计特征--独立高斯分布的期望和方差
2.labels as a classification problem
tags are sparse
将每个标签分为a lot , some , none三类
3. tag predict with AdaBoost
用一些弱分类器h_l^t(x)来训练,得到g(x)为强分类器
one-verse-all的多分类
4. generating autotags
每个g(x) 产生的是none, some, a lot的分类
1.以 g(x)可为每段音乐分出类
2.可为同一artist的所有音乐
对于2, a.选a lot b其它方法
PS. Last.fm是个好网站,API很丰富,douban.fm没找到官方API,只找到了这个http://code.google.com/p/drhac/wiki/Protocol