心胸决定格局,眼界决定境界...

音乐和人声自动判别小结

      人声的平均识别率在89.31%,音乐的平均识别率在95.95%。相声和故事的结果较差,原因在于测试集中包含的相声现场录制环境较差,环境吵闹,频谱混乱;而讲故事有比较明显的音乐背景伴奏。

表1   音乐和人声自动分类结果

 

正确数目

数目

准确率

电视节目

59

66

0.893939

故事

69

88

0.784091

评书

181

186

0.973118

相声

73

96

0.760417

有声电台

41

44

0.930233

1800有声

96

101

0.950495

合计

518

580

0.893103

 

 

 

 

1800音乐

1614

1690

0.95503

华语舞曲

54

54

1

R&B

44

44

1

西方民谣

80

80

1

华语摇滚

50

52

0.961538

rap

104

108

0.962963

合计

1946

2028

0.959566

合理阈值

0.5

 

 

 

表2  两层筛选自动分类结果

 

正确数目

数目

准确率

电视节目

62

66

0.939394

故事

72

88

0.818182

评书

182

186

0.978495

相声

77

96

0.802083

有声电台

41

43

0.953488

1800有声

96

101

0.950495

合计

530

580

0.913793

 

 

 

 

1800音乐

1592

1688

0.943128

华语舞曲

54

54

1

R&B

43

44

0.977273

西方民谣

80

80

1

华语摇滚

49

52

0.942308

rap

104

108

0.962963

合计

1922

2026

0.948667

合理阈值

0.5

 

 

posted @ 2015-02-28 16:05  WELEN  阅读(2250)  评论(0编辑  收藏  举报