摘要: Finding Core Topics: Topic Extraction with Clustering on Tweet挺水的文章,其中的借鉴可以是:1)以转发数作为微博质量的衡量标准,区分高质量微博和垃圾微博(或许可以综合考虑评论,转发,赞的数目?)2)通过聚类的方法进行话题提取,种子的选取是提取双引号以内的,以及首字母大写的。3)没有定量的评价,可以看看其如何进行定性的评价SEARCHINGTELEVISIONFRAGMENTSUSING MICRO-BLOGS: WHO IS ON#DWDDANDWHAT DO THETWEETSREPORT?1)n-gram结合tf-idf,结合微 阅读全文
posted @ 2014-03-09 20:52 bobo的学习笔记 阅读(197) 评论(0) 推荐(0) 编辑