摘要: 今天的工作效率好低啊,究其原因,主要是目标不是很明确,总是在做些无用功。不过经过和wx的讨论,思路渐渐的明朗起来,目前主要的工作是这样的:1、将UW-CSE的五个数据集归结成一个总的数据集all.db,用这个总的db训练出一个mln;2、同理,将WEBKB的四个数据集归结成all.db,训练出WEBKB的mln;3、利用前两步得到的结果,向imdb数据集做结构迁移。注意,imdb中有五个数据集,需要依次以其中的一个作为测试集,其他的组合起来作为训练集,训练出目标域imdb的mln;4、利用目标域的mln和测试集进行Infer测试,得到每个谓词的出现概率;5、计算每个谓词的CLL和AUC。经过上 阅读全文
posted @ 2010-12-09 22:36 centimeter 阅读(201) 评论(0) 推荐(0) 编辑