毕业论文开始啦~~~
上周浑浑噩噩的过去了,先是平安夜和实验室朋友出去玩,之后又和其他朋友出去玩,每天看看胡兰成的传记和作品,然后新手机到了之后辛辛苦苦的钻研了很久,周六玩了一天,上午滑冰 下午滑冰 晚上逛街 周日花了很长时间给手机贴膜,好多好大的气泡,打扫下卫生,一周就这样过去了。不对,还给一对朋友牵了线,哈哈。从今天起,我找工作的假期就结束了;从今天起,我要写毕业论文了撒~~
之前的工作是针对社区问答系统做了社区发现,如何在抽样的情况下加强社区发现,以及一些网络上的统计特征分析,毕业论文还需要在上述工作的基础上进一步扩展,下面是可能的问题和路线。
1 是否存在虚假用户社区? 验证方法:把真假数据集用于之前的社区发现算法,计算虚假用户的社区分布,社区内比例;(节点间边的权值有可能影响社区聚集的参考要素)
2014.1.2更新:虚假用户比例不高,原因是很多不确定用户被默认为真实用户了,但是人工判断发现,对于特定的社区,不确定用户更倾向于是虚假用户。这里开始探索半监督机器学习算法。
2 哪些用户帮助虚假用户进行伪装隐藏,help farming? 这些用户可能是:与虚假用户处于同一社区的真实用户;颈部用户,这些用户的属性值
2014.1.2更新:基本上是新生类用户和热心类用户,而这两种用户试图通过分类规则判断, 同一更新;
3 大拿用户对虚假用户的态度?此处把问与答分开;
2014.1.2更新:仅仅提取了大拿用户,还没有进行分析
待续中。。。
另外 重新补起c++ python...