10 2010 档案

WebGraph++编译
摘要:WebGraph是一个很好的用来存储和表示Web图的工具,目前提供Java版、C++版以及其他一些版本对Java的接口。以前,我一直在用Java 版本的,但最近用Java压缩一个大型的Web图(60多G)的时候出现未知错误。因此,就想用C++版本来试一试。之前也用过C++版本的 WebGraph,但一直没有build成功。这次,经过努力,最后终于build成功,下面记录一下详细过程。从WebGra... 阅读全文

posted @ 2010-10-15 14:16 小橋流水 阅读(192) 评论(0) 推荐(0) 编辑

在VS2010下编译boost库
摘要:boost c++库是一个非常好的图形库,但是下载的时候是没有编译的,是需要自己编译的。这里我下载的是boost_1_44_0,包括boost_1_44_0.7z和boost-jam-3.1.18-1-ntx86.zip,其中boost-jam是用来编译的。第一步,当然是解压了,将上面的两个文件进行解压,将第二个文件解压得到的bjam.exe拷贝到第一个文件解压的根目录下。第二步,开始编译,首先进... 阅读全文

posted @ 2010-10-15 03:49 小橋流水 阅读(280) 评论(0) 推荐(0) 编辑

Web Spam研究方向发展问题
摘要:今年关于Web Spam的Workshop已经停开了,这是不是意味这Web Spam这个方向没有研究的余地了呢?答案是否定的。根据对最新数据集ClueWeb09 Dataset的 研究,对于一些热门查询的前10结果,大部分页面(尤其是英文页面)是作弊页面 [1]。这说明现在作弊还是非常流行的,对信息检索造成了严重的后果。这也从某个侧面说明,我们现在的反作弊策略的研究还不是很成功,还有很长的路要走... 阅读全文

posted @ 2010-10-14 08:13 小橋流水 阅读(185) 评论(0) 推荐(0) 编辑

还有多少时间可以用来读书
摘要:刚刚看来大齐的日志,感触很多,也让我想起了我的大学生活。总的来说,我对我的大学生活基本满意,但在有些方面还是有很多遗憾。也来说一下我对某些方面的感悟。一、关于做人每 个人都是在实践中慢慢学会做人的,大学可以说是一个很好的平台。这方面是我在大学收获最多的。从大一时的“独自抱一个收音机在角落”到大四时的“为同学服 务的就业负责人”,不知道的可能认为是两个不同世界的人。在大学,最重要的就是学会做人:学会... 阅读全文

posted @ 2010-10-10 06:13 小橋流水 阅读(216) 评论(0) 推荐(0) 编辑

在研究的道路上到底还能走多远
摘要:曾记得刚跨入大学时,任何事情都想尝试,哪怕接二连三的失败也毫不在乎。碰到自己喜欢的女孩,敢去追求。面对别人背后的议论,依然自信满满,心中总有追求。可以为了一个技术问题,废寝忘食。面对毫无意义的问题,也可以和同学争得面红耳赤。有事没事经常给家里打电话。不记得从什么时候开始,已没有往日的激情。遇到挫折,就开始逃避。有无尽的想法,就是不愿意去实现,每天面对毫无生气的电脑发呆,或是看着枯燥无味的文章,或是... 阅读全文

posted @ 2010-10-10 06:07 小橋流水 阅读(166) 评论(0) 推荐(0) 编辑

Web Spam相关实验室与学者与实验室
摘要:学者 Juan Martinez RomoAU YEUNG Ching-man, AlbertBaoning WuBin ZhouDavid F. GleichCraig MacdonaldBeate KrauseGordon V. CormackGeorgia KoutrikaHongbo DengJames CaverleeJianfeng GaoJuan Martinez RomoMich... 阅读全文

posted @ 2010-10-10 06:02 小橋流水 阅读(120) 评论(0) 推荐(0) 编辑

数学之美整理
摘要:最近发现Google博客上连载的数学之美比较不错,用latex整理了一下。 本人已经看完,觉得非常不错,适合像我这种数学基础不是很好的同学。 the_beauty_of_mathmatics 阅读全文

posted @ 2010-10-10 05:59 小橋流水 阅读(139) 评论(0) 推荐(0) 编辑

研究相关国际会议
摘要:会议类别级别网址AAAIAIA+http://www.aaai.org/Conferences/conferences.phpNIPSAIA+http://nips.cc/Conferences/2010/AICIAI http://wism-aici2010.hainanic.net/CIDRDBAhttp://www-db.cs.wisc.edu/cidr/PKDDDBAhttp://www.... 阅读全文

posted @ 2010-10-10 05:52 小橋流水 阅读(182) 评论(0) 推荐(0) 编辑

[Reading Notes] 2010 ICISTM Can Your Judge a Man by His Friends?-Enhancing Spammer Detection on the Twitter Microblogging Platform Using Friends and Followers
摘要:方法 这篇文章利用机器学习与社交网络信任传播相结合的方法来检测微博中的作弊者。该方法分为两步:第一步,首先利用用户的基础属性(和该用户相关的一些 特征)构建一个基学习器(分类器),然后利用该基学习器以及人工标记的一些训练集来预测其他的用户的类别(作弊与非作弊);第二步,首先利用第一步中得到 的结果,结合用户社交网络的信任传播模型得到一个用户的扩展属性集,然后利用这些扩展属性集构建一个学习器,再利... 阅读全文

posted @ 2010-10-10 01:05 小橋流水 阅读(227) 评论(0) 推荐(0) 编辑

[Reading Notes] 2010 CEAS Detecting Spammers on Twitter
摘要:AbstractThis paper discribes machine learning method to classify spam users from non-spam users in Twitter, a popular microblog, based on user attributes including content attributes and user behavior... 阅读全文

posted @ 2010-10-09 06:33 小橋流水 阅读(263) 评论(0) 推荐(0) 编辑

我的博客开张了
摘要:我的博客开张了,以后会陆续把一些别的地方博客转过来,也会写一些新的博客。博客内容主要是关于技术和研究,也会有少量的生活。 阅读全文

posted @ 2010-10-08 19:22 小橋流水 阅读(155) 评论(0) 推荐(0) 编辑

导航

统计

点击右上角即可分享
微信分享提示