摘要:
Artificial Intelligence in Motion发布的博文,谈MongoDB、Python和MapReduce。 阅读全文
摘要:
我平时喜欢玩Mashup,所以对国外各种开放接口都有兴趣看两眼。像Twitter的,Yahoo!的(Yahoo! Pipe、YQL),Google(Buzz、Google Reader、Chart、WebFinger等)的,即使是很不着调的Social Graph API,都能很快测试通过然后嵌到自己的所谓“智能语义聚合框架”里。但对于国内哪怕是所谓“开放平台”提供的API都会比较犯憷。 阅读全文
摘要:
每次蹲在投币式电动摇摆机前等女儿下来时,我都会梦想,要是我能发明并注册下这么一种原理极其简单、ARPU高、又给使用者带来喜悦、买家有动力不断升级换代的专利该有多好。当然了,如果这是一个专利受到保护的国家,作为专利持有人,才会有坐地收钱的事情发生。 阅读全文
摘要:
Socket 连接资源耗尽,在 Windows Server 下很常见,如果使用者程序写得没问题的话,一般都是微软(或其他软件厂商)设置的一些默认参数不合时宜导致的。 阅读全文
摘要:
关于上节《02-Twisted 构建 Web Server 的 Socket 长链接问题》,还可以继续探讨为何会保持 Socket 长链接。 阅读全文
摘要:
Social Computing Lab 最近发布了一个研究报告,其中一个结论是:名气和影响力没什么关联,比人们期望的弱得多;名气和影响力是两码事,关注者多并不等于有影响力,重要的是有多少人愿意转发你的 Tweet 。 阅读全文
摘要:
Cutt.com在组织资讯时,我把它划分到Topic Engine一类,暂且不谈它的阅读模式和群体智慧。(Updated:我拼写错误,应该是“王靖雯”,这样就可以找到王菲) 阅读全文
摘要:
原文地址:http://aimotion.blogspot.com/2010/07/working-on-sentiment-analysis-on.html
虽然是讲葡萄牙语下的情感分析,但作为一个入门指导也有可看之处。
阅读全文
摘要:
Twitter 提供了两种 Streaming 接口,让第三方可以省却轮询,由 Twitter 主动把合适的数据推送过来,近乎实时。 阅读全文
摘要:
主要通过三种方式。当然,算上各种公开的 twitter 第三方Proxy API ,会更多。
由于每一种方式都有请求频率限制,所以建议最终程序混合这三种方法,要么随机选择其一,要么按优先级逐次访问,如果访问不通,立刻切换到下一种。
阅读全文
摘要:
Kuber 的 SocialBadge 还利用了 WebFinger ,从而可以根据用户输入的 Email 地址获取它的关联信息。当然 Kuber 还是走 Social Graph 来得到关联信息,因为 WebFinger 的数据能被 Social Graph 调用。 阅读全文
摘要:
当用此 Web Server 接收 PubSubHubbub Hub Server 发送过来的各种请求时,遇到了一个大问题:
随着时间推移,处于 ESTABLISHED 状态的 Socket 连接越来越多,慢慢抵达500多个,
最终导致服务爆出异常“too many file descriptors in select”,当此异常发生时,已无法挽救,只能重启服务。 阅读全文
摘要:
最近 Kuber 推出了 SocialBadge ,是利用 google social graph api 做的。
SocialBadge 算是社会化推荐封闭社区的预研 demo 了。有了这个雏形,面向全球 Social 重度用户的个性化推荐计算有了可能。 阅读全文
摘要:
一般让爬虫在一个进程内多线程并发,有几种方法。 阅读全文
摘要:
设置 HTTP 或 Socket 访问超时,来防止爬虫抓取某个页面时间过长。 阅读全文
摘要:
我们需要确定网页的内容/标题等文字的编码格式,比如 utf-8 、gb2312 等。 阅读全文
只有注册用户登录后才能阅读该文。 阅读全文
摘要:
可以认为这是一个理想的自动问答机器,利用协同过滤原理和语义技术,同时又有人工编辑审核问题和答案保证机器学习的质量。 阅读全文
摘要:
而从人类的感觉上,至少要能有几个标签,比如名词、动词、形容词等,才能证明一个tweet可能包含有一定信息量,值得被传播。所以强制要求有N个标签被检测到的规则,恰好能逼近这种人类的认知。 阅读全文