上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 32 下一页
摘要: Artificial Intelligence in Motion发布的博文,谈MongoDB、Python和MapReduce。 阅读全文
posted @ 2010-08-22 17:20 老兵笔记 阅读(4053) 评论(0) 推荐(0) 编辑
摘要: 我平时喜欢玩Mashup,所以对国外各种开放接口都有兴趣看两眼。像Twitter的,Yahoo!的(Yahoo! Pipe、YQL),Google(Buzz、Google Reader、Chart、WebFinger等)的,即使是很不着调的Social Graph API,都能很快测试通过然后嵌到自己的所谓“智能语义聚合框架”里。但对于国内哪怕是所谓“开放平台”提供的API都会比较犯憷。 阅读全文
posted @ 2010-08-19 14:11 老兵笔记 阅读(12461) 评论(6) 推荐(1) 编辑
摘要: 每次蹲在投币式电动摇摆机前等女儿下来时,我都会梦想,要是我能发明并注册下这么一种原理极其简单、ARPU高、又给使用者带来喜悦、买家有动力不断升级换代的专利该有多好。当然了,如果这是一个专利受到保护的国家,作为专利持有人,才会有坐地收钱的事情发生。 阅读全文
posted @ 2010-08-17 16:53 老兵笔记 阅读(6877) 评论(0) 推荐(0) 编辑
摘要: Socket 连接资源耗尽,在 Windows Server 下很常见,如果使用者程序写得没问题的话,一般都是微软(或其他软件厂商)设置的一些默认参数不合时宜导致的。 阅读全文
posted @ 2010-08-10 16:59 老兵笔记 阅读(4431) 评论(2) 推荐(0) 编辑
摘要: 关于上节《02-Twisted 构建 Web Server 的 Socket 长链接问题》,还可以继续探讨为何会保持 Socket 长链接。 阅读全文
posted @ 2010-08-10 16:53 老兵笔记 阅读(1687) 评论(0) 推荐(0) 编辑
摘要: Social Computing Lab 最近发布了一个研究报告,其中一个结论是:名气和影响力没什么关联,比人们期望的弱得多;名气和影响力是两码事,关注者多并不等于有影响力,重要的是有多少人愿意转发你的 Tweet 。 阅读全文
posted @ 2010-08-09 00:34 老兵笔记 阅读(3535) 评论(0) 推荐(1) 编辑
摘要: Cutt.com在组织资讯时,我把它划分到Topic Engine一类,暂且不谈它的阅读模式和群体智慧。(Updated:我拼写错误,应该是“王靖雯”,这样就可以找到王菲) 阅读全文
posted @ 2010-07-27 00:54 老兵笔记 阅读(6855) 评论(4) 推荐(2) 编辑
摘要: 原文地址:http://aimotion.blogspot.com/2010/07/working-on-sentiment-analysis-on.html 虽然是讲葡萄牙语下的情感分析,但作为一个入门指导也有可看之处。 阅读全文
posted @ 2010-07-22 00:55 老兵笔记 阅读(2799) 评论(0) 推荐(1) 编辑
摘要: Twitter 提供了两种 Streaming 接口,让第三方可以省却轮询,由 Twitter 主动把合适的数据推送过来,近乎实时。 阅读全文
posted @ 2010-06-22 15:53 老兵笔记 阅读(8154) 评论(0) 推荐(0) 编辑
摘要: 主要通过三种方式。当然,算上各种公开的 twitter 第三方Proxy API ,会更多。 由于每一种方式都有请求频率限制,所以建议最终程序混合这三种方法,要么随机选择其一,要么按优先级逐次访问,如果访问不通,立刻切换到下一种。 阅读全文
posted @ 2010-06-11 02:19 老兵笔记 阅读(3393) 评论(0) 推荐(0) 编辑
摘要: Kuber 的 SocialBadge 还利用了 WebFinger ,从而可以根据用户输入的 Email 地址获取它的关联信息。当然 Kuber 还是走 Social Graph 来得到关联信息,因为 WebFinger 的数据能被 Social Graph 调用。 阅读全文
posted @ 2010-05-26 13:57 老兵笔记 阅读(1606) 评论(0) 推荐(0) 编辑
摘要: 当用此 Web Server 接收 PubSubHubbub Hub Server 发送过来的各种请求时,遇到了一个大问题: 随着时间推移,处于 ESTABLISHED 状态的 Socket 连接越来越多,慢慢抵达500多个, 最终导致服务爆出异常“too many file descriptors in select”,当此异常发生时,已无法挽救,只能重启服务。 阅读全文
posted @ 2010-05-26 11:39 老兵笔记 阅读(5072) 评论(1) 推荐(0) 编辑
摘要: 最近 Kuber 推出了 SocialBadge ,是利用 google social graph api 做的。 SocialBadge 算是社会化推荐封闭社区的预研 demo 了。有了这个雏形,面向全球 Social 重度用户的个性化推荐计算有了可能。 阅读全文
posted @ 2010-05-25 00:38 老兵笔记 阅读(1448) 评论(0) 推荐(0) 编辑
摘要: 一般让爬虫在一个进程内多线程并发,有几种方法。 阅读全文
posted @ 2010-05-18 16:12 老兵笔记 阅读(8044) 评论(1) 推荐(2) 编辑
摘要: 设置 HTTP 或 Socket 访问超时,来防止爬虫抓取某个页面时间过长。 阅读全文
posted @ 2010-05-18 16:07 老兵笔记 阅读(12055) 评论(0) 推荐(1) 编辑
摘要: 我们需要确定网页的内容/标题等文字的编码格式,比如 utf-8 、gb2312 等。 阅读全文
posted @ 2010-05-18 15:57 老兵笔记 阅读(3523) 评论(1) 推荐(1) 编辑
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2010-05-18 14:48 老兵笔记 阅读(4153) 评论(4) 推荐(3) 编辑
摘要: 可以认为这是一个理想的自动问答机器,利用协同过滤原理和语义技术,同时又有人工编辑审核问题和答案保证机器学习的质量。 阅读全文
posted @ 2010-03-08 16:20 老兵笔记 阅读(3916) 评论(0) 推荐(0) 编辑
摘要: 实时分析大致有几种。 阅读全文
posted @ 2010-03-06 21:53 老兵笔记 阅读(8746) 评论(0) 推荐(0) 编辑
摘要: 而从人类的感觉上,至少要能有几个标签,比如名词、动词、形容词等,才能证明一个tweet可能包含有一定信息量,值得被传播。所以强制要求有N个标签被检测到的规则,恰好能逼近这种人类的认知。 阅读全文
posted @ 2010-01-23 23:14 老兵笔记 阅读(4634) 评论(0) 推荐(1) 编辑
上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 32 下一页