摘要:
前端优化一:Combo Handler来合并CSS/JS文件;前端优化二:新浪微博的link标签includes属性。 阅读全文
摘要:
先介绍一下SimHash处理短文本合并重复的效果,再介绍一下2009年2月份我们做Twitter锐推榜时是如何做的。 阅读全文
摘要:
乱码是怎么造成的:一些浏览器(如IE内核低版本浏览器)因meta之前有中文导致无法解析,会用默认字符集GB2312来解析该网页。 阅读全文
摘要:
还是要多打大仗恶仗。
小规模战斗打多了,兵都打残(包括脑残)了,极度厌战。 阅读全文
摘要:
过去两年里一再说,今天还要继续推,锐推榜算法以及讨论博文都在:http://www.cnblogs.com/zhengyun_ustc/category/341945.html 移步查询即可,其实语义分析入门后在工程上挺简单的,都是很成熟的东西,工程界和学术界有大量论文和实作。 阅读全文
摘要:
在技术控的小世界里,以下世界是不应存在的:
楼宇液晶屏 构成的广告媒体世界;
由短信通道和号码资源构成的移动广告世界;
由Avatar和微支付构成的虚拟装饰世界; 阅读全文
摘要:
经典励志片,可走《永不妥协Erin Brockovich》、《城市英雄 Falling Down》路线。哪位天使大哥大姐,赶紧找这个的哥买独家版权吧!
请点击知乎链接:http://www.zhihu.com/question/19855176/answer/13163625 阅读全文
摘要:
很好的一个流水帐,很好的一个实习生案例,很好的一个职场现身说法,很好的用数据说话的实战例子,很好的鲶鱼!请仔细阅读,尤其是你们中刚刚踏入职场没几年的年轻人,看看一个大三的北邮学生是怎么震了赶集网的销售、数据挖掘、竞情分析、产品、团购、运营和电话销售。 阅读全文
摘要:
前面说到Topic Engine/个性化阅读/Meme Tracker这几个方向所需要的研发团队大致是12个人起。下面着重说一下在现如今如何做个性化阅读。 阅读全文
摘要:
现在再讲讲个性化阅读的过去、现在和未来,也算是这个话题的延续。 阅读全文
摘要:
简介EDM邮件中常见的几个概念。 阅读全文
摘要:
大多数工程师进入公司,当进入实作之后,都会有很多想法,这很好。但做到更好的是,给出具体的改进操作步骤,而不仅仅停留在模糊的、似是而非的指出问题上。 阅读全文
摘要:
这个算法的解释参见我的文章:《Hacker News与Reddit的算法比较》。 阅读全文
摘要:
【注:去年的旧文。上一篇是《02-在 Kuber SocialBadge 基础上再前进一步》和《01-学习 Kuber 的 SocialBadge 好榜样 | 02.技术预研 | Social》,下一篇是《04-WebFinger的利用 | 02.技术预研 | Social》】 阅读全文
摘要:
【注:去年的旧文了。上一篇是《01-学习 Kuber 的 SocialBadge 好榜样 | 02.技术预研 | Social》】 阅读全文
摘要:
集中回答一下网友对互联网信息监测的提问。 阅读全文
摘要:
Web Server常见的三个问题。 阅读全文
摘要:
由于resin版本升级到4.0之后,重启时,如果会根据自身resin.xml的如下配置做判断,如果当前启动Resin的用户是root,那么就会使用user-name节点中指定的www-data用户身份启动Resin(也因此有些工程师自己测试时启动不了Resin,就是因为www-data用户不存在)。 阅读全文
摘要:
早先说过线上Resin的配置文件中要增加线程池大小、各种timeout参数(resin 4.0.15的默认配置文件肯定没有这些参数,需要另行增加)。
在resin 4.0.10里,有这么一个bug,thread-max的数量设置没有起作用:http://bugs.caucho.com/view.php?id=4251 ,但后面到了resin 4.0.15应该就修复了。
下面内容会给出背景介绍以及建议配置。 阅读全文
摘要:
知乎上最近有一个Question(也不知道谁问的,UI为什么这么设计?):“面试人的时候,更应该相信 第一直觉 还是 某种方法论?比如?”
问题问的方式虽然不好,但还是可以作答的。 阅读全文