08 2017 档案
摘要:【Description】 Divide two integers without using multiplication, division and mod operator. If it is overflow, return MAX_INT. 用例: -2147483648 -2147483
阅读全文
摘要:http://www.michaelnielsen.org/ddi/how-to-crawl-a-quarter-billion-webpages-in-40-hours/ 一个大规模爬虫的抓取实例 本文是一篇大规模爬虫的文章的阅读笔记,记录了一个作者利用amazon集群在40个小时的时间里爬取2.
阅读全文
摘要:Yang Yang, Jianfei Wang, Yutao Zhang, Wei Chen, Jing Zhang, Honglei Zhuang, Zhilin Yang, Bo Ma, Zhanpeng Fang, Sen Wu, Xiaoxiao Li, Debing Liu, and Ji
阅读全文
摘要:背景 OJ的算法题总是会返回一个结果告诉你时间和占用的内存,要是有问题还会告诉你代码的BUG。你可能也知道一份提交的代码可以通过调用函数来测试它所用的时间,但是如果总是要删除再增加它的内容好像也是挺浪费时间的。本来几个同学在维护Matrix那边的OJ项目,可以问一下他们的,但是他们现在他们没空233
阅读全文
摘要:Q1. 为什么搜索引擎要用到文本分类? 搜索引擎要处理海量文本,人工分类不现实,机器的自动分类对提高文本的分类效率至少起到了一个基准的效果。另外,文本分类跟搜索引擎系统可以进行信息互通,文本分类的输入是文本,输出可以是标签或者是否从属于某个分类。 Q2.文本分类基础算法 文本分类基础算法与机器学习、
阅读全文