摘要: 转自:http://lesliezhu.github.io/public/2015-04-20-python-multi-process-thread.html 1 GIL(Global Interpretor Lock,全局解释器锁) see: http://www.jeffknupp.com/b 阅读全文
posted @ 2018-01-23 19:53 mapuboy 阅读(549) 评论(0) 推荐(0) 编辑
摘要: http://www.cnblogs.com/binye-typing/p/6656595.html 读者可能会奇怪我标题怎么理成这个鬼样子,主要是单单写 lxml 与 bs4 这两个 py 模块名可能并不能一下引起大众的注意,一般讲到网页解析技术,提到的关键词更多的是 BeautifulSoup 阅读全文
posted @ 2018-01-23 19:06 mapuboy 阅读(373) 评论(0) 推荐(0) 编辑
摘要: 快捷键 1、编辑(Editing)Ctrl + Space 基本的代码完成(类、方法、属性)Ctrl + Alt + Space 快速导入任意类Ctrl + Shift + Enter 语句完成Ctrl + P 参数信息(在方法中调用参数)Ctrl + Q 快速查看文档Shift + F1 外部文档 阅读全文
posted @ 2018-01-23 17:50 mapuboy 阅读(371) 评论(0) 推荐(0) 编辑
摘要: 问题起因 最近要将一个文本分割成好几个topic,每个topic设计一个regressor,各regressor是相互独立的,最后汇总所有topic的regressor得到总得预测结果。没错!类似bagging ensemble!只是我没有抽样。文本不大,大概3000行,topic个数为8,于是我写 阅读全文
posted @ 2018-01-23 17:11 mapuboy 阅读(2602) 评论(0) 推荐(0) 编辑
摘要: 请移步到http://www.jb51.net/tools/zhengze.html 30分钟学会正则表达式的详细教学. #下面是一些常用法 url 的基本判断: 正则表达式是一个很强大的字符串处理工具,几乎任何关于字符串的操作都可以使用正则表达式来完成,作为一个爬虫工作者,每天和字符串打交道,正则 阅读全文
posted @ 2018-01-23 13:42 mapuboy 阅读(454) 评论(0) 推荐(0) 编辑