04 2018 档案

[转载][GitHub]How to undo the most recent commits in Git?
摘要:原文地址:https://stackoverflow.com/questions/927358/how-to-undo-the-most-recent-commits-in-git/927386#927386 git reset最详尽介绍:https://git-scm.com/docs/git-r 阅读全文

posted @ 2018-04-27 09:53 tuohai666 阅读(216) 评论(0) 推荐(0) 编辑

[原创]手把手教你写网络爬虫(9):待续...
摘要: 阅读全文

posted @ 2018-04-27 09:19 tuohai666 阅读(1099) 评论(3) 推荐(0) 编辑

[原创]手把手教你写网络爬虫(8):彻底解决乱码问题
摘要:手把手教你写网络爬虫(8) 作者:拓海 (https://github.com/tuohai666) 摘要:从零开始写爬虫,初学者的速成指南! 封面: 字符编解码是爬虫里必学的一项知识,在我们的爬虫生涯中早晚会爬到乱码的网页,与其遇到时惊慌失措,不如早学早好,彻底避免乱码问题。 字符编码简介 什么是 阅读全文

posted @ 2018-04-27 08:48 tuohai666 阅读(4034) 评论(2) 推荐(5) 编辑

[原创]手把手教你写网络爬虫(7):URL去重
摘要:手把手教你写网络爬虫(7) 作者:拓海 (https://github.com/tuohai666) 摘要:从零开始写爬虫,初学者的速成指南! 封面: 本期我们来聊聊URL去重那些事儿。以前我们曾使用Python的字典来保存抓取过的URL,目的是将重复抓取的URL去除,避免多次抓取同一网页。爬虫会将 阅读全文

posted @ 2018-04-26 08:51 tuohai666 阅读(4105) 评论(8) 推荐(6) 编辑

[原创]手把手教你写网络爬虫(6):分布式爬虫
摘要:手把手教你写网络爬虫(6) 作者:拓海 (https://github.com/tuohai666) 摘要:从零开始写爬虫,初学者的速成指南! 封面: 下面是一个超级计算机的排行榜,如果我们能拥有其中任意一个,那么我们就不需要搞什么分布式系统。可是我们买不起,即使买得起,也交不起电费,所以我们只好费 阅读全文

posted @ 2018-04-25 08:28 tuohai666 阅读(5452) 评论(8) 推荐(10) 编辑

[原创]手把手教你写网络爬虫(5):PhantomJS实战
摘要:手把手教你写网络爬虫(5) 作者:拓海 (https://github.com/tuohai666) 摘要:从零开始写爬虫,初学者的速成指南! 封面: 大家好!从今天开始,我要与大家一起打造一个属于我们自己的分布式爬虫平台,同时也会对涉及到的技术进行详细介绍。大家如果有什么好的想法请多留言,多提意见 阅读全文

posted @ 2018-04-21 15:01 tuohai666 阅读(3798) 评论(5) 推荐(2) 编辑

[转载][IntelliJ IDEA]No Tabs in IntelliJ IDEA
摘要:原文地址:http://hadihariri.com/2014/06/24/no-tabs-in-intellij-idea/ I often come across people complaining about some odd behaviour when it comes to edito 阅读全文

posted @ 2018-04-19 09:07 tuohai666 阅读(489) 评论(0) 推荐(0) 编辑

[原创]手把手教你写网络爬虫(4):Scrapy入门
摘要:手把手教你写网络爬虫(4) 作者:拓海 (https://github.com/tuohai666) 摘要:从零开始写爬虫,初学者的速成指南! 封面: 上期我们理性的分析了为什么要学习Scrapy,理由只有一个,那就是免费,一分钱都不用花! 咦?怎么有人扔西红柿?好吧,我承认电视看多了。不过今天是没 阅读全文

posted @ 2018-04-19 08:46 tuohai666 阅读(3889) 评论(5) 推荐(3) 编辑

[原创]MySQL协议学习(1):准备工作
摘要:MySQL Client/Server协议 准确的说应该是MySQL Client/Server协议,另一个叫X Protocol的暂不涉及。地址如下:MySQL Client/Server Protocol 字节序 一般协议里说的字节序是指网络字节序,网络字节序是big endian。而MySQL 阅读全文

posted @ 2018-04-17 09:34 tuohai666 阅读(792) 评论(0) 推荐(1) 编辑

[原创]手把手教你写网络爬虫(3):开源爬虫框架对比
摘要:手把手教你写网络爬虫(3) 作者:拓海 (https://github.com/tuohai666) 摘要:从零开始写爬虫,初学者的速成指南! 封面: 介绍 大家好!我们从今天开始学习开源爬虫框架Scrapy,如果你看过《手把手》系列的前两篇,那么今天的内容就非常容易理解了。细心的读者也许会有疑问, 阅读全文

posted @ 2018-04-17 08:17 tuohai666 阅读(4736) 评论(1) 推荐(0) 编辑

[转载][GitHub]Working with forks
摘要:原文地址:https://help.github.com/articles/working-with-forks/ Configuring a remote for a fork You must configure a remote that points to the upstream repo 阅读全文

posted @ 2018-04-16 09:02 tuohai666 阅读(422) 评论(0) 推荐(0) 编辑

[原创]手把手教你写网络爬虫(2):迷你爬虫架构
摘要:手把手教你写网络爬虫(2) 作者:拓海 (https://github.com/tuohai666) 摘要:从零开始写爬虫,初学者的速成指南! 封面: 介绍 大家好!回顾上一期,我们在介绍了爬虫的基本概念之后,就利用各种工具横冲直撞的完成了一个小爬虫,目的就是猛、糙、快,方便初学者上手,建立信心。对 阅读全文

posted @ 2018-04-16 08:30 tuohai666 阅读(5485) 评论(9) 推荐(6) 编辑

[原创]SQL发音考证(搜寻SQL-86标准)
摘要:据我观察,中国的开发者创造了一种独特的SQL发音:/'sɜːkl/,既好听,又好读,挺好的。但是今年我开始做数据库相关的工作,作为一个专业人士,决定对SQL发音进行一些考证。 直接说结论吧,很多人沿用了/ˈsiːkwəl/这个读音,因为这门语言以前叫做“SEQUEL”。但更官方一些的读音应该是ISO 阅读全文

posted @ 2018-04-14 22:39 tuohai666 阅读(7816) 评论(0) 推荐(3) 编辑

[转载]《暗时间》:为什么你应该(从现在开始就)写博客
摘要:原文地址:http://mindhacks.cn/2009/02/15/why-you-should-start-blogging-now/ (一)为什么你应该(从现在开始就)写博客 用一句话来说就是,写一个博客有很多好处,却没有任何明显的坏处。(阿灵顿的情况属于例外,而非常态,就像不能拿抽烟活到一 阅读全文

posted @ 2018-04-04 17:32 tuohai666 阅读(465) 评论(0) 推荐(0) 编辑

[转载]《暗时间》:书写是为了更好的思考
摘要:原文地址:http://mindhacks.cn/2009/02/09/writing-is-better-thinking/ 我经常在走路和睡前总结所学过的内容,思考遗留的问题,一段时间的阅读和思考之后,一个总体的知识框架就会逐渐浮现在脑海中。然后我会将它书写下来,然而,我往往非常惊讶地发现,当我 阅读全文

posted @ 2018-04-04 17:27 tuohai666 阅读(409) 评论(1) 推荐(1) 编辑

[原创]手把手教你写网络爬虫(1):网易云音乐歌单
摘要:把之前发表在微信公众号的爬虫系列文章迁移过来,热热身,就当备份了。 本来还有一些内容想写的,比如headless chrome、okhttp、netty和文本相似度算法等等,不过最近精力不在爬虫上面,以后等因缘成熟再把这个系列写完。 手把手教你写网络爬虫(1) 作者:拓海 (https://gith 阅读全文

posted @ 2018-04-04 16:48 tuohai666 阅读(13219) 评论(25) 推荐(10) 编辑

为什么要写博客
摘要:“我经常在走路和睡前总结所学过的内容,思考遗留的问题,一段时间的阅读和思考之后,一个总体的知识框架就会逐渐浮现在脑海中。然后我会将它书写下来,然而,我往往非常惊讶地发现,当我书写的时候,新的内容仍然源源不断的冒出来,就像我的键盘自己也会思考一样。” --《暗时间》 去年读了刘未鹏大神的《暗时间》后就 阅读全文

posted @ 2018-04-04 15:37 tuohai666 阅读(311) 评论(0) 推荐(0) 编辑

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示