摘要: 问题: 书接上文,有些网站是不同意程序直接用之前的方式访问的,如果我们传入的参数不合适,站点就不会响应,所以我们需要对Request进行进一步的伪装。 Headers 以Bilibili的登录为例,我使用的是Ubuntu自带的Firefox浏览器,在登录页面,右键点击查看元素后,点击第一个GET,点 阅读全文
posted @ 2018-05-10 19:09 akalv 阅读(90) 评论(0) 推荐(0) 编辑
摘要: 爬虫简介 爬虫,生物上类比就是在互联网这张网行怕爬来爬去的蜘蛛,遇到猎物(想要的资源)就会抓取下来。 环境介绍 Ubutu16.04 Python2.7.12 sublime text3.0 网页的实质 网页的实质是由HTML代码组成,爬虫爬来这些内容,通过代码进行分析过滤,得到需要图片和文字。 U 阅读全文
posted @ 2018-05-09 16:21 akalv 阅读(157) 评论(0) 推荐(0) 编辑
摘要: 过程 过程 花了将近十天的时间,把算法导论的前六章看了一遍,证明跳过习题跳过,看伪码,文字和图表。旨在理解算法的思想和复杂度分析。 感受 感受 算法导论上讲得通俗易懂,除了红黑树那部分有点绕,其他的都挺好理解,当然题目就是另一回事了。。接触到了很多算法,其中的思想,二分、动态规划、递归等等,之后打算 阅读全文
posted @ 2018-04-24 21:14 akalv 阅读(644) 评论(0) 推荐(0) 编辑