戴怪兽

2017年9月15日

摘要： 1用requests进行网页请求与urlopen差不多，这里省略不说 2抓取网页的学习 import requests import re headers={'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWeb 阅读全文

posted @ 2017-09-15 20:18 戴怪兽阅读(374) 评论(0) 推荐(0)

python3 爬虫5--分析Robots协议

摘要： 1Robots协议 Robots协议告诉了搜索引擎和爬虫那些页面可以抓取，那些不可以，通常是存放在robots.txt文件里面，位于网站的根目录下 robots.txt中内容的示范： User-agent:* //表示了搜索爬虫的名称，*表示对任何爬虫都有效 Disallow:/ //表示了不允许抓阅读全文

posted @ 2017-09-15 12:39 戴怪兽阅读(2270) 评论(0) 推荐(0)

2017年9月14日

深度优先算法--对DFS的一些小小的总结（一）

摘要：提到DFS，我们首先想到的是对树的DFS，例如下面的例子：求二叉树的深度 int TreeDepth(BinaryTreeNode* root){ if(root==nullptr)return 0; int left=TreeDepth(root->left); int right=TreeDep 阅读全文

posted @ 2017-09-14 21:55 戴怪兽阅读(967) 评论(0) 推荐(0)

python3 爬虫4--解析链接

摘要： 1.urlparse() 属于urllib.parse 在urlparse世界里面，一个标准的URL链接格式如下 scheme://nrtlooc/path;paramters?query#fragment 所以，一个url='http://www.baidu.com/index.html;user 阅读全文

posted @ 2017-09-14 16:50 戴怪兽阅读(3244) 评论(0) 推荐(0)

python3 爬虫2--发送请求1

摘要： 1urlopen 属于url.request类我们用urlopen("网址")来发送请求最基础的发送请求如下 from urllib.request import urlopen reponse=urlopen('https://www.baidu.com') print(reponse.rea 阅读全文

posted @ 2017-09-14 10:45 戴怪兽阅读(234) 评论(0) 推荐(0)

2017年9月13日

python3 爬虫3--异常处理

摘要：本文学习内容来自：https://germey.gitbooks.io/python3webspider/content/ urllib库中有URLError类，request模块产生的错误都可以通过捕获这个类进行处理 URLErroe若是发生错误了就会返回一个reason，就是错误原因 URLEr 阅读全文

posted @ 2017-09-13 22:54 戴怪兽阅读(236) 评论(0) 推荐(0)

APUE1--3.8-3.10wirte、read函数以及IO效率

摘要： 1read函数 #include<unistd.h> ssize_t read(int fd,void* buf,size_t nbytes) 返回值：读到的字节数，若已到文件尾，返回0;若出错，返回-1 2write函数 #include<unistd.h> ssize_t write(int f 阅读全文

posted @ 2017-09-13 20:55 戴怪兽阅读(219) 评论(0) 推荐(0)

漫长的旅途--C++primer学习-命名空间以及类的自动转换和强制转换

摘要： C++用名称空间来控制名称的作用域： 1不同命名空间的同名变量可以同时存在，不会发生冲突 2命名空间不能出现在代码块中 3我们用作用域运算符::，使用空间名来限定名称，最常用的std::cout 4using 声明和using编译指令： using 使特定的标识符可用例如using std::cou 阅读全文

posted @ 2017-09-13 19:54 戴怪兽阅读(235) 评论(0) 推荐(0)

leetcode刷题1--动态规划法回文串2

摘要：题目是： Given a string s,partition s such that every substring of the partition is a palindrome Return tthe mininum cuts needed for a palindrome partitio 阅读全文

posted @ 2017-09-13 19:22 戴怪兽阅读(369) 评论(0) 推荐(0)

2017年8月16日

UNIX网络编程--学习日记

摘要：今天在学习accept函数的时候，在执行服务器程序的时候，碰到了如下的出错信息： bind error: Address already in use 其原因在于服务器程序使用了13号的端口; 然而在我们用netstat -tanlp查看的时候发现： Proto Recv-Q Send-Q Loca 阅读全文

posted @ 2017-08-16 15:08 戴怪兽阅读(110) 评论(0) 推荐(0)

公告