2019年2月14日

02_输入检索词自动爬取百度搜索页标题信息

摘要: 背景:在百度每次输入关键词检索后,会出现很多的检索页,不利于有效阅读,为更方便收集检索信息,编写了一个可以收集每个检索页与检索词相关的十条检索信息(百度在每个检索页放置十条检索标题信息)。可以根据需要选择爬取多少检索页,通过修改main()函数的depth变量 1 import urllib.request 2 import re 3 4 def get_html_text(url,da... 阅读全文

posted @ 2019-02-14 12:30 Summer儿 阅读(2600) 评论(1) 推荐(0) 编辑

2019年2月12日

04_多协程爬取斗鱼高颜值美女图片

摘要: 斗鱼已将网页的源代码修改,若想爬取图片请转至https://www.cnblogs.com/summer1019/p/10388348.html 1 import requests 2 from bs4 import BeautifulSoup 3 from urllib import request 4 # import threading 5 import gevent 6 fro... 阅读全文

posted @ 2019-02-12 11:33 Summer儿 阅读(334) 评论(0) 推荐(0) 编辑

2019年2月11日

8-python基础—2.x中如何使用中文

摘要: python2.x 默认使用ASCII编码格式 python3.x 默认使用UTF-8编码格式 在python2.x文件的第一行增加一下代码,解释器会以utf-8编码来处理python文件。 # *_* coding:utf8 *_* 官方推荐 或者 # coding=utf8 阅读全文

posted @ 2019-02-11 13:09 Summer儿 阅读(150) 评论(0) 推荐(0) 编辑

2019年2月10日

7-python基础—Ubuntu安装python的第三方包gevent

摘要: 方法一(可能失败): sudo pip3 install gevent 方法二: sudo apt-get install python3-gevent 阅读全文

posted @ 2019-02-10 21:59 Summer儿 阅读(1013) 评论(0) 推荐(0) 编辑

2019年2月9日

9-xshell—实现Linux与Windows之间的文件传递

摘要: 在Windows系统上,通过xshell连接Linux系统。 第一种使用方式:从Linux系统上下载文件到Windows系统。 准备工作: $ sudo apt-get install lrzsz 安装完毕后,具体操作命令是: sz 【file】 >可将服务器的文件下载到本地 从xshell环境下登 阅读全文

posted @ 2019-02-09 23:01 Summer儿 阅读(1359) 评论(0) 推荐(0) 编辑

2019年2月6日

6-python基础—IDLE的shell上下翻看历史

摘要: 命令 功能 Alt+p 向上(history previous) Alt+n 向下(history next) 阅读全文

posted @ 2019-02-06 15:33 Summer儿 阅读(564) 评论(0) 推荐(0) 编辑

2019年2月3日

5-python基础—‘\r’

摘要: # \r 默认表示将输出的内容返回到第一个指针,这样的话,后面的内容会覆盖前面的内容 如常用的显示程序完成进度!! 阅读全文

posted @ 2019-02-03 12:15 Summer儿 阅读(713) 评论(0) 推荐(0) 编辑

8-vim常用命令—撤销与反撤销

摘要: 命令模式下(即按ESC后的模式) u 撤销 Ctrl r (组合键) 反撤销<后悔撤销> 阅读全文

posted @ 2019-02-03 12:13 Summer儿 阅读(8754) 评论(0) 推荐(2) 编辑

7-Ubuntu—终端命令调整窗口的大小

摘要: 1,查看当前窗口大小,有两种方式 (1)current 1280x768 (2)尺寸后面带 * 号 命令:$ xrandr 2.修改窗口大小 示例: 命令: $ xrandr -s 1024x768 阅读全文

posted @ 2019-02-03 11:27 Summer儿 阅读(5033) 评论(0) 推荐(0) 编辑

2019年2月2日

5-python基础—获取某个目录下的文件列表(适用于任何系统)

摘要: 1.导入os模块 import os 2.调用os模块的listdir方法并添加目录的绝对路径 os.listdir('文件夹路径') 阅读全文

posted @ 2019-02-02 21:10 Summer儿 阅读(1858) 评论(0) 推荐(0) 编辑

导航