2018 年 1月随笔档案 - 淋哥

Python 爬虫实例（11）—— 爬虫苏宁易购

摘要：# coding:utf-8 import json import redis import time import requests session = requests.session() import logging.handlers import pickle import sys import re import datetime from bs4 import BeautifulS... 阅读全文

posted @ 2018-01-21 23:05 淋哥阅读(2856) 评论(0) 推荐(0) 编辑

Python 爬虫实例（10）—— 四行代码实现刷博客园阅读数量

摘要：代码很少，自己去体会代码不能运行，仅供参考。阅读全文

posted @ 2018-01-19 09:33 淋哥阅读(647) 评论(1) 推荐(0) 编辑

Python 爬虫实例（9）—— 搜索爬取淘宝

摘要：# coding:utf-8 import json import redis import time import requests session = requests.session() import logging.handlers import pickle import sys import re import datetime from bs4 import BeautifulS... 阅读全文

posted @ 2018-01-18 22:22 淋哥阅读(3150) 评论(0) 推荐(1) 编辑

Python MySQLdb 批量插入封装

摘要：使用说明：阅读全文

posted @ 2018-01-18 13:35 淋哥阅读(2131) 评论(0) 推荐(0) 编辑

Python MySQLdb insert（插入）封装

摘要：使用说明：阅读全文

posted @ 2018-01-18 13:29 淋哥阅读(10465) 评论(0) 推荐(0) 编辑

Python MySQLdb select（选择）封装

摘要：对MySQL选择的封装阅读全文

posted @ 2018-01-18 13:25 淋哥阅读(1726) 评论(0) 推荐(0) 编辑

Python 爬虫实例（8）—— 爬取动态页面

摘要：今天使用python 和selenium爬取动态数据，主要是通过不停的更新页面，实现数据的爬取，要爬取的数据如下图源代码：阅读全文

posted @ 2018-01-08 13:31 淋哥阅读(11448) 评论(0) 推荐(0) 编辑

Python 爬虫实例（7）—— 爬取新浪军事新闻

摘要：我们打开新浪新闻，看到页面如下，首先去爬取一级 url，图片中蓝色圆圈部分第二zh张图片，显示需要分页，源代码：阅读全文

posted @ 2018-01-06 19:28 淋哥阅读(1457) 评论(0) 推荐(0) 编辑

Beautiful Soup 解决爬虫编码格式问题，Beautiful Soup编码格式

摘要：一。为什么要用解析框架 bs4 我觉得爬虫最难得问题就是编码格式，因为你不知道要爬取目标网站的编码格式，有可能是Unicode，utf-8, ASCII ， gbk格式，但是使用Beautiful Soup解析后,文档都被转换成了Unicode，通过Beautiful Soup输出文档时,不管输入阅读全文

posted @ 2018-01-04 17:53 淋哥阅读(2648) 评论(0) 推荐(0) 编辑

User-Agent 信息汇总（拿去就能用）

摘要：# encoding=utf-8 agents = [ "Mozilla/5.0 (Linux; U; Android 2.3.6; en-us; Nexus S Build/GRK39F) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1", "Avant Browser/1.2.789... 阅读全文

posted @ 2018-01-03 10:55 淋哥阅读(1051) 评论(0) 推荐(0) 编辑

英雄莫问出处,富贵当思缘由

01 2018 档案

公告

搜索

常用链接

最新随笔

我的标签

积分与排名

随笔分类 (338)

随笔档案 (452)

文章分类 (6)

文章档案 (19)

阅读排行榜

评论排行榜

推荐排行榜

最新评论