上一页 1 ··· 3 4 5 6 7 8 9 10 11 12 下一页
摘要: 先说解决办法:头部加几行代码 OK了,试试看... 再慢慢说原因: 从网上抓了一些字节流,想打印出来结果发生了一下错误: UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 8530: illegal m 阅读全文
posted @ 2018-03-31 16:22 Leq123 阅读(332) 评论(0) 推荐(0) 编辑
摘要: 1.豆瓣采集 1 #coding:utf-8 2 #采集豆瓣书信息和图片,写进数据库 3 4 from urllib import request 5 # from bs4 import BeautifulSoup 6 from lxml import etree 7 import json,pym 阅读全文
posted @ 2018-03-22 08:36 Leq123 阅读(584) 评论(0) 推荐(0) 编辑
摘要: 简介:提取网页保存到txt文件中 + 解析txt文件内容,取出内容 简介:提取美团链接保存在一个txt文件中 范例:功能实现后提高代码质量 urllib添加代理IP 阅读全文
posted @ 2018-03-19 14:48 Leq123 阅读(226) 评论(0) 推荐(0) 编辑
摘要: BeautifulSoup网页解析库 from bs4 import BeautifulSoup 0.BeautifulSoup网页解析库包含 的 几个解析器 Python标准库【主要,系统自带;】 使用方法: BeautifulSoup(markup,"html.parser")【注:markup 阅读全文
posted @ 2018-03-18 14:54 Leq123 阅读(386) 评论(0) 推荐(0) 编辑
摘要: 百度图片有些有编码问题,暂时不能爬取,多试几个 阅读全文
posted @ 2018-03-17 17:57 Leq123 阅读(581) 评论(0) 推荐(0) 编辑
摘要: 异常处理 几个提示信息: notice 注意 warning 警告 error 错误 debug 调试 错误处理 1、Try语句 try execpt 2、print() 3、assert断言,当满足某条件就执行 n=1 assert n !=0, 'n is zero!' / assert O n 阅读全文
posted @ 2018-03-17 11:34 Leq123 阅读(120) 评论(0) 推荐(0) 编辑
摘要: 正则表达式_2018.3.15 一个正则表达式工具:regexpal 正则定义:由普通字符和特殊字符(元字符)组成的文字模式,常用于刷选匹配 1.字符 1.1普通字符 包括打印字符 和 非打印字符 打印字符:字母、数字、标点、下划线 非打印字符: 【字符】 【含义】 \s 匹配任何空白字符,包括空格 阅读全文
posted @ 2018-03-15 12:14 Leq123 阅读(264) 评论(1) 推荐(0) 编辑
摘要: Python_爬虫_笔记 1.前言 1.1爬虫用途: 网站采集、接口采集(地图(jis 热力学 屋里端口/协议)、微信、知乎、) 1.2基本流程:网页下载(requests)+网页解析+爬虫调度 网页解析:在当前网站找信息、下一个入口等信息 调度:调度器/队列(先进先出、谁快谁先...) 1.3Py 阅读全文
posted @ 2018-03-12 20:12 Leq123 阅读(381) 评论(0) 推荐(0) 编辑
摘要: 1、json.dumps() json.dumps()用于将dict类型的数据转成str,因为如果直接将dict类型的数据写入json文件中会发生报错,因此在将数据写入时需要用到该函数。 转换案例: 1 import json 2 3 name_emb = {'a':'1111','b':'2222 阅读全文
posted @ 2018-03-12 20:06 Leq123 阅读(1349) 评论(0) 推荐(0) 编辑
摘要: Tensorflow 1.基本概念 TensorFlow是一个编程系统,使用图(graphs)来表示计算任务,图(graphs)中的节点称之为op(operation),一个op获得0个或多个Tensor,执行计算,产生0个或多个Tensor。Tensor看多是一个n维的数组或列表。图必须在会话(S 阅读全文
posted @ 2018-03-11 19:23 Leq123 阅读(160) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 11 12 下一页