摘要: 转自:波哥1、使用np.array()创建数组import numpy as npnp.array([1,2,3,4,5]) # 创建一个一维数组np.array([1,2,3],[4,5,6]) # 创建一个二维数组# numpy默认ndarray的所有元素... 阅读全文
posted @ 2019-05-14 21:19 一只程序猿呀 阅读(398) 评论(0) 推荐(0) 编辑
摘要: - 概念:使用多台机器组成一个分布式的机群,在机群中运行同一组程序,进行联合数据的爬取。 - 原生的scrapy是不可以实现分布式: - 原生的scrapy中的调度器不可以被共享 - 原生的scrapy的管道不可以被共享 - ... 阅读全文
posted @ 2019-05-09 17:52 一只程序猿呀 阅读(133) 评论(0) 推荐(0) 编辑
摘要: 1.持久化存储 - 编码流程: 1.数据解析 2.封装item类 3.将解析的数据存储到实例化好的item对象 4.提交item 5.管道接收i... 阅读全文
posted @ 2019-05-08 15:19 一只程序猿呀 阅读(240) 评论(0) 推荐(0) 编辑
摘要: 三种方式:正则匹配、bs4解析、xpath解析 一、正则解析# 正则回顾 单字符: . : 除换行以外所有字符 [] :[aoe] [a-w] 匹配集合中任意一个字符 \d :数字 [0-9] \D : 非... 阅读全文
posted @ 2019-05-03 21:06 一只程序猿呀 阅读(369) 评论(0) 推荐(0) 编辑
摘要: 必知知识点-常见请求头User-Agent 浏览器的身份标识字符串 Content-Type 请求体的MIME类型 (用于POST和PUT请求中) -常见响应头Status 通用网关接口的响应头字段,用来说明当前HTTP连接的响应状态。 -https... 阅读全文
posted @ 2019-05-03 18:12 一只程序猿呀 阅读(105) 评论(0) 推荐(0) 编辑
摘要: - 插入cell:a,b- 删除: x- 执行: shift+enter- tab: 补全- cell模式切换: y(marker->code) m(code->marker)- 打开帮助文档:shift+tab 阅读全文
posted @ 2019-05-03 17:44 一只程序猿呀 阅读(187) 评论(0) 推荐(0) 编辑
摘要: 基础工作区: 当前的编辑位置缓存区: add 之后的区域版本库:commit之后的区域就是版本库git init . 初始化git add . 将工作区的所有文件添加到缓存区git commit -m “提交信息” 将缓存区的内容添加到版本库git status 查看... 阅读全文
posted @ 2019-04-22 21:12 一只程序猿呀 阅读(813) 评论(0) 推荐(0) 编辑
摘要: server端from flask import Flask,request,render_templatefrom geventwebsocket.handler import WebSocketHandlerfrom gevent.pywsgi import WS... 阅读全文
posted @ 2019-03-22 17:44 一只程序猿呀 阅读(161) 评论(0) 推荐(0) 编辑
摘要: server代码:import jsonfrom flask import Flask,request,render_templatefrom geventwebsocket.handler import WebSocketHandlerfrom gevent.pyw... 阅读全文
posted @ 2019-03-22 17:42 一只程序猿呀 阅读(719) 评论(0) 推荐(0) 编辑
摘要: 转自DragenFire手写websocket握手import socket, base64, hashlibsock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)sock.setsockopt(socket.... 阅读全文
posted @ 2019-03-22 17:21 一只程序猿呀 阅读(447) 评论(0) 推荐(0) 编辑