摘要: 搬家 尝试一下CSDN的Markdown编辑器。 阅读全文
posted @ 2019-06-09 10:54 黑洞频率 阅读(77) 评论(0) 推荐(0) 编辑
摘要: 矩陣 1. 矩阵是numpy.matrix类类型的对象,该类继承自numpy.ndarray,任何针对多维数组的操作,对矩阵同样有效,但是作为子类矩阵又结合其自身的特点,做了必要的扩充,比如:乘法计算、求逆等。 2. 矩阵对象的创建可以通过以下三种方式: 如果copy的值为True(缺省),所得到的 阅读全文
posted @ 2019-06-08 09:58 黑洞频率 阅读(177) 评论(0) 推荐(0) 编辑
摘要: 五、数据可视化 1. 基本绘图 (1000,) 2. 线型、线宽和颜色 (1000,) 3. 设置坐标范围 4. 设置坐标刻度 5. 设置坐标轴 坐标轴名:left/right/bottom/top 6. 图例 7. 特殊点 mp.scatter(水平坐标, 垂直坐标, marker=点型, s=大 阅读全文
posted @ 2019-05-24 17:03 黑洞频率 阅读(528) 评论(0) 推荐(0) 编辑
摘要: 六、numpy的常用函数 1. 读取文件 逻辑上可被解释为二维数组的文本文件: numpy.loadtxt( 文件路径, delimiter=分隔符(缺省一个空格), usecols=列序列(缺省所有列), unpack=是否展开列(缺省False), 返回一个二维数组(False)或多个一维数组( 阅读全文
posted @ 2019-05-24 17:03 黑洞频率 阅读(228) 评论(0) 推荐(0) 编辑
摘要: 一、Numpy是什么 1. Numerical Python,数值的Python,补充了Python语言所欠缺的数值计算能力。 2. Numpy是其它数据分析及机器学习库的底层库。 3. Numpy完全标准C语言实现,运行效率充分优化。 4. Numpy开源免费。 二、Numpy的历史 1. 199 阅读全文
posted @ 2019-05-19 11:43 黑洞频率 阅读(135) 评论(0) 推荐(0) 编辑
摘要: 多线程爬虫 进程线程回顾 进程 系统中正在运行的一个应用程序 1个CPU核心1次只能执行1个进程,其他进程处于非运行状态 N个CPU核心可同时执行N个任务 线程 进程中包含的执行单元,1个进程可包含多个线程 线程可使用所属进程空间(1次只能执行1个线程,阻塞) 锁:防止多个线程同时使用共享空间 GI 阅读全文
posted @ 2019-05-19 11:40 黑洞频率 阅读(240) 评论(0) 推荐(0) 编辑
摘要: json模块 什么是json? javascript中的对象和数组 对象: 取值:对象名.key 数组: 取值:数组[索引值] 作用 json格式的字符串和Python数据类型之间的转换 常用方法 1. json.loads():json格式 Python数据类型 json python 对象 字典 阅读全文
posted @ 2019-05-12 17:35 黑洞频率 阅读(333) 评论(0) 推荐(0) 编辑
摘要: xpath工具(解析) xpath 在XML文档中查找信息的语言,同样适用于HTML文档的检索 xpath辅助工具 Chrome插件 :XPath Helper 打开 :Ctrl + Shift + X 关闭 :Ctrl + Shift + X Firefox插件 :XPath checker XP 阅读全文
posted @ 2019-05-12 17:33 黑洞频率 阅读(170) 评论(0) 推荐(0) 编辑
摘要: 解析 数据的分类 结构化数据 有固定的格式,如 :HTML、XML、JSON 非结构化数据 图片、音频、视频,这类数据一般都存储为二进制 正则表达式 re 使用流程 1. 创建编译对象:p = re.compile("正则表达式") 2. 对字符串匹配:r = p.match("字符串") 3. 获 阅读全文
posted @ 2019-05-12 17:32 黑洞频率 阅读(277) 评论(0) 推荐(0) 编辑
摘要: requests模块 1. 安装(用管理员身份去打开Anaconda Prompt) 以管理员身份去执行pip安装命令 2. 常用方法 1. get(url,headers=headers):发起请求,获取响应对象 2. response属性 :返回字符串类型 :返回bytes类型,应用场景:爬取非 阅读全文
posted @ 2019-05-12 17:29 黑洞频率 阅读(237) 评论(0) 推荐(0) 编辑