摘要: 一,介绍 Python 中的机器学习库 简单高效的数据挖掘和数据分析工具 可供大家使用,可在各种环境中重复使用 建立在 NumPy,SciPy 和 matplotlib 上 开放源码,可商业使用 - BSD license 二,线性回归算法模型 2个概念 样本集:用于对机器学习算法模型对象进行训练。 阅读全文
posted @ 2019-03-10 18:02 sado 阅读(698) 评论(0) 推荐(0) 编辑
摘要: 一.urllib库 概念:urllib是Python自带的一个用于爬虫的库,其主要作用就是可以通过代码模拟浏览器发送请求。其常被用到的子模块在Python3中的为urllib.request和urllib.parse,在Python2中是urllib和urllib2。 使用流程: 指定url 基于u 阅读全文
posted @ 2019-03-10 16:34 sado 阅读(669) 评论(0) 推荐(0) 编辑
摘要: 一,介绍 Matplotlib是一个Python 绘图库,可以生成各种硬拷贝格式和跨平台交互式环境的出版物质量数据。Matplotlib可用于Python脚本,Python和IPython shell,Jupyter笔记本,Web应用程序服务器和四个图形用户界面工具包。 Matplotlib试图让简 阅读全文
posted @ 2019-03-10 11:57 sado 阅读(316) 评论(0) 推荐(0) 编辑
摘要: 首先,数据加载 pandas提供了一些用于将表格型数据读取为DataFrame对象的函数,期中read_csv和read_table这两个使用最多。 1、删除重复元素 使用duplicated()函数检测重复的行,返回元素为布尔类型的Series对象,每个元素对应一行,如果该行不是第一次出现,则元素 阅读全文
posted @ 2019-03-10 11:56 sado 阅读(364) 评论(0) 推荐(0) 编辑