摘要: sklearn是基于numpy和scipy的一个机器学习算法库,设计的非常优雅,它让我们能够使用同样的接口来实现所有不同的算法调用。 支持包括分类、回归、降维和聚类四大机器学习算法。还包含了特征提取、数据处理和模型评估三大模块。同时sklearn内置了大量数据集,节省了获取和整理数据集的时间。 使用 阅读全文
posted @ 2018-08-21 17:13 eo_will 阅读(2048) 评论(0) 推荐(2) 编辑
摘要: Matplotlib是Python的一个可视化模块,他能方便的制作线条图、饼图、柱状图以及其他专业图形,并且支持所有操作系统下不同的GUI后端。Matplotlib有一套允许定制各种属性的默认设置,可以控制Matplotlib中的每一个默认属性:图像大小、每英寸点数、线宽、色彩和样式、子图、坐标轴、 阅读全文
posted @ 2018-08-21 17:10 eo_will 阅读(818) 评论(0) 推荐(0) 编辑
摘要: Pandas是基于NumPy的另一个python数据分析库,提供了一套名为DataFrame的数据结构,实现高性能数据操作和分析。 Pandas的主要特点: 快速高效的DataFrame对象,具有默认和自定义的索引; 将数据从不同文件格式加载到内存中的数据对象的工具; 丢失数据的数据对齐和综合处理; 阅读全文
posted @ 2018-08-21 17:07 eo_will 阅读(1130) 评论(0) 推荐(0) 编辑
摘要: NumPy 是一个 Python 包。 它代表 “Numeric Python”。 它是一个由多维数组对象和用于处理数组的例程集合组成的库。Numpy中最重要的对象是称为ndarray的N维数组类型 NumPy可以执行以下操作: 数组的算数和逻辑运算。 傅立叶变换和用于图形操作的例程。 与线性代数有 阅读全文
posted @ 2018-08-21 17:05 eo_will 阅读(469) 评论(0) 推荐(0) 编辑
摘要: Python无疑是目前数据科学和机器学习中应用最广泛的编程语言。针对python从入门到精通的详细教程也网上有很多。这两篇python入门博客(基础篇和进阶篇)主要是个人学习过程中做的简单笔记,便于记录和复习。关于基本概念和功能的介绍详见python官方文档。 三、进阶操作 本部分主要包括类、高级用 阅读全文
posted @ 2018-08-21 15:47 eo_will 阅读(223) 评论(0) 推荐(0) 编辑
摘要: Python无疑是目前数据科学和机器学习中应用最广泛的编程语言。针对python从入门到精通的详细教程也网上有很多。这两篇python入门博客(基础篇和进阶篇)主要是个人学习过程中做的简单笔记,便于记录和复习。关于基本概念和功能的介绍详见python官方文档。 一、简介 优点: · “优雅”、“明确 阅读全文
posted @ 2018-08-21 15:40 eo_will 阅读(308) 评论(0) 推荐(0) 编辑