随笔档案「2017年6月」 - python-data-machine

摘要：https://www.zhihu.com/question/20086677 阅读全文

posted @ 2017-06-28 15:11 python-data-machine 阅读(104) 评论(0) 推荐(0)

摘要：地址：http://tongji.baidu.com/data/browser 阅读全文

posted @ 2017-06-25 10:33 python-data-machine 阅读(222) 评论(0) 推荐(0)

摘要：一、互联网的原理 1、概述 html：用来制作网页。互联网原理：上网即请求数据。用户通过在浏览器上输入一个网址，通过HTTP协议向服务器发送请求，服务器做出响应，将相关的网页数据传输到本地计算机，在浏览器上渲染出来。数据：文字、图片、视频、音频等。 2、服务器服务器：server 作用：保存阅读全文

posted @ 2017-06-24 21:37 python-data-machine 阅读(968) 评论(0) 推荐(0)

数据分析之Numpy库入门

摘要：1.列表与数组在python的基础语言部分，我们并没有介绍数组类型，但是像C、Java等语言都是有数组类型的，那python中的列表和数组有何区别呢？一维数据：都表示一组数据的有序结构区别：列表：数据类型可以不同，如：【3.1413,'pi',3.1404,[3.1402,2.34],'3. 阅读全文

posted @ 2017-06-20 23:32 python-data-machine 阅读(2845) 评论(0) 推荐(2)

2-2：python之控制结构

摘要：一、程序流程图 1.用规定的一系列图形、流程线和文字说明算法从开始到结束全部步骤，包括基本操作和控制流程。2.流程图的基本元素包括： 1）表示相应操作的框 2）带箭头的流程线 3）框内必要的文字说明 3.设计程序框图的步骤：第一步：用自然语言表述算法步骤；第二步：确定每一个算法步骤所包含的逻辑阅读全文

posted @ 2017-06-11 14:22 python-data-machine 阅读(2283) 评论(0) 推荐(0)

2-1:math库与random库

摘要：一、math库： math库是python语言中常用的一个函数库，它包含了一批数学函数，下面我们看一下这个函数库由于math库中的函数与数学中的函数比较一致，相对比较简单，请同学们自行练习一下；二、random库 random库也是python语言中常用的一个函数库，它包含了一批随机函数，随机函阅读全文

posted @ 2017-06-11 13:51 python-data-machine 阅读(655) 评论(0) 推荐(0)

1-2:数据类型之元组、列表类型

摘要：一.元组的概念：前面我们学过数字类型，字符串类型，它们都代表一个元素！1.元组是包含多个元素的类型，元素之间用逗号分隔。 2.元组可以使空的，t2 = ()3.元组包含一个元素: t3 = 123,4.元组外层可以使用括号，也可以不使用二、元组的三大特点: 1.元组中元素可以使不同类型。元组也可阅读全文

posted @ 2017-06-11 12:51 python-data-machine 阅读(2877) 评论(0) 推荐(0)

1-1: 数据类型之字符串

摘要：一、字符串字符串数据类型： 1.字符串是用双引号""或者单引号""括起来的一个或多个字符。例如： 2.字符串可以保持在变量中，也可以单独存在3.可以用type()函数测试一个字符串的类型得到结果: <type 'str'> 4.Python语言转义符:\ 1)既然字符串用双引号或单引号标识，那阅读全文

posted @ 2017-06-11 12:04 python-data-machine 阅读(969) 评论(0) 推荐(0)

python-demo实例

摘要：1.turtle库与蟒蛇案例阅读全文

posted @ 2017-06-05 08:27 python-data-machine 阅读(5559) 评论(0) 推荐(0)

6.无监督学习-降维

摘要：PCA算法及其应用 1.主成分分析（PCA） 1.主成分分析(Principal Component Analysis,PCA) 是最常用的一种降维方法，通常用于高维数据集的探索与可视化，还可以用做数据压缩和预处理等。2.PCA可以把具有相关性的高维变量合成为线性无关的低维变量，称为主成分。主成分能阅读全文

posted @ 2017-06-04 21:42 python-data-machine 阅读(2335) 评论(0) 推荐(0)

5.无监督学习-DBSCAN聚类算法及应用

摘要：DBSCAN方法及应用 1.DBSCAN密度聚类简介 DBSCAN 算法是一种基于密度的聚类算法： 1.聚类的时候不需要预先指定簇的个数 2.最终的簇的个数不确定DBSCAN算法将数据点分为三类： 1.核心点：在半径Eps内含有超过MinPts数目的点。 2.边界点：在半径Eps内点的数量小于Min 阅读全文

posted @ 2017-06-04 21:11 python-data-machine 阅读(19556) 评论(2) 推荐(1)

4.无监督学习--K-means聚类

摘要：K-means方法及其应用 1.K-means聚类算法简介： k-means算法以k为参数，把n个对象分成k个簇，使簇内具有较高的相似度，而簇间的相似度较低。主要处理过程包括： 1.随机选择k个点作为初始的聚类中心。 2.对于剩下的点，根据其与聚类中心的距离，将其归入最近的簇。 3.对每个簇，计算所阅读全文

posted @ 2017-06-04 18:21 python-data-machine 阅读(2783) 评论(0) 推荐(0)

3.无监督学习简介

摘要：无监督学习 1.无监督学习的目标：利用无标签的数据学习数据的分布或数据与数据之间的关系被称为无监督学习。 1.有监督学习和无监督学习的最大区别在于数据是否有标签 2.无监督学习最常应用的场景是聚类(clustering)和降维(Dimension Reduction) 2.聚类(clusterin 阅读全文

posted @ 2017-06-04 16:35 python-data-machine 阅读(4824) 评论(0) 推荐(1)

2.sklearn库中的标准数据集与基本功能

摘要：sklearn库中的标准数据集与基本功能下面我们详细介绍几个有代表性的数据集：当然同学们也可以用sklearn机器学习函数来挖掘这些数据，看看可不可以捕捉到一些有趣的想象或者是发现：波士顿房价数据集：波士顿房价数据集包含506组数据，每条数据包含房屋以及房屋周围的详细信息。其中包含城镇犯罪率阅读全文

posted @ 2017-06-04 15:07 python-data-machine 阅读(12571) 评论(0) 推荐(0)

1.sklearn库的安装

摘要：sklearn库 sklearn是scikit-learn的简称，是一个基于Python的第三方模块。sklearn库集成了一些常用的机器学习方法，在进行机器学习任务时，并不需要实现算法，只需要简单的调用sklearn库中提供的模块就能完成大多数的机器学习任务。 sklearn库是在Numpy、Sc 阅读全文

posted @ 2017-06-04 11:59 python-data-machine 阅读(17504) 评论(0) 推荐(0)

python-data-machine

06 2017 档案

公告