11 2017 档案
摘要:所谓人工智能,通俗地讲是指由人工制造出来的系统所表现出来的智能 机器学习简单来讲就是通过算法,使机器能从大量历史数据中学习规律,从而对新的样本做出智能识别或对未来做预测 机器学习是基于概率统计、矩阵或图模型而得出的分析结论 机器学习是人工智能的一个分支 深度学习是机器学习的一个新领域 监督学习 逻辑
阅读全文
摘要:1. 机器学习 明白一些基本概念 什么是机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能通俗来讲,让代码学着干活 特征:自变量标签:因变量 学习的种类有监督学习:提供标签,分类、回归无监督学习:无标签,聚类增强学习:也称强化学习,马尔科夫决策过程(Markov Decision Proc
阅读全文
摘要:KNN算法的定义: KNN通过测量不同样本的特征值之间的距离进行分类。它的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。K通常是不大于20的整数。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻
阅读全文
摘要:本文是Sublime Text 全程指引 by Lucida (http://www.cnblogs.com/figure9/p/sublime-text-complete-guide.html)的笔记,并添加了自己整理的一些内容,感谢原作者。 1. 下载 可以从官网 http://www.subl
阅读全文
摘要:动态可视化 数据可视化之魅D3,Processing,pandas数据分析,科学计算包Numpy,可视化包Matplotlib,Matlab语言可视化的工作,Matlab没有指针和引用是个大问题 D3.js入门指南 什么是D3?D3是指数据驱动文档(Data-Driven Documents),根据
阅读全文
摘要:1. Web基础 网页的骨骼HTML 什么是HTML超文本标记语言:Hyper Text Markup Language 这都不重要,重要的是:HTML是Web网页的基本组成部分HTML中定义的元素,决定了网页的内容和结构 Python:编程语言,编写程序HTML:标记语言,像画画一样,画出网页的内
阅读全文
摘要:MAMP和WAMP搭建Web环境,数据库,数据分布可视化 1. 数据库 用MAMP和WAMP搭建Web环境,数据分布可视化 Web环境Web服务器:Apache、Nginx,处理Web请求数据库:MySQL,存储和管理数据后端:PHPWeb服务启动后,就可以在浏览器中访问根目录中的网站项目 MAMP
阅读全文
摘要:爬虫 Http请求,urllib2获取数据,第三方库requests获取数据,BeautifulSoup处理数据,使用Chrome浏览器开发者工具显示检查网页源代码,json模块的dumps,loads,dump,load方法介绍 伪装浏览器、IP限制、登陆、验证码(CAPTCHA) 1.爬虫 Ht
阅读全文
摘要:Python 基本语法,文件读写,数据结构和类型 1.基本语法 解释型(无需编译)、交互式、面向对象、跨平台、简单好用 中文编码:http://www.cnblogs.com/huxi/archive/2010/12/05/1897271.html 变量名:可以包括英文、数字以及下划线,但不能以数字
阅读全文
摘要:数据工程采集、存储、清洗、分析、可视化 编程语言C++和Javapython大法Rweb:php、html、css、javascript 结合采集:python存储:python+数据库/.csv/txt清洗:python分析:python+R/pandas/numpy可视化:R+web/matpl
阅读全文