摘要: 决策树算法历史: 简单实例: Q1:如何对客户分类? Q2:如何根据分类的依据,对销售人员给出销售意见? 已该种方式选取各节点产生树形图:(怎么选取节点会更优?) 二、决策树算法框架 1、决策树主函数 各种决策树主函数都大同小异,本质上是一个递归函数。其主要有如下几个功能: 1、输入需要分类的数据集 阅读全文
posted @ 2018-12-02 21:55 MK3945 阅读(442) 评论(0) 推荐(0) 编辑
摘要: 1、python默认字典,好处是当字典内无字段时不会报错,而会返回默认值。 dic = defaultdict(<int/float/str...>) # 可以指定默认返回值 # 测试 str 返回值 # 指定默认返回值 2、python read (), readline(), readlines 阅读全文
posted @ 2018-12-02 17:24 MK3945 阅读(108) 评论(0) 推荐(0) 编辑
摘要: linalg.norm -- norm 表示范数的意思 numpy文档给出的参数: L1参数表示的是闵可夫斯基距离 L2范数表示的是欧式距离 L无穷大 表示切比雪夫距离 阅读全文
posted @ 2018-12-01 16:26 MK3945 阅读(291) 评论(0) 推荐(0) 编辑
摘要: 一、Aoriori原始算法: 频繁挖掘模式与关联规则 关联规则两个基本的指标(假设有事务A和事务B) 1、支持度(suport):计算公式如下 2、置信度(confidence): 关联规则的挖掘过程: 1、设定最小支持度阈值,找出所有的频繁项集且每个出现的次数要大于等于最小支持度阈值。 2、由频繁 阅读全文
posted @ 2018-11-26 18:11 MK3945 阅读(1228) 评论(0) 推荐(1) 编辑
摘要: 阅读全文
posted @ 2018-09-25 18:00 MK3945 阅读(153) 评论(0) 推荐(0) 编辑
摘要: time库是python处理时间数据的标准库 time库有3种时间表现方式: time库主要提供3类属性: 1、time库时间获取属性: gmtime与localtimex,ctime与 asctime的比较 不同的是: gmtime 返回的是 电脑时间的格林威治时间,也就是0时区的时间, loca 阅读全文
posted @ 2018-09-13 15:22 MK3945 阅读(3850) 评论(0) 推荐(0) 编辑
摘要: virtualenv对python来说是一个非常好用的工具,能够为不同功能的python环境隔离开来,互不影响。 使用步骤: 1、进入命令行,安装virtualenv -- pip install virtualenv 2、在该目录下创建容纳虚拟空间专用文件夹, virtualenv myvirtu 阅读全文
posted @ 2018-08-16 09:41 MK3945 阅读(114) 评论(0) 推荐(0) 编辑
摘要: NumPy是一个开源的Python科学计算基础库,包含: • 一个强大的N维数组对象 ndarray • 广播功能函数 • 整合C/C++/Fortran代码的工具 • 线性代数、傅里叶变换、随机数生成等功能NumPy是SciPy、 Pandas等数据处理或科学计算库的基础 NumPy的引用: im 阅读全文
posted @ 2017-07-07 21:34 MK3945 阅读(402) 评论(0) 推荐(0) 编辑
摘要: 从特定网址获取json数据--> 将json数据序列化字典格式 --> 将字典格式数据反序列化json数据传递给模板 工具:rest_frawork rest_frawork库安装-->pip安装 Python3 -m pip install django-rest-framework --> 将r 阅读全文
posted @ 2017-07-04 20:31 MK3945 阅读(1123) 评论(0) 推荐(0) 编辑
摘要: 进步重在学习,阅读了几篇有关restful api 的技术文章,分享一下: http://www.ruanyifeng.com/blog/2014/05/restful_api.html http://www.ruanyifeng.com/blog/2011/09/restful 阅读全文
posted @ 2017-07-04 18:52 MK3945 阅读(122) 评论(0) 推荐(0) 编辑