摘要:
按文件中数据组织形式,可把文件分为文本文件和二进制两大类。 1.文本文件:存储的是普通“字符”的文本,python默认的是unicode字符集,可以用记事本打开。 2.二进制文件:二进制文件把数据内容用“字节”进行存储,无法用记事本,即使打开了,也是乱码,必须使用专用的软件解码。常见的mp3,mp4 阅读全文
摘要:
1.发布:如图所示,按下图创建好对应的文件夹。 demo1和demo2先随便定义个输入函数,然后在文件夹下创建setup.py 文件,在setup.py文件夹下输入: from distutils.core import setup setup( name='newMath', # 对外发布我们模块 阅读全文
摘要:
一.算法 决策树在优化过程中,有3个经典的算法,分别是ID3,C4.5,和CART。后面的算法都是基于前面算法的一些不足进行改进的,这里用ID3算法。 二. 一个案例 大家可能赖床过,早上要不要赖床是一个问题。它取决于多个变量,下面就让我们看看小明的赖床习惯。 | 季节 | 时间是否过8点 | 风力 阅读全文
摘要:
一. 什么是决策树 决策树是常见的挖掘算法之一,决策树的关键还是在树,我们平时写代码那一串一串的if else就是的思想。 二.决策树介绍 根节点:最顶部的那个节点。 叶子节点:每条路径最末尾的那个节点,也就是最外层的节点。 非叶子节点:一些条件的节点,下面会有更多分支,也叫做分支节点。 三.信息熵 阅读全文
摘要:
数据埋点 定义:埋点就是在应用中特定的流程收集一些信息,用来跟踪应用使用的状况,后续用来进一步优化产品或是提供运营的数据支撑,包括访问数,访客数,停留时长,页面浏览数和跳出率。这样的信息收集可以大致分为两种:页面统计,统计操作行为。 数据埋点的方式: 1. 自已研发,注入到产品代码中,并搭建起相应的 阅读全文