上一页 1 2 3 4 5 6 7 8 9 10 ··· 34 下一页
摘要: 场景一:显示内部占比 度量值下三角 --> 快速表计算(总额百分比) --> 计算依据 表向下 场景二:更改显示数量级 度量值下三角 --> 设置格式 场景三:求日期差值 DATEDIFF('day','x',y) 场景四:case的用法,一个应用场景是文本类型转换数值类型 CASE [test] 阅读全文
posted @ 2020-01-05 17:54 骑者赶路 阅读(158) 评论(0) 推荐(0) 编辑
摘要: # 文本分析项目实战 # 背景:根据新闻文本中的内容,进行文本预处理,建模操作,从而可以自动将新闻划分到最 # 可能的类别中,节省人力资源。 # 具体实现内容: # 能够对文本数据进行预处理【文本清洗(正则),分词(jieba),去除停用词,文本向量化(TfidfVectorizer)】 # 能够通过统计词频,生成词云图。【描述性统计分析】 chain,counter。 哪个词出现多,在这一部实现 阅读全文
posted @ 2020-01-03 19:18 骑者赶路 阅读(370) 评论(0) 推荐(0) 编辑
摘要: #!/usr/bin/env python # coding=utf-8 from string import punctuation import re import sys reload(sys) sys.setdefaultencoding('utf-8') import codecs # 英文标点符号+中文标点符号 punc = punctuation + u'.,;《》?!“”‘... 阅读全文
posted @ 2020-01-02 15:39 骑者赶路 阅读(746) 评论(0) 推荐(0) 编辑
摘要: conda install -c conda-forge jieba 阅读全文
posted @ 2020-01-02 15:23 骑者赶路 阅读(324) 评论(0) 推荐(0) 编辑
摘要: KNN算法 # 模型参数与超参数 # 模型参数是模型内部的配置变量,可以用数据估计模型参数的值;模型超参数是模型外部的配置,必须手动设置参数的值。 # 交叉验证 # 我们解决机器学习问题的一般步骤: # 数据预处理:重复缺失异常值处理,特征选择,特征变换,特征降维 # 数据建模:机器学习的问题分为两 阅读全文
posted @ 2019-12-29 16:28 骑者赶路 阅读(459) 评论(0) 推荐(0) 编辑
摘要: # 数据类型分为两种,一种是数值类型,数值还可以继续分为离散型,连续型。 # 一种是种类,还可以分为可以区分等级的种类(县长,市长,省长),和不可以区分等级的种类(苹果,橘子)。 # 数据的统计性分析,可以分为描述性统计和 推断统计 # 描述性统计 # 频数/频率 # 集中趋势 # 数值 用 平均值 阅读全文
posted @ 2019-12-16 18:33 骑者赶路 阅读(1148) 评论(0) 推荐(0) 编辑
摘要: 一 切片器 给我的感觉就是groupby,就是按照某个维度进行了分组,然后显示。 https://www.jianshu.com/p/2e78bf342747 二 建模 https://zhuanlan.zhihu.com/p/64149834 使用的数据透视表的都知道,透视表只能从单个表中取数,如 阅读全文
posted @ 2019-12-16 13:23 骑者赶路 阅读(2359) 评论(0) 推荐(0) 编辑
摘要: 轴的概念 英文解释 https://www.sharpsightlabs.com/blog/numpy-axes-explained/ 汉化解释 https://www.jianshu.com/p/f4e9407f9f9d 多维数组的索引及切片 https://blog.csdn.net/bruce 阅读全文
posted @ 2019-12-11 21:54 骑者赶路 阅读(677) 评论(0) 推荐(0) 编辑
摘要: https://blog.csdn.net/qq_39813400/article/details/102381885 阅读全文
posted @ 2019-12-10 22:49 骑者赶路 阅读(262) 评论(0) 推荐(0) 编辑
摘要: https://www.cnblogs.com/telwanggs/p/11943650.html 阅读全文
posted @ 2019-12-03 16:39 骑者赶路 阅读(94) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 34 下一页