08 2018 档案

flask下载文件中文IE,Edge,Safari文件名乱码
摘要:flask(0.11.2)+python3.6 兼容各个主流浏览器,已经过各种测试(chrome,firefox,safari,IE,Edge) quote是将文件名urlencode化,然后以适应Edge浏览器 阅读全文

posted @ 2018-08-30 11:22 多一点 阅读(1014) 评论(0) 推荐(0) 编辑

numpy 中的reshape,flatten,ravel 数据平展,多维数组变成一维数组
摘要:numpy 中的reshape,flatten,ravel 数据平展,多维数组变成一维数组 import numpy as np 使用array对象 arr1=np.arange(12).reshape(3,4) print(arr1) print(type(arr1)) [[ 0 1 2 3] [ 阅读全文

posted @ 2018-08-28 23:54 多一点 阅读(12537) 评论(1) 推荐(1) 编辑

numpy 中不常用的一些方法
摘要:作者:代码律动链接:https://zhuanlan.zhihu.com/p/36303821来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 挑战 1:引入 numpy 并查看 numpy 的版本。 要求:这是第一步,以后我们使用 numpy 时都将用别名 np。 # 阅读全文

posted @ 2018-08-27 14:17 多一点 阅读(1360) 评论(0) 推荐(0) 编辑

pandas.DataFrame对行和列求和及添加新行和列
摘要:pandas.DataFrame对行和列求和及添加新行和列 导入模块: 生成DataFrame数据 计算各列数据总和并作为新列添加到末尾 计算各行数据总和并作为新行添加到末尾 最终数据结果: 阅读全文

posted @ 2018-08-27 13:49 多一点 阅读(8726) 评论(0) 推荐(1) 编辑

numpy中数据合并,stack ,concentrate,vstack,hstack
摘要:在python的numpy库中有一个函数np.stack(), 看过一些博文后觉得别人写的太复杂,然后自己有了一些理解之后做了一些比较简单的解释 np.stack 首先stack函数用于堆叠数组,其调用方式如下所示: np.stack(arrays,axis=0) 其中arrays即需要进行堆叠的数 阅读全文

posted @ 2018-08-27 13:44 多一点 阅读(11422) 评论(0) 推荐(0) 编辑

sohu_news搜狐新闻类型分类
摘要:数据获取 数据是从搜狐新闻开放的新闻xml数据,经过一系列的处理之后,生成的一个excel文件 该xml文件的处理有单独的处理过程,就是用pandas处理,该过程在此省略 读取新闻文本文件,查看文本的长度 去掉长度小于50的文本 查看新闻类型的分布,共9类 health 30929 news 276 阅读全文

posted @ 2018-08-24 17:16 多一点 阅读(918) 评论(1) 推荐(0) 编辑

pandas pivot_table 活学活用实例教程
摘要:<! TOC "pandas pivot_table 活学活用实例教程" " 导入相关数据分析的库 " " 首先进行commentTime时间进行数据预处理 " " 查看数据类型信息 " " 最简单的透视表 " " 直接敲击该函数 , 在notebook中可以查看该函数的参数 " " 多个索引列 " 阅读全文

posted @ 2018-08-20 23:51 多一点 阅读(3823) 评论(4) 推荐(4) 编辑

美团店铺评价语言处理以及文本分类(logistic regression)
摘要:美团店铺评价语言处理以及分类(LogisticRegression) 第一篇 "数据清洗与分析部分" 第二篇 "可视化部分" , 第三篇 "朴素贝叶斯文本分类" 本文是该系列的第四篇 主要讨论逻辑回归分类算法的参数以及优化 主要用到的包有jieba,sklearn,pandas,本篇博文主要先用的是 阅读全文

posted @ 2018-08-16 14:20 多一点 阅读(3228) 评论(5) 推荐(0) 编辑

基于pandas python sklearn 的美团某商家的评论分类(文本分类)
摘要:美团店铺评价语言处理以及分类(NLP) 第一篇 "数据分析部分" 第二篇 "可视化部分" , 本文是该系列第三篇,文本分类 主要用到的包有jieba,sklearn,pandas,本篇博文主要先用的是词袋模型(bag of words),将文本以数值特征向量的形式来表示(每个文档构建一个特征向量,有 阅读全文

posted @ 2018-08-14 22:34 多一点 阅读(8178) 评论(10) 推荐(1) 编辑

基于pandas python的美团某商家的评论销售数据分析(可视化)
摘要:基于pandas python的美团某商家的评论销售数据分析 第一篇 "数据初步的统计" 本文是该可视化系列的第二篇 第三篇 "数据中的评论数据用于自然语言处理" 导入相关库 数据清洗与简单统计 评论数据,其中包括一下几个字段 是否匿名,均价,评价(以去掉,后续会做一些关于这些评论的更为深入的分析) 阅读全文

posted @ 2018-08-11 23:37 多一点 阅读(3157) 评论(1) 推荐(1) 编辑

基于pandas python的美团某商家的评论销售(数据分析)
摘要:数据初步的分析 本文是该系列的第一篇 数据清洗 数据初步的统计 第二篇 "数据可视化" 第三篇 "数据中的评论数据用于自然语言处理" .dataframe tbody tr th:only of type { vertical align: middle; } .dataframe tbody tr 阅读全文

posted @ 2018-08-08 23:52 多一点 阅读(4162) 评论(4) 推荐(1) 编辑

python pandas 豆瓣电影 top250 数据分析
摘要:豆瓣电影top250数据分析 数据来源(豆瓣电影top250) 爬虫代码比较简单 数据较为真实,可以进行初步的数据分析 可以将前面的几篇文章中的介绍的数据预处理的方法进行实践 最后用matplotlib与pyecharts两种可视化包进行部分数据展示 数据仍需深挖,有待加强 num int64 ti 阅读全文

posted @ 2018-08-08 15:07 多一点 阅读(2359) 评论(4) 推荐(0) 编辑

pandas category数据类型
摘要:实际应用pandas过程中,经常会用到category数据类型,通常以string的形式显示,包括颜色(红,绿,蓝),尺寸的大小(大,中,小),还有地理信息等(国家,省份),这些数据的处理经常会有各种各样的问题,pandas以及scikit learn两个包可以将category数据转化为合适的数值 阅读全文

posted @ 2018-08-02 15:53 多一点 阅读(10592) 评论(1) 推荐(2) 编辑

pandas 数据类型转换
摘要:数据处理过程的数据类型 当利用pandas进行数据处理的时候,经常会遇到数据类型的问题,当拿到数据的时候,首先需要确定拿到的是正确类型的数据,一般通过数据类型的转化,这篇文章就介绍pandas里面的数据类型(data types也就是常用的dtyps),以及pandas与numpy之间的数据对应关系 阅读全文

posted @ 2018-08-02 00:14 多一点 阅读(159286) 评论(12) 推荐(12) 编辑

导航

< 2025年2月 >
26 27 28 29 30 31 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 1
2 3 4 5 6 7 8
点击右上角即可分享
微信分享提示