上一页 1 ··· 6 7 8 9 10 11 12 13 14 ··· 28 下一页

2018年8月28日

numpy 中的reshape,flatten,ravel 数据平展,多维数组变成一维数组

摘要: numpy 中的reshape,flatten,ravel 数据平展,多维数组变成一维数组 import numpy as np 使用array对象 arr1=np.arange(12).reshape(3,4) print(arr1) print(type(arr1)) [[ 0 1 2 3] [ 阅读全文

posted @ 2018-08-28 23:54 多一点 阅读(12424) 评论(1) 推荐(1) 编辑

2018年8月27日

numpy 中不常用的一些方法

摘要: 作者:代码律动链接:https://zhuanlan.zhihu.com/p/36303821来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 挑战 1:引入 numpy 并查看 numpy 的版本。 要求:这是第一步,以后我们使用 numpy 时都将用别名 np。 # 阅读全文

posted @ 2018-08-27 14:17 多一点 阅读(1356) 评论(0) 推荐(0) 编辑

pandas.DataFrame对行和列求和及添加新行和列

摘要: pandas.DataFrame对行和列求和及添加新行和列 导入模块: 生成DataFrame数据 计算各列数据总和并作为新列添加到末尾 计算各行数据总和并作为新行添加到末尾 最终数据结果: 阅读全文

posted @ 2018-08-27 13:49 多一点 阅读(8705) 评论(0) 推荐(1) 编辑

numpy中数据合并,stack ,concentrate,vstack,hstack

摘要: 在python的numpy库中有一个函数np.stack(), 看过一些博文后觉得别人写的太复杂,然后自己有了一些理解之后做了一些比较简单的解释 np.stack 首先stack函数用于堆叠数组,其调用方式如下所示: np.stack(arrays,axis=0) 其中arrays即需要进行堆叠的数 阅读全文

posted @ 2018-08-27 13:44 多一点 阅读(11345) 评论(0) 推荐(0) 编辑

2018年8月24日

sohu_news搜狐新闻类型分类

摘要: 数据获取 数据是从搜狐新闻开放的新闻xml数据,经过一系列的处理之后,生成的一个excel文件 该xml文件的处理有单独的处理过程,就是用pandas处理,该过程在此省略 读取新闻文本文件,查看文本的长度 去掉长度小于50的文本 查看新闻类型的分布,共9类 health 30929 news 276 阅读全文

posted @ 2018-08-24 17:16 多一点 阅读(899) 评论(1) 推荐(0) 编辑

2018年8月20日

pandas pivot_table 活学活用实例教程

摘要: <! TOC "pandas pivot_table 活学活用实例教程" " 导入相关数据分析的库 " " 首先进行commentTime时间进行数据预处理 " " 查看数据类型信息 " " 最简单的透视表 " " 直接敲击该函数 , 在notebook中可以查看该函数的参数 " " 多个索引列 " 阅读全文

posted @ 2018-08-20 23:51 多一点 阅读(3800) 评论(4) 推荐(4) 编辑

2018年8月16日

美团店铺评价语言处理以及文本分类(logistic regression)

摘要: 美团店铺评价语言处理以及分类(LogisticRegression) 第一篇 "数据清洗与分析部分" 第二篇 "可视化部分" , 第三篇 "朴素贝叶斯文本分类" 本文是该系列的第四篇 主要讨论逻辑回归分类算法的参数以及优化 主要用到的包有jieba,sklearn,pandas,本篇博文主要先用的是 阅读全文

posted @ 2018-08-16 14:20 多一点 阅读(3206) 评论(5) 推荐(0) 编辑

2018年8月14日

基于pandas python sklearn 的美团某商家的评论分类(文本分类)

摘要: 美团店铺评价语言处理以及分类(NLP) 第一篇 "数据分析部分" 第二篇 "可视化部分" , 本文是该系列第三篇,文本分类 主要用到的包有jieba,sklearn,pandas,本篇博文主要先用的是词袋模型(bag of words),将文本以数值特征向量的形式来表示(每个文档构建一个特征向量,有 阅读全文

posted @ 2018-08-14 22:34 多一点 阅读(8128) 评论(10) 推荐(1) 编辑

2018年8月11日

基于pandas python的美团某商家的评论销售数据分析(可视化)

摘要: 基于pandas python的美团某商家的评论销售数据分析 第一篇 "数据初步的统计" 本文是该可视化系列的第二篇 第三篇 "数据中的评论数据用于自然语言处理" 导入相关库 数据清洗与简单统计 评论数据,其中包括一下几个字段 是否匿名,均价,评价(以去掉,后续会做一些关于这些评论的更为深入的分析) 阅读全文

posted @ 2018-08-11 23:37 多一点 阅读(3130) 评论(1) 推荐(1) 编辑

2018年8月8日

基于pandas python的美团某商家的评论销售(数据分析)

摘要: 数据初步的分析 本文是该系列的第一篇 数据清洗 数据初步的统计 第二篇 "数据可视化" 第三篇 "数据中的评论数据用于自然语言处理" .dataframe tbody tr th:only of type { vertical align: middle; } .dataframe tbody tr 阅读全文

posted @ 2018-08-08 23:52 多一点 阅读(4144) 评论(4) 推荐(1) 编辑

上一页 1 ··· 6 7 8 9 10 11 12 13 14 ··· 28 下一页

导航