多一点

numpy 中的reshape，flatten，ravel 数据平展，多维数组变成一维数组

摘要： numpy 中的reshape，flatten，ravel 数据平展，多维数组变成一维数组 import numpy as np 使用array对象 arr1=np.arange(12).reshape(3,4) print(arr1) print(type(arr1)) [[ 0 1 2 3] [ 阅读全文

posted @ 2018-08-28 23:54 多一点阅读(12553) 评论(1) 推荐(1) 编辑

numpy 中不常用的一些方法

摘要：作者：代码律动链接：https://zhuanlan.zhihu.com/p/36303821来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。挑战 1：引入 numpy 并查看 numpy 的版本。要求：这是第一步，以后我们使用 numpy 时都将用别名 np。 # 阅读全文

posted @ 2018-08-27 14:17 多一点阅读(1361) 评论(0) 推荐(0) 编辑

pandas.DataFrame对行和列求和及添加新行和列

摘要： pandas.DataFrame对行和列求和及添加新行和列导入模块：生成DataFrame数据计算各列数据总和并作为新列添加到末尾计算各行数据总和并作为新行添加到末尾最终数据结果：阅读全文

posted @ 2018-08-27 13:49 多一点阅读(8729) 评论(0) 推荐(1) 编辑

numpy中数据合并，stack ，concentrate，vstack，hstack

摘要：在python的numpy库中有一个函数np.stack(), 看过一些博文后觉得别人写的太复杂，然后自己有了一些理解之后做了一些比较简单的解释 np.stack 首先stack函数用于堆叠数组，其调用方式如下所示： np.stack(arrays,axis=0) 其中arrays即需要进行堆叠的数阅读全文

posted @ 2018-08-27 13:44 多一点阅读(11436) 评论(0) 推荐(0) 编辑

sohu_news搜狐新闻类型分类

摘要：数据获取数据是从搜狐新闻开放的新闻xml数据，经过一系列的处理之后，生成的一个excel文件该xml文件的处理有单独的处理过程，就是用pandas处理，该过程在此省略读取新闻文本文件，查看文本的长度去掉长度小于50的文本查看新闻类型的分布，共9类 health 30929 news 276 阅读全文

posted @ 2018-08-24 17:16 多一点阅读(920) 评论(1) 推荐(0) 编辑

pandas pivot_table 活学活用实例教程

摘要： <! TOC "pandas pivot_table 活学活用实例教程" " 导入相关数据分析的库 " " 首先进行commentTime时间进行数据预处理 " " 查看数据类型信息 " " 最简单的透视表 " " 直接敲击该函数，在notebook中可以查看该函数的参数 " " 多个索引列 " 阅读全文

posted @ 2018-08-20 23:51 多一点阅读(3832) 评论(4) 推荐(4) 编辑

美团店铺评价语言处理以及文本分类（logistic regression）

摘要：美团店铺评价语言处理以及分类（LogisticRegression）第一篇 "数据清洗与分析部分" 第二篇 "可视化部分" , 第三篇 "朴素贝叶斯文本分类" 本文是该系列的第四篇主要讨论逻辑回归分类算法的参数以及优化主要用到的包有jieba，sklearn，pandas，本篇博文主要先用的是阅读全文

posted @ 2018-08-16 14:20 多一点阅读(3231) 评论(5) 推荐(0) 编辑

基于pandas python sklearn 的美团某商家的评论分类(文本分类）

摘要：美团店铺评价语言处理以及分类（NLP）第一篇 "数据分析部分" 第二篇 "可视化部分" , 本文是该系列第三篇，文本分类主要用到的包有jieba，sklearn，pandas，本篇博文主要先用的是词袋模型(bag of words),将文本以数值特征向量的形式来表示(每个文档构建一个特征向量，有阅读全文

posted @ 2018-08-14 22:34 多一点阅读(8191) 评论(10) 推荐(1) 编辑

基于pandas python的美团某商家的评论销售数据分析(可视化）

摘要：基于pandas python的美团某商家的评论销售数据分析第一篇 "数据初步的统计" 本文是该可视化系列的第二篇第三篇 "数据中的评论数据用于自然语言处理" 导入相关库数据清洗与简单统计评论数据，其中包括一下几个字段是否匿名，均价，评价（以去掉，后续会做一些关于这些评论的更为深入的分析）阅读全文

posted @ 2018-08-11 23:37 多一点阅读(3160) 评论(1) 推荐(1) 编辑

基于pandas python的美团某商家的评论销售(数据分析)

摘要：数据初步的分析本文是该系列的第一篇数据清洗数据初步的统计第二篇 "数据可视化" 第三篇 "数据中的评论数据用于自然语言处理" .dataframe tbody tr th:only of type { vertical align: middle; } .dataframe tbody tr 阅读全文

posted @ 2018-08-08 23:52 多一点阅读(4167) 评论(4) 推荐(1) 编辑