• 博客园logo
  • 会员
  • 周边
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录

Robin_Yao_Wenbin

  • 博客园
  • 联系
  • 订阅
  • 管理

公告

2019年4月20日

R&SPSS重复测量方差分析

摘要: 最近在做重复测量方差分析,真的是走了很多弯路,足足花费了我两周的时间,因此在此写一篇博文,希望能给其他人提供一些参考。 先说建议: 建议使用SPSS,不要使用R,会省很多精力,我用R做了3天,失败了,然后改用SPSS,花了1天就搞定,一方面是因为SPSS确实对用户很友好,而且很简单,另一方面也是因为 阅读全文

posted @ 2019-04-20 23:52 Robin_Yao_Wenbin 阅读(4497) 评论(0) 推荐(0)

2019年4月2日

dataframe.to_csv()中文乱码

摘要: 今天又遇到了dataframe.to_csv()然后文件里的中文乱码了。1、首先吧dataframe.to_csv(“file_name” ,encoding = ‘utf-8’)结果乱码依旧。2、上网查了下,改成了dataframe.to_csv(“fil... 阅读全文

posted @ 2019-04-02 10:14 Robin_Yao_Wenbin 阅读(6224) 评论(0) 推荐(0)

2019年2月27日

非线性拟合/GAM

摘要: 因为要用到GAM,但是网上资料很少,看到这篇博文,特地学习了一下,相对比较全面,感谢博主的分享,在此转载,希望更多人看到啦!!原文博客:https://blog.csdn.net/tongweiganglp/article/details/53422324参... 阅读全文

posted @ 2019-02-27 19:52 Robin_Yao_Wenbin 阅读(1060) 评论(0) 推荐(0)

hive lateral view和explode的理解

摘要: 今天使用hive的时候需要把一个字段中的josn数据分开,于是需要用到explode()函数。网上有许多文章,但是写的复杂,在此就概括下。 表生成函数:explode:把map集合或数组array中每个键值对或数组中的每个元素都单独生成一行的形式。 explode()就是内置表生成函数(UDTF), 阅读全文

posted @ 2019-02-27 14:02 Robin_Yao_Wenbin 阅读(2605) 评论(0) 推荐(0)

2019年2月8日

python dataframe删除指定的行

摘要: 网上关于dataframe删除指定行的博文较少,看到一篇不错的,转载一下,原文地址:https://blog.csdn.net/shuihupo/article/details/82842524遇到清洗数据的问题,需要把某一列数据中,那些为指定元素的数据,整... 阅读全文

posted @ 2019-02-08 10:44 Robin_Yao_Wenbin 阅读(13625) 评论(0) 推荐(0)

2019年2月7日

python横坐标为时间序列绘制散点图

摘要: 今天需要以时间序列为横坐标绘制散点图,十分困难,因为scatter()都要求x为数字,在网上搜索时,搜到了一篇博文,尝试了一下真的成功,感谢感谢,在此转载,让更多人看到,感谢博主的分享:http://blog.51cto.com/happy366/20957... 阅读全文

posted @ 2019-02-07 16:31 Robin_Yao_Wenbin 阅读(1611) 评论(0) 推荐(0)

2019年2月3日

python箱型图的返回值

摘要: 今天,搞了一天的pyhton箱型图,头昏眼花,所幸终于搞定了,这里主要想记录下python箱型图的25%,50%,75%分位的计算,以及dataframe.boxplot()的返回值。首先25%,50%,75%分为这些统计参数没法通过箱型图相关的方法得到,也... 阅读全文

posted @ 2019-02-03 20:38 Robin_Yao_Wenbin 阅读(1162) 评论(0) 推荐(0)

2019年2月1日

时间序列补全

摘要: 今天实习做项目时遇到一个问题,就是时间序列中存在个别日期的缺失,因此需要对日期进行补全,然后在网上搜到一篇博文,可以解决此问题,但是这篇博文中的代码存在一个地方有个小bug,因此在此记录下,博文原地址:https://blog.csdn.net/leo_sh... 阅读全文

posted @ 2019-02-01 17:46 Robin_Yao_Wenbin 阅读(438) 评论(0) 推荐(0)

2018年12月17日

杭州市卡口数据分析常用代码1

摘要: 由于经常要使用,又总是找不到,因此在此做一个记录。车辆牌照筛选的正则表达式代码:(REGEXP_LIKE(CAR_NUM,'浙A.1[A-Z][A-Z][A-Z]') OR REGEXP_LIKE(CAR_NUM,'浙A..1[A-Z][A-Z]') O... 阅读全文

posted @ 2018-12-17 11:40 Robin_Yao_Wenbin 阅读(149) 评论(0) 推荐(0)

2018年12月9日

kmeans聚类详解

摘要: 今天看了多元统计分析的聚类分析一章,终于算是对聚类分析有点理解了。 Kmeans聚类是最简单的快速聚类方法了,目标就是按照给定的K,将所有样本按照类内尽可能紧凑,类间尽可能松散的原则来组织,得到k个簇。 聚类方法: (1)从n个数据对象中取k个对象作为初始簇中心; (2)循环下述流程(3)到(4), 阅读全文

posted @ 2018-12-09 16:45 Robin_Yao_Wenbin 阅读(806) 评论(0) 推荐(0)

下一页
 
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3