摘要: Pandas为所有中等规模数据分析的最有效的工具,它依赖Numpy。 学习过程中我搜集了一些资料汇总如下: 作为开始,你可以先看一个关于Pandas的 "10分钟简短介绍" ,中文版在 "这里" 。 然后可以学习一个更详细的 "Pandas教程" ,百度文库也有一个系列的 "Pandas教程" 。 阅读全文
posted @ 2016-10-20 08:44 晋好林 阅读(1129) 评论(0) 推荐(1) 编辑
摘要: 最近无意中发现了一款轻量级的标记语言,语法简单,排版方便,正好最近想学习大数据与机器学习相关的知识,并计划时常写一些博客来做笔记,感觉Markdown应该是比较适合编辑,所以把博客园的编辑器改成了markdown,并在以后的记录中习惯使用。下面就总结一些Markdown的基本语法方便随时查阅。 1. 阅读全文
posted @ 2016-08-15 11:01 晋好林 阅读(1127) 评论(1) 推荐(2) 编辑
摘要: 以下依次列出python2常遇到的几个问题及讲解。 # -*- coding:utf-8 -*- python2默认以ASCII编码,但是在实际编码过程中,我们会用到很多中文,为了不使包含中文的程序报错,也是为了符合国际通用惯例,一般将我们的文件编码设置为utf-8格式。 设定编码的格式有很多种,只 阅读全文
posted @ 2016-01-14 00:53 晋好林 阅读(18958) 评论(3) 推荐(2) 编辑
摘要: 在开始之前先要吐槽一下CSDN,昨晚怀着激动得心情写下了我人生中的第一篇博文,今天审核通过后发现所有的图片都不见了,瞬间就不开心了。所以不得不又申请了博客园的账号,重新开始。 前段时间一直研究通用爬虫,做的过程中也是各种问题,不过好在磕磕绊绊搞出点眉目,中间学到了不少东西,感觉互联网真的好神奇。 但 阅读全文
posted @ 2015-12-09 18:25 晋好林 阅读(11269) 评论(7) 推荐(1) 编辑
作者:jinhaolin
出处:http://www.cnblogs.com/jinhaolin/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出, 原文链接 如有问题, 可邮件咨询.