随笔分类 - 数据科学
数据科学
摘要:作者 | Will Koehrsen 翻译 | Lemon 译文出品 | Python数据之道 (ID:PyDataRoad) 本文通过一个项目案例,详细的介绍了如何从 Bokeh 基础到构建 Bokeh 交互式应用程序的过程,内容循序渐进且具有很高的实用性。本文共有两万字左右,属于纯干货分享,强烈
阅读全文
摘要:2018年,世界杯小组赛已经在如火如荼的进行中。在上篇文章的基础上【2018世界杯:用Python分析热门夺冠球队】,我们继续分析世界杯32强的实力情况,以期能够更进一步分析本次世界杯的夺冠热门球队。 三十年河东三十年河西,对于世界杯而言,这个时间可能4年就足够。 前几场爆冷,使得天台上已经拥挤不堪
阅读全文
摘要:2018年,火热的世界杯即将拉开序幕。在比赛开始之前,我们不妨用 Python 来对参赛队伍的实力情况进行分析,并大胆的预测下本届世界杯的夺冠热门球队。 通过数据分析,可以发现很多有趣的结果,比如: 找出哪些队伍是首次进入世界杯的黑马队伍 找出2018年32强中之前已经进入过世界杯,但在世界杯上没有
阅读全文
摘要:近期在好几个地方都看到meshgrid的使用,虽然之前也注意到meshgrid的用法。但总觉得印象不深刻,不是太了解meshgrid的应用场景。所以,本文将进一步介绍Numpy中meshgrid的用法。 Meshgrid函数的基本用法 在Numpy的官方文章里,meshgrid函数的英文描述也显得文
阅读全文
摘要:近期,DataCamp发布了jupyter notebook的 cheat sheet,【Python数据之道】第一时间与大家一起来分享下该cheat sheet的内容。 以下是该cheat sheet的部分内容: 各位小伙伴可以从DataCamp的网站获取该cheat sheet的pdf版,当然,
阅读全文
摘要:编译:Lemon,原文作者:Ernst Haagsman 公众号:Python数据之道(ID:PyDataRoad) pycharm:2017.3版即将新增科学计算模式 在JetBrains将发布的新版本PyCharm中,考虑到越来越多的Python开发者进行数据科学相关开发,即将发布的PyChar
阅读全文
摘要:本文介绍的是我在机器学习方面的 实际经历,想以此给大家提供些建议与思路,供各位参考。希望通过一些途径,来提高机器学习的兴趣:(1)参与打卡活动:45天机器学习实战(2)加入专门的微信群(3)建立机器学习的Github项目仓库
阅读全文
摘要:在同一列中,本该分别填入多行中的数据,被填在一行里了,然而在分析的时候,需要拆分成为多行。
今天,我们来介绍将含有多值的内容分拆成多行的几种方法。
阅读全文
摘要:本文就Pandas的运行效率作一个对比的测试,来探讨用哪些方式,会使得运行效率较好。
阅读全文
摘要:手头现在有一份福布斯2016年全球上市企业2000强排行榜的数据,但原始数据并不规范,需要处理后才能进一步使用。
本文通过实例操作来介绍用pandas进行数据整理。
阅读全文
摘要:什么是机器学习?
机器学习通常可以分为三个大的步骤,即 输入、整合、输出,可以用下图来表示大致的意思:
阅读全文
摘要:本期来讨论下,jupyter notebook中怎样同时安装python2.7 和python3.x。
阅读全文
摘要:1 曾经的困扰 有段时间,想使用基于不同python版本的anaconda,就直接从官网下载了两个不同的anaconda版本进行安装。刚开始的时候,还觉得也没啥问题。用了一小段时间,在安装其他的第三方库时,经常发现安装失败,并且经常出现下面的问题:这个问题,我google、百度等查了好久,也没有解决
阅读全文
摘要:先说下环境 Anaconda 对应Python3.5的版本 win7,64位系统。 step1:下载whl文件 step2:打开‘Anaconda Command Prompt‘, 如下图: step3:命令行窗口pip安装,代码如下: pip install 路径+whl文件名 具体如下: Ste
阅读全文
摘要:本文主要是对之前发布的文章进行分类整理,方面大家查阅,以后会不定期对文章汇总进行更新与发布。
阅读全文