摘要:
从Kaggle上获取的这份数据集,是从超过15000个专业的数据科学家收集的数据,让我们对他们的偏好、工作、学习资源和技术水平有了一个非常好的了解。 以下的分析中,简单的从几个方面对数据科学家的现状进行分析。 我们有超过16716人的数据。由于问题的数量实在是太大了(总共超过300个),所以指望人们 阅读全文
摘要:
mac下安装mysql后,在终端输入mysql,会报bash:mysql:command not found。 对于这样错误的解决方法:配置环境变量 步骤如下: 1.终端中执行 vi ~/.bash_profile 2.按键盘的字母i 进入编辑模式 3.在末尾添加两行 alias mysql=/us 阅读全文
摘要:
安装BeautifulSoup Python3版本需要安装BeautifulSoup4。 可以通过 pip 来安装BeautifulSoup4 pip3 install beautifulsoup4 Jupyter实现网页的获取 运行以下代码看BeautifulSoup 是否正常安装(若未提示错误则 阅读全文
摘要:
基于API的爬虫的一般步骤 举例:从豆瓣电影上爬取《摔跤吧,爸爸》电影的评分,并保存到本地 # 使用工具是Jupyter Notebook 和 Python3 第一步:利用Python读取url的核心代码如下: 第二步:利用 python 解析 JSON 代码 第三步:将数据存到本地 说明: 这里我 阅读全文
摘要:
目录 一、MySQL的相关概念介绍 二、Windows下MySQL的配置 配置步骤 MySQL服务的启动、停止与卸载 三、MySQL脚本的基本组成 四、MySQL中的数据类型 五、使用MySQL数据库 登录到MySQL 创建一个数据库 选择所要操作的数据库 创建数据库表 六、操作MySQL数据库 向 阅读全文
摘要:
一:pandas的数据类型 pandas中最重要的数据类型是Series序列 和 DataFrame数据框,Series相当于Numpy中的一维数组,不同之处series会自带索引值。dataframe相当于numpy的二维数组。 1.1)Series的创建 有两种方式:通过一维数组 和 字典 1) 阅读全文
摘要:
最近在学习Python的pandas包,一开始学习起来乱七八糟,后来思考如何从宏观层面来讨论,学习一名语言需要从哪些方面来学习。 第一:这门语言的作用,比如pandas包就是python来进行数据分析的。 第二:这门语言的数据类型 第三:每个数据类型的创建,查询,修改,删除,排序等 阅读全文