python重要第三方库pandas加载数据(详解)

Pandas数据加载

关注公众号“轻松学编程”了解更多。

pandas提供了一些用于将表格型数据读取为DataFrame对象的函数,其中read_csv和read_table这两个使用最多。

以下命令都是在浏览器中输入。

cmd命令窗口输入:jupyter notebook

后打开浏览器输入网址http://localhost:8888/

导入包

import pandas as pd
from pandas import DataFrame,Series

read_xxx()参数:

  • sep
  • header

1、读取.txt文件数据

data=pd.read_csv('./type-.txt')
data

这里写图片描述

1.1 sep参数

将文件中每一个词作为元素存放在DataFrame中

#sep参数可以多读取到的数据值进行拆分
data=pd.read_csv('./data-07/type-.txt',sep='-')
data

这里写图片描述

1.2 header参数

#header参数可以设置的列索引
data=pd.read_csv('./type-.txt',sep='-',header=None)
data

这里写图片描述

2、读取type_comma文件,将每一个数值存放到DataFrame中

data_1=pd.read_csv('./type_comma')
data_1

这里写图片描述

3、写入excel文件 :df.to_excel(‘name.xlsx’)

#写入
data_1.to_excel('./data.xlsx')
#读取
data=pd.read_excel('./data.xlsx')
data

这里写图片描述

4、读取sqlite文件

导包 import sqlite3 as sqlite3

import sqlite3 as sqlite3
  • 连接数据库
    sqlite3.connect(‘dbpath’)
  • 读取table内容
    pd.read_sql(“SQL语句”, con)
  • 写入数据库文件 df对象.to_sql(name,connection):将df中的数据值写入数据库中,表名为name
  • 操作数据库 connection.execute(SQL语句)

4.1 读取

#连接数据库,获取连接对象
conn=sqlite3.connect('./weather_2012.sqlite')
#读取库表中的数据值
sql_df=pd.read_sql('select * from weather_2012',conn)
sql_df.head()

这里写图片描述

4.2 写入

#将一个df中的数据值写入存储到db
data_1.to_sql('data_1',conn)
#验证:读取文件
pd.read_sql('select * from data_1',conn)

这里写图片描述

4.3 执行sql语句

conn.execute("delete from data_1 where message ='hello';")
conn.commit()
pd.read_sql('select * from data_1',conn)

这里写图片描述

5、读取url获取网络上的数据

使用pd.read_csv读取url获取网络上的数据

url='https://raw.githubusercontent.com/datasets/investor-flow-of-funds-us/master/data/weekly.csv'
pd.read_csv(url)

这里写图片描述

后记

【后记】为了让大家能够轻松学编程,我创建了一个公众号【轻松学编程】,里面有让你快速学会编程的文章,当然也有一些干货提高你的编程水平,也有一些编程项目适合做一些课程设计等课题。

也可加我微信【1257309054】,拉你进群,大家一起交流学习。
如果文章对您有帮助,请我喝杯咖啡吧!

公众号

公众号

赞赏码

关注我,我们一起成长~~

posted @ 2018-07-25 19:27  轻松学编程  阅读(679)  评论(0编辑  收藏  举报