摘要:
https://www.jianshu.com/p/ac45e8d168ea 一、说明 Python数据科学生态环境的强大力量在Numpy和Pandas的基础之上,并通过直观的语法将基本操作转化为c语言:在Numpy里是向量化/广播运算,在pandas里是分组型的运算。 虽然这些抽象功能可以简洁高效 阅读全文
摘要:
阅读全文
摘要:
df = pd.read_clipboard(na_values=[None],parse_dates=['d']) df2 = pd.read_clipboard(index_col=None,names=[0,1,2,3]) 阅读全文
摘要:
http://www.360doc.com/content/20/0601/09/4993768_915810015.shtml 阅读全文
摘要:
哑变量处理 pd.get_dummies(table,columns=['column1',''...]) pd.get_dummies(combined_data_table,columns=["星座",'学科'],drop_first=True) # drop_first 星座有5种,设置为Tr 阅读全文
摘要:
# 按整条记录进行去重 df1.drop_duplicates(inplace=True) df1 # 按某一列进行去重(例如列举所有不同星座,每个星座只需要有一条记录代表)df1.drop_duplicates("星座") 阅读全文
摘要:
numpy.concatenate((a1,a2,...),axis=0) 数组的拼接,一维数组 与axis值无关,都往横向拼接。多维数组 与axis有关,0是纵向,1是横向 pandas.concat((a,b,c...),axis=0,join='outter',sort=True, ignor 阅读全文
摘要:
安装模块 pip install pymysql pip install sqlalchemy import pymysql from sqlalchemy import create_engine 建立连接(不推荐使用pymysql 占用内存) conn=pymysql.connect(host= 阅读全文
摘要:
数据清洗 1、处理空值:过滤,删除,填充 2、处理重复数据:.drop_duplicates(keep = 'first') 删除重复行 3、处理异常值:异常值(极值等)可以用均值去替换 1、空值 1.1 空值的区别 pandas里头有两种空值类型 type(None) # NoneType Non 阅读全文
摘要:
Tushare Pandas 1 分析某只股票的盈利情况 2 双均线策略制定 1 分析某只股票的盈利情况 使用tushare包获取股票历史行情数据 输出该股票所有收盘比开盘上涨3%以上的日期 输出该股票所有开盘比前日收益跌幅超过2%的日期 假如我从2010年1月1日开始,每月第一个交易日买入1手股票 阅读全文