摘要: # login12306_02 # 图像识别涉及到深度学习,这里直接将验证码识别任务发送到大佬的验证码解析地址,不过现在已经失效了,程序跑到这会报错。 # 用户名和密码存储在本地工作目录中的 username_password_12306.txt文件中。 from selenium import w 阅读全文
posted @ 2020-06-03 16:57 collin_pxy 阅读(130) 评论(0) 推荐(0) 编辑
摘要: # Selenium (firefox) # 1,介绍: # selenium 是一个 web 的自动化测试工具,是一个包,可以支持 C、 java、ruby、python、或都是 C# 语言。 # 1)安装: # 1-1)安装 selenium # pip install selenium # 在 阅读全文
posted @ 2020-06-03 16:56 collin_pxy 阅读(447) 评论(0) 推荐(0) 编辑
摘要: import numpy as np import pandas as pd from pandas import Series,DataFrame # 1--读取数据文件 file_obj=open('Baltimore_City_Employee_Salaries_FY2016.csv') sa 阅读全文
posted @ 2020-06-03 16:51 collin_pxy 阅读(594) 评论(0) 推荐(0) 编辑
摘要: Pandas基础(全) 引言 Pandas是基于Numpy的库,但功能更加强大,Numpy专注于数值型数据的操作,而Pandas对数值型,字符串型等多种格式的表格数据都有很好的支持。 关于Numpy的基础知识,请查看 Numpy基础(全) 内容介绍 1.数据结构(Series,DataFrame) 阅读全文
posted @ 2020-06-03 16:47 collin_pxy 阅读(122) 评论(0) 推荐(0) 编辑
摘要: # 十,使用数组进行文件输入和输出 # Numpy 可以将数据以【文本】或【二进制】的形式存入硬盘,或从硬盘载入。 # 由于大部分用户更倾向于使用pandas等其他工具来载入文本或表格型数据,因此,这里只讲 Numpy 的内建二进制格式。 # 10.1,np.save(),np.savez(),np 阅读全文
posted @ 2020-06-03 16:46 collin_pxy 阅读(94) 评论(0) 推荐(0) 编辑
摘要: Pandas 读取和存储数据 目录 读取 csv数据 读取 txt数据 存储 csv 和 txt 文件 读取和存储 json数据 读取和存储 excel数据 一道练习题 参考 Numpy基础(全) Pandas基础(全) 一,读取 CSV 文件: # 文字解析函数: # pd.read_csv() 阅读全文
posted @ 2020-06-03 16:44 collin_pxy 阅读(384) 评论(0) 推荐(0) 编辑
摘要: # 一,读取 CSV 文件: # 文字解析函数: # pd.read_csv() 从文件中加载带分隔符的数据,默认分隔符为逗号 # pd.read_table() 从文件中加载带分隔符的数据,默认分隔符为制表符 # read()_csv/read_table()参数: # path 文件路径,路径中 阅读全文
posted @ 2020-06-03 16:43 collin_pxy 阅读(334) 评论(0) 推荐(0) 编辑
摘要: # 数据清洗与整(全) # 1) 常见的数据清洗方法 # 2) 数据合并:多源数据的合并和连接 # 3) 数据重塑:针对层次化索引,学会 stack和 unstack # 4) 字符串处理:学会 DataFrame中字符串函数的使用 # 一,常见的数据清洗方法 # 1, 查看数据基本信息 # df. 阅读全文
posted @ 2020-06-03 16:41 collin_pxy 阅读(343) 评论(0) 推荐(0) 编辑
摘要: # 分组统计是数据分析中的重要环节: # 1-数据分组:GroupBy的原理和使用方法; # 2-聚合运算:学会分组数据的聚合运算方法和函数使用; 类似于 SQL思想 # 3-分组运算:重点 apply方法的使用 # 4-数据透视表:学会构建数据透视表和交叉表 # 一,GroupBy: # 步骤:s 阅读全文
posted @ 2020-06-03 16:40 collin_pxy 阅读(245) 评论(0) 推荐(0) 编辑
摘要: VBA处理数据与Python Pandas处理数据案例比较 Author : Collin_PXY 需求: 现有一个 csv文件,包含'CNUM'和'COMPANY'两列,数据里包含空行,且有内容重复的行数据。 要求: 1)去掉空行; 2)重复行数据只保留一行有效数据; 3)修改'COMPANY'列 阅读全文
posted @ 2020-06-03 16:37 collin_pxy 阅读(308) 评论(0) 推荐(0) 编辑