文章分类 - 数据分析
摘要:一、背景 在做数据分析时,有时候Python的Pandas会把Excel中的文本数据(例如编号,身份证号)识别为’float’或’int’类型,导致数据类型出现错误,我们不希望它改变数据的类型。比如:卡号的数据类型是字符串,我们不希望它读取后,类型改为数字类型 二、脚本编写 1、错误演示 在不做任何
阅读全文
摘要:一、问题描述 通常CSV文件可以用excel正常打开,但使用EXCEL打开后,原本应该出现中文地方都变成乱码了。这种情况怎么解决呢?如下图: 二、解决思路一 在简体中文环境下,EXCEL打开的CSV文件默认是ANSI编码,如果CSV文件的编码方式为utf-8、Unicode等编码可能就会出现文件乱码
阅读全文
摘要:一、背景 在日常的数据分析工作中,经常会去寻找数据来源,因此会时常见到网页表格信息,并且不能直接复制到excel表中。为了能快速的将网页中的表格信息获取,并进行分析总结,最后呈报上级领导。所以需要思考怎么去获取信息更方便快捷,当然正常的网页爬取也是可行,但是要相对复杂一些,这里我们选用pandas库
阅读全文
摘要:一、背景 在日常工作中经常回用到数据分析与统计工作,而在实施数据分析之前,最为最要的就是数据的搜集、整理工作。这里介绍一下多个相同格式的excel合并的处理。如果在excel文件表比较少时,手工合并还可以应付,当几十个几百个甚至更多的表时,手工合并效率会非常低,于是让计算机自动合并处理,帮助我们完成
阅读全文
摘要:一、背景 python自动化测试中,有时候也需要使用到Excel文件,而此时要借用第三方库才能进行操作。在执行读execl文件时要用到xlrd库,要写入数据至excel文件时,要用到xlwt库,它们需要单独安装,安装方式也非常简单。当然也可以用其他的第三方库,比如openpyxl和xlutils库。
阅读全文