摘要:
经常用火车头采集器的站长朋友,可能会遇到需要需要使用Xpath方式获取地址的方法来采集网址。今天品自行说一下如何用Chrome浏览器查看html元素,进行XPath定位,找到XPath路径。 1、下载并安装Chrome浏览器(就是Google浏览器),打开目标网页; 2、使用快捷键ctrl+shif 阅读全文
摘要:
python数据预处理的三种情况 1、缺失数据的处理 导入的数据存在缺失是经常发生的,最简单的处理方式是删除缺失的数据行。使用 pandas 中的 .dropna() 删除含有缺失值的行或列,也可以 对特定的列进行缺失值删除处理 。 JavaScript dfNew = dfData.dropna( 阅读全文
摘要:
python如何读取不同格式文件 分析问题所用的数据都是保存在数据文件中的,首先就要从数据文件读取数据。 1、数据文件的格式很多,最常用的是 .csv,.xls 和 .txt 文件,以及 sql 数据库文件的读取。 2、使用pandas 从数据文件导入数据的程序最为简单。 不同格式的使用案例 (1) 阅读全文