摘要: 偶然在网上看到Scrapy这个网站抓取工具,心痒痒想试一下,这一试又是一晚上,成果来之不易,还是记录一下,万一以后用到呢,我用Scrapy抓取了我的CSDN博客信息,以下是整个过程。1.安装 Scrapypip install Scrapy2.新建项目打开命... 阅读全文
posted @ 2018-11-08 07:41 xtfge0915 阅读(199) 评论(0) 推荐(0) 编辑
摘要: Xpath基本语法一、常用的路径表达式:表达式描述实例nodename选取nodename节点的所有子节点//div/从根节点选取/div//选取所有的节点,不考虑他们的位置//div.选取当前节点./div…选取当前节点的父节点…@选取属性//@calss... 阅读全文
posted @ 2018-11-08 04:37 xtfge0915 阅读(276) 评论(0) 推荐(0) 编辑
摘要: 在openlayers中,Layer是Map的必须组成,也是核心要素,今天学习利用openlayers加载各种不同类型的地图数据。内容包括:利用openlayers加载瓦片数据;利用openlayers加载图片数据利用openlayers加载矢量数据利用op... 阅读全文
posted @ 2018-11-04 05:05 xtfge0915 阅读(2116) 评论(1) 推荐(1) 编辑
摘要: 前面写了很多利用python-docx批量处理word文件的教程,但是python-docx不支持doc格式,因此如何将doc文件转为docx文件就是一个需要解决的问题,如果文件少可以另存为,如何文件多呢,因此需要一个doc批量转docx的方法。该方法需要用... 阅读全文
posted @ 2018-10-30 14:58 xtfge0915 阅读(4095) 评论(0) 推荐(0) 编辑
摘要: 图片是Word的一种特殊内容,这篇文章主要内容是如何利用python-docx批量提取Word中的图片,以及如何在Word国插入图片。1.提取Word中的图片并保护成指定格式docx好像并没有直接获取图片的方法,网上的资料也很少,有用的资料我就找到这一篇:如... 阅读全文
posted @ 2018-10-30 13:36 xtfge0915 阅读(5878) 评论(0) 推荐(1) 编辑
摘要: python-docx的表格样式如下:使用方法:table.style='Medium Grid 1 Accent 1' ordocument.add_table(3,4,style='Medium Grid 1 Accent 1')表格样式:Normal Table... 阅读全文
posted @ 2018-10-28 23:50 xtfge0915 阅读(4193) 评论(0) 推荐(0) 编辑
摘要: 表格样式可以分为两种:一要表格的自身的样式,比如边框,对齐方式、背景等,别一种是表格中文字的样式。本文的内容包括:表格样式表格的对齐方式:居中、居左、居右表格的亮度和高度表格边框表格内容的样式字体、字号文字的对齐方式文字颜色一次性引入下面会用到的库:from... 阅读全文
posted @ 2018-10-28 23:25 xtfge0915 阅读(9956) 评论(2) 推荐(0) 编辑
摘要: 前面写了如何处理word中的表格:利用python批量处理Word文件——表格 ,其实我觉得word正文应该很少用到批处理,不过万一有朋友需要呢,我们要处理的文件内容千奇百怪,但我觉得难点其实是如何对我们想处理的内容进行读写,所以这篇博客的主要内容就是wor... 阅读全文
posted @ 2018-10-28 23:23 xtfge0915 阅读(3993) 评论(0) 推荐(1) 编辑
摘要: Word和Excel大概是我们最常碰到的两种文件了,我前面写过pandas的基本操作,利用它可以轻松完成Excel文件的批量处理,那么对于word文件的处理是否也有同样简单的方式,答案是肯定的,这涉及到python的另一个库docx,这篇文章的主要内容是:如... 阅读全文
posted @ 2018-10-28 21:28 xtfge0915 阅读(15125) 评论(0) 推荐(1) 编辑
摘要: 我想这篇博客内容可能比较散,因为我没有任何思路,可能想到哪里写到哪里,工作中用到什么功能写什么功能。1. drop_duplicatesdrop_duplicates()的作用是删除重复行,首先,有这么一个DataFramedf.drop_duplicate... 阅读全文
posted @ 2018-10-28 19:00 xtfge0915 阅读(378) 评论(0) 推荐(0) 编辑