摘要:
直接上代码,顺便在这里记录,时间2190906. 刚开始爬贝壳网的,发现有反爬虫,我也不会绕,换了链家网,原来中文也可以做变量。 spider.py item.py settings.py 只用到了3个y文件,其他的都是命令生成的,保持默认。 执行结果: 阅读全文
摘要:
提取电影网站的片名,导演,影片播放地址。 item.py spider,py settings.py 1 FEED_EXPORT_ENCODING ='utf-8' #插入这两行,解码成中文,不然出现的是乱码 2 FEED_EXPORT_ENCODING = 'gb18030' 运行 scrapy 阅读全文
摘要:
使用scrapy里自带的Image功能下载,下面贴代码,解释在代码的注释里。 items.py settings.py spider.py(这里是carhome) pipelines.py 代码就这么多,下面执行一下: 文件夹结果: 还不会的快去试试吧! 阅读全文
摘要:
python编程时,经常和文件、目录打交道,这是就离不了os模块。os模块包含普遍的操作系统功能,与具体的平台无关。以下列举常用的命令 1. os.name——判断现在正在实用的平台,Windows 返回 ‘nt'; Linux 返回’posix' 用python IDLE测试,可以直接返回结果,如 阅读全文
摘要:
1、打开文件 with语句的语法 with open('1.txt','r') as f: print(f.read()) 2.操作文件 1)写文件 函数格式:write(str)返回值:返回所写入文件的字符串中的字符数。说明:该函数可以一次性写入一个字符串内容,到文件中。每次写入文件是,如果使用的 阅读全文
摘要:
pip install pyspider 最终解决方案:(参考 http://www.v2ex.com/t/173842) 1: http://www.lfd.uci.edu/~gohlke/pythonlibs/ 下载 pycurl-7.19.5.3-cp27-none-win_amd64.whl 阅读全文
摘要:
安装方法 1.去官网下载最新版的ZIP包 发现是easygui-0.97.zip,没关系,解压到任意地方 找到easygui.py,拷贝进电脑Python安装目录下的Lib\site-packages文件夹下 这时打开IDLE,import easygui,回车,如果没报错,那就是识别到了。 但是运 阅读全文
摘要:
大小写处理 判断字符串中的字符类型 字符串替换 去空格 用特定符连接单个字符 用字符串中的特定符分割字符串 搜索 python中str函数isdigit、isdecimal、isnumeric的区别 isdigit()True: Unicode数字,byte数字(单字节),全角数字(双字节),罗马数 阅读全文
摘要:
摘自 https://www.cnblogs.com/chendai21/p/8125422.html 一,创建列表 只要把逗号分隔的不同的数据项使用方括号([ ])括起来即可 下标(角标,索引)从0开始,最后一个元素的下标可以写-1 list = ['1',‘2,‘3’] list = [] 空列 阅读全文
摘要:
魔法传送门 https://blog.csdn.net/qq_44884619/article/details/89277657 font-family:'Microsoft YaHei'。 1、网页字体样式华文黑体:STHeiti 2、网页字体样式华文楷体:STKaiti 3、网页字体样式华文宋体 阅读全文