houziaipangqi

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2018年9月12日

摘要: 本人半道出家,自学python,才疏学浅,如有错误的地方,还望大神纠正 所谓爬虫,就是一段代码,可以爬取网页信息的代码,可以说未来的世界,数据就是财富,可见数据的重要性,但怎样获得数据是一个问题,而爬虫是一个很好的选择。 我只接触过python,所以在此写写学习python及爬虫的一些东西 学习写爬 阅读全文
posted @ 2018-09-12 22:08 houziaipangqi 阅读(198) 评论(0) 推荐(0) 编辑

摘要: # 正则表达式(Regular Expression,re)-用来匹配符合某个规则的字符串-检索/替换某些文本数据 #正则的写法- .(点号):表示任意一个字符,除了\n,比如查找所有的一个字符 .- []:匹配括号中列举的任意字符,比如[L,Y,0],LLY,Y0等都可以- \d:任意一个数字- 阅读全文
posted @ 2018-09-12 21:00 houziaipangqi 阅读(273) 评论(0) 推荐(0) 编辑

摘要: #迭代器-可迭代(Iterable):直接用于for循环的变量#可迭代 #迭代器(Iterator):不但可以作用于for循环,还可以被next调用-list是典型的可迭代对象,但不是迭代器-通过isinstance判断#可迭代l = [i for i in range(10)]#l是可迭代的,但不 阅读全文
posted @ 2018-09-12 20:58 houziaipangqi 阅读(136) 评论(0) 推荐(0) 编辑

摘要: #多进程与多线程-进程:程序运行的一个状态 -包含地址空间/内存/数据栈等 -每个进程有自己独立运行的空间,但数据共享是一个问题-线程 -一个进程的独立运行片段,一个进程可以有多个线程 -轻量化的进程 -一个进程的多个线程间可以共享数据和上下文运行环境 -互斥问题-全局解锁器(GIL) -pytho 阅读全文
posted @ 2018-09-12 20:53 houziaipangqi 阅读(157) 评论(0) 推荐(0) 编辑

摘要: #LOG-logging-logging模块提供模块级别的函数记录日志-包括四大组件 #日志相关概念-日志-日志的级别(level) -不同的用户关注不同的程序信息 -DEBUG -INFO -NOTICE -WARNING -ERROR -CRITICAL -ALERT -EMERGENCT-IO 阅读全文
posted @ 2018-09-12 20:46 houziaipangqi 阅读(210) 评论(0) 推荐(0) 编辑

摘要: #文件常用操作 -打开关闭(一旦打开,必须要有关闭操作) -读写内容 -查找 #open函数-open函数负责打开文件,带有很多参数-第一个参数:必须有,文件的路径和名称-mode:表明文件用什么方式打开 - r:以只读方式打开 - w: 以写方式打开,会覆盖以前的内容 - x:创建方式打开,如文件 阅读全文
posted @ 2018-09-12 20:42 houziaipangqi 阅读(134) 评论(0) 推荐(0) 编辑