2018 年 8月 23 日随笔档案 - 菜鸟key

2018年8月23日

第三周 3 re库的贪婪匹配和最小匹配

摘要：阅读全文

posted @ 2018-08-23 20:38 菜鸟key 阅读(171) 评论(0) 推荐(0) 编辑

第三周 2 re库match对象

摘要：阅读全文

posted @ 2018-08-23 20:25 菜鸟key 阅读(141) 评论(0) 推荐(0) 编辑

第三周 1 re库的基本使用

摘要： re库的基本使用阅读全文

posted @ 2018-08-23 16:48 菜鸟key 阅读(255) 评论(0) 推荐(0) 编辑

第二周 3（实战：中国大学排名定向爬虫）

摘要： import requests from bs4 import BeautifulSoup import bs4 def getHTMLText(url): try: r = requests.get(url, timeout=30) r.raise_for_status() r.encoding = r.appar... 阅读全文

posted @ 2018-08-23 16:39 菜鸟key 阅读(320) 评论(0) 推荐(0) 编辑

第二周 2（信息标记与提取）

摘要：标记后的信息可形成信息组织结构，增加了信息维度标记的结构与信息一样具有重要价值标记后的信息可用于通信、存储或展示标记后的信息更利于程序理解和运用信息标记的三种形式： XMLJSONYAML 基于bs4库的HTML内容查找方法阅读全文

posted @ 2018-08-23 15:32 菜鸟key 阅读(276) 评论(0) 推荐(0) 编辑

菜鸟key

公告