摘要: 阅读全文
posted @ 2018-08-23 20:38 菜鸟key 阅读(171) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2018-08-23 20:25 菜鸟key 阅读(141) 评论(0) 推荐(0) 编辑
摘要: re库的基本使用 阅读全文
posted @ 2018-08-23 16:48 菜鸟key 阅读(255) 评论(0) 推荐(0) 编辑
摘要: import requests from bs4 import BeautifulSoup import bs4 def getHTMLText(url): try: r = requests.get(url, timeout=30) r.raise_for_status() r.encoding = r.appar... 阅读全文
posted @ 2018-08-23 16:39 菜鸟key 阅读(320) 评论(0) 推荐(0) 编辑
摘要: 标记后的信息可形成信息组织结构,增加了信息维度标记的结构与信息一样具有重要价值标记后的信息可用于通信、存储或展示标记后的信息更利于程序理解和运用 信息标记的三种形式: XMLJSONYAML 基于bs4库的HTML内容查找方法 阅读全文
posted @ 2018-08-23 15:32 菜鸟key 阅读(276) 评论(0) 推荐(0) 编辑