摘要: 1. 正则表达式 https://www.cnblogs.com/douzujun/p/7446448.html 单词边界的用法(非常好用啊!!!) 比如,我只想替换 app 为 qq,不像替换掉 apple和application里的app re.findall(r'\b\d{3}\b', '11 阅读全文
posted @ 2020-01-29 23:07 douzujun 阅读(1074) 评论(0) 推荐(0) 编辑
摘要: 1. 基于bs4库的HTML内容查找方法 1.1 <>.find_all() 和 re (正则表达式库) (1)参数为单一字符串 (2)参数为 列表 (3)参数为True,则返回所有标签内容 (4)显示 以 b 开头的标签,如 b,body。(使用 re:正则表达式库) import request 阅读全文
posted @ 2020-01-29 20:19 douzujun 阅读(289) 评论(0) 推荐(0) 编辑
摘要: 1. 信息提取的一般方法 1.1 方法一 1.2 方法2 1.3 方法3 2. 实例 import requests from bs4 import BeautifulSoup r = requests.get("http://python123.io/ws/demo.html") demo = r 阅读全文
posted @ 2020-01-29 19:48 douzujun 阅读(226) 评论(0) 推荐(0) 编辑
摘要: 官网下载好anaconda,然后 bash Anaconda3-5.2.0-Linux-x86_64.sh 安装时候,需要输入的地方输入yes,然后一路回车: 安装完成,打开 .bashrc文件,添加把 export xxxx 写到最后一行,保存 sudo gedit ~/.bashrc expor 阅读全文
posted @ 2020-01-29 00:07 douzujun 阅读(205) 评论(0) 推荐(0) 编辑