摘要: 1、正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 re 模块使 Python 语言拥有全部的正则表达式功能。 re.match函数 re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。 结 阅读全文
posted @ 2017-09-30 17:19 方木--数据分析与挖掘 阅读(5321) 评论(0) 推荐(0) 编辑
摘要: 关于模拟浏览器登录的header,可以在相应网站按F12调取出编辑器,点击netwook,如下: 以便于不会被网站反爬虫拒绝。 import requests from bs4 import BeautifulSoup def get_movies(): headers = { 'user-agen 阅读全文
posted @ 2017-09-30 11:35 方木--数据分析与挖掘 阅读(951) 评论(0) 推荐(0) 编辑