摘要: Python第三方库 jieba - 分词 matplotlib - 绘图 PIL - 图片处理 numpy - 矩阵运算 sqlite3 - sqlite数据库 Flask - web框架 urllib - URL处理,网页爬虫 bs4 - 解析文档-html re - 正则表达式,文字匹配 xl 阅读全文
posted @ 2020-07-18 12:09 丨Kouch 阅读(121) 评论(0) 推荐(0) 编辑
摘要: Python爬虫 # 开发思路 准备 - 分析网页内容-结合chrome开发者模式 爬取原始数据 HTTP库 提取/清洗数据 保存 # 引入包 urllib - 指定url 获取网页信息 bs4 - 解析网页 re - 正则表达式,文字匹配 xlwt - excel操作 sqlite3 - SQLi 阅读全文
posted @ 2020-07-18 12:08 丨Kouch 阅读(92) 评论(0) 推荐(0) 编辑
摘要: Python语法-基本 # 基本内置数据结构 字符串 列表 元组 字典 集合 1 字符串操作 截取: str[x] str[:x] / str[x:] str[x:x:x] 连接 x+x 输出(忽略转义) print(r"x") 内置方法 编码encode/解码decode 判断字符串内容的isal 阅读全文
posted @ 2020-07-18 12:05 丨Kouch 阅读(137) 评论(0) 推荐(0) 编辑