摘要: 在抓取网络数据的时候,有时会用正则对结构化的数据进行提取,比如 href="https://www.1234.com"等。python的re模块的findall()函数会返回一个所有匹配到的内容的列表,在将数据存入数据库时,列表数据类型是不被允许的,而是需要将其转换为元组形式。下面看下,str/li 阅读全文
posted @ 2019-04-01 16:21 正态分个布 阅读(4953) 评论(0) 推荐(0) 编辑
摘要: 在写网络爬虫的时候,有时候会抓取到一些json格式的字符串,想要通过python字典的方式对字串中的内容进行寻址,则需要将json字符串先转换为python字典。 dumps()函数: loads()函数: 示例: 阅读全文
posted @ 2019-04-01 11:21 正态分个布 阅读(1642) 评论(0) 推荐(0) 编辑