使用 Json 文件存储
将爬取到的数据以 Json 文件形式存储:
import json import requests req = requests.get('http://www.baidu.com/') data = { 'code': req.status_code, 'url': req.url, 'text': req.text } with open('/tmp/1.json', 'w') as fd: json.dump(data, fd)
结果如下:
{ "code":200, "url":"http://www.baidu.com/", "text":"<!DOCTYPE html>......</html>" }