摘要:
爬取多页电影信息及简介 爬取标题,评分,排名,摘要,剧情简介 使用 Feed exports 保存爬取的数据 代码: 阅读全文
摘要:
数据持久化的需求: 与其他系统交互的需求 数据持久化的方式: 保存为文件: json csv 保存到数据库中: mysql MongoDB 将数据保存在文件中的方法: Feed exports:将数据导出成常用格式的方法 默认支持的格式: JSON、JSON line、CSV、XML 使用方法: 在 阅读全文
摘要:
优势: 更加通用(适应任何语言) 可以提取文本中的指定信息 可以提取非HTML中的信息 劣势: 语法比较晦涩 常用方法: 正则表达式符号: 阅读全文