摘要: 代码: <script> var chartDom = document.getElementById('main3'); var myChart = echarts.init(chartDom); var option; window.onload = function () { getSpide 阅读全文
posted @ 2022-03-16 18:01 睡觉不困 阅读(657) 评论(0) 推荐(0) 编辑
摘要: 一. 数据采集(要求至少爬取三千条记录,时间跨度超过一星期)数据采集到本地文件内容 爬取详见:python爬取京东评论 爬取了将近20000条数据,156个商品种类,用时2个多小时,期间中断数次 二、数据预处理:要求使用MapReduce或者kettle实现源数据的预处理,对大量的Json文件,进行 阅读全文
posted @ 2022-03-16 17:50 睡觉不困 阅读(1072) 评论(0) 推荐(1) 编辑
摘要: 一.分析 1.找到京东商品评论所在位置(记得点击商品评论,否则找不到productPageComments.action) 2.解析文件 打开后发现是json数据,但不是那么规范,所以需要去点前面的字符串和括号,还有最后一行的分号和括号 3.放到json解析器可以看到数据的结构 4.解析网址 里面的 阅读全文
posted @ 2022-03-16 17:14 睡觉不困 阅读(3414) 评论(0) 推荐(0) 编辑