摘要:
代码: <script> var chartDom = document.getElementById('main3'); var myChart = echarts.init(chartDom); var option; window.onload = function () { getSpide 阅读全文
摘要:
一. 数据采集(要求至少爬取三千条记录,时间跨度超过一星期)数据采集到本地文件内容 爬取详见:python爬取京东评论 爬取了将近20000条数据,156个商品种类,用时2个多小时,期间中断数次 二、数据预处理:要求使用MapReduce或者kettle实现源数据的预处理,对大量的Json文件,进行 阅读全文
摘要:
一.分析 1.找到京东商品评论所在位置(记得点击商品评论,否则找不到productPageComments.action) 2.解析文件 打开后发现是json数据,但不是那么规范,所以需要去点前面的字符串和括号,还有最后一行的分号和括号 3.放到json解析器可以看到数据的结构 4.解析网址 里面的 阅读全文