摘要:
1.1、Answer:web crawler question 1 概述 Question 1 1、cookie、JavaScript的关系?怎么产生的cookie?cookie包含哪些内容?JavaScript的功能在crawler代码中通过python的第三方库selenium,selenium 阅读全文
摘要:
2、Question about RDD、分区、stage、并行计算、集群、流水线计算、shuffle(join??)、task、executor RDD是spark数据中最基本的数据抽象,task是spark的最小代码执行单元?数据不是代码的资源???那为什么RDD又是分区存储?节点中又是对分区( 阅读全文
摘要:
1、Question about web crawler 难: 1、cookie、JavaScript的关系?怎么产生的cookie?cookie包含哪些内容?JavaScript的功能在crawler代码中通过python的第三方库selenium,selenium用于执行JavaScript的脚 阅读全文