摘要:
blog导航 在左下侧:随笔分类 简要做个导航图放到这儿方便大家查阅 直奔爬虫: 点击-> 直奔oracle:点击-> 阅读全文
摘要:
个人总结爬虫的学习曲线,可分为三个阶段,一、 主要在填充基础知识,要熟悉http协议,学习正则表达式,首先基于jdk的基础包的网络功能,.net包下的 httpurlconnction从细节上简单访问网络数据,进一步可以减去一些繁琐的封装功能(请求参数),使用httpClient (4.2.1)版... 阅读全文
摘要:
1.transformation和action的区别 Transformation:代表的是转化操作就是我们的计算流程,返回是RDD[T],可以是一个链式的转化,并且是延迟触发的。 Action:代表是一个具体的行为,返回的值非RDD类型,可以一个object,或者是一个数值,也可以为Unit代表无 阅读全文
摘要:
1:数据倾斜 理论 hive数据倾斜可能的原因有哪些?主要解决方法有哪些? 原因 1:数据倾斜多由于脏数据/特殊数据 (某一类数据集中) 2:大小表join 3:小文件过多; 解决方案 1:脏数据不参与关联,给特数据数据做随机(建表时) 2:使用mapjoin将小表加入内存。 3:合并小文件,通过s 阅读全文
摘要:
无线模式开启: adb tcpip 48887 参考引用: https://www.cnblogs.com/xieqiankun/p/wireless-mode-of-poco.html 阅读全文
摘要:
回顾一下,前面我们讲到启动geth geth --rpc --datadir "F:/geth/Geth/" --light console 2>console.log 这一篇接着上面讲geth的使用,分为4个部分 1、创建账户 2、验证区块是否更新完毕 3、解锁账户 4、转账 此时进入到命令行模式 阅读全文
摘要:
这里是第一篇,主要讲eth客户端安装 eth官网 https://ethereum.org/ 国内有一个论坛内容挺多的,可以参考 http://ethfans.org/ eth客户端: eth客户端种类很多,go,Java,Python等各种语言写的都有 目前最常用的,官网推荐的有带图形界面的 mi 阅读全文
摘要:
一.Matplotlib介绍 Matplotlib是一个Python的2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。通过Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,折线图、散点图、柱状图、饼图、直方图、子图等。Matplotlib使用NumPy进行数组 阅读全文
摘要:
可以试试切换下你的NPM源。看是否能得到解决。国内的NPM有CNPM和淘宝的NPM源比较稳定。npm源切换和工具可参照站内贴 nrm工具的使用或者是直接用命令切换 阅读全文
摘要:
最后的2行错误信息是 1 2 发现是six出现了问题,用pip更新一下six,问题并没有解决,原因是并没有真正更新six的文件。在python下输入: 1 2 /System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/py 阅读全文
摘要:
安装: https://jupyter.readthedocs.io/en/latest/install.html#install 配置 Ubuntu 16.04 LTS 配置 Jupyter notebook 为服务器 原材料: Ubuntu 16.04 LTS 64bit 已经配置好 IPyth 阅读全文
摘要:
时间: 2017.03.21 分类: 【操作系统】 评论 Mac下的readlink没有-f参数,诸如screenfetch又会去调用readlink -f,于是每次都会出现: readlink: illegal option -- f usage: readlink [-n] [file ...] 阅读全文