摘要:
在公司开发中,有时候会存在公司账户跟私人账户共存,并随时需要切换的情况,这种情况下git可以配置多个ssh-key,无缝切换账号。 假如有两个github账号,一个是私人github账号,一个是公司github账号 私人账号: github用户名:my email:convict@qq.com 公司 阅读全文
摘要:
释义 groupby用来分组,调用groupby 之后返回pandas.core.groupby.generic.DataFrameGroupBy,其实就是由一个个格式为(key, 分组后的dataframe)的元组,组成的列表: [(key1, dataframe1), (key2, datafr 阅读全文
摘要:
isna() 释义 筛选为NaN的布尔值,可接受单个标量或者数组 举例 筛选stu_name为NaN的所有行: df = pd.DataFrame({'stu_name': ['Tom', 'Tony', 'Jack', 'Jack', np.nan], 'stu_age': [16, 16, 15 阅读全文
摘要:
释义 根据RDD中的某个属性进行分组,分组后形式为(k, [v1, v2, ...]) 方法签名如下: def groupByKey(): RDD[(K, Iterable[V])] = self.withScope { ... } 案例 查看每个科目有哪些学生选择 object TestGroup 阅读全文
摘要:
释义 根据RDD中的某个属性进行分组,分组后形式为(k, [(k, v1), (k, v2), ...]),即groupBy 后组内元素会保留key值 方法签名如下: def groupBy[K](f: T => K)(implicit kt: ClassTag[K]): RDD[(K, Itera 阅读全文
摘要:
一、冒泡排序 百度百科 public static void bubbleSort(int[] ints) { for(int i = 0; i < ints.length - 1; i++) { for(int j = 0; j < ints.length - 1 - i; j++) { if ( 阅读全文
摘要:
1. 修改/etc/systemd/system.conf sudo vim /etc/systemd/system.conf 2. 找到一下两行 #DefaultTimeoutStartSec=90s #DefaultTimeoutStopSec=90s 3. 取消注释并修改为 DefaultTi 阅读全文
摘要:
释义 reduceByKey类似reduce,但reduceByKey 是先根据key进行分组,再将每个组内的记录归并成1个记录,最终返回一个PairRDD,k为key类型,v为每个组归并后的记录类型 方法签名如下: def reduceByKey(func: (V, V) => V): RDD[( 阅读全文
摘要:
释义 reduce将partition内所有记录最终计算成1个记录,结果类型与reduce 时数据类型一致 方法签名如下: def reduce(f: (T, T) => T): T = withScope { ... } f: 每个partition内,每每两条记录进行归并计算。输入类型为U跟U, 阅读全文
摘要:
初始化测试数据 df = pd.DataFrame({'stu_name': ['Nancy', 'Tony', 'Tim', 'Jack', 'Lucy'], 'stu_age': [17, 16, 16, 21, 19]}) stu_name stu_age 0 Nancy 17 1 Tony 阅读全文