摘要:
https://www.cnblogs.com/caiyishuai/p/8646345.html 1.关于set C++ STL 之所以得到广泛的赞誉,也被很多人使用,不只是提供了像vector, string, list等方便的容器,更重要的是STL封装了许多复杂的数据结构算法和大量常用数据结构 阅读全文
摘要:
https://blog.csdn.net/luoshengkim/article/details/52103427 457. Classical Binary Search 这是一道非常经典的二分查找题,给出一个有序数组以及一个目标值target,要求返回target在数组中的位置,若数组里不存在 阅读全文
摘要:
当insert数据到表时抛出异常: Diagnostic Messages for this Task: Error: java.lang.RuntimeException: java.lang.ClassCastException: org.apache.hadoop.io.Text cannot 阅读全文
摘要:
根据每日 气温 列表,请重新生成一个列表,对应位置的输入是你需要再等待多久温度才会升高的天数。如果之后都不会升高,请输入 0 来代替。 例如,给定一个列表 temperatures = [73, 74, 75, 71, 69, 72, 76, 73],你的输出应该是 [1, 1, 4, 2, 1, 阅读全文
摘要:
STL简介 为了建立数据结构和算法的一套标准,并且降低他们之间的耦合关系,以提升各自的独立性、弹性、交互操作性(相互合作性,interoperability),诞生了STL。 STL提供了六大组件,彼此之间可以组合套用,这六大组件分别是:容器、算法、迭代器、仿函数、适配器(配接器)、空间配置器。 容 阅读全文
摘要:
一、知乎总结: 1)string类介绍 2)容器操作 3)修改 4)查找 5)比较 https://zhuanlan.zhihu.com/p/136244569 二、常用操作 C风格字符串: C风格字符串初始化 C风格字符串常见操作 string类: string类初始化 string类常见操作 C 阅读全文
摘要:
GBDT原理和推导:https://blog.csdn.net/yangxudong/article/details/53872141 Pyspark 分类、回归、聚类示例: https://blog.csdn.net/littlely_ll/article/details/78151964 htt 阅读全文
摘要:
GBTRegressor 模型评估指标和特征重要度分析 官方文档:https://spark.apache.org/docs/2.2.0/api/python/_modules/pyspark/ml/regression.html 和随机森林类似,训练好model 可用如下代码打印特征以及重要度排序 阅读全文
摘要:
1. 外部表(external table) 有external修饰,表数据保存在HDFS上,该位置由用户指定。删除表时,只会删除表的元数据,所以外部表不是有Hive完全管理的 2. 内部表(internal table/managed table) 没有external修饰,表数据保存在Hive默 阅读全文
摘要:
1、数据迁移过程中,验证数据拷贝后大小是否一致; shell命令: hadoop fs -count -q 目录 ps: 查看目录下总的大小 dfs -count -q 目录 ps:一样的 hadoop fs -du 目录 ps:查看目录下每个子目录的大小 2、随机森林和GBDT的区别 https: 阅读全文