静悟生慧

2020年9月1日

摘要： https://www.cnblogs.com/caiyishuai/p/8646345.html 1.关于set C++ STL 之所以得到广泛的赞誉，也被很多人使用，不只是提供了像vector, string, list等方便的容器，更重要的是STL封装了许多复杂的数据结构算法和大量常用数据结构阅读全文

posted @ 2020-09-01 17:22 静悟生慧阅读(228) 评论(0) 推荐(0) 编辑

2020年8月31日

二分查找题目汇总

摘要： https://blog.csdn.net/luoshengkim/article/details/52103427 457. Classical Binary Search 这是一道非常经典的二分查找题，给出一个有序数组以及一个目标值target，要求返回target在数组中的位置，若数组里不存在阅读全文

posted @ 2020-08-31 15:45 静悟生慧阅读(599) 评论(0) 推荐(0) 编辑

2020年8月11日

java.lang.ClassCastException: org.apache.hadoop.io.Text cannot be cast to org.apache.h...

摘要：当insert数据到表时抛出异常： Diagnostic Messages for this Task: Error: java.lang.RuntimeException: java.lang.ClassCastException: org.apache.hadoop.io.Text cannot 阅读全文

posted @ 2020-08-11 17:05 静悟生慧阅读(3811) 评论(0) 推荐(0) 编辑

2020年8月3日

每日温度

摘要：根据每日气温列表，请重新生成一个列表，对应位置的输入是你需要再等待多久温度才会升高的天数。如果之后都不会升高，请输入 0 来代替。例如，给定一个列表 temperatures = [73, 74, 75, 71, 69, 72, 76, 73]，你的输出应该是 [1, 1, 4, 2, 1, 阅读全文

posted @ 2020-08-03 10:17 静悟生慧阅读(188) 评论(0) 推荐(0) 编辑

2020年7月30日

C++ STL总结

摘要： STL简介为了建立数据结构和算法的一套标准，并且降低他们之间的耦合关系，以提升各自的独立性、弹性、交互操作性(相互合作性,interoperability),诞生了STL。 STL提供了六大组件，彼此之间可以组合套用，这六大组件分别是:容器、算法、迭代器、仿函数、适配器（配接器）、空间配置器。容阅读全文

posted @ 2020-07-30 14:08 静悟生慧阅读(235) 评论(0) 推荐(0) 编辑

C++ 字符串基本操作

摘要：一、知乎总结： 1）string类介绍 2）容器操作 3）修改 4）查找 5）比较 https://zhuanlan.zhihu.com/p/136244569 二、常用操作 C风格字符串： C风格字符串初始化 C风格字符串常见操作 string类： string类初始化 string类常见操作 C 阅读全文

posted @ 2020-07-30 10:48 静悟生慧阅读(939) 评论(0) 推荐(0) 编辑

2020年7月29日

GBDT 特征重要度计算

摘要： GBDT原理和推导：https://blog.csdn.net/yangxudong/article/details/53872141 Pyspark 分类、回归、聚类示例： https://blog.csdn.net/littlely_ll/article/details/78151964 htt 阅读全文

posted @ 2020-07-29 10:14 静悟生慧阅读(1673) 评论(0) 推荐(0) 编辑

2020年7月28日

pyspark GBTRegressor 特征重要度及排序

摘要： GBTRegressor 模型评估指标和特征重要度分析官方文档：https://spark.apache.org/docs/2.2.0/api/python/_modules/pyspark/ml/regression.html 和随机森林类似，训练好model 可用如下代码打印特征以及重要度排序阅读全文

posted @ 2020-07-28 11:20 静悟生慧阅读(1432) 评论(0) 推荐(0) 编辑

2020年7月24日

hive 内部表和外部表总结

摘要： 1. 外部表（external table）有external修饰，表数据保存在HDFS上，该位置由用户指定。删除表时，只会删除表的元数据，所以外部表不是有Hive完全管理的 2. 内部表(internal table/managed table) 没有external修饰，表数据保存在Hive默阅读全文

posted @ 2020-07-24 14:49 静悟生慧阅读(857) 评论(0) 推荐(0) 编辑

2020年7月22日

hadoop 查看目录下总的大小

摘要： 1、数据迁移过程中，验证数据拷贝后大小是否一致； shell命令： hadoop fs -count -q 目录 ps：查看目录下总的大小 dfs -count -q 目录 ps：一样的 hadoop fs -du 目录 ps：查看目录下每个子目录的大小 2、随机森林和GBDT的区别 https: 阅读全文

posted @ 2020-07-22 16:05 静悟生慧阅读(1838) 评论(0) 推荐(0) 编辑

公告