平平淡淡以明志

2026年3月4日

摘要：阅读全文

posted @ 2026-03-04 17:06 平平淡淡以明志阅读(3) 评论(0) 推荐(0)

2026年2月4日

摘要： <View> <Header value="Video Captioning" size="3"/> <View style="margin-bottom: 1em"> <Header value="Video" size="4"/> <Video name="video" value="$vide 阅读全文

posted @ 2026-02-04 10:01 平平淡淡以明志阅读(2) 评论(0) 推荐(0)

2026年1月19日

llm

摘要： import loggingimport jsonimport difflibimport reimport osimport requestsimport pytesseractfrom PIL import Image, ImageOpsfrom io import BytesIOfrom ty 阅读全文

posted @ 2026-01-19 16:04 平平淡淡以明志阅读(4) 评论(0) 推荐(0)

2024年10月30日

HBase 的结构与表的对应关系

摘要：一个 HFile 在 HBase 中对应一个表中特定列族的部分数据。在 HBase 的存储体系中，数据是按照表 -> Region -> Store -> StoreFile -> HFile 这样逐层组织的： Table（表）：HBase 表由多个行和列族组成。 Region：每个表被水平划分成多阅读全文

posted @ 2024-10-30 17:51 平平淡淡以明志阅读(78) 评论(0) 推荐(0)

2024年4月23日

Cassandra节点重启失败 java.lang.RuntimeException: A node with address *** already exists, cancelling join. Use cassandra.replace_address if you want to replace this node.

摘要：问题杀死一个节点后重启报节点已存在： java.lang.RuntimeException: A node with address *** already exists, cancelling join. Use cassandra.replace_address if you want to 阅读全文

posted @ 2024-04-23 11:35 平平淡淡以明志阅读(76) 评论(0) 推荐(0)

2024年3月20日

[Apache Calcite] 允许使用未定义的sql函数

摘要： org.apache.calcite.sql.validate.SqlValidator.Config#withLenientOperatorLookup 设置为true SqlValidator.Config.DEFAULT.withSqlConformance(calciteConnection 阅读全文

posted @ 2024-03-20 14:19 平平淡淡以明志阅读(68) 评论(0) 推荐(0)

2023年8月15日

spark中decode函数

摘要： decode函数 decode(bin, charset) - 使用第二个参数字符集解码第一个参数。 decode(expr, search, result [, search, result ] ... [, default]) - 解码比较 expr 对每个搜索值一一进行。如果 expr 等于搜阅读全文

posted @ 2023-08-15 15:27 平平淡淡以明志阅读(514) 评论(0) 推荐(0)

spark3的bug

摘要： 1.[SPARK-39936][SQL] Store schema in properties for Spark Views，spark视图保存到hive metastore时未清空tableschema导致解析失败 Hive DataType解析器主要发生在Hive的元数据存储（Hive Met 阅读全文

posted @ 2023-08-15 09:38 平平淡淡以明志阅读(108) 评论(0) 推荐(0)

2023年8月14日

Hive SQL 的 ntile 分组切片函数

摘要： Hive SQL 的 ntile 函数用于将分组数据按照顺序切分成n组，并返回当前切片值。如果切片不均匀，默认增加第一个切片的分布。它把有序的数据集合「平均分配」到指定的数量（n）个桶中, 将桶号分配给每一行。如果不能平均分配，则优先分配较小编号的桶，并且各个桶中能放的行数最多相差 1。语法 Hi 阅读全文

posted @ 2023-08-14 19:58 平平淡淡以明志阅读(932) 评论(0) 推荐(0)

2023年8月11日

spark社区bug

摘要： 1.SPARK-26114（已合）repartitionAndSortWithinPartitions 后合并时 PartitionedPairBuffer 的内存泄漏原因这个Spark源码的issue描述了在使用coalesce操作合并分区时可能会导致PartitionedPairBuffer 阅读全文

posted @ 2023-08-11 14:42 平平淡淡以明志阅读(86) 评论(0) 推荐(0)

bigdata6666

公告