摘要: mybatis https://blog.csdn.net/qq_45656077/article/details/129923785 https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=0C4E83CE82045550C147C782750B221 阅读全文
posted @ 2023-05-21 20:55 千千寰宇 阅读(311) 评论(0) 推荐(1)
摘要: 场景:测试目标主机端口是否联通 序言 一般情况下,使用telnet ip port判断端口通不通,其实测试方法不止这一种,还有很多种方法。 本文提供的网络可达性测试方法:基于传输层(host + port)的工作原理 方法1 telnet telnet是Windows标准服务,可直接用; 如果是Li 阅读全文
posted @ 2023-03-16 14:16 千千寰宇 阅读(698) 评论(0) 推荐(1)
摘要: 序:总体思路 python pytorch-GPU 环境搭建 (CUDA 11.2) - CSDN Step0 升级Nvidia显卡的驱动程序 以笔者的 GeForce GTX 1650 显卡为例,驱动程序版本为 462.30,计划升级到版本 > 465.19.01 (以便能正常安装 PyTorch 阅读全文
posted @ 2026-01-05 23:39 千千寰宇 阅读(197) 评论(0) 推荐(0)
摘要: 浏览器Cookie技术 序言 今日打开电脑浏览器访问一个新网站时,再次弹出了是否需要接受cookie策略的弹窗。 已经好几年不写前端代码了,在笔者的印象中,至少2018年前就一直在说Google Chrome要移除cookie技术。 那么到了2026年了,为啥这个技术还在呢?相信不搞前端或不熟悉前端 阅读全文
posted @ 2026-01-04 12:51 千千寰宇 阅读(699) 评论(2) 推荐(0)
摘要: 0 序 DuckDB 是近期非常火的一款 AP 数据库,其独特的定位很有趣。甚至有数据库产品考虑将其纳入进来,作为分析能力的扩展。 考虑到项目中一个数据处理场景,就此调研一二。 DuckDB 的爆火,也给所有盲目追逐“大数据”的技术人敲响了警钟: DuckDB 是一场复古的叛逆,也是一场属于单机的复 阅读全文
posted @ 2026-01-03 23:24 千千寰宇 阅读(51) 评论(0) 推荐(0)
摘要: 0 序 在近期查看一篇技术文章时,博主提及到了 OSS Insight 这个新词汇,出于好奇便搜索、使用、初步研究了一二。 在当今快速发展的技术世界中,开源软件扮演着越来越重要的角色。然而,面对数以百万计的开源项目和贡献者,如何有效地分析和洞察这个庞大的生态系统呢? OSS Insight应运而生, 阅读全文
posted @ 2026-01-03 20:31 千千寰宇 阅读(10) 评论(0) 推荐(0)
摘要: 1 需求描述 个人服务器的磁盘空间不足了,恍然发现主要是 docker 占用了太多空间。那么如何安全地清理Docker服务占用的磁盘空间呢? 2 解决方案 检查磁盘空间情况 检查磁盘空间,确认overlay2占用的空间 # df -h Filesystem Size Used Avail Use% 阅读全文
posted @ 2026-01-01 00:21 千千寰宇 阅读(241) 评论(0) 推荐(0)
摘要: 0 引言 Presto (Trino) 在 Facebook 的诞生最开始是为了填补当时 Facebook 内部实时查询和 ETL 处理之间的空白。 Presto 的核心目标就是提供【交互式查询】,也就是我们常说的 Ad-Hoc Query(即席查询),很多公司都使用它作为 OLAP 计算引擎。 但 阅读全文
posted @ 2025-12-24 01:18 千千寰宇 阅读(34) 评论(0) 推荐(0)
摘要: 0 序 这个有趣的数据结构,以前最早在Hadoop的mr和几年前用Python写自动文本摘要算法时用到过(基于此自己实现了滑动窗口)。 这次是在flink的一个业务场景中使用上了,总结一二。 1 概述:循环队列 循环队列 循环队列: 一种先进先出(FIFO)的数据结构——它通过将【顺序队列】的末尾连 阅读全文
posted @ 2025-12-13 23:56 千千寰宇 阅读(26) 评论(0) 推荐(0)
摘要: 1 概述:Flink 安装部署篇 1.0 前置知识 1.0.1 Flink 概述 Apache Flink 概述 - 博客园/千千寰宇 1.0.2 Flink Demo Job Flink Demo Job : WordCount - 博客园/千千寰宇 1.1 Windows下安装 Flink 1. 阅读全文
posted @ 2025-12-11 01:20 千千寰宇 阅读(71) 评论(0) 推荐(0)
摘要: 1 概述: Podman 当我们谈论容器时,我们首先想到的默认工具就是Docker。但自从 Docker 诞生以来,容器领域已经有了很多发展,特别是在容器安全方面。Podman 是解决安全问题的项目之一。 Podman(POD Manager)是一个开源的无守护进程(daemonless)容器引擎, 阅读全文
posted @ 2025-12-07 21:03 千千寰宇 阅读(151) 评论(0) 推荐(0)
摘要: 0 序 学习一款新的Python依赖包管理与环境管理工具: UV。 "最近几个月,我注意到一个现象:看到的新开源项目里,越来越多开始在README里写uv pip install而不是pip install。" 2025年,Python包管理工具已经由pip变成了uv? - Weixin/机器学习实 阅读全文
posted @ 2025-12-05 23:55 千千寰宇 阅读(85) 评论(0) 推荐(0)
摘要: 1 概述:一致性哈希算法 一致性哈希(Consistent Hashing)是一种特殊的哈希算法,其主要用于在分布式系统中实现【数据的负载均衡】和【高可用性】。 它解决了【传统哈希方法】在节点增减时导致【大量数据迁移】的问题。 一致性哈希的基本原理 1. 哈希环(Hash Ring) 将整个哈希空间 阅读全文
posted @ 2025-11-25 00:33 千千寰宇 阅读(26) 评论(0) 推荐(0)
摘要: 1 概述: OpenGemini 发展历程暨版本特性 OpenGemini 是由华为云发起并开源的一款高性能、高可用、云原生的分布式时序数据库(Time Series Database, TSDB)。 其目标是为物联网(IoT)、运维监控、金融等领域提供高效的时间序列数据存储与分析能力。 自 202 阅读全文
posted @ 2025-11-25 00:17 千千寰宇 阅读(4) 评论(0) 推荐(0)
摘要: 0 序言 续接[数据存储] 浅谈大数据领域的数据存储格式:ORC / Avro / Parquet / Arrow- 博客园/千千寰宇,展开回顾一下 Hive 的数据存储格式。 1 概述: Hive Hive支持多种存储格式,选择合适的存储格式对于提升查询性能和存储效率至关重要。 常见的Hive存储 阅读全文
posted @ 2025-11-24 01:17 千千寰宇 阅读(17) 评论(0) 推荐(0)
摘要: 0 序 数据存储格式,区别于压缩格式、归档格式,如: gzip、zstd、zip、rar、7z等。 如: orc / avro / parquet 等。 1 概述:大数据领域的数据存储格式 在当今大数据生态系统中,高效、可靠且可扩展的数据存储格式是支撑海量数据分析与处理的关键基础。 Apache O 阅读全文
posted @ 2025-11-24 01:16 千千寰宇 阅读(30) 评论(0) 推荐(0)
摘要: 1 概述 Volcano是 CNCF 下首个也是唯一的基于Kubernetes的容器批量计算平台,主要用于高性能计算场景。 Volcano 是一个开源的 Kubernetes 批处理系统,专为高性能计算任务设计。 它提供了一种高效的方式来管理和调度资源密集型作业。比如:大数据处理和机器学习任务。 它 阅读全文
posted @ 2025-11-20 01:04 千千寰宇 阅读(163) 评论(0) 推荐(0)