1 2 3 4 5 ··· 31 下一页
摘要: Textin Tools:https://tools.textin.com/ 阅读全文
posted @ 2024-07-31 15:22 业余砖家 阅读(1) 评论(0) 推荐(0) 编辑
摘要: 1、手动进行字符串格式化 # 坏习惯 name = "Alice" greeting = "Hello, " + name + "!" # 好习惯 name = "Alice" greeting = f"Hello, {name}!" 理由:使用+进行字符串拼接会导致代码可读性差,而且在复杂情况下容 阅读全文
posted @ 2024-07-31 11:24 业余砖家 阅读(1) 评论(0) 推荐(0) 编辑
摘要: 一、ES介绍 Elasticsearch 是一个分布式可扩展的实时搜索和分析引擎,一个建立在全文搜索引擎 Apache Lucene™ 基础上的搜索引擎.当然 Elasticsearch 并不仅仅是 Lucene 那么简单,它不仅包括了全文搜索功能,还可以进行以下工作: (1).分布式实时文件存储, 阅读全文
posted @ 2024-07-30 16:39 业余砖家 阅读(4) 评论(0) 推荐(0) 编辑
摘要: 1.概述 在Python中,我们可以使用split()函数来按照指定的分隔符对字符串进行分割。默认情况下,split()函数以空格作为分隔符,将字符串分割成一个列表。然而,如果字符串中有多个连续的空格,split()函数会将它们都当作分隔符,导致分割后的列表中会有空白项。本文将教会你如何按照空格分割 阅读全文
posted @ 2024-07-19 16:46 业余砖家 阅读(15) 评论(0) 推荐(0) 编辑
摘要: python-docx官网文档:https://github.com/python-openxml/python-docx 阅读全文
posted @ 2024-07-15 17:50 业余砖家 阅读(4) 评论(0) 推荐(0) 编辑
摘要: 1. 线程池 为什么要使用线程池? 1)、多线程中, 线程的数量并非越多越好; 不是线程数量越多,程序的执行效率就越快。线程也是一个对象,是需要占用资源的,线程数量过多的话肯定会消耗过多的资源,同时线程间的上下文切换也是一笔不小的开销,所以有时候开辟过多的线程不但不会提高程序的执行效率,反而会适得其 阅读全文
posted @ 2024-07-05 16:10 业余砖家 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 1、什么是ZooKeeper? - 期望回答:ZooKeeper是一个分布式协调服务,提供了高度可靠且具有高性能的分布式应用协调服务。 ZooKeeper是一个开源的分布式协调服务,它提供了一个简单而健壮的分布式应用程序协调解决方案。其主要设计目标是通过提供高性能、可靠性、且具备高度可扩展性的服务, 阅读全文
posted @ 2024-07-04 17:18 业余砖家 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 背景: 启动Flink的sql-client.sh,创建Kafka的source端表,然后查询Kafka的数据时报错。 报错信息: 2024-06-18 16:10:12 org.apache.flink.util.FlinkException: Global failure triggered b 阅读全文
posted @ 2024-06-18 16:35 业余砖家 阅读(6) 评论(0) 推荐(0) 编辑
摘要: Java代码 import org.apache.spark.SparkConf; import org.apache.spark.api.java.function.VoidFunction; import org.apache.spark.streaming.api.java.JavaInput 阅读全文
posted @ 2024-06-12 10:50 业余砖家 阅读(5) 评论(0) 推荐(0) 编辑
摘要: 一、spark直接读取本地文件系统的文件(不推荐)file前缀地址“file:///”,例如:文件绝对路径为/data/20240606,那么文件名应该设置为:file:///data/20240606 说明: (1)本地文件系统地址的前缀是“file:///”后边也必须是全部的绝对路径,不能用相对 阅读全文
posted @ 2024-06-06 09:19 业余砖家 阅读(22) 评论(0) 推荐(0) 编辑
1 2 3 4 5 ··· 31 下一页