摘要: 在Rag模型读取document时发现doc文件SimpleDirectoryReader无法正常读取字符,所以采用LibreOffice将doc转化为docx的方式。内网LibreOffice安装然后python循环的调用的方式来对input documents进行转换,转换后的docx Simp 阅读全文
posted @ 2024-10-17 14:48 AxiaNibiru 阅读(161) 评论(0) 推荐(1) 编辑
摘要: 记录一下使用pyspark读取Hive数据导入至Arango import pyspark import os import findspark from pyspark.sql import SparkSession from pyspark.sql.functions import col, l 阅读全文
posted @ 2024-07-22 14:35 AxiaNibiru 阅读(13) 评论(0) 推荐(0) 编辑
摘要: Hive版本:2.3.4 Spark版本:2.4.0 问题:在线上查看数据时,数据平台跑出的数据与外部平台不一致。使用的SQL一样,经排查发现是使用 WHERE value <> 0,导致的。value 为字符串格式的数字id。 样例SQL如下: DROP TABLE IF EXISTS test. 阅读全文
posted @ 2024-03-05 14:43 AxiaNibiru 阅读(100) 评论(0) 推荐(0) 编辑
摘要: 在[medcl/elasticsearch-analysis-ik at 7.x (github.com)](https://github.com/medcl/elasticsearch-analysis-ik/tree/7.x)中未找到7.17.10版本的发布版本,如歌ik版本和Elasticse 阅读全文
posted @ 2023-06-02 11:11 AxiaNibiru 阅读(1642) 评论(0) 推荐(0) 编辑
摘要: 一切以官网为准: Introduction | Documentation | Poetry - Python dependency management and packaging made easy (python-poetry.org) Windows默认安装位置为: %APPDATA%\Py 阅读全文
posted @ 2023-04-18 15:07 AxiaNibiru 阅读(1215) 评论(0) 推荐(0) 编辑
摘要: 开放封闭原则 软件实体(类,模块,函数等等)应该可以扩展,但是不可以修改 不要指望系统一开始确定需求之后就再也不会变化,要使得设计的软件要容易维护又不容易出问题就得多扩展,少修改 但模块没有绝对的封闭,所以就需要对设计的模块有哪些变化作出选择:猜测那些类最有可能发生变化,然后构造抽象来隔离那些变化。 阅读全文
posted @ 2022-05-14 14:55 AxiaNibiru 阅读(48) 评论(0) 推荐(0) 编辑
摘要: 无重复字符的最长子串 Java/Go/Rust实现找出无重复字符的最长子串,虽然写的不咋地 class Solution { public int lengthOfLongestSubstring(String s) { int sLen = s.length(); int maxLen = 0; 阅读全文
posted @ 2022-04-30 12:40 AxiaNibiru 阅读(36) 评论(0) 推荐(0) 编辑
摘要: Java 多线程并发 并发时需要解决得问题可能有多个,而实现并发的方式也有多种,并且在这两者之间没有明显的映射关系。因此你必须理解所有这些问题和特例,以便有效的使用并发。 用并发解决的问题大致上可以分为“速度”和“设计可管理性两种” 速度:如果你想要一个程序运行的更快,那么可以将其切开为多个片段,在 阅读全文
posted @ 2022-04-30 10:27 AxiaNibiru 阅读(31) 评论(0) 推荐(0) 编辑
摘要: JVM 基本概念:JVM是可运行Java代码的假象计算机,包括一套字节码指令集,一组寄存器,一个栈,一个垃圾回收,堆和一个存储方法域。JVM是运行在操作系统之上的它与硬件没有直接的交互。 Java代码的执行: java代码编译为class-javac:Java源文件通过编译期产生相应的.Class文 阅读全文
posted @ 2022-04-22 18:52 AxiaNibiru 阅读(65) 评论(0) 推荐(0) 编辑
摘要: java日期类 java.util.Date 对java.util.Date中的操作实际上都是对BaseCalendar.Date的操作 java.util.Date是对于一个时间点上的抽象, 表示时间戳上这个具体的时间点, 可以根据这个时间戳时间点提取出各个属性 Date类的常用构造 public 阅读全文
posted @ 2022-04-19 19:16 AxiaNibiru 阅读(186) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示
主题色彩