摘要: 数据导入和导出依赖于命令 elasticdump 数据导出 #!/bin/bash ES=http://ip:port ED=数据保存位置 datename=$(date +%Y-%m-%d) #datename=2021-08-20 index=导出的索引名 echo "elasticdump - 阅读全文
posted @ 2024-09-03 13:56 柯南小海盗 阅读(4) 评论(0) 推荐(0) 编辑
摘要: split -l 600000 -d -a 1 u_movie_qa.txt tmp/m_ && cd tmp/ && ls|grep m_|xargs -n1 -i{} mv {} {}.txt 阅读全文
posted @ 2024-08-28 18:02 柯南小海盗 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 服务端 websocket和event-stream的优缺点 WebSocket和Event-Stream(Server-Sent Events)都是实现实时通信的技术,但是它们各自有不同的优缺点。 ⭐️ WebSocket 优点: 双向通信:WebSocket提供了一个全双工的通信通道,客户端和服 阅读全文
posted @ 2024-08-28 12:50 柯南小海盗 阅读(15) 评论(0) 推荐(0) 编辑
摘要: milvus基础 Milvus 是在 2019 年创建的,其目标是存储、索引和管理深度神经网络和其他机器学习(ML)模型生成的大规模 嵌入向量。作为一种专门设计用于处理对输入向量的查询的数据库,它能够处理万亿级规模的向量索引。与现有的主要处理按照预定义模式遵循结构化数据的关系型数据库不同,Milvus 从底层开始设计,主要处理从 非结构化数据 转换而来的嵌入向量。 阅读全文
posted @ 2024-08-21 13:37 柯南小海盗 阅读(7) 评论(0) 推荐(0) 编辑
摘要: Milvus 拥有在 Milvus API 之上封装的客户端库,可以从应用程序代码中以编程方式插入、删除和查询数据。其中较为常用的Java和Python。 阅读全文
posted @ 2024-08-19 13:28 柯南小海盗 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 什么是分词器❓ 顾名思义,文本分析就是 把全文本转换成一系列单词(term/token)的过程 ,也叫 分词 。在 ES 中,Analysis 是通过分词器(Analyzer) 来实现的,可使用 ES 内置的分析器或者按需定制化分析器。 分词器组成部分 分词器是专门处理分词的组件,分词器由以下三部分 阅读全文
posted @ 2024-08-13 20:57 柯南小海盗 阅读(19) 评论(0) 推荐(0) 编辑
摘要: pip的使用 升级pip python3 -m pip install --upgrade pip 镜像源设置 查看镜像源 pip config list 指定镜像源更新依赖 pip3 install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple 阅读全文
posted @ 2024-08-13 09:49 柯南小海盗 阅读(58) 评论(0) 推荐(0) 编辑
摘要: ElasticSearch服务提供对索引操作、文档操作、分词操作等多种接口。接口的查询通常采用DSL的形式,也可采用SQL形式进行查询。 阅读全文
posted @ 2024-08-13 09:01 柯南小海盗 阅读(15) 评论(0) 推荐(0) 编辑
摘要: 服务端 websocket和event-stream的优缺点 WebSocket和Event-Stream(Server-Sent Events)都是实现实时通信的技术,但是它们各自有不同的优缺点。 ⭐️ WebSocket 优点: 双向通信:WebSocket提供了一个全双工的通信通道,客户端和服 阅读全文
posted @ 2024-08-09 11:29 柯南小海盗 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 基本命令 创建环境 conda create [可选项] env_name python=3.7 # 可选项 -c 镜像地址,采用镜像地址创建环境 # 例如:conda create -c https://conda.anaconda.org/conda-forge -n python37 pyth 阅读全文
posted @ 2024-08-07 08:55 柯南小海盗 阅读(3) 评论(0) 推荐(0) 编辑