摘要: 语言大模型是通过大规模数据集训练而来可以帮我们进行文本生成、内容总结,但对于一些小众知识、内部数据模型不一定知道怎么回答,这时候可能会胡言乱语。目前要想在特定领域小众知识或私密数据时模型能够表现出比较好的水平目前主要有两种方式可以实现:模型微调、外挂知识库也就是RAG模式,RAG模式之前我们有介绍过 阅读全文
posted @ 2024-11-26 08:42 AiFly 阅读(29) 评论(0) 推荐(0) 编辑
摘要: 现在很多语音助手比如小爱同学、小度等都有支持方言语音识别,开源模型也有不少中文的ASR(自动语音识别)预训练模型可做到开箱即用。方言的ASR模型比较少特别是海南话ASR模型更是没有。这几篇文章主要是基于Transformer从0开始训练一个海南话语音识别模型,当然效果可能不会特别好,这也是方言语音识 阅读全文
posted @ 2024-09-18 08:40 AiFly 阅读(96) 评论(0) 推荐(0) 编辑
摘要: 上篇文章介绍了使用大模型构建生成知识图谱,其实也可不用大模型用其他方式构建生成知识图谱,但RAG要结合知识图谱使用关键还是怎么把图谱的内容查询出来;简单来说可以先查出Chunk集在关联查出每个Chunk所关联的实体Entity再查询出实体之间的的关系集;这里说的RAG结合知识图谱和微软开源的Grap 阅读全文
posted @ 2024-09-03 08:42 AiFly 阅读(114) 评论(0) 推荐(0) 编辑
摘要: 前面几篇文章谈了多种针对RAG的优化如多表示索引(Multi-representation indexing)、Raptor等但其都是存储在向量库中的,这里将介绍一种新的存储模式,图数据库,适合存储数据高度相关的数据。其存储实体与实体间的关系,存储着丰富的关系类型数据,能给RAG知识库带来更精准的上 阅读全文
posted @ 2024-08-12 08:40 AiFly 阅读(436) 评论(0) 推荐(0) 编辑
摘要: 在现有的朴素RAG应用中其只是简单的对文档进行分块后存储的向量库中,然后在使用是根据 提问问题 从查询向量库中查询相识度较高的文档快作为问题上下文提交到LLM让其根据上下文去回答用户所提问的问题。对于小文本可以直接将整个文档作为上下文或使用上篇文章所提到的多表示索引(Multi-representa 阅读全文
posted @ 2024-08-05 08:39 AiFly 阅读(83) 评论(0) 推荐(0) 编辑
摘要: 闲来无事,想起吃灰的树莓派拿来做点什么,貌似去年还专门买了个麦克风还没怎么用过。正好拿来做个类似小爱智能语音助手的小林同学,现在智能助手不接入大模型都不好意思说出来,当然小林同学没有小爱同学的米家生态功能,后续如果加入多模态图片识别貌似会更有点意思。 智能助手涉及到的技术主要由:语音离线唤醒、录音、 阅读全文
posted @ 2024-07-12 08:40 AiFly 阅读(147) 评论(0) 推荐(0) 编辑
摘要: 在朴素RAG中通常会对文档、文本进行分块后进行文档嵌入,对所有文件、文本都没有经过采用Chunk方法可能有时候效果不是和好,尽管有着各种分块策略有针对大文件的、针对小文件的策略,但都难免可能会造成上下文语义丢失。 分块通常有两个非常重要的参数chunk_size、chunk_overlap,分别代表 阅读全文
posted @ 2024-07-08 08:42 AiFly 阅读(170) 评论(0) 推荐(0) 编辑
摘要: otel-profiling-agent为elastic开源项目,用于对生产环境中的应用程序进行性能分析,帮助开发者理解程序的运行情况,识别瓶颈,优化性能。用于包括CPU和内存使用情况的分析、调用跟踪、性能指标收集等功能。它是一个用于Linux的全系统、跨语言的性能分析器,通过eBPF(Extend 阅读全文
posted @ 2024-06-24 08:35 AiFly 阅读(70) 评论(0) 推荐(0) 编辑
摘要: 时隔7年再看海南人口流入情况,这几年海南政策相当多特别是提出海南自由贸易港之后,还提出了百万人才进海南计划。这几年海南人口相对前些年也有所增长,其中在2020年常住人口首次超过1000万人。 七年后再看海南近十个市县的户籍人口与常住人口,人口的净流入肯定和当地的经济发展有着莫大的联系,看看经过了几年 阅读全文
posted @ 2024-05-31 13:25 AiFly 阅读(136) 评论(0) 推荐(0) 编辑
摘要: 前面几篇文章介绍了最基本的RAG实现,也了解了RAG的基本原理。最基本的RAG 流程为用户Query问题,RAG应用在向量库查询出Context,然后将Query与 Context喂到LLM,LLM生成满足Query的Response答案。 从这里可以存在三元组: Query、Context 和 R 阅读全文
posted @ 2024-04-15 08:41 AiFly 阅读(2180) 评论(0) 推荐(0) 编辑
摘要: 上篇文件介绍了RAG优化与评估的基本概念,以及使用TruLens-Eval在没有Ground-truth的情况下评估RAG应用。本篇文件主要是使用Ragas对RAG应用进行评估; 使用了Gagas生成合成测试数据集,在只有知识库文档并没有Ground-truth(真实答案)的情况下让想评估该知识库文 阅读全文
posted @ 2024-04-01 08:39 AiFly 阅读(741) 评论(2) 推荐(0) 编辑
摘要: 在开发基于LLM的RAG应用并准备将其上线应用时,都会比较关注RAG的性能、质量、可靠性其回答的结果准确性到底如何,甚至可以说RAG的质量可靠性其重要性要大于性能,RAG“调好了”看上去效果不错,有没有什么方法去量化度量RAG应用的质量也至关重要,下图为RAG应用度量质量指标分布图。 何为RAG 由 阅读全文
posted @ 2024-03-25 08:40 AiFly 阅读(591) 评论(0) 推荐(0) 编辑
摘要: micrograd为一个自动梯度引擎,其实现了反向传播算法,用于学习理解深度学习中的自动求导原理。自动求导无论再传统的机器学习中还是深度学习或是目前非常热门的大语言模型GPT中其都是非常重要基础部分。 反向传播算法可以高效计算出神经网络中损失函数关于训练权重的梯度,使得可通过快速迭代调整权重已得到损 阅读全文
posted @ 2024-03-11 08:18 AiFly 阅读(49) 评论(0) 推荐(0) 编辑
摘要: Ray一个开源的通用分布式计算框架,支持传统的并行任务并支持AI模型的分布式训练,分布式任务包括有状态与无状态任务,Ray能够快速的构建分布式系统,支持按需申请CPU或GPU;Ray提供了统一的接口提供了基于任务的并行计算与基于行动器的计算,前者通常用于无状态的任务后者用于有状态的任务;Ray为一个 阅读全文
posted @ 2024-01-22 08:24 AiFly 阅读(2285) 评论(0) 推荐(0) 编辑
摘要: 大语言模型也只是将用户提供的大规模数据集训练而来,也并非万能的什么都知道,特别是一些小众知识、内部数据或私密的个人数据等,此时ChatGLM3肯定会胡乱回答就是ChatGPT4也不一定能给出满意回答;不少公司、个人都有自己的知识库或日志等此时如有可将这些数据以某种方式挂在大模型上此时在知识库存在的知 阅读全文
posted @ 2023-12-02 16:26 AiFly 阅读(3409) 评论(1) 推荐(0) 编辑
摘要: 本篇主要内容为介绍ChatGLM3的安装使用,后续才会涉及到使用LangChain实现本地知识库的内容; ChatGLM为智谱与清华大学开源的一个大语言模型,支持多轮对话、内容创作等,ChatGLM3-6B为ChatGLM3系列中门槛相对较低的一个,本地部署提供兼容OpenAI的API; LangC 阅读全文
posted @ 2023-11-28 20:55 AiFly 阅读(3718) 评论(1) 推荐(0) 编辑
摘要: OpenAI的Karpathy利用周末搞了一个迷你Llama2项目llama2.c用500行C语言实现无任何依赖项的推理程序,此项目在github发布以来衍生出了基于各种语言的迷你Llama推理实现llama2.go、llama2.java、llama2.py等等; 但该项目原本的模型并不支持中文, 阅读全文
posted @ 2023-08-20 16:24 AiFly 阅读(457) 评论(0) 推荐(0) 编辑
摘要: 老照片修复利器GFPGAN,该模型为腾讯2021年开源的一个用于图片人脸复原修复的**GAN模型**;我们都有很多老照片,很多很久以前用**两三百万像素**拍的照片或原文件丢失了,只剩下压缩文件或**QQ空间**里面的老照片,现在一些App也支持老照片修复但往往效果不太理想或都需要收费;这时可以使用 阅读全文
posted @ 2023-07-30 17:26 AiFly 阅读(728) 评论(0) 推荐(0) 编辑
摘要: ## 排线接通 先需要使用树莓派摄像头ffc排线,连接树莓派摄像头与树莓派开发板,其中排线连接的接口被称为CSI(Camera Serial Interface)接口。 树莓派板的CSI接口位于USB和以太网接口旁。我们先将CSI接口的黑色挡板拔开,后将排线蓝色一端正对以太网接口方向插入,之后按下黑 阅读全文
posted @ 2023-06-30 23:52 AiFly 阅读(1058) 评论(0) 推荐(0) 编辑
摘要: ### 超声波模块介绍 超声波测距原理很简单: 1、通过记录发送超声波的时间、记录超声波返回的时间,返回时间与发送时间相减得到超声波的持续时间。 2、通过公式:(**超声波持续时间** * **声波速度**) / **2**就可以得出距离; ![image.png](https://img2023. 阅读全文
posted @ 2023-05-28 08:51 AiFly 阅读(236) 评论(0) 推荐(0) 编辑
摘要: 上篇文章已经介绍了语料数据的预处理,对数据集中的音频数据分别做了重采样、静音切除、降噪以及在Fbank和MFCC中特征提取方式中选择了Fbank对音频数据进行特征提取的方法;在经过上面的处理后已经可以将提取出的音频数据Fbank丢到Transformer中进行训练,但还漏了一个比较重要的数据预处理, 阅读全文
posted @ 2024-11-02 22:37 AiFly 阅读(31) 评论(0) 推荐(0) 编辑