又见阿郎

2024年3月16日

摘要：转载请注明出处: https://www.cnblogs.com/zhiyong-ITNote/ 参考了多个医疗大模型，如扁鹊、灵心等，重新思考了下微调的方案以及数据集的格式；基于ChatGLM/其它LLM整合多种微调方法的非官方实现的框架，审视其数据集格式，以及调试效果，进行微调。最终基于liu 阅读全文

posted @ 2024-03-16 09:50 又见阿郎阅读(1014) 评论(2) 推荐(1)

2024年3月15日

聊聊大模型的微调实现及其应用

摘要：转载请备注出处: https://www.cnblogs.com/zhiyong-ITNote 微调框架概述模型的微调有多种方式，对于入门的来说，一般都是基于官方的文档微调；最近发现很多开源库，其目的就是支持应用多种微调策略来微调模型，简化模型的微调门槛。比如 ChatGLM-Efficient- 阅读全文

posted @ 2024-03-15 14:12 又见阿郎阅读(860) 评论(0) 推荐(1)

2024年1月12日

聊聊ChatGLM-6B源码分析(二)

摘要：基于ChatGLM-6B第一版，要注意还有ChatGLM2-6B以及ChatGLM3-6B 转载请备注出处：https://www.cnblogs.com/zhiyong-ITNote/ ChatGLMPreTrainedModel 官方的描述是处理权重初始化的抽象类，以及下载和加载预训练模型的接阅读全文

posted @ 2024-01-12 10:50 又见阿郎阅读(802) 评论(0) 推荐(0)

2024年1月11日

聊聊ChatGLM中P-tuning v2的应用

摘要：论文PDF地址：https://arxiv.org/pdf/2110.07602.pdf 转载请备注出处：https://www.cnblogs.com/zhiyong-ITNote/ P-Tuning v2 摘录自第三部分桔色块指代可训练的prompt embedding；蓝色块是由固定(冻结) 阅读全文

posted @ 2024-01-11 11:24 又见阿郎阅读(665) 评论(0) 推荐(0)

2024年1月8日

聊聊ChatGLM-6B的源码分析

摘要：基于ChatGLM-6B第一版，要注意还有ChatGLM2-6B以及ChatGLM3-6B 转载请备注出处：https://www.cnblogs.com/zhiyong-ITNote/ PrefixEncoder 作用：在微调时（以P-Tuning V2为例），方法训练时冻结模型的全部参数，只激活阅读全文

posted @ 2024-01-08 14:25 又见阿郎阅读(810) 评论(0) 推荐(0)

2024年1月6日

聊聊从源码来看ChatGLM-6B的模型结构

摘要：基于ChatGLM-6B第一版，要注意还有ChatGLM2-6B以及ChatGLM3-6B 概述 ChatGLM是transformer架构的神经网络模型，因此从transformer结构入手，分析其源码结构。 transformer结构：转载请备注出处：https://www.cnblogs.c 阅读全文

posted @ 2024-01-06 17:26 又见阿郎阅读(1708) 评论(0) 推荐(0)

2024年1月3日

聊聊ChatGLM6B的微调脚本及与Huggingface的关联

摘要：本文首先分析微调脚本trainer.sh的内容，再剖析ChatGLM是如何与Huggingface平台对接，实现transformers库的API直接调用ChatGLM模型，最后定位到了ChatGLM模型的源码文件。脚本分析微调脚本： PRE_SEQ_LEN=128 LR=2e-2 CUDA_V 阅读全文

posted @ 2024-01-03 14:57 又见阿郎阅读(645) 评论(0) 推荐(0)

2024年1月2日

聊聊ChatGLM-6B部署与微调的深入理解

摘要： ChatGLM的部署，主要是两个步骤：在Github上下载chatglm的库文件在Hugging Face上下载模型参数与配置文件 ChatGLM包从Github上看ChatGLM项目文件的结构来看，仅仅是包含三种部署方式的py代码与微调的py代码而相关的实现细节，比如神经网络、激活函数、损阅读全文

posted @ 2024-01-02 16:47 又见阿郎阅读(862) 评论(0) 推荐(1)

2023年12月29日

聊聊流式数据湖Paimon(五)

摘要：从Demo入手，了解Paimon/Flink项目搭建的全过程。记录下采坑之旅。创建Flink项目在IDEA中创建Flink项目，由于没有Flink的archetype，因此需要手动创建一下。参考：idea快速创建flink项目，至此Flink的项目框架就搭建起来了。注意：必须注释掉pom文件阅读全文

posted @ 2023-12-29 09:27 又见阿郎阅读(550) 评论(0) 推荐(1)

2023年12月28日

聊聊流式数据湖Paimon(四)

摘要： Partial Update 数据打宽通过不同的流写不同的字段，打宽了数据的维度，填充了数据内容；如下所示： --FlinkSQL参数设置 set `table.dynamic-table-options.enabled` = `true`; SET `env.state.backend` = ` 阅读全文

posted @ 2023-12-28 14:12 又见阿郎阅读(2382) 评论(1) 推荐(0)

公告