会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
又见阿郎
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
···
26
下一页
2024年3月16日
聊聊ChatGLM-6B医疗数据微调
摘要: 转载请注明出处: https://www.cnblogs.com/zhiyong-ITNote/ 参考了多个医疗大模型,如扁鹊、灵心等,重新思考了下微调的方案以及数据集的格式;基于ChatGLM/其它LLM整合多种微调方法的非官方实现的框架,审视其数据集格式,以及调试效果,进行微调。 最终基于liu
阅读全文
posted @ 2024-03-16 09:50 又见阿郎
阅读(1014)
评论(2)
推荐(1)
2024年3月15日
聊聊大模型的微调实现及其应用
摘要: 转载请备注出处: https://www.cnblogs.com/zhiyong-ITNote 微调框架概述 模型的微调有多种方式,对于入门的来说,一般都是基于官方的文档微调;最近发现很多开源库,其目的就是支持应用多种微调策略来微调模型,简化模型的微调门槛。比如 ChatGLM-Efficient-
阅读全文
posted @ 2024-03-15 14:12 又见阿郎
阅读(860)
评论(0)
推荐(1)
2024年1月12日
聊聊ChatGLM-6B源码分析(二)
摘要: 基于ChatGLM-6B第一版,要注意还有ChatGLM2-6B以及ChatGLM3-6B 转载请备注出处:https://www.cnblogs.com/zhiyong-ITNote/ ChatGLMPreTrainedModel 官方的描述是 处理权重初始化的抽象类,以及下载和加载预训练模型的接
阅读全文
posted @ 2024-01-12 10:50 又见阿郎
阅读(802)
评论(0)
推荐(0)
2024年1月11日
聊聊ChatGLM中P-tuning v2的应用
摘要: 论文PDF地址:https://arxiv.org/pdf/2110.07602.pdf 转载请备注出处:https://www.cnblogs.com/zhiyong-ITNote/ P-Tuning v2 摘录自第三部分 桔色块指代可训练的prompt embedding;蓝色块是由固定(冻结)
阅读全文
posted @ 2024-01-11 11:24 又见阿郎
阅读(665)
评论(0)
推荐(0)
2024年1月8日
聊聊ChatGLM-6B的源码分析
摘要: 基于ChatGLM-6B第一版,要注意还有ChatGLM2-6B以及ChatGLM3-6B 转载请备注出处:https://www.cnblogs.com/zhiyong-ITNote/ PrefixEncoder 作用:在微调时(以P-Tuning V2为例),方法训练时冻结模型的全部参数,只激活
阅读全文
posted @ 2024-01-08 14:25 又见阿郎
阅读(810)
评论(0)
推荐(0)
2024年1月6日
聊聊 从源码来看ChatGLM-6B的模型结构
摘要: 基于ChatGLM-6B第一版,要注意还有ChatGLM2-6B以及ChatGLM3-6B 概述 ChatGLM是transformer架构的神经网络模型,因此从transformer结构入手,分析其源码结构。 transformer结构: 转载请备注出处:https://www.cnblogs.c
阅读全文
posted @ 2024-01-06 17:26 又见阿郎
阅读(1708)
评论(0)
推荐(0)
2024年1月3日
聊聊ChatGLM6B的微调脚本及与Huggingface的关联
摘要: 本文首先分析微调脚本trainer.sh的内容,再剖析ChatGLM是如何与Huggingface平台对接,实现transformers库的API直接调用ChatGLM模型,最后定位到了ChatGLM模型的源码文件。 脚本分析 微调脚本: PRE_SEQ_LEN=128 LR=2e-2 CUDA_V
阅读全文
posted @ 2024-01-03 14:57 又见阿郎
阅读(645)
评论(0)
推荐(0)
2024年1月2日
聊聊ChatGLM-6B部署与微调的深入理解
摘要: ChatGLM的部署,主要是两个步骤: 在Github上下载chatglm的库文件 在Hugging Face上下载模型参数与配置文件 ChatGLM包 从Github上看ChatGLM项目文件的结构来看,仅仅是包含三种部署方式的py代码与微调的py代码 而相关的实现细节,比如神经网络、激活函数、损
阅读全文
posted @ 2024-01-02 16:47 又见阿郎
阅读(862)
评论(0)
推荐(1)
2023年12月29日
聊聊流式数据湖Paimon(五)
摘要: 从Demo入手,了解Paimon/Flink项目搭建的全过程。记录下采坑之旅。 创建Flink项目 在IDEA中创建Flink项目,由于没有Flink的archetype,因此需要手动创建一下。 参考:idea快速创建flink项目,至此Flink的项目框架就搭建起来了。 注意:必须注释掉pom文件
阅读全文
posted @ 2023-12-29 09:27 又见阿郎
阅读(550)
评论(0)
推荐(1)
2023年12月28日
聊聊流式数据湖Paimon(四)
摘要: Partial Update 数据打宽 通过不同的流写不同的字段,打宽了数据的维度,填充了数据内容;如下所示: --FlinkSQL参数设置 set `table.dynamic-table-options.enabled` = `true`; SET `env.state.backend` = `
阅读全文
posted @ 2023-12-28 14:12 又见阿郎
阅读(2382)
评论(1)
推荐(0)
上一页
1
2
3
4
5
6
···
26
下一页
公告