会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
mengrennwpu
好学求知,稳健中流
博客园
首页
新随笔
联系
管理
订阅
随笔- 159 文章- 1 评论- 34 阅读-
44万
上一页
1
2
3
4
5
6
···
16
下一页
2024年5月20日
LLM实战:当网页爬虫集成gpt3.5
摘要:
本文主要是通过Scrapegraph-ai集成gpt3.5实现一个简单的网页爬取并解析的demo应用,其中涉及到gpt3.5免费申请,Scrapegraph-ai底层原理简介,demo应用源码等。
阅读全文
posted @ 2024-05-20 20:50 mengrennwpu
阅读(933)
评论(0)
推荐(0)
编辑
2024年5月16日
LLM实战:LLM微调加速神器-Unsloth + Qwen1.5
摘要:
本文主要是使用unsloth框架针对Qwen1.5的高效微调实验,提供了详细的对比代码以及不同维度的对比分析结果。
阅读全文
posted @ 2024-05-16 21:18 mengrennwpu
阅读(763)
评论(0)
推荐(1)
编辑
2024年5月14日
LLM实战:LLM微调加速神器-Unsloth + LLama3
摘要:
本文主要是使用unsloth框架针对llama3的高效微调实验,提供了详细的对比代码以及不同维度的对比分析结果。
阅读全文
posted @ 2024-05-14 10:00 mengrennwpu
阅读(3240)
评论(0)
推荐(1)
编辑
2024年4月28日
LLM优化:开源星火13B显卡及内存占用优化
摘要:
本文主要是针对开源星火13B的显存及内存占用过大的一个代码优化。核心思想是使用CPU预加载模型,再转换至GPU。
阅读全文
posted @ 2024-04-28 16:46 mengrennwpu
阅读(753)
评论(1)
推荐(0)
编辑
2024年4月25日
LLM应用实战:当KBQA集成LLM(二)
摘要:
本文主要是针对KBQA方案基于LLM实现存在的问题进行优化,主要涉及到图谱存储至Es,且支持Es的向量检索,还有解决了一部分基于属性值倒查实体的场景,且效果相对提升。
阅读全文
posted @ 2024-04-25 21:16 mengrennwpu
阅读(510)
评论(1)
推荐(0)
编辑
2024年4月11日
LLM应用实战:当KBQA集成LLM
摘要:
将传统KBQA中的部分模块,如NLU、指代消解、实体对齐等任务,完全由LLM实现
阅读全文
posted @ 2024-04-11 10:56 mengrennwpu
阅读(718)
评论(3)
推荐(2)
编辑
2024年4月2日
LLM面面观之MoE
摘要:
此文是本qiang~针对大语言模型的MoE的整理,包括原理、流程及部分源码
阅读全文
posted @ 2024-04-02 09:28 mengrennwpu
阅读(1385)
评论(0)
推荐(0)
编辑
2024年1月31日
LLM面面观之RLHF平替算法DPO
摘要:
此文是本qiang~针对大语言模型的DPO算法的整理,包括原理、流程及部分源码。
阅读全文
posted @ 2024-01-31 12:37 mengrennwpu
阅读(3475)
评论(1)
推荐(0)
编辑
2024年1月22日
LLM面面观之LLM上下文扩展方案
摘要:
1. 背景 本qiang~这段时间调研了LLM上下文扩展的问题,并且实打实的运行了几个开源的项目,所谓实践与理论相结合嘛! 此文是本qiang~针对上下文扩展问题的总结,包括解决方案的整理概括,文中参考了多篇有意义的文章,他山之石可以攻玉。 大语言模型的扩展有诸多意义,如进行更长的会话、总结更长的文
阅读全文
posted @ 2024-01-22 13:48 mengrennwpu
阅读(1098)
评论(0)
推荐(1)
编辑
2023年12月14日
LLM面面观之LLM复读机问题及解决方案
摘要:
LLM复读机产生的原因以及对应的解决方案
阅读全文
posted @ 2023-12-14 15:42 mengrennwpu
阅读(4417)
评论(0)
推荐(0)
编辑
上一页
1
2
3
4
5
6
···
16
下一页
公告
昵称:
mengrennwpu
园龄:
11年
粉丝:
56
关注:
44
+加关注
<
2025年3月
>
日
一
二
三
四
五
六
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
更多链接
我的标签
LLM
(8)
NLP
(4)
quartz
(3)
java
(3)
KBQA
(2)
知识图谱
(2)
Redis基础
(1)
Redis安装
(1)
OPT-175B
(1)
mongo
(1)
更多
积分与排名
积分 - 174392
排名 - 7472
合集
LLM面面观(5)
LLM应用实战(10)
LLM论文研读(2)
AI资讯(1)
随笔分类
docker(4)
Guava(2)
Hadoop学习(6)
hive(4)
Java学习(5)
Java优化(5)
Linux C编程(2)
Linux Useful Applications(3)
Linux操作基础(39)
LLM(21)
MongoDB(2)
nginx(3)
Python(2)
Quartz(6)
Redis札记(4)
Scala(10)
spark(8)
spring boot(7)
工作札记(6)
更多
随笔档案
2024年12月(1)
2024年11月(3)
2024年10月(2)
2024年9月(1)
2024年8月(2)
2024年6月(1)
2024年5月(3)
2024年4月(4)
2024年1月(2)
2023年12月(1)
2023年11月(1)
2023年2月(1)
2022年5月(1)
2021年4月(2)
2021年3月(1)
2021年2月(1)
2019年12月(3)
2019年11月(2)
2019年10月(2)
2019年9月(2)
2019年8月(3)
2019年6月(2)
2019年5月(3)
2019年3月(2)
2019年2月(3)
2019年1月(2)
2018年12月(7)
2018年11月(3)
2018年9月(3)
2018年8月(3)
2018年6月(3)
2018年4月(3)
2018年1月(2)
2017年12月(4)
2017年11月(2)
2017年7月(4)
2017年5月(4)
2017年4月(3)
2017年3月(4)
2017年2月(3)
2017年1月(3)
2016年12月(1)
2016年11月(7)
2016年2月(2)
2016年1月(7)
2015年12月(3)
2015年10月(8)
2015年8月(8)
2015年7月(1)
2015年6月(4)
2015年3月(2)
2015年2月(1)
2015年1月(13)
更多
文章分类
Transformer(1)
阅读排行榜
1. Java使用HttpClient实现Post请求(216465)
2. Java工具-检验ftp服务器的指定文件是否存在(14094)
3. Quartz使用(4) - Quartz监听器Listerner(10394)
4. Spring Boot使用mongo的GridFS模块(9502)
5. Quartz使用(2) - Quartz核心接口Scheduler、Job(9458)
评论排行榜
1. LLM应用实战: 文档问答系统Kotaemon-1. 简介及部署实践(6)
2. LLM应用实战: 产业治理多标签分类(5)
3. LLM应用实战: 给个公司简称,输出公司全称(4)
4. LLM应用实战:当KBQA集成LLM(3)
5. Linux学习笔记(16)shell基础之Bash变量(3)
推荐排行榜
1. Java使用HttpClient实现Post请求(5)
2. LLM应用实战: 给个公司简称,输出公司全称(2)
3. LLM应用实战: AI资讯的自动聚合及报告生成(2)
4. LLM应用实战:当KBQA集成LLM(2)
5. Spring Boot使用mongo的GridFS模块(2)
最新评论
1. Re:LLM应用实战:当KBQA集成LLM
@mengrennwpu 2.2 解析和溯源部分是通过cypher query?...
--wweii
2. Re:LLM应用实战:当KBQA集成LLM
@wweii 你好,抱歉,回复较晚.... sim表示的是相似度 两次调用大模型是两个prompt,其中: 对齐校准:使用一个prompt, 主要是从问题中抽取对应的三元组关系 解析和溯源:不涉及调用...
--mengrennwpu
3. Re:LLM应用实战: 文档问答系统Kotaemon-1. 简介及部署实践
@字助之 您好,不好意思,现在才答复... env文件中的内容不需要都填~ 我的配置信息如下: ` settings for OpenAI OPENAI_API_BASE= OPENAI_API_KE...
--mengrennwpu
4. Re:LLM应用实战:当KBQA集成LLM
请教一下: 对齐模块里的sim是指什么? 两次llm调用中间的步骤(对齐校准,解析和溯源)没看明白怎么实现的,是生成部分prompt整合起来吗? 还是通过什么包实现的? 可以更详细介绍一下吗?...
--wweii
5. Re:LLM应用实战: 给个公司简称,输出公司全称
@JIeJaitt 貌似也不是很大~ 整体流程:牛客爬取 -> 大模型提取公司名简称 -> 搜索引擎检索 -> 大模型推理...
--mengrennwpu
点击右上角即可分享