2023年3月25日

GPT前世今生-transformer

摘要: GPT前世今生-transformer 路线: hugging(tang)->transformer(tang)-> GPT2 NLP 中的transformer 都是分类问题 hugging中 怎么查预训练模型。 FAQ 1 多头注意力机制中什么是key,value和query? 答: 在Tran 阅读全文

posted @ 2023-03-25 11:56 lexn 阅读(72) 评论(0) 推荐(0) 编辑

2023年3月24日

GPT前世今生-二刷论文

摘要: GPT前世今生-二刷论文 1 GPT3 专门网站 提供api ,开放各种任务 2 GPT2怎么来的 transformer 编码器+解码器 -> GPT 只是使用了解码器 -> BERT 使用了编码器 -> GPT2 1)使用解码器 2)多任务学习变化 带有prompt, 提示词的标注。 zeros 阅读全文

posted @ 2023-03-24 10:11 lexn 阅读(304) 评论(0) 推荐(0) 编辑

2023年3月22日

:)关于transformers模型的保存与加载-|

摘要: 关于transformers模型的保存与加载 两种情况, 自定义模型训练后保存, transformers预训练模型保存。 参考代码 # -*- coding: utf-8 -*- import torch from transformers import GPT2LMHeadModel from 阅读全文

posted @ 2023-03-22 21:58 lexn 阅读(1773) 评论(0) 推荐(0) 编辑

2023年3月21日

基于GPT-2预训练模型chat 演示-代码说明

摘要: 基于GPT-2预训练模型chat 演示-代码说明 代码路径:shibing624/gpt2-dialogbot-base-chinese · Hugging Face 代码说明:4.MMI模型训练与生成_哔哩哔哩_bilibili 1 文本预处理 下载语料 2 train 1 dataset 2 d 阅读全文

posted @ 2023-03-21 09:37 lexn 阅读(138) 评论(0) 推荐(0) 编辑

2023年3月19日

ChatGPT背后的算法——RLHF总结

摘要: ChatGPT背后的算法——RLHF总结 参考链接:抱抱脸:ChatGPT背后的算法——RLHF | 附12篇RLHF必刷论文 (qq.com) 背景 (文本生成的语言模型评价不在训练中) chatGPT训练4步骤 1 预训练 [prompt, text] 无监督, 数据语料来源可能都是 爬虫web 阅读全文

posted @ 2023-03-19 19:01 lexn 阅读(167) 评论(0) 推荐(0) 编辑

2023年3月9日

NLP-聊天机器人输入输出原理

摘要: NLP-聊天机器人输入输出原理 后续会加载 聊天机器人使用的transformer 更深入内部原理 import transformers import torch import os import json import random import numpy as np import argpa 阅读全文

posted @ 2023-03-09 08:26 lexn 阅读(115) 评论(0) 推荐(0) 编辑

2023年3月3日

NLP-transformer-分词库用法

摘要: NLP-transformer-分词库用法 参考文档: https://blog.csdn.net/orangerfun/article/details/124089467 1 pip install transformer 2 下载专有的vocab.txt词典 这个词典用于 把 单词-> id - 阅读全文

posted @ 2023-03-03 09:48 lexn 阅读(81) 评论(0) 推荐(0) 编辑

2023年3月2日

make编译工具教程

摘要: make编译工具教程 背景 CC++编译起来目录结构多的情况需要脚本完成搜索编译-> make 第一课 第三课 makefile常用编程语法: 1 pipe管道符号,用;把命令相连接。 这样就 一条命令结果应用在下一条命令中。 CD -- ;pwd 与 cd --; pwd 结果不一样 2 用-在命 阅读全文

posted @ 2023-03-02 20:48 lexn 阅读(44) 评论(0) 推荐(0) 编辑

2023年3月1日

工程能力-远程JUNO-linux

摘要: 工程能力-远程JUNO-linux 1 ping 通linux 地址 2 ssh/scp 连接/传输数据 ssh root@10.188.72.42 scp -P 22 README.md root@10.188.72.42:~/Desktop 问题:root密码输入, Permission den 阅读全文

posted @ 2023-03-01 10:27 lexn 阅读(19) 评论(0) 推荐(0) 编辑

2023年2月28日

chatGPT-meta抗衡版本

摘要: chatGPT-meta抗衡版本 链接:https://mp.weixin.qq.com/s/MbZTfVgxx221Eo9pl1h80w 内置 git代码 LLaMA 项目地址:https://github.com/facebookresearch/llama LLaMA 论文地址:https:/ 阅读全文

posted @ 2023-02-28 09:34 lexn 阅读(50) 评论(0) 推荐(0) 编辑

导航