西西嘛呦

[置顶] 【论文笔记】张航和李沐等提出：ResNeSt: Split-Attention Networks（ResNet改进版本）

摘要： github地址：https://github.com/zhanghang1989/ResNeSt 论文地址：https://hangzhang.org/files/resnest.pdf 2020.06.23 张航视频讲解ResNeSt：https://www.bilibili.com/video 阅读全文

posted @ 2020-04-18 22:27 西西嘛呦阅读(24660) 评论(3) 推荐(8)

2023年6月28日

怎么让英文大语言模型支持中文？（三）进行指令微调

摘要：前面已经讲过：怎么让英文大语言模型支持中文？（一）构建中文tokenization 怎么让英文大语言模型支持中文？（二）继续预训练这里是最后一部分了：怎么让英文大语言模型支持中文？（三）对预训练模型进行指令微调。代码已上传到github： chinese_llm_sft Part1前言在之前阅读全文

posted @ 2023-06-28 10:58 西西嘛呦阅读(1764) 评论(0) 推荐(1)

2023年6月25日

怎么让英文大预言模型支持中文？（二）继续预训练

摘要：代码已上传到github： https://github.com/taishan1994/chinese_llm_pretrained Part1前言前面我们已经讲过怎么构建中文领域的tokenization： https://zhuanlan.zhihu.com/p/639144223 接下来我阅读全文

posted @ 2023-06-25 16:16 西西嘛呦阅读(738) 评论(4) 推荐(0)

2023年6月24日

怎么让英文大预言模型支持中文？（一）构建自己的tokenization

摘要：代码地址：https://github.com/taishan1994/sentencepiece_chinese_bpe Part1前言目前，大语言模型呈爆发式的增长，其中，基于llama家族的模型占据了半壁江山。而原始的llama模型对中文的支持不太友好，接下来本文将讲解如何去扩充vocab里阅读全文

posted @ 2023-06-24 10:44 西西嘛呦阅读(2372) 评论(0) 推荐(0)

2023年6月16日

anaconda和python之间的对应关系

摘要：对应关系： https://docs.anaconda.com/free/anaconda/reference/packages/oldpkglists/ 国内下载地址： https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=M&O=D 1 阅读全文

posted @ 2023-06-16 14:27 西西嘛呦阅读(276) 评论(2) 推荐(0)

2023年5月4日

【python】linux下安装python的一般方法

摘要：下载python 网址：https://mirrors.huaweicloud.com/python/ 这里以安装python3.7.1为例： wget https://www.python.org/ftp/python/3.7.1/Python-3.7.1.tgz 编译和安装python pref 阅读全文

posted @ 2023-05-04 18:20 西西嘛呦阅读(173) 评论(0) 推荐(0)

2023年4月26日

你还弄不清xxxForCausalLM和xxxForConditionalGeneration吗？

摘要： Part1基本介绍大语言模型目前一发不可收拾，在使用的时候经常会看到transformers库的踪影，其中xxxCausalLM和xxxForConditionalGeneration会经常出现在我们的视野中，接下来我们就来聊聊transformers库中的一些基本任务。这里以三类模型为例：be 阅读全文

posted @ 2023-04-26 16:36 西西嘛呦阅读(887) 评论(0) 推荐(0)

2023年4月25日

LLM（大语言模型）解码时是怎么生成文本的？

摘要： Part1配置及参数 transformers==4.28.1 源码地址：transformers/configuration_utils.py at v4.28.1 · huggingface/transformers (github.com) 文档地址：Generation (huggingfa 阅读全文

posted @ 2023-04-25 17:34 西西嘛呦阅读(5629) 评论(0) 推荐(1)

2023年4月24日

【colab】怎么在colab打开github上的ipynb文件

摘要：登录:https://colab.research.google.com/github/ 将github上的ipynb文件路径复制到框里面即可。阅读全文

posted @ 2023-04-24 16:30 西西嘛呦阅读(512) 评论(0) 推荐(0)

2023年4月23日

pytorch在有限的资源下部署大语言模型（以ChatGLM-6B为例）

摘要： pytorch在有限的资源下部署大语言模型（以ChatGLM-6B为例） Part1知识准备在PyTorch中加载预训练的模型时，通常的工作流程是这样的： my_model = ModelClass(...)state_dict =torch.load(checkpoint_file) 用简单的话阅读全文

posted @ 2023-04-23 09:38 西西嘛呦阅读(4635) 评论(0) 推荐(2)

2023年4月21日

GPT-NER：使用大型语言模型进行命名实体识别

摘要：讲在前面，chatgpt出来的时候就想过将其利用在信息抽取方面，后续也发现了不少基于这种大语言模型的信息抽取的论文，比如之前收集过的： https://github.com/cocacola-lab/GPT4IEhttps://github.com/RidongHan/Evaluation-of-C 阅读全文

posted @ 2023-04-21 15:02 西西嘛呦阅读(2714) 评论(0) 推荐(2)

从自己能做到的开始，一件件来，缓慢而坚定地前进，尽力而为

公告