会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
公众号:NLP工程化
专注于Python/C++/CUDA、ML/DL/RL和NLP/KG/DS/LLM领域的技术分享。
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
6
7
8
9
10
11
12
13
下一页
2023年8月29日
中文情感分类
摘要: 本文通过ChnSentiCorp数据集介绍了文本分类任务过程,主要使用预训练语言模型bert-base-chinese直接在测试集上进行测试,也简要介绍了模型训练流程,不过最后没有保存训练好的模型。 一.任务和数据集介绍 1.任务 中文情感分类本质还是一个文本分类问题。 2.数据集 本文使用ChnS
阅读全文
posted @ 2023-08-29 21:38 扫地升
阅读(516)
评论(0)
推荐(0)
编辑
2023年8月26日
使用训练工具
摘要: HuggingFace上提供了很多已经训练好的模型库,如果想针对特定数据集优化,那么就需要二次训练模型,并且HuggingFace也提供了训练工具。 一.准备数据集 1.加载编码工具 加载hfl/rbt3编码工具如下所示: def load_encode(): # 1.加载编码工具 # 第6章/加载
阅读全文
posted @ 2023-08-26 08:03 扫地升
阅读(688)
评论(2)
推荐(1)
编辑
使用管道工具
摘要: HuggingFace本身就是一个模型库,包括了很多经典的模型,比如文本分类、阅读理解、完形填空、文本生成、命名实体识别、文本摘要、翻译等,这些模型即使不进行任何训练也能直接得出比较好的预测结果。pipeline是HuggingFace提供的一个非常实用的工具,但是封装程度太高,需要看源码才能理解其
阅读全文
posted @ 2023-08-26 08:01 扫地升
阅读(61)
评论(0)
推荐(0)
编辑
2023年6月27日
使用评价指标工具
摘要: 评估一个训练好的模型需要评估指标,比如正确率、查准率、查全率、F1值等。当然不同的任务类型有着不同的评估指标,而HuggingFace提供了统一的评价指标工具。 1.列出可用的评价指标 通过list_metrics()函数列出可用的评价指标: def list_metric_test(): # 第4
阅读全文
posted @ 2023-06-27 23:14 扫地升
阅读(83)
评论(0)
推荐(0)
编辑
使用数据集工具
摘要: 一.数据集工具介绍 HuggingFace通过API提供了统一的数据集处理工具,它提供的数据集如下所示: 该界面左侧可以根据不同的任务类型、类库、语言、License等来筛选数据集,右侧为具体的数据集列表,其中有经典的glue、super_glue数据集,问答数据集squad,情感分类数据集imdb
阅读全文
posted @ 2023-06-27 21:49 扫地升
阅读(126)
评论(0)
推荐(0)
编辑
Python3.7源码编译
摘要: 1.下载Python3.7.0源码 git clone https://github.com/python/cpython.gitgit checkout v3.7.0 wget https://www.python.org/ftp/python/3.7.0/Python-3.7.0.tar.xz
阅读全文
posted @ 2023-06-27 21:48 扫地升
阅读(184)
评论(2)
推荐(1)
编辑
2023年6月25日
使用编码工具
摘要: 本文主要介绍了对句子编码的过程,以及如何使用PyTorch中自带的编码工具,包括基本编码encode()、增强编码encode_plus()和批量编码batch_encode_plus()。 一.对一个句子编码例子 假设想在要对句子'the quick brown fox jumps over a
阅读全文
posted @ 2023-06-25 15:19 扫地升
阅读(208)
评论(0)
推荐(0)
编辑
什么是HuggingFace
摘要: 一.HuggingFace简介 1.HuggingFace是什么 可以理解为对于AI开发者的GitHub,提供了模型、数据集(文本|图像|音频|视频)、类库(比如transformers|peft|accelerate)、教程等。 2.为什么需要HuggingFace 主要是HuggingFace把
阅读全文
posted @ 2023-06-25 15:18 扫地升
阅读(2161)
评论(0)
推荐(0)
编辑
2023年6月22日
SPSS统计教程:卡方检验
摘要: 本文简要的介绍了卡方分布、卡方概率密度函数和卡方检验,并通过SPSS实现了一个卡方检验例子,不仅对结果进行了解释,而且还给出了卡方、自由度和渐近显著性的计算过程。本文用到的数据"2.2.sav"链接为: https://url39.ctfile.com/f/2501739-875711187-f3d
阅读全文
posted @ 2023-06-22 23:11 扫地升
阅读(575)
评论(0)
推荐(0)
编辑
2023年1月16日
Blazor技术入门
摘要: 曾写过点儿前后端分离的项目(Vue+.NET Core Web API)、WPF和WinForm。因为Blazor不支持小程序的原因(相对于uniapp),所以只是大概知道Blazor可以写Web、PC和移动端项目,最大的特点就是使用C#代替JS。本文算是通过几个默认例子入门Blazor技术吧。 一
阅读全文
posted @ 2023-01-16 22:14 扫地升
阅读(735)
评论(0)
推荐(0)
编辑
上一页
1
···
6
7
8
9
10
11
12
13
下一页