摘要: **报错信息** 使用`metric = evaluate.load("seqeval")`的时候,报如下错误: ```python ImportError: To be able to use evaluate-metric/seqeval, you need to install the fol 阅读全文
posted @ 2023-07-30 22:06 张Zong在修行 阅读(387) 评论(0) 推荐(0) 编辑
摘要: **训练一个NLU模型** 本文将使用trainer 训练一个牛客网讨论帖文本分类模型。详细过程如下: #### 构建数据集 数据集下载链接: [train data](https://github.com/chadqiu/newcoder-crawler/blob/main/train.csv) 阅读全文
posted @ 2023-07-30 18:31 张Zong在修行 阅读(350) 评论(0) 推荐(0) 编辑
摘要: **报错信息** Python加载xlsx文件时,遇到: ```python xlrd.biffh.XLRDError Excel xlsx file; not supported ``` **错误原因** 报错翻译过来是: ```python xlrd.biffh.xlrd错误:Excel xls 阅读全文
posted @ 2023-07-30 16:14 张Zong在修行 阅读(538) 评论(0) 推荐(0) 编辑
摘要: 在Hugging Face中,`config.json`文件是用于配置预训练模型参数的文件。这个文件通常包含了模型的架构、超参数和其他模型配置信息。它是一个JSON格式的文件,可以在加载模型时用来初始化模型的配置。 在加载模型时,`from_pretrained()`方法通常会自动加载相应的`con 阅读全文
posted @ 2023-07-30 12:22 张Zong在修行 阅读(3027) 评论(1) 推荐(0) 编辑
摘要: 在 Hugging Face 中,有多种不同的 tokenizer 实现可供选择,每种实现都有其独特的优缺点和用途。 1. `BertTokenizer`:适用于 BERT 模型,支持 WordPiece 分词和 Byte-Pair Encoding(BPE)分词算法。它还支持对输入序列进行截断和填 阅读全文
posted @ 2023-07-30 11:49 张Zong在修行 阅读(1601) 评论(0) 推荐(0) 编辑
摘要: 本实验将实现一款爬虫工具,微博热搜采集发送器,通过 requests 库加 bs4 库完成对热搜的爬取,之后通过 smtplib 库与 email 库实现邮件信息的传递。最后还为大家介绍了一个爬虫技巧,pandas 一行代码抓取表格数据。 #### 知识点 - 微博热搜爬取 - Python 邮件发 阅读全文
posted @ 2023-07-30 07:45 张Zong在修行 阅读(165) 评论(0) 推荐(0) 编辑