上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 16 下一页
摘要: 我们在阅读源码的时候可以看见这样的代码: ```python from torchmetrics.classification import ( accuracy, precision, recall, f1_score, iou, hamming_distance, ) ``` 如果不加括号,代码 阅读全文
posted @ 2023-07-09 19:50 张Zong在修行 阅读(110) 评论(0) 推荐(0) 编辑
摘要: **模型下载地址**:https://www.huggingface.co/THUMT/mGPT ### mGPT mGPT使用因果语言建模目标在[mC4 数据集](https://huggingface.co/datasets/mc4)上进行预训练。它已在[本文](https://arxiv.or 阅读全文
posted @ 2023-07-09 17:37 张Zong在修行 阅读(303) 评论(0) 推荐(0) 编辑
摘要: 编码(Encoding)是将字符转换为计算机可以处理的二进制数据的过程。在计算机中,所有的文本都是以二进制形式存储的,因此需要使用编码将文本转换为二进制数据。Python 中的编码指的是将字符串转换为字节串(bytes)的过程,或将字节串转换为字符串的过程。 ### 编码与解码 在 Python 中 阅读全文
posted @ 2023-07-09 15:52 张Zong在修行 阅读(38) 评论(0) 推荐(0) 编辑
摘要: **文本分词(Tokenization)是将一个文本序列分割成一个个单独的“词”或“标记”的过程**。在自然语言处理(NLP)中,文本分词是一个必要的预处理步骤,几乎所有的自然语言处理任务都需要对文本进行分词。 文本分词的目的是根据某种规则或算法,将文本序列分割成较小的单元,例如**单词、词组、标点 阅读全文
posted @ 2023-07-09 12:23 张Zong在修行 阅读(89) 评论(0) 推荐(0) 编辑
摘要: **需求说明:** 我们想要收集单语数据,但是有时候数据是json类型的存在,我们想要在json数据中读取单语数据的部分,把它们处理成每行一条单语数据的文件。 #### 数据展示 **json数据:** ```json # 一条数据的展示 {"articleId": 2, "sentId": 20, 阅读全文
posted @ 2023-07-09 09:01 张Zong在修行 阅读(37) 评论(0) 推荐(0) 编辑
摘要: ### 前言: 魔法方法(Magic Method)是Python内置方法,格式为:“`__方法名__`”,不需要主动调用,存在的目的是为了给python的解释器进行调用,几乎每个魔法方法都有一个对应的内置函数,或者运算符,当我们对这个对象使用这些函数或者运算符时就会调用类中的对应魔法方法,可以理解 阅读全文
posted @ 2023-07-08 23:56 张Zong在修行 阅读(38) 评论(0) 推荐(0) 编辑
摘要: 导包的时候我们可能会遇到这样的代码: ```python try: from .hugmodel import HugModel except Exception: pass ``` 这段代码的作用是尝试导入名为 `HugModel` 的模块,如果导入失败则不做任何操作,而是直接跳过异常。其中 `. 阅读全文
posted @ 2023-07-08 18:56 张Zong在修行 阅读(130) 评论(0) 推荐(0) 编辑
摘要: 相信对于大多数熟悉Python的人来说,一定都听说并且使用过pip这个工具,但是对它的了解可能还不一定是非常的透彻,今天就来为大家介绍pip的小技巧,相信对大家以后管理和使用Python当中的标准库会有帮助。 ### 安装 当然在Python 3.4版本之后以及Python 2.7.9版本之后,官网 阅读全文
posted @ 2023-07-08 18:06 张Zong在修行 阅读(35) 评论(0) 推荐(0) 编辑
摘要: 众所周知,**JSON 文件**是使用 JSON(JavaScript Object Notation)格式存储数据的文件。它是一种结构化的文本格式,使用键值对的方式表示数据。JSON 文件通常包含一个根对象,可以包含多个嵌套的对象、数组和基本数据类型。 而 **`JSONL 文件`(JSON Li 阅读全文
posted @ 2023-07-08 17:36 张Zong在修行 阅读(1588) 评论(0) 推荐(0) 编辑
摘要: **词嵌入技术**主要是为了解决自然语言处理中的词表示问题,将词转化成机器容易理解的形式。 在早期的自然语言处理任务中,词通常被表示为离散的符号,例如"猫"就是一个符号,"狗"是另一个符号,这种表示方法无法捕捉词与词之间的语义关系。 **作用原理**词嵌入技术将词映射到连续的向量空间中,使得语义上相 阅读全文
posted @ 2023-07-08 17:07 张Zong在修行 阅读(483) 评论(0) 推荐(0) 编辑
上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 16 下一页