06 2020 档案
摘要:主要用到了python中的random和numpy 生成随机整数 生成m~n以内的随机数 >>> import random >>> random.randint(0,10) 1 >>> random.randint(0,10) 9 >>> random.randint(0,10) 6 生成k个m~
阅读全文
摘要:词袋模型是一种表征文本数据的方法,可以从文本数据中提取出特征并用向量表示.词袋模型主要包括两件事 构建词汇表 确定度量单词出现的方法 词袋模型不考虑单词在文本中出现的顺序,只考虑单词是否出现. 具体以"双城记"开头为例 收集数据 It was the best of times, it was th
阅读全文
摘要:C ++提供了一种数据结构,即数组,该数组存储一个固定大小的由相同类型元素构成的顺序集合。 数组中的元素存储在一个连续内存位置中,元素可通过数组索引访问, 最低地址对应于第一个元素,最高地址对应于最后一个元素。 声明数组 例如 声明固定长度的数组: const int Size = 5; int a
阅读全文
摘要:在finetune Chinese GPT2的时候遇到如上错误,错误原因index越界,原始代码中给定的输入长度是1024,但是我使用模型可接受的输入长度是512,把输入长度都改为512,错误解决
阅读全文