pytorch Dataset数据集和Dataloader迭代数据集
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 | import torch from torch.utils.data import Dataset,DataLoader class SmsDataset(Dataset): def __init__( self ): self .file_path = "./SMSSpamCollection" self .lines = open ( self .file_path,encoding = "utf-8" ).readlines() def __getitem__( self , index): line = self .lines[index].strip() label = line.split( "\t" )[ 0 ] sent = line.split( "\t" )[ 1 ] return label,sent def __len__( self ): return len ( self .lines) sms_dataset = SmsDataset() dataloader = DataLoader(sms_dataset,batch_size = 2 ,shuffle = True ) if __name__ = = '__main__' : for idx,(label,sent) in enumerate (dataloader): print (idx) print (label) print (sent) break print ( len (sms_dataset)) print ( len (dataloader)) |
1 2 3 4 5 | 0 ( 'ham' , 'spam' ) ( 'And popping <#> ibuprofens was no help.' , 'This is the 2nd time we have tried 2 contact u. U have won the 750 Pound prize. 2 claim is easy, call 08712101358 NOW! Only 10p per min. BT-national-rate' ) 5574 2787 |
多思考也是一种努力,做出正确的分析和选择,因为我们的时间和精力都有限,所以把时间花在更有价值的地方。
标签:
人工智能
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 用 C# 插值字符串处理器写一个 sscanf
· Java 中堆内存和栈内存上的数据分布和特点
· 开发中对象命名的一点思考
· .NET Core内存结构体系(Windows环境)底层原理浅谈
· C# 深度学习:对抗生成网络(GAN)训练头像生成模型
· 趁着过年的时候手搓了一个低代码框架
· 本地部署DeepSeek后,没有好看的交互界面怎么行!
· 为什么说在企业级应用开发中,后端往往是效率杀手?
· 用 C# 插值字符串处理器写一个 sscanf
· 乌龟冬眠箱湿度监控系统和AI辅助建议功能的实现