kaggle平台的配置与使用
Kaggle是由联合创始人、首席执行官安东尼·高德布卢姆(Anthony Goldbloom)2010年在墨尔本创立的,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。很多数据样本可以从该平台获取。类似于Githup.
想获取上面的数据则需要一个账号。
目前只支持Facebook gmail 雅虎账号直接授权登录。
由于某些原因,账号登录时认证需要使用vpn。个人习惯直接使用gmail授权登录。恰好谷歌访问助手可以直接访问gmail.这种方式比赛风3FQ靠谱多了,不会总是掉线。
反正授权登录是没有问题的,想去看墙外其他精彩的世界,还是用vpn哦,小老弟。
使用kaggle实现数据集的下载:
1.在用户头像处点击 My Account,进入用户中心,若当前设备未安装kaggle库,则需要安装 pip install kaggle
2.在 C:\Users\asaxh\.kaggle 找到.kaggle文件夹。如果没有这个文件夹,可以在命令行中输入 kaggle competitions list
待其报错后,去刷新当前目录,则能看到文件夹了。
3.去个人中心my account 下最下面生成一个授权的json文件,授权认证需要它,将该文件拷贝之.kaggle中。
再次执行 kaggle competitions list 就能看到列表数据了。
4.去下载数据集,就是页面中提供好的URL地址,直接在命令行执行就能下载了。
比如获取如下页面数据:https://www.kaggle.com/c/instacart-market-basket-analysis/data
碰到的问题:forbidden 403
新账号授权登录问题,用gmail登录kaggle,被要求验证手机号码,手机号码正常填写后,无法收到验证码。
查询后才明白要手动在前面补860,才能是国内的手机号,太low了。浙江嘉兴的服务商提供的验证码,呵呵
手机账号认证后,还需要同意规则。否则一直都是403错误。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?