合集-大数据

摘要:设想我们在一家很大的互联网公司做IT方面的规划、开发和维护,有以下这样的应用场景: 公司里有若干个不同的开发团队,开发语言有Java、.net、Python、C++....十来种,还有很多外包团队对项目进行开发,大中小系统已经多的数不过来;并且各个团队、系统间都需要进行海量数据的交换(比如搜索引擎实 阅读全文
posted @ 2024-07-08 13:22 thanks 阅读(358) 评论(0) 推荐(0) 编辑
摘要:Spark中的那些坑 Spark中的那些坑 前言 读取配置文件 时区陷阱 怪异的DayOfWeek substring陷阱 IP地址解析 枚举的数值 posexplode函数 为什么我的程序运行那么慢?慎用Count()和Show() 为什么我的程序运行那么慢?(2)优化、优化 其它 题外话 前言 阅读全文
posted @ 2023-02-01 13:38 thanks 阅读(350) 评论(0) 推荐(0) 编辑
摘要:每当我们在公有云或者私有云发布训练好的大数据模型,为了方便大家辨识、理解和运用,参照huggingface所制定的标准制作一个Model Card展示页,是种非常好的模型展示和组织形式。 下面就是一个Model Card 的示例,我试着把它翻译成了中文,源网址,并且提供了Markdown的模板,供大 阅读全文
posted @ 2024-07-09 14:04 thanks 阅读(230) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示