magika google 开源的基于深度学习的文件类型检测框架
magika google 开源的基于深度学习的文件类型检测框架,基于了一个keras 模型,包含了1MB的参数,而且需要的资源比较少
不以来GPU
包含的特性
- 支持python cli 以及nodejs 使用(基于tfjs)
- 训练超过了25M的文件数,超过100中类型
- 支持递归检测
- 支持3中类型的预测模型高,中,最优模式
说明
magika 目前已经在google 内部使用了,包含drive,gmail 主要是对于文件内容安全的处理
参考资料
https://github.com/google/magika
https://google.github.io/magika/
https://opensource.googleblog.com/2024/02/magika-ai-powered-fast-and-efficient-file-type-identification.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
2023-02-19 tsup 简单快速的typescript库打包工具
2023-02-19 pgspider v0.20 之后的一些变动
2023-02-19 pgspider 发布v0.3.0 了
2022-02-19 grafana loki 2.4 简化服务部署
2021-02-19 airbyte 整体架构
2021-02-19 plop 方便的micro-generator framework
2021-02-19 jsdelivr 工作原理