OpenMLDB 社区月报 | 2022年11月
十一月,OpenMLDB 进行了高频的小版本迭代,共发布四个版本,平均每周一次。v0.6.5、v0.6.6、v0.6.7 和 v0.6.8 陆续与广大开发者见面,在增强功能的同时,也提高了运维效率,对易用性、可观测性、自动化等方面进行了改进。
技术动态
十一月 v0.6.5 - v0.6.8 新特性
-
优化表分区的分布(Optimize the distribution of table partitions)
-
添加一个新的工作流来自动生成内置函数的文档(Add a new workflow to generate the documents of built-in functions automatically)
-
支持新的 SQL 语句
show joblog
(Support the new SQL statement show joblog ) -
添加显示表状态的警告消息(Add a warning message for show table status )
-
添加用于数据恢复和横向扩展/纵向扩展的新工具(Add a new tool for data recovery and scale-out/scale-in )
-
支持新的内置函数
hash64
(Support the new build-in function hash64) -
支持从/向配置单元导入和导出数据 (Support importing and exporting data from/to Hive)
-
改进了
autof
的模块 (Improve the module of autofe) -
改进了
TaskManager
客户端的错误消息 (Improve error messages of the TaskManager client) -
支持 SQL 批处理引擎中的
where
子句 (Support the where clause in the SQL batch engine) -
在 APIServer 中支持 JSON 格式的输入和输出 (Support input and output with the JSON format in APIServer)
十一月主要 Bug 修复
-
当模式与 parquet 文件不匹配时会在脱机模式下加载错误数据 (Incorrect data will be loaded in offline mode if the schema mismatches with parquet files. )
-
如果在 SQL 语句中指定数据库,则创建索引失败(Creating index fails if specifying a database in SQL statement)
-
提交作业后,start_time 不可读(
start_time
is not human-readable after submitting a job) -
MemTable
中产生了错误的GetRecordIdxCnt
结果(Incorrect result of GetRecordIdxCnt is produced in MemTable ) -
在 MacOS 虚拟机中找不到
pytest
命令。(pytest command is not found in the MacOS virtual machine.) -
错误的输出架构传递到
WindowAggRunner
。 (Wrong output schema passes to the WindowAggRunner.) -
如果未指定数据库,则执行
showopstatus
命令时没有输出 (There are no outputs when executing showopstatus command if no database is specified) -
数据恢复工具在某些情况下会失败 (The data recovery tool fails in some cases )
-
Python SDK 工作流在 MacOS 上可能会失败。 (Python SDK workflow may fail on MacOS.)
-
某些日志消息中存在语法错误。(There are syntax errors in some log messages. )
-
安装 Python SDK 需要冗余的安装包。 (Installing Python SDK requires unnessary packages.)
社区动态
社区活动
分享活动
-
11月16日 19:30-21:00
OpenMLDB 项目发起人、第四范式技术副总裁 郑曌 受邀主持 DataFunSummit 2022 AI基础软件架构峰会圆桌会,与一流科技创始人 袁进辉、百度飞桨总架构师 于佃海等资深专家在线上做深度的交流分享。 -
11月19日 13:30-17:30
OpenMLDB 项目发起人、第四范式技术副总裁 郑曌 作为出品人发起 DataFunSummit 2022 MLOps 及 AI 工程化落地论坛,与阿里云高级技术专家 林东、微软首席数据科学家 朱晓勇等业界专家共话 AI 应用落地。其中 OpenMLDB PMC 卢冕 在论坛中为大家带来议题为《开源机器学习数据库 OpenMLDB:线上线下一致的生产级特征平台》的内容分享。 -
11月19日 14:30-15:30
OpenMLDB PMC 祁利国在 GIAC 全球互联网架构大会人工智能基础设施专题 中为大家带来议题为《开源数据库 OpenMLDB:线上线下一致的实时特征平台》的内容分享。
贡献活动
-
OpenMLDB Bug 悬赏令仍在进行中。
-
开源摘星活动活动也在持续进行。
-
OpenMLDB 贡献者任务第五期、开发者嘉年华在十一月落下帷幕。
-
OpenMLDB 参与的高校开源活动——2022 开源之夏和 GLCC 编程夏令营于十一月圆满结束并完成公示。
希望各位开发者在开源活动中获得技术上成长进步,也在测试使用中加深对 OpenMLDB 的了解掌握,与 OpenMLDB 共建包容有活力的开源生态。
后续,OpenMLDB 也会积极合作或组织开展开源活动,为各位提供更丰富的开源实践机会、更广阔的开源参与平台。
Meet us
OpenMLDB 官网
OpenMLDBgithub主页(更多动态请关注这里!)
https://github.com/4paradigm/OpenMLDB
OpenMLDB 微信交流群