摘要:
本文深入探讨语音识别处理环节。 本阶段的重点特性为语音识别、VAD、热词、文本的时间偏移、讲话人的识别等。 语音识别 业界流派众多,比如Kaldi、端到端等,具体选择哪一种,需要综合考虑人员能力、训练数据量和质量、硬件设施、交付周期等,作出相对合理的交付规划。 基于Kaldi的方案,优点在于其发挥稳 阅读全文
摘要:
对于应用星型建模来建设数据仓库业务,在工程实践时绕不开的一个话题。但在数据仓库工具箱(第3版)- 维度建模权威指南和大数据之路 - 阿里巴巴大数据实践却没有详细说明,很有意思。 我接触数据仓库类业务时间不长,距今不过9个月左右,但在这个问题上迷惑了很长时间。前后咨询了多位从业同事,他们给出了很多答案 阅读全文
摘要:
产品内部前期有一个共识,依据业务要求的时效性来选择技术平台,即: 实时类业务,时效性小于2小时,则使用HANA构建。 离线类业务,时效性大于2小时,则使用大数据平台构建。 经过五月、六月两月的努力,离线类的业务已基本完成开发和验证完毕,后面待在生产环境对数完毕后,即可启动切换。 因此实时类业务的方案 阅读全文
摘要:
依据部门的统计数据,70%的生产事故都和生产变更操作相关,而究其原因,重要的一点即是变更方案准备不充分,导致生产变更过程中的操作和实施步骤中的操作存在差异,重要操作在实施步骤中存在遗漏、细节缺失,对于可能出现的意外场景,准备不充分,缺少预案,或者预案实施后会引发其它的次生问题。 自18年10月接手X 阅读全文
摘要:
转岗之初 18年9月,转岗至新部门,主业是数据仓库类的项目。 部门主管安排我们几个一起转岗的同事,线下学习资料,比如大数据之路:阿里巴巴大数据实践和数据仓库工具箱。 喜接新项目 10月国庆节后,10号晚,到达深圳。 11号上午去部门报到,导师告知我将接手一个项目组,简称G。在我还在苦思项目G的含意时 阅读全文
摘要:
索引的参数,分为两类: 静态参数,仅支持在创建索引时指定,或者关闭索引后指定。 动态参数,允许在索引工作期间指定或者修改。 静态参数 index.number_of_shards 默认值为1。 本参数用于控制主分片的数量,仅支持在创建时指定,对于已关闭的索引,修改本参数不会生效。 es.index. 阅读全文
摘要:
MinIO提供了一个命令行程序mc用于协助用户完成日常的维护、管理类工作。 官方资料 mc diff 检查指定桶内对象清单的差异,注意不比较对象内容的差异,命令如下: ./mc diff local1/bkt1 local1/bkt2 控制台的输出,如下: < http://192.168.0.10 阅读全文
摘要:
MinIO提供了一个命令行程序mc用于协助用户完成日常的维护、管理类工作。 官方资料 mc head 查看对象的前N行内容,N默认为10,命令如下: ./mc head local1/bkt1/docker-compose 控制台的输出,如下: #!/bin/bash # # Run docker- 阅读全文
摘要:
MinIO提供了一个命令行程序mc用于协助用户完成日常的维护、管理类工作。 官方资料 mc stat 获取指定桶或者对象的信息,包含对象的元数据。 指定桶bkt1,查看信息,命令如下: ./mc stat --recursive local1/bkt1 控制台的输出,如下: Name : bkt1/ 阅读全文
摘要:
MinIO提供了一个命令行程序mc用于协助用户完成日常的维护、管理类工作。 官方资料 mc share mc share download mc share upload 生成下载对象的URL,指定对象名称,命令如下: ./mc share download --recursive local1/b 阅读全文