10 2020 档案

boundary 基于身份标示的动态基础设施管理工具
摘要:boundary是hashicorp最新开源的动态基础设施身份管理工具,当前处于早期阶段,比较期待ga 参考资料 https://github.com/hashicorp/boundary https://boundaryproject.io/ 阅读全文

posted @ 2020-10-28 20:52 荣锋亮 阅读(597) 评论(0) 推荐(0) 编辑

使用path 格式获取java hashmap key 值
摘要:一个简单场景,需要通过字符串格式获取hashmap 的数据 参考请求格式 getvalue(hashmap,"<key>.<subkey>.<subkey>") 好处,我们不需要进行太多复杂的处理,就可以方便的获取支持嵌套hashmap的数据 参考工具类 package com.dalong; ​ 阅读全文

posted @ 2020-10-28 18:55 荣锋亮 阅读(526) 评论(0) 推荐(0) 编辑

Kubeapps-2.0 发布了
摘要:Kubeapps-2.0 最进发布了,提供了好多新的特性,同时新的ui以下是一些参考连接 https://blog.bitnami.com/2020/10/Kubeapps-2.0.html https://github.com/kubeapps/kubeapps/releases/tag/v2.0 阅读全文

posted @ 2020-10-28 18:54 荣锋亮 阅读(436) 评论(0) 推荐(0) 编辑

monio系统性能分析相关命令
摘要:minio 的mc 是一个很不错的工具,提供了比较全的关于minio 的操作,比如系统的profile profile命令 可以生成profile 相关的(cpu,mem.block...) mc admin profile start --type cpu,mem,block <mc配置的endp 阅读全文

posted @ 2020-10-28 14:40 荣锋亮 阅读(609) 评论(0) 推荐(0) 编辑

imgproxy 强大高效的图片处理服务
摘要:imgproxy 类似willnorris/imageproxy,但是功能上更加强大,也是基于golang编写的,但是支持的配置参数以及 扩展上更加灵活 参考使用场景 参考运行 启动服务 docker run -p 8080:8080 -it darthsim/imgproxy 重置图片大小例子 h 阅读全文

posted @ 2020-10-27 21:31 荣锋亮 阅读(1791) 评论(0) 推荐(0) 编辑

java 使用js 引擎处理业务逻辑
摘要:一个比较简单的demo,就是基于java 内置的js 引擎,扩展业务逻辑代码,实现一个xml 解析的 项目结构 代码简单说明 就是js 中使用了jackson xml 处理,同时获取xml 数组的第一个,转换为book 对象,方便业务处理 pom.xml <?xml version="1.0" en 阅读全文

posted @ 2020-10-27 19:41 荣锋亮 阅读(1338) 评论(0) 推荐(0) 编辑

nodejs java 互调用
摘要:nodejs 与java的互调用方法很多,我们可选的是使用oracle 新的vm 引擎(graalvm很不错) 还有就是基于browserify进行包装,同时给java 提供一套require 的模式机制,但是对于原 生的nodejs 来说就有一些问题了,社区有人提供了一个基于jni的node 包装 阅读全文

posted @ 2020-10-27 13:03 荣锋亮 阅读(6849) 评论(0) 推荐(0) 编辑

开发一个简单的maven plugin
摘要:maven plugin 的开发还是比较清晰以及简单的,因为maven 提供了自己的ioc 以及开发约定,同时社区也有比较多的扩展 我们都是可以参考学习的,官方也还算清晰 简单说明 如果需要开发maven 插件我们需要做的就是开发自己的mojo,同时配置一些参数注解,因为很多时候我们需要依赖外部服务 阅读全文

posted @ 2020-10-25 14:42 荣锋亮 阅读(976) 评论(0) 推荐(0) 编辑

apache trafficcontrol 开源的基于golang 的cdn 框架
摘要:apache trafficcontrol 是一个开源的基于golang编写的可以用来cdn 的框架 包含的模块 流量操作 流量路由 流量统计 流量portal 流量监控 参考资料 https://trafficcontrol.apache.org/ https://github.com/apach 阅读全文

posted @ 2020-10-23 20:29 荣锋亮 阅读(1092) 评论(0) 推荐(0) 编辑

sftpgo 多功能高度可配置的sftp server
摘要:sftpgo 是一个很不错的多功能特性的sftp server 同时支持s3,webdav,gcs,本地文件系统 是一个很不错的mock server,同时也提供了强大的用户管理以及权限配置,同时源码也是很 值得学习的,有空了可以试用了 参考资料 https://github.com/drakkan 阅读全文

posted @ 2020-10-23 19:37 荣锋亮 阅读(1701) 评论(0) 推荐(0) 编辑

opencsv csv 数据解析通用包
摘要:opencsv是一个很不错的java 版本csv 解析包,使用简单,而且比较灵活 参考代码 pom.xml <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns: 阅读全文

posted @ 2020-10-23 19:09 荣锋亮 阅读(1081) 评论(0) 推荐(0) 编辑

jenkins+ rclone定时同步sftp数据到s3
摘要:一个简单任务场景,业务对账,同时需要备份请求的对账文件(sftp服务),所以使用了一个强大的支持 多种存储的工具rclone,然后定时自动同步到s3存储中,对于定时任务,使用jenkins(基于定时任务cron) 使用jenkins的好处是灵活可以随意配置,同时我们系统已经有了好多构建节点,具有冗余 阅读全文

posted @ 2020-10-23 13:29 荣锋亮 阅读(886) 评论(0) 推荐(0) 编辑

一个关于java package 命名的一个坑
摘要:昨天写了一个简单的demo代码,一般java pacakge 的命名类似<com>.<company>.<subpackage> 格式的 但是因为手误,将com 写成了con,因为自己使用的是mac系统,运行一点问题都没有,但是在提交git 之后 同事需要使用部分参考代码(windows系统),然后 阅读全文

posted @ 2020-10-22 19:49 荣锋亮 阅读(228) 评论(0) 推荐(0) 编辑

spring boot 访问sftp csv 格式数据&&写入db
摘要:算是一个比较常见的问题,银行对账(sftp读取使用csv格式,比ftp安全点),一般都是定时数据处理(可以使用spring boot 的Scheduled 可以方便处理) 以下只是说明关于sftp读取以及csv处理以及jdbc写入的 依赖的组件 spring-integration-sftp(包装处 阅读全文

posted @ 2020-10-22 11:28 荣锋亮 阅读(1017) 评论(0) 推荐(1) 编辑

使用properties-maven-plugin管理配置
摘要:properties-maven-plugin 是一个很不错的配置管理插件,很多时候我们的配置有安全以及多环境的问题 那个基于properties-maven-plugin 就是一个很不错的选择,我们可以基于此插件管理不用的配置,同时 结合resource 插件进行资源的替换,可以灵活的管理我们的配 阅读全文

posted @ 2020-10-21 12:53 荣锋亮 阅读(1084) 评论(0) 推荐(0) 编辑

The Fault in Our JARs: Why We Stopped Building Fat JARs
摘要:一篇很不错的关于fat jar 的文章,参考资料https://product.hubspot.com/blog/the-fault-in-our-jars-why-we-stopped-building-fat-jars HubSpot’s backend services are almost 阅读全文

posted @ 2020-10-21 12:48 荣锋亮 阅读(132) 评论(0) 推荐(0) 编辑

go-plugin hashicorp开源的golang插件框架
摘要:go-plugin 已经存在很长时间了,同时hashicorp公司的好多产品都在使用vault,terrform,nomad,waypoint 详细的介绍可以参考官方文档,以下只是一个简单的学习试用(demo来自官方) 项目准备 go mod go mo init demo-plugin go ge 阅读全文

posted @ 2020-10-20 17:35 荣锋亮 阅读(3107) 评论(0) 推荐(0) 编辑

maven 下载项目依赖jar包的方法
摘要:尽管我们使用了maven进行项目管理,但是很多时候可能需要使用依赖的jar包(排查问题,分发) 我们可以基于maven-dependency-plugin 解决 参考配置 核心配置 <plugin> <groupId>org.apache.maven.plugins</groupId> <artif 阅读全文

posted @ 2020-10-20 11:36 荣锋亮 阅读(3740) 评论(0) 推荐(0) 编辑

govalidator 方便的golang 数据校验框架
摘要:govalidator提供了基于tag 的golang 数据类型校验,实际上其他语言比如.net java ,typescript 也都有类似的框架 以下是一个简单的试用 环境准备 go mod go mod init demoapp 简单代码 main.go package main ​ impo 阅读全文

posted @ 2020-10-19 23:04 荣锋亮 阅读(758) 评论(0) 推荐(0) 编辑

go mod checksum mismatch 问题
摘要:最近在跑一个项目clone 完成代码之后需要进行构建,发现了如下问题 <wiz_code_mirror> verifying gopkg.in/src-d/go-git.v4@v4.13.1/go.mod: checksum mismatch downloaded: h1:G7mAYYxgmS0lV 阅读全文

posted @ 2020-10-19 21:38 荣锋亮 阅读(4822) 评论(0) 推荐(0) 编辑

基于openresty的ip白名单控制
摘要:目的很简单,因为基于nginx的 ngx_http_access_module ip 模块有点太弱了,不灵活,可以直接使用openresty 在access_by_lua 阶段处理 预备 我们需要支持cidr格式的ip,所以需要一个灵活的ip解析处理包, hamishforbes/lua-resty 阅读全文

posted @ 2020-10-19 20:41 荣锋亮 阅读(2055) 评论(0) 推荐(0) 编辑

go-linq 很不错的golang linq 包
摘要:go-linq 是.net linq 的golang 实现,使用简单灵活,而且支持多种操作模式,同时也支持基于范型函数,使得代码更清晰 linq 参考格式 From(slice) .Where(predicate) .Select(selector) .Union(data) 参考使用 集成了mit 阅读全文

posted @ 2020-10-19 20:39 荣锋亮 阅读(3252) 评论(0) 推荐(0) 编辑

ClearScript 微软开源的js 引擎
摘要:ClearScript 实际上属于一个老项目了,只是最近微软迁移到github了,同时也增强了跨平台的支持(linux,mac) 对于基于.net 系列的软件开发是比较方便了,当然目前和graalvm 的js 引擎相比还是比较弱的 ,比较期待微软能 有更好的提升 目前支持的特性 js 与.net o 阅读全文

posted @ 2020-10-19 13:06 荣锋亮 阅读(2296) 评论(0) 推荐(0) 编辑

malinajs来自Svelte 启发的前端编译器
摘要:malinajs是一个前端编译器,可以不用框架来开发web 应用,好处是我们的web 应用可以变得 比较小以及快速,同时官方也提供了一些关于Svelte 以及vue3的比较,是一个比较有意思的项目 同时官方也提供了一个repl可以方便的调试 参考资料 https://github.com/malin 阅读全文

posted @ 2020-10-19 09:36 荣锋亮 阅读(309) 评论(0) 推荐(0) 编辑

Luckysheet 国内企业开源的很不错的web excel 项目
摘要:Luckysheet 是由国内企业开源的web excel 项目,功能真的很强大,而且我们可以方便的集成到我们的web应用中 参考资料 https://github.com/mengshukeji/Luckysheet 阅读全文

posted @ 2020-10-19 09:17 荣锋亮 阅读(1793) 评论(0) 推荐(0) 编辑

Waypoint Server 安装
摘要:如果运行了官方的demo 应该知道默认需要进行server 的安装的,基于容器部署的应用需要进行server的部署启动 实际上按照官方的说明,server 可以只需要一个,同时也是可以独立只不是一个的,并不需要部署多个的,以下 是关于手工部署的简单说明 部署流程 启动server 只是初始化 way 阅读全文

posted @ 2020-10-18 22:15 荣锋亮 阅读(215) 评论(0) 推荐(0) 编辑

Waypoint Entrypoint简单说明
摘要:Waypoint Entrypoint 实际上基于接口1号进程的一个二进制应用,类似docker 的tinit 进程(类似的很多) 但是Entrypoint提供了其他的功能: url 服务 应用配置 exec (类似容器的exec) logs (类似容器的logs) 实例追踪 参考图 一个简单说明 阅读全文

posted @ 2020-10-18 22:07 荣锋亮 阅读(225) 评论(0) 推荐(0) 编辑

clustershell 方便的软件部署工具
摘要:clustershell 是基于基于python开发的事件驱动的包,提供也提供了cli工具,可以用来方便的管理大规模的软件包 类似ansible,是一个值得使用的软件包以及工具集,同时以及存了各种语言的软件包 ,可以使用方便的安装 参考资料 https://clustershell.readthed 阅读全文

posted @ 2020-10-18 21:18 荣锋亮 阅读(146) 评论(0) 推荐(0) 编辑

waypoint docker 部署试用
摘要:以下是关于部署到docker的测试试用 安装waypoint mac 系统 brew tap hashicorp/tap brew install hashicorp/tap/waypoint clone 代码 clone demo 代码 git clone https://github.com/h 阅读全文

posted @ 2020-10-18 12:44 荣锋亮 阅读(334) 评论(0) 推荐(0) 编辑

waypoint 参考架构
摘要:以下内容来自官方文档 概览 包含的组件 server waypoint 比较核心的存储状态的服务,同时提供了api,方便cli,enrtypoint 以及其他消费者访问 cli 就是我们客户端使用的工具 entrypoint 提供了exec log 以及url 服务,属于一个包装,方便server 阅读全文

posted @ 2020-10-18 10:53 荣锋亮 阅读(568) 评论(0) 推荐(0) 编辑

waypoint hashicorp 团队新开源的跨多平台的构建部署&&发布工具
摘要:hashicorp 真是很给力开源了waypoint可以多平台的构建,部署以及发布 waypoint设计与terrform 类似都提供了插件模式,目前支持的插件 buildpacks docker k8s aws&&ecs azure google cloud netlify .... 说明 way 阅读全文

posted @ 2020-10-17 21:40 荣锋亮 阅读(452) 评论(0) 推荐(0) 编辑

pgenv 一个不错的postgres 多版本管理工具
摘要:pgenv 类似rbenv 以及pyenv,可以方便我们进行posgres 各种版本的管理(特别使用开发以及测试) pgenv 的使用还是比较简单的,同时官方也提供了比较全的说明文档 参考资料 https://github.com/theory/pgenv 阅读全文

posted @ 2020-10-17 21:23 荣锋亮 阅读(317) 评论(0) 推荐(0) 编辑

golang 一些不错的环境变量管理包
摘要:joho/godotenv ruby dotenv 库golang 的移植,功能还是比较强大的,同时支持编码加载变量 参考使用 package main ​ import ( "github.com/joho/godotenv" "log" "os" ) ​ func main() { err := 阅读全文

posted @ 2020-10-17 21:17 荣锋亮 阅读(587) 评论(0) 推荐(0) 编辑

treemux 集成pprof以及statsviz
摘要:pprof 是golang内置的一个性能分析包,使用简单、方便,statsviz 是最近 开源的一个可视化的golang性能观察点 以下是说明treemux 如何集成这两个工具 准备pprof&&statsviz treemux handlerfunc 因为treemux与golang内置的hand 阅读全文

posted @ 2020-10-17 15:56 荣锋亮 阅读(402) 评论(0) 推荐(0) 编辑

treemux 基于tree模型的golang http httprouter
摘要:treemux 是一个新的基于tree结构的httprouter 支持的特性 包装的handler 中间件(handler包装) tree 模式的路由规则 路由组(方便应用扩展) 自定义错误 自定义重定向 参考使用 参考代码 package main ​ import ( "fmt" "net/ht 阅读全文

posted @ 2020-10-16 16:33 荣锋亮 阅读(266) 评论(0) 推荐(0) 编辑

QRGen+thumbnailator生成包含logo 参考配置说明
摘要:以下主要是说明下生成的一些细节,减少使用难度 参考代码 pom.xml <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3 阅读全文

posted @ 2020-10-16 12:30 荣锋亮 阅读(212) 评论(0) 推荐(0) 编辑

golang图片处理的一些包
摘要:搜索来源子github,主要是进行一些整理 ,方便后期使用 参考项目 https://github.com/golang/image https://github.com/fogleman/primitive https://github.com/disintegration/gift https: 阅读全文

posted @ 2020-10-16 12:25 荣锋亮 阅读(1867) 评论(0) 推荐(0) 编辑

pg 关于使用zfs文件系统的优化参考
摘要:文章来自go-pg/pg 项目,官方文档有一篇关于pg使用zfs文件系统的优化说明,很不错,所以记录下 ,同时看了这篇文档 大家对于一些性能优化也会有一些收获的-我们实际部署环境的时候最好结合实际的情况,合理选择较优的参数 ,以前经常 和别人说过一个话题: sql server 大家一般使用上配置管 阅读全文

posted @ 2020-10-16 12:24 荣锋亮 阅读(549) 评论(0) 推荐(0) 编辑

QRGen+thumbnailator生成包含logo 的 二维码
摘要:原理很简单:QRGen 生成二维码,同时结合thumbnailator的 水印模式将图片放中心,这样一个支持logo 的二维码就可以了 参考代码 pom.xml <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.a 阅读全文

posted @ 2020-10-15 23:31 荣锋亮 阅读(273) 评论(0) 推荐(0) 编辑

jdbc连接池工具与pg fdw连接的问题 二
摘要:上次有简单介绍过关于pg fdw 对于使用连接池故障的问题,经过几天的调试以及摸索 ,印证了上次说的关于 sql 预编译处理的,目前测试发现主要是对于tds-fdw 扩展引起的异常比较严重,会造成db 异常 ,然后自动恢复, 同时会造成连接异常,如果还需要使用连接池比较推荐使用hikari,需要我们 阅读全文

posted @ 2020-10-15 20:29 荣锋亮 阅读(333) 评论(0) 推荐(0) 编辑

apache ignite docker集群运行试用
摘要:apache ignite 是一个很不错的内存计算平台 常见参考使用场景 应用缓存加速 数据集成hub 基于容器的集群环境部署 环境准备 说明为了方便基于静态ip发现的模式进行集群的搭建,关于静态ip配置,核心如下 <bean class="org.apache.ignite.spi.discove 阅读全文

posted @ 2020-10-14 19:18 荣锋亮 阅读(951) 评论(0) 推荐(0) 编辑

rr一款强大的应用请求录制以及回放框架
摘要:rr 由mozilla团队开发,可以进行应用进程以及线程的调用的录制以及回放,可以方便的进行应用的性能调试 后边可以尝试使用下,同时此工具也是pg 官方关于追踪pg调用的工具 参考资料 https://github.com/mozilla/rr https://rr-project.org/ htt 阅读全文

posted @ 2020-10-14 13:27 荣锋亮 阅读(626) 评论(0) 推荐(0) 编辑

追踪postgres 后端调用情况
摘要:以下是篇文章来自官方文档,主要介绍下关于pg 系统如何调试后端调用情况的,后边好好研究下,最近刚好 碰到一个关于pg fdw 调用的问题,可以学习下如果基于工具分析原因 参考资料 https://wiki.postgresql.org/wiki/Getting_a_stack_trace_of_a_ 阅读全文

posted @ 2020-10-14 13:22 荣锋亮 阅读(147) 评论(0) 推荐(0) 编辑

重置idea 配置的方法
摘要:今天在运行idea的时候发现idea突然不好使了(maven项目内置依赖管理处理问题了,代码提示有问题),直接使用maven 构建命令是没有问题的,直接想到重置默认配置,搜过一些资料发现都不太好事(mac 系统 ),后边发现了官方的一篇介绍 文档,简单清晰 参考操作图 说明 多看官方文档还是很重要的 阅读全文

posted @ 2020-10-14 13:10 荣锋亮 阅读(7340) 评论(5) 推荐(0) 编辑

jdbc连接池工具与pg fdw连接的问题
摘要:最近一个项目使用了postgres 的fdw 进行跨库的业务数查询分析,直接使用pg 的client 工具以及直接使用pg的datasource 实现PGSimpleDataSource测试都是没有问题的 pg fdw 使用参考 因为项目默认使用了alibaba 的druid 连接池工具发现没请求几 阅读全文

posted @ 2020-10-14 13:00 荣锋亮 阅读(347) 评论(0) 推荐(0) 编辑

关于drill http存储插件http 超时的一些说明
摘要:默认http 存储插件的配置,参考 { "type": "http", "cacheResults": false, "connections": { "sunrise": { "url": "https://api.sunrise-sunset.org/json", "method": "GET" 阅读全文

posted @ 2020-10-12 23:36 荣锋亮 阅读(246) 评论(0) 推荐(0) 编辑

tds-fdw PostgreSQL said: DB-Library error: DB #: 20002, DB Msg: Adaptive Server connection failed, OS #: 0, OS Msg: Success, Level: 9 问题解决.md
摘要:属于一个常见问题,解决方法还是查看日志,可以配置的参数 配置sql ALTER SERVER mssql_svr OPTIONS (ADD msg_handler 'notice'); SET client_min_messages=DEBUG3; 通过以上配置参数我们可以方便的查看请求日志,进行问 阅读全文

posted @ 2020-10-12 22:25 荣锋亮 阅读(547) 评论(0) 推荐(0) 编辑

开发自己的jdbc驱动——可选开发工具
摘要:前边有简单介绍过关于jdbc驱动开发的说明,以下是一些简单的整理,提供关于快速开发jdbc的一些参考资料 驱动开发的一些说明 需要实现的接口 以下的接口是需要实现的,除过Driver 接口一般都会创建一个抽象类进行扩展 Statement ResultSetMetaData ResultSet Pr 阅读全文

posted @ 2020-10-11 21:15 荣锋亮 阅读(620) 评论(0) 推荐(0) 编辑

nexus Invalid state: DELETED; allowed: [STARTED] 问题解决
摘要:问题 线上nexus因为误操作 blob存储,造成nexus 出现Invalid state: DELETED; allowed: [STARTED],然后就是现有的nexus 也不能使用了(nexus服务异常) 以下是参考的解决方法 解决方法 手工处理相关的blob存储,删除,同时重启nexus服 阅读全文

posted @ 2020-10-10 11:35 荣锋亮 阅读(984) 评论(0) 推荐(0) 编辑

airline开发类似git cli 的jar 包
摘要:airline 是一个很不错的用来开发类似git cli 应用的jar包,使用简单,功能强大是一个值得使用的jar包 类似的jar 包有jcommander,picocli,同时picocli也提供了一个比较完整的开源cli 工具比较文章很值 得看看 参考资料 https://github.com/ 阅读全文

posted @ 2020-10-09 22:52 荣锋亮 阅读(247) 评论(0) 推荐(0) 编辑

开发自己的jdbc驱动——基本说明
摘要:jdbc目前支持4种类型的驱动模式 参考如下图,我们需要开发的是type4 100%纯java代码的,以下只是简单的原型,实现一个比较完整的jdbc驱动,后续会逐步完成 项目结构 当前没有依赖任何三方包,对于包含了依赖的,对于驱动的如果使用maven项目推荐使用maven-shade-plugin 阅读全文

posted @ 2020-10-09 20:44 荣锋亮 阅读(2324) 评论(0) 推荐(0) 编辑

nessie 安装&&简单试用
摘要:以下是关于nessie基于容器的简单运行试用 环境准备 docker 运行 docker run -p 19120:19120 projectnessie/nessie 安装cli pip install pynessie 试用 创建分支 nessie create-branch my_branch 阅读全文

posted @ 2020-10-08 22:28 荣锋亮 阅读(497) 评论(0) 推荐(0) 编辑

nessie 类似git 管理数据湖
摘要:nessie 是由dremio团队开源的一个类似git 管理数据湖的系统方案 支持的特性 类似git 模式的版本管理 跨表事物(基于iceberg) 开放式的数据湖支持 参考资料 https://projectnessie.org/ https://www.dremio.com/introducin 阅读全文

posted @ 2020-10-08 15:53 荣锋亮 阅读(452) 评论(0) 推荐(0) 编辑

一些不错的开源大数据虚拟数据sql 查询引擎
摘要:以下就是一个简单的整理,核心在数据sql查询以及支持的联邦数据处理上 presto 一个通用的sql on anything 工具 apache drill 很不错的多数据源sql 查询引擎,schema on fly dremio 很不错,从官方文档看有点对标presto,但是dremio 更强大 阅读全文

posted @ 2020-10-08 09:58 荣锋亮 阅读(1439) 评论(2) 推荐(0) 编辑

What Is a Data Lake Engine?
摘要:转自:https://www.dremio.com/what-is-a-data-lake-engine/ A data lake engine is an open source software solution or cloud service that provides critical c 阅读全文

posted @ 2020-10-08 09:38 荣锋亮 阅读(236) 评论(0) 推荐(0) 编辑

drill http 存储插件试用
摘要:以下是对于http 存储插件的试用 环境准备 docker 启动drill (1.18.0 ) docker run -i --name drill-1.18.0 -p 8047:8047 -p 31010:31010 -p 31011:31011 -p 31012:31012 -t apache/ 阅读全文

posted @ 2020-10-06 21:22 荣锋亮 阅读(278) 评论(0) 推荐(0) 编辑

apache drill 1.18.0 新特性
摘要:apache drill 1.18.0 在九月6号,发布了1.18.0 版本,目前官方文档更新的不是很及时,以下大概说明下新的特性 drill metadata 功能,这个文档有写到,可以加速drill 的查询处理,同时方便bi工具 格式插件hdf5 http rest api 存储插件(很期待的功 阅读全文

posted @ 2020-10-06 20:52 荣锋亮 阅读(340) 评论(0) 推荐(0) 编辑

drill 学习 十 drill rest api
摘要:drill 提供了web ui 以及rest api 我们基于rest api 可以开发相关的业务系统(不需要依赖jdbc 驱动) 以下是简单梳理rest api 的使用(关于暴露的系统ui api 没有说明) 查询 api 地址:POST /query.json 请求提内容 { "queryTyp 阅读全文

posted @ 2020-10-06 15:04 荣锋亮 阅读(297) 评论(0) 推荐(0) 编辑

drill 学习 九 drill性能优化-整体介绍
摘要:我们可以通过分析查询计划以及profiles 识别引起性能问题的原因,在识别了引起的原因之后我们可以 尝试进行以下操作来解决: 修改查询计划选项 修改广播 join选项 在1/2 阶段聚合切换 基于hash 的内存操作约束开启以及关闭 开启查询队列 控制并行度 数据的组织以及分片的修剪 修改存储格式 阅读全文

posted @ 2020-10-06 09:16 荣锋亮 阅读(339) 评论(0) 推荐(0) 编辑

drill 学习 九 drill性能优化-Metastore
摘要:尽管drill 是schema on fly 的但是,提供scehma 以及统计信息可以加速drill 数据的处理,所以drill 1.17 添加了Metastore(基于iceberg tables) 简单介绍 模式感知执行的显着优势: 在计划时间: 更好的计划优化范围。 由于类型已知,因此可以正 阅读全文

posted @ 2020-10-05 23:19 荣锋亮 阅读(350) 评论(0) 推荐(0) 编辑

apache iceberg 用于分析庞大数据集的开放格式
摘要:apche iceberg是一个开放标准,旨在解决庞大数据集的数据处理 支持的特性 可靠性 &&性能 扫描计划速度快 高级过滤 支持acid 开放标准 确保跨语言实现的兼容性 参考资料 http://iceberg.apache.org/ 阅读全文

posted @ 2020-10-05 10:19 荣锋亮 阅读(700) 评论(0) 推荐(0) 编辑

drill 学习 八 drill information schema
摘要:drill 数据schema on fly 模式的,但是drill也提供了metadata tables 可以 方便的查看数据源(或者schema) drill 提供的schema table schema catalogs tables columns views files partitions 阅读全文

posted @ 2020-10-05 09:47 荣锋亮 阅读(279) 评论(0) 推荐(0) 编辑

drill 学习 五 配置说明- 多租户
摘要:drill 支持多用户共享同一个drillbit以及运行在独立drillbit节点的集群模式 drill可以与以下大数据工具运行在一起: mapreduce yarn hbase hive && pig spark 当我们与其他工具一起运行的时候需要关注:内存,cpu,以及磁盘的配置 当用户共享dr 阅读全文

posted @ 2020-10-05 09:22 荣锋亮 阅读(316) 评论(0) 推荐(0) 编辑

drill 学习 七 drill jdbc 连接说明
摘要:drill 官方没有提供直接的jdbc支持,但是mapr 提供了一个 下载jdbc 驱动 可以直接在drill 的安装包提取,也可以在https://apache.osuosl.org/drill/ 地址下载 ## drill jdbc 连接格式 drill jdbc 驱动支持了多种模式的连接配置: 阅读全文

posted @ 2020-10-04 17:07 荣锋亮 阅读(506) 评论(0) 推荐(0) 编辑

drill 学习 六 数据存储插件配置
摘要:具体可以参考以前整理的一个(比较简单,主要是关于常用数据库的) https://www.cnblogs.com/rongfengliang/p/6926009.html https://www.cnblogs.com/rongfengliang/p/6940485.html 说明 官方文档对于存储插 阅读全文

posted @ 2020-10-04 15:26 荣锋亮 阅读(202) 评论(0) 推荐(0) 编辑

drill 学习 五 配置说明- 安全
摘要:安全是一个比较重要的,但是在实际的开发中,大家可能关注的不是很多,drill 安全配置包含: 认证: 基于Kerberos模式,用户密码模式,签名 加密: 基于Kerberos提供数据的保密以及一致性 授权: 当前主要基于hive 授权配置模拟用户 模拟: 配置模拟用户,配置入展模拟,使用hive配 阅读全文

posted @ 2020-10-04 15:09 荣锋亮 阅读(341) 评论(0) 推荐(0) 编辑

drill 学习 五 配置说明- 内存
摘要:关于 drill 的配置主要包含了: 内存配置 多租户配置 安全配置 性能以及功能配置 查询profile以及数据配置配置 内存配置 drill 使用包含了jvm 的直接内存,堆内存,核心使用最多的是直接内存,默认是8G,但是推荐配置更好(drill 高效使用了内存) 大部分场景drill使用的是内 阅读全文

posted @ 2020-10-04 11:38 荣锋亮 阅读(413) 评论(0) 推荐(0) 编辑

drill 学习 四 drill参考案例
摘要:具体案例来自官方文档,只是简单的说明下,详细的可以参考官方文档 环境准备 运行drill 测试环境可以通过docker运行,简单方便 简单查询 查询json文件 SELECT * FROM cp.`employee.json` LIMIT 3; 查询parquet文件 SELECT * FROM d 阅读全文

posted @ 2020-10-04 11:00 荣锋亮 阅读(357) 评论(0) 推荐(0) 编辑

drill 学习 三 drill 参考架构介绍二
摘要:前边有简单介绍过drill的整体设计,以下是关于查询执行处理的简单介绍drill 包含了一个foreman 组件 foreman 主要 是进行会话以及sql 处理 sql 处理过程 参考图: 说明: 从客户端或应用程序接收查询的Drillbit成为查询的foreman,并驱动整个查询。Foreman 阅读全文

posted @ 2020-10-04 08:13 荣锋亮 阅读(390) 评论(0) 推荐(0) 编辑

drill 学习 三 drill 参考架构介绍一
摘要:以前大概有介绍过drill,drill 是一个低延迟的分布式查询引擎,drill 的核心是 drillbit 服务 该服务负责接受来自客户端的请求,同时处理查询并将结果返回给客户端 参考通信架构图 核心组件图 rpc endpoint 是一个低开销的,以及protobuf的rpc 通信处理,以及zk 阅读全文

posted @ 2020-10-03 22:23 荣锋亮 阅读(418) 评论(0) 推荐(0) 编辑

drill 学习 二 drill 运行模式简单说
摘要:测试环境的运行还是比较简单的,我们核心的是jvm drill 运行模式 嵌入式模式 比较适合测试(当然基于单机运行还是可以的,注意单机生产需要修改一些配置参数,很重要) 运行命令 bin/drill-embedded 分布式集群模式 依赖zk,我们需要安装zk,zk 的集群节点需要至少3个节点(奇数 阅读全文

posted @ 2020-10-02 09:13 荣锋亮 阅读(332) 评论(0) 推荐(0) 编辑

drill 学习 一 drill 基本介绍
摘要:drill 是一个大数据sql 查询引擎(当然对于hdf也是支持写入的,我们的主要场景还是数据查询) drill 支持的数据格式 drill 支持的数据格式较多,以下是一个简单的说明 csv,tsv,psv或者其他任意用分隔符字段的数据(当然我们可以自己配置数据解析——通过存储插件配置选项) jso 阅读全文

posted @ 2020-10-02 09:02 荣锋亮 阅读(1261) 评论(0) 推荐(0) 编辑

导航