摘要: 原来文本匹配的方式一直是用中规中矩的正则来做,最近在实际生产中由于数据量骤升,现有数据量提高了大约 3-4 倍,原本使用正则处理已经到了瓶颈,这次又有增量对生产来说可谓雪上加霜,而且随着正则词越加越多,匹配效率也越来越差,数据量的激增再加上正则词越加越多,提升生产的匹配效率已是迫在眉睫。 最近一段时 阅读全文
posted @ 2020-06-08 22:58 大数据江湖 阅读(632) 评论(0) 推荐(1) 编辑
摘要: 上篇文章最后说Hbase原生不支持sql查询,phoenix之于Hbase,就像hive之于Hadoop,会完美的实现hbase的sql查询操作,下面我们就来了解下phoenix,它不仅支持sqlonhbase,还使得创建Hbase二级索引变得更为简单。 本文主要从 phoenix 安装使用入手,介 阅读全文
posted @ 2020-06-08 22:53 大数据江湖 阅读(277) 评论(0) 推荐(1) 编辑