ZacksTang

2021年10月9日

摘要：从头开始训练一个BERT模型是一个成本非常高的工作，所以现在一般是直接去下载已经预训练好的BERT模型。结合迁移学习，实现所要完成的NLP任务。谷歌在github上已经开放了预训练好的不同大小的BERT模型，可以在谷歌官方的github repo中下载[1]。以下是官方提供的可下载版本：其中L表阅读全文

posted @ 2021-10-09 23:13 ZacksTang 阅读(24846) 评论(2) 推荐(8) 编辑

2021年9月30日

NLP与深度学习（五）BERT预训练模型

摘要： 1. BERT简介 Transformer架构的出现，是NLP界的一个重要的里程碑。它激发了很多基于此架构的模型，其中一个非常重要的模型就是BERT。 BERT的全称是Bidirectional Encoder Representation from Transformer，如名称所示，BERT仅使阅读全文

posted @ 2021-09-30 20:35 ZacksTang 阅读(12926) 评论(0) 推荐(1) 编辑

2021年9月24日

Prometheus监控系统（三）Prometheus与Grafana集成

摘要： 1. Prometheus和Grafana集成 Grafana是一款采用Go语言编写的开源应用，主要用于大规模指标数据的可视化展现，是网络架构和应用分析中最流行的时序数据展示工具。目前已支持绝大部分常用的时序数据库。下载地址为：https://grafana.com/grafana/downloa 阅读全文

posted @ 2021-09-24 22:45 ZacksTang 阅读(409) 评论(0) 推荐(0) 编辑

Prometheus监控系统（二）Prometheus部署与使用

摘要： 1. Prometheus安装官网：https://prometheus.io/ 下载地址：https://prometheus.io/download/ Prometheus基于Golang编写，编译后的软件包不依赖于任何第三方依赖。只需要下载对应平台的二进制包，解压并添加基本的配置即可正常启动阅读全文

posted @ 2021-09-24 22:42 ZacksTang 阅读(2271) 评论(0) 推荐(0) 编辑

Prometheus监控系统（一）Prometheus介绍

摘要： 1. Prometheus简介 Prometheus受启发于Google的Brogmon监控系统（类似kubernetes是从Google的Brog系统演变而来）。于2012年以开源形式发布，在2015年对外发布早期版本。2016年发布1.0版本，2017年发布基于全新存储层的2.0版本，能更好地与阅读全文

posted @ 2021-09-24 18:54 ZacksTang 阅读(1315) 评论(0) 推荐(0) 编辑

2021年9月14日

NLP与深度学习（四）Transformer模型

摘要： 1. Transformer模型在Attention机制被提出后的第3年，2017年又有一篇影响力巨大的论文由Google提出，它就是著名的Attention Is All You Need[1]。这篇论文中提出的Transformer模型，对自然语言处理领域带来了巨大的影响，使得NLP任务的性能阅读全文

posted @ 2021-09-14 00:10 ZacksTang 阅读(7138) 评论(1) 推荐(1) 编辑

2021年9月2日

NLP与深度学习（三）Seq2Seq模型与Attention机制

摘要： 1. Attention与Transformer模型 Attention机制与Transformer模型，以及基于Transformer模型的预训练模型BERT的出现，对NLP领域产生了变革性提升。现在在大型NLP任务、比赛中，基本很少能见到RNN的影子了。大部分是BERT（或是其各种变体，或者还加阅读全文

posted @ 2021-09-02 00:45 ZacksTang 阅读(1942) 评论(0) 推荐(0) 编辑

2021年8月28日

NLP与深度学习（二）循环神经网络

摘要： 1. 循环神经网络在介绍循环神经网络之前，我们先考虑一个大家阅读文章的场景。一般在阅读一个句子时，我们是一个字或是一个词的阅读，而在阅读的同时，我们能够记住前几个词或是前几句的内容。这样我们便能理解整个句子或是段落所表达的内容。循环神经网络便是采用的与此同样的原理。循环神经网络（RNN，Recu 阅读全文

posted @ 2021-08-28 17:30 ZacksTang 阅读(1971) 评论(0) 推荐(2) 编辑

2021年8月24日

NLP与深度学习（一）NLP任务流程

摘要： 1. 自然语言处理简介根据工业界的估计，仅有21% 的数据是以结构化的形式展现的[1]。在日常生活中，大量的数据是以文本、语音的方式产生（例如短信、微博、录音、聊天记录等等），这种方式是高度无结构化的。如何去对这些文本数据进行系统化分析、理解、以及做信息提取，就是自然语言处理（Natural La 阅读全文

posted @ 2021-08-24 20:36 ZacksTang 阅读(4164) 评论(1) 推荐(2) 编辑

2021年5月24日

Debezium-Flink-Hudi：实时流式CDC

摘要： 1. 什么是Debezium Debezium是一个开源的分布式平台，用于捕捉变化数据（change data capture）的场景。它可以捕捉数据库中的事件变化（例如表的增、删、改等），并将其转为事件流，使得下游应用可以看到这些变化，并作出指定响应。 2. Debezium常规使用架构根据De 阅读全文

posted @ 2021-05-24 23:58 ZacksTang 阅读(3189) 评论(1) 推荐(0) 编辑

公告