2020 年 5月随笔档案 - 技术研究与问题解决

关于时序数据流经Kafka之后可能产生乱序的原因和解决方法

摘要：关于时序数据流经Kafka之后可能产生乱序的原因和解决方法阅读全文

posted @ 2020-05-31 17:29 技术研究与问题解决阅读(663) 评论(0) 推荐(0) 编辑

手动安装Maven依赖（oracle驱动包）

摘要：手动安装Maven依赖（oracle）阅读全文

posted @ 2020-05-31 14:30 技术研究与问题解决阅读(176) 评论(0) 推荐(0) 编辑

Flink流计算编程--Flink sink to Oracle

摘要：Flink流计算编程--Flink sink to Oracle 阅读全文

posted @ 2020-05-31 14:20 技术研究与问题解决阅读(1285) 评论(0) 推荐(0) 编辑

CentOS7：ifconfig command not found解决

摘要：问题描述我是在VirtualBox上装的CentOS 7 Minimal，网上搜了一下原因，可能是CentOS 7的最小化安装少了一些工具，比如 ifconfig 及 netstat 等。因此解决办法很简单，把它们安装上就好了。首先判断一下是不是缺少了ifconfig，它是在/sbin目录下的阅读全文

posted @ 2020-05-31 13:05 技术研究与问题解决阅读(253) 评论(0) 推荐(0) 编辑

Redis 命令参考

摘要：Redis 命令参考阅读全文

posted @ 2020-05-31 11:22 技术研究与问题解决阅读(66) 评论(0) 推荐(0) 编辑

Intellij IDEA快捷键与使用小技巧

摘要：Ctrl+Shift + Enter，语句完成“！”，否定完成，输入表达式时按 “！”键Ctrl+E，最近的文件Ctrl+Shift+E，最近更改的文件Shift+Click，可以关闭文件Ctrl+[ OR ]，可以跑到大括号的开头与结尾Ctrl+F12，可以显示当前文件的结构Ctrl+F7，可以查阅读全文

posted @ 2020-05-30 19:56 技术研究与问题解决阅读(163) 评论(0) 推荐(0) 编辑

Oracle date timestamp 毫秒 - 时间函数总结

摘要：yyyy-mm-dd hh24:mi:ss.ff 年-月-日时：分：秒.毫秒 --上一月，上一年select add_months(sysdate,-1) last_month,add_months(sysdate,-12) last_year from dual;--下一月，下一年select 阅读全文

posted @ 2020-05-30 15:18 技术研究与问题解决阅读(507) 评论(0) 推荐(0) 编辑

Oracle to_date、to_timestamp、to_char、to_number 用法

摘要：Oracle to_date、to_timestamp、to_char、to_number 用法阅读全文

posted @ 2020-05-30 14:41 技术研究与问题解决阅读(326) 评论(0) 推荐(0) 编辑

Oracle中exists替代in语句

摘要：大家都知道exists的速度要比in的速度快，也知道exists函数返回一个布尔值，也就是说exists函数里最后要是 a.id =b.id类似这种方式结束。例如： 1 2 3 SELECT * FROM TBL_REBATE_DAY_COUNT WHERE ID IN (1, 2, 3, 4, 阅读全文

posted @ 2020-05-28 09:33 技术研究与问题解决阅读(275) 评论(0) 推荐(0) 编辑

【oracle】通过存储过程名查看package名

摘要：--查看all_source视图即可 select * from all_source where text like '%存储过程名%'; 阅读全文

posted @ 2020-05-26 20:13 技术研究与问题解决阅读(755) 评论(0) 推荐(0) 编辑

解决Flink消费Kafka信息，结果存储在Mysql的重复消费问题

摘要：背景最近项目中使用Flink消费kafka消息，并将消费的消息存储到mysql中，看似一个很简单的需求，在网上也有很多flink消费kafka的例子，但看了一圈也没看到能解决重复消费的问题的文章，于是在flink官网中搜索此类场景的处理方式，发现官网也没有实现flink到mysql的Exactly 阅读全文

posted @ 2020-05-25 09:16 技术研究与问题解决阅读(1861) 评论(0) 推荐(0) 编辑

利用Flink消费Kafka数据保证全局有序

摘要：Kafka 是现在大数据中流行的消息中间件，其中 kafka 中由 topic 组成，而 topic 下又可以由多个 partition 构成。有时候我们在消费 kafka 中的数据想要保证消费 kafka 中的所有的分区下数据是全局有序的，这种情况下就需要将 topic 下的 partition 阅读全文

posted @ 2020-05-25 08:53 技术研究与问题解决阅读(2282) 评论(1) 推荐(0) 编辑

Oracle 字符集的查看和修改

摘要：一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货币，数字，和日历自动适应本地化语言和平台。影响Oracle 阅读全文

posted @ 2020-05-24 15:14 技术研究与问题解决阅读(232) 评论(0) 推荐(0) 编辑

oracle数据库修改客户端和服务器端字符集

摘要：1、查询客户端字符集 SELECT * FROM V$NLS_PARAMETERS; 例如 2、查看服务器端字符集 SELECT * FROM NLS_DATABASE_PARAMETERS; 例一个是美国一个是中国。修改客户端字符集与服务器端一致 3、鼠标右键计算机-属性-高级系统设置-高级-环阅读全文

posted @ 2020-05-24 13:51 技术研究与问题解决阅读(341) 评论(0) 推荐(0) 编辑

Centos修改swap分区大小

摘要：1. 查看当前分区情况 free -m 2. 增加swap大小 dd if=/dev/zero of=/var/swap bs=1024 count=12288000 #增加12G空间 3. 设置交换分区 mkswap /var/swap 4. 立即激活交换分区 swapon /var/swap 5 阅读全文

posted @ 2020-05-24 10:04 技术研究与问题解决阅读(645) 评论(0) 推荐(0) 编辑

Linux/Centos安装oracle11G数据库-史上最详细的图文安装数据库方法

摘要：Linux/Centos安装oracle11G数据库-史上最详细的图文安装数据库方法阅读全文

posted @ 2020-05-24 09:53 技术研究与问题解决阅读(184) 评论(0) 推荐(0) 编辑

IDEA快捷键设置复制上一行（CTRL+D）

摘要：IDEA快捷键设置复制上一行（CTRL+D）阅读全文

posted @ 2020-05-23 18:38 技术研究与问题解决阅读(4135) 评论(0) 推荐(0) 编辑

Kafka常用命令之kafka-console-producer.sh

摘要：--2.5版本采用如下命令 Kafka常用命令之kafka-console-producer.sh --1.9.3版本使用如下命令： kafka-console-producer.sh --broker-list node21:9092,node22:9092,node23:9092 --topic 阅读全文

posted @ 2020-05-23 16:32 技术研究与问题解决阅读(5109) 评论(0) 推荐(0) 编辑

Kafka常用命令之kafka-topics.sh

摘要：Kafka常用命令之kafka-topics.sh 阅读全文

posted @ 2020-05-23 15:34 技术研究与问题解决阅读(1595) 评论(0) 推荐(0) 编辑

Kafka常用命令之kafka-console-consumer.sh

摘要：Kafka常用命令之kafka-console-consumer.sh 阅读全文

posted @ 2020-05-23 15:06 技术研究与问题解决阅读(3996) 评论(0) 推荐(0) 编辑

maven idea设置查找依赖优先从指定的本地仓库获取

摘要：maven idea设置查找依赖优先从指定的本地仓库获取选择Setting>Build,Execution,Deployment>Build Tools >Maven>Runner，设置Maven启动虚拟机的选项：VMOption，设置所有资源先从本地仓库查找，如果本地仓库中没有才去互联网找。 -D 阅读全文

posted @ 2020-05-23 13:51 技术研究与问题解决阅读(18751) 评论(0) 推荐(0) 编辑

Java isAlive()方法的作用

摘要：Java isAlive()方法的作用阅读全文

posted @ 2020-05-23 00:09 技术研究与问题解决阅读(223) 评论(0) 推荐(0) 编辑

intellij 格式化代码

摘要：1.格式化import列表Ctrl+Alt+O 2.格式化代码Ctrl+Alt+L。阅读全文

posted @ 2020-05-22 19:19 技术研究与问题解决阅读(145) 评论(0) 推荐(0) 编辑

kafka后台启动的命令

摘要：kafka如果直接启动会出现问题，就是信息会打印在控制台，就会出现在控制台。然后关闭窗口，kafka随之关闭，然后启动以下的命令就可以实现。 nohup ./kafka-server-start.sh ../config/server.properties 1>/dev/null 2>&1 & 发阅读全文

posted @ 2020-05-21 21:15 技术研究与问题解决阅读(1155) 评论(0) 推荐(0) 编辑

Kafka 集群部署，启动，关闭，命令行操作

摘要：Kafka 集群部署，启动，关闭，命令行操作阅读全文

posted @ 2020-05-21 20:15 技术研究与问题解决阅读(642) 评论(0) 推荐(0) 编辑

jquery请求ajax对返回数据解析

摘要：jquery请求ajax对返回数据解析对返回数据进行读取与打印输出 jquery ajax发送post和get请求成功之后返回的data数据类型为object 如果想取出里面的数据，那么需要用object.yourdata_key 例如：假设返回数据格式为：{'code': 0, 'total' 阅读全文

posted @ 2020-05-21 16:55 技术研究与问题解决阅读(492) 评论(0) 推荐(0) 编辑

kafka 创建消费者报错 consumer zookeeper is not a recognized option

摘要：在做kafka测试的时候，使用命令bin/kafka-console-consumer.sh --zookeeper 192.168.0.140:2181,192.168.0.141:2181 --topic test --from-beginning启动消费者，发现一只报错consumer zoo 阅读全文

posted @ 2020-05-20 22:14 技术研究与问题解决阅读(433) 评论(0) 推荐(0) 编辑

ORACLE分区表、分区索引详解

摘要：ORACLE分区表、分区索引ORACLE对于分区表方式其实就是将表分段存储，一般普通表格是一个段存储，而分区表会分成多个段，所以查找数据过程都是先定位根据查询条件定位分区范围，即数据在那个分区或那几个内部，然后在分区内部去查找数据，一个分区一般保证四十多万条数据就比较正常了，但是分区表并非乱建立，而阅读全文

posted @ 2020-05-15 09:26 技术研究与问题解决阅读(1506) 评论(0) 推荐(0) 编辑

To check your hdfs port use the following command in linux

摘要：To check your hdfs port use the following command in linux hdfs getconf -confKey fs.default.name 阅读全文

posted @ 2020-05-12 22:35 技术研究与问题解决阅读(134) 评论(0) 推荐(0) 编辑

hadoop HDFS常用文件操作命令

摘要：命令基本格式: 1 hadoop fs -cmd < args > 1. ls 列出hdfs文件系统根目录下的目录和文件 1 hadoop fs -ls /dir 1 hadoop fs -ls -R /dir --列出hdfs文件系统所有的目录和文件 2.put hadoop fs -put <l 阅读全文

posted @ 2020-05-12 21:56 技术研究与问题解决阅读(330) 评论(0) 推荐(0) 编辑

在scala中关于split以及正则表达式

摘要：在scala中，"".split("\\s+").size == 1, 而" ".split("\\s+").size == 0 （\s是用来匹配任何空白字符，当\放在最前面，前面得再放个\，或者在scala中用"""\s+""") 正则表达式 - 语法正则表达式(regular expressi 阅读全文

posted @ 2020-05-12 20:08 技术研究与问题解决阅读(578) 评论(0) 推荐(0) 编辑

pandas入门之Series

摘要：一、创建Series # 参数# - Series (Series)是能够保存任何类型的数据(整数，字符串，浮点数，Python对象等)的一维标记数组。轴标签统称为索引。 - data 参数 - index 索引索引值必须是唯一的和散列的，与数据的长度相同。默认np.arange(n)如果没有索阅读全文

posted @ 2020-05-09 19:59 技术研究与问题解决阅读(490) 评论(0) 推荐(0) 编辑

基于sklearn岭回归的波士顿房价预测

摘要：基于sklearn岭回归的波士顿房价预测阅读全文

posted @ 2020-05-09 10:07 技术研究与问题解决阅读(698) 评论(0) 推荐(0) 编辑

nginx+keepalive实现高可用负载均衡

摘要：nginx+keepalive实现高可用负载均衡阅读全文

posted @ 2020-05-08 22:13 技术研究与问题解决阅读(135) 评论(0) 推荐(0) 编辑

crontab -e 配置定时任务

摘要：crontab -e 配置定时任务阅读全文

posted @ 2020-05-08 19:52 技术研究与问题解决阅读(403) 评论(0) 推荐(0) 编辑

生产环境中进行机器学习模型部署（using Flask）（×××××）

摘要：生产环境中进行机器学习模型部署（using Flask）阅读全文

posted @ 2020-05-08 14:17 技术研究与问题解决阅读(280) 评论(0) 推荐(0) 编辑

机器学习基本流程整理

摘要：机器学习基本流程流程图链接众所周知，ML是一个流程性很强的工作（所以很多人后面会用PipeLine），数据采集、数据清洗、数据预处理、特征工程、模型调优、模型融合、模型验证、模型持久化；而在这些基本的步骤内，又存在很多种方式，比如数据采集可以是爬虫，可以是数据库拉取，可以是通过API获取等等，阅读全文

posted @ 2020-05-08 11:20 技术研究与问题解决阅读(556) 评论(0) 推荐(0) 编辑

vi 显示行号

摘要：用vi filename 进入文件后，使用命令：“：set nu” 阅读全文

posted @ 2020-05-08 09:18 技术研究与问题解决阅读(141) 评论(0) 推荐(0) 编辑

keepalived安装

摘要：两台Linux 环境搭建安装keepalived 1.下载keepalived wget http://www.keepalived.org/software/keepalived-1.2.18.tar.gz 2.解压安装： tar -zxvf keepalived-1.2.18.tar.gz - 阅读全文

posted @ 2020-05-08 08:43 技术研究与问题解决阅读(340) 评论(0) 推荐(0) 编辑

python读取文件特定的行数

摘要：from itertools import islice f=open("pyhpd.txt") for a in islice(f,2,6): print(a) 阅读全文

posted @ 2020-05-07 15:52 技术研究与问题解决阅读(1743) 评论(0) 推荐(0) 编辑

Pycharm 退回跳转之前光标页面位置

摘要：赶时间不细看系列: 直接按 SHIFT+ALT+LEFT即可退回之前的光标位置情景当在pycharm中按F4查找某个函数定义时,总是不知道怎样在跳回到查看定义之前的那个函数的位置. 比如,光标在nn.LSTM函数的位置: 当按F4键后查看定义: 但是却不知如何再跳转回含有nn.LSTM函数的位置. 阅读全文

posted @ 2020-05-07 15:38 技术研究与问题解决阅读(1178) 评论(0) 推荐(0) 编辑

python中yield的用法详解——最简单，最清晰的解释

摘要：python中yield的用法详解——最简单，最清晰的解释阅读全文

posted @ 2020-05-07 15:04 技术研究与问题解决阅读(160) 评论(0) 推荐(0) 编辑

np.random.permutation()解析

摘要：np.random.permutation()：随机排列序列。例1：对0-5之间的序列进行随机排序例2：对一个list进行随机排序多维度的咋回事？来看一个例子： a矩阵输出为：现在看c矩阵，我运行了两次：第一次运行结果：然后，我又运行了一次：通过这个例子可以看出，对于一个多维的输入，只阅读全文

posted @ 2020-05-07 14:45 技术研究与问题解决阅读(398) 评论(0) 推荐(0) 编辑

处理文本分类数据集——THUCNews数据

摘要：处理文本分类数据集——THUCNews数据阅读全文

posted @ 2020-05-06 20:25 技术研究与问题解决阅读(887) 评论(1) 推荐(0) 编辑

[深度学习] PyTorch 实现双向LSTM 情感分析

摘要：[深度学习] PyTorch 实现双向LSTM 情感分析阅读全文

posted @ 2020-05-06 18:40 技术研究与问题解决阅读(1682) 评论(0) 推荐(0) 编辑

lstm模型与情感分析实例

摘要：lstm模型与情感分析实例阅读全文

posted @ 2020-05-06 15:45 技术研究与问题解决阅读(410) 评论(0) 推荐(0) 编辑

跑Bert还得用tensorflow-1.11.0版本，否则报错

摘要：跑Bert还得用tensorflow-1.11.0版本，否则报错跑Bert还得用tensorflow-1.11.0版本，否则报错跑Bert还得用tensorflow-1.11.0版本，否则报错阅读全文

posted @ 2020-05-06 14:21 技术研究与问题解决阅读(1231) 评论(0) 推荐(0) 编辑

jupyter快捷键

摘要：常用命令模式快捷键： y: 单元进入代码状态 m: 转入markdown状态 r：转入raw状态 a: 上方插入新单元 b：下方插入新单元 x：剪切选中单元 c: 复制选中单元 shift-v：粘贴到上方单元 v：粘贴到下方单元 d,d（连续按两次d）:删除选中单元 z：恢复最后删除单元 l: 为当阅读全文

posted @ 2020-05-06 12:21 技术研究与问题解决阅读(296) 评论(0) 推荐(0) 编辑

NLP之BERT中文文本分类超详细教程

摘要：NLP之BERT中文文本分类超详细教程阅读全文

posted @ 2020-05-05 20:40 技术研究与问题解决阅读(1592) 评论(0) 推荐(0) 编辑

THUCTC: 一个高效的中文文本分类工具包

摘要：THUCTC: 一个高效的中文文本分类工具包阅读全文

posted @ 2020-05-05 19:07 技术研究与问题解决阅读(548) 评论(0) 推荐(0) 编辑

BERT模型fine-tuning代码解析（一）

摘要：BERT模型fine-tuning代码解析（一）阅读全文

posted @ 2020-05-05 18:31 技术研究与问题解决阅读(544) 评论(0) 推荐(0) 编辑

使用BERT获取中文词向量

摘要：使用BERT获取中文词向量阅读全文

posted @ 2020-05-05 07:02 技术研究与问题解决阅读(2572) 评论(0) 推荐(0) 编辑

使用BERT获取中文词向量

摘要：使用BERT获取中文词向量阅读全文

posted @ 2020-05-05 07:00 技术研究与问题解决阅读(1577) 评论(0) 推荐(0) 编辑

中文情感分类任务如何对bert语言模型微调，微调后的模型如何使用

摘要：中文情感分类任务如何对bert语言模型微调，微调后的模型如何使用阅读全文

posted @ 2020-05-04 20:15 技术研究与问题解决阅读(352) 评论(0) 推荐(0) 编辑

Tencent_AILab_ChineseEmbedding使用（×××××）

摘要：Tencent_AILab_ChineseEmbedding使用阅读全文

posted @ 2020-05-04 20:01 技术研究与问题解决阅读(907) 评论(0) 推荐(0) 编辑

中文自然语言处理数据集

摘要：中文自然语言处理数据集阅读全文

posted @ 2020-05-04 19:21 技术研究与问题解决阅读(149) 评论(0) 推荐(0) 编辑

Anaconda环境的创建/激活/删除/管理

摘要：Anaconda环境的创建 conda create -n py3 python=3.5 其中py3表示创建环境的名字，后面python=3.5表示创建的版本。这个是在创建环境的时候同时安装包 conda create -n py3 python=3.5 numpy pandas Anaconda环阅读全文

posted @ 2020-05-04 17:44 技术研究与问题解决阅读(229) 评论(0) 推荐(0) 编辑

thymeleaf和vue的关系

摘要：Thymeleaf和vue不是一类事务。模板引擎：Thymeleaf、freemarker、JSP。前端框架：vue、angularjs、react。 Thymeleaf是一个替代JSP的模板引擎。使用Thymeleaf或其他模板的时候也可以使用前端框架。现在github上很多工程就是spr 阅读全文

posted @ 2020-05-03 17:05 技术研究与问题解决阅读(10915) 评论(7) 推荐(1) 编辑

python-pip升级报错- AttributeError: 'NoneType' object has no attribute 'bytes'

摘要：最近在pycharm里面创建了一个Python项目，pycharm会自动搭建一个新的Python环境，在当前的目录下使用正常的pip升级命令：python -m pip install --upgrade pip出现下面错误之前用终端敲正常的升级命令没有问题，这里在pycharm创建的虚拟环境目录阅读全文

posted @ 2020-05-02 12:06 技术研究与问题解决阅读(463) 评论(0) 推荐(0) 编辑

启动终端后自动进入conda环境

摘要：可以通过配置auto_activate_base关闭自动进入conda基础环境：conda config --set auto_activate_base false如要开启，将其设为true就可以了：conda config --set auto_activate_base true 另：可通过c 阅读全文

posted @ 2020-05-01 17:34 技术研究与问题解决阅读(3362) 评论(0) 推荐(0) 编辑

conda清华镜像(TUNA)使用指南

摘要：Details: https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/ TUNA 提供了 Anaconda 仓库的镜像，运行以下命令: conda config --add channels https://mirrors.tuna.tsinghua 阅读全文

posted @ 2020-05-01 16:55 技术研究与问题解决阅读(965) 评论(0) 推荐(0) 编辑

pip安装模块速度慢（国内镜像源）

摘要：6：pip安装模块速度慢经常在使用Python的时候需要安装各种模块，而pip是很强大的模块安装工具，但是由于国外官方pypi经常被墙，导致不可用，所以我们最好是将自己使用的pip源更换一下，这样就能解决被墙导致的装不上库的烦恼。 01：国内源新版ubuntu要求使用https源，要注意。清华阅读全文

posted @ 2020-05-01 16:43 技术研究与问题解决阅读(473) 评论(0) 推荐(0) 编辑

Anaconda不同版本python环境的安装及切换

摘要：通过如下命令查看当前已经装好的python环境 conda info -e 此时会显示安装所有python版本通过python -V 查看当前所处的版本以已经安装好了anaconda3，即已经有了python3.x环境为例，现在要安装python2.x环境，命令如下 #创建一个名为python2 阅读全文

posted @ 2020-05-01 15:35 技术研究与问题解决阅读(3606) 评论(0) 推荐(0) 编辑

05 2020 档案

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论