05 2020 档案

摘要:关于时序数据流经Kafka之后可能产生乱序的原因和解决方法 阅读全文
posted @ 2020-05-31 17:29 技术研究与问题解决 阅读(663) 评论(0) 推荐(0) 编辑
摘要:手动安装Maven依赖(oracle) 阅读全文
posted @ 2020-05-31 14:30 技术研究与问题解决 阅读(176) 评论(0) 推荐(0) 编辑
摘要:Flink流计算编程--Flink sink to Oracle 阅读全文
posted @ 2020-05-31 14:20 技术研究与问题解决 阅读(1285) 评论(0) 推荐(0) 编辑
摘要:问题描述 我是在VirtualBox上装的CentOS 7 Minimal,网上搜了一下原因,可能是CentOS 7的最小化安装少了一些工具,比如 ifconfig 及 netstat 等。因此解决办法很简单,把它们安装上就好了。 首先判断一下是不是缺少了ifconfig,它是在/sbin目录下的 阅读全文
posted @ 2020-05-31 13:05 技术研究与问题解决 阅读(253) 评论(0) 推荐(0) 编辑
摘要:Redis 命令参考 阅读全文
posted @ 2020-05-31 11:22 技术研究与问题解决 阅读(66) 评论(0) 推荐(0) 编辑
摘要:Ctrl+Shift + Enter,语句完成“!”,否定完成,输入表达式时按 “!”键Ctrl+E,最近的文件Ctrl+Shift+E,最近更改的文件Shift+Click,可以关闭文件Ctrl+[ OR ],可以跑到大括号的开头与结尾Ctrl+F12,可以显示当前文件的结构Ctrl+F7,可以查 阅读全文
posted @ 2020-05-30 19:56 技术研究与问题解决 阅读(163) 评论(0) 推荐(0) 编辑
摘要:yyyy-mm-dd hh24:mi:ss.ff 年-月-日 时:分:秒.毫秒 --上一月,上一年select add_months(sysdate,-1) last_month,add_months(sysdate,-12) last_year from dual;--下一月,下一年select 阅读全文
posted @ 2020-05-30 15:18 技术研究与问题解决 阅读(507) 评论(0) 推荐(0) 编辑
摘要:Oracle to_date、to_timestamp、to_char、to_number 用法 阅读全文
posted @ 2020-05-30 14:41 技术研究与问题解决 阅读(326) 评论(0) 推荐(0) 编辑
摘要:大家都知道exists的速度要比in的速度快,也知道exists函数返回一个布尔值,也就是说exists函数里最后要是 a.id =b.id类似这种方式结束。 例如: 1 2 3 SELECT * FROM TBL_REBATE_DAY_COUNT WHERE ID IN (1, 2, 3, 4, 阅读全文
posted @ 2020-05-28 09:33 技术研究与问题解决 阅读(275) 评论(0) 推荐(0) 编辑
摘要:--查看all_source视图即可 select * from all_source where text like '%存储过程名%'; 阅读全文
posted @ 2020-05-26 20:13 技术研究与问题解决 阅读(755) 评论(0) 推荐(0) 编辑
摘要:背景 最近项目中使用Flink消费kafka消息,并将消费的消息存储到mysql中,看似一个很简单的需求,在网上也有很多flink消费kafka的例子,但看了一圈也没看到能解决重复消费的问题的文章,于是在flink官网中搜索此类场景的处理方式,发现官网也没有实现flink到mysql的Exactly 阅读全文
posted @ 2020-05-25 09:16 技术研究与问题解决 阅读(1861) 评论(0) 推荐(0) 编辑
摘要:Kafka 是现在大数据中流行的消息中间件,其中 kafka 中由 topic 组成,而 topic 下又可以由多个 partition 构成。有时候我们在消费 kafka 中的数据想要保证消费 kafka 中的所有的分区下数据是全局有序的,这种情况下就需要将 topic 下的 partition 阅读全文
posted @ 2020-05-25 08:53 技术研究与问题解决 阅读(2282) 评论(1) 推荐(0) 编辑
摘要:一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储,处理,检索数据。它使数据库工具,错误消息,排序次序,日期,时间,货币,数字,和日历自动适应本地化语言和平台。 影响Oracle 阅读全文
posted @ 2020-05-24 15:14 技术研究与问题解决 阅读(232) 评论(0) 推荐(0) 编辑
摘要:1、查询客户端字符集 SELECT * FROM V$NLS_PARAMETERS; 例如 2、查看服务器端字符集 SELECT * FROM NLS_DATABASE_PARAMETERS; 例 一个是美国一个是中国。修改客户端字符集与服务器端一致 3、鼠标右键计算机-属性-高级系统设置-高级-环 阅读全文
posted @ 2020-05-24 13:51 技术研究与问题解决 阅读(341) 评论(0) 推荐(0) 编辑
摘要:1. 查看当前分区情况 free -m 2. 增加swap大小 dd if=/dev/zero of=/var/swap bs=1024 count=12288000 #增加12G空间 3. 设置交换分区 mkswap /var/swap 4. 立即激活交换分区 swapon /var/swap 5 阅读全文
posted @ 2020-05-24 10:04 技术研究与问题解决 阅读(645) 评论(0) 推荐(0) 编辑
摘要:Linux/Centos安装oracle11G数据库-史上最详细的图文安装数据库方法 阅读全文
posted @ 2020-05-24 09:53 技术研究与问题解决 阅读(184) 评论(0) 推荐(0) 编辑
摘要:IDEA快捷键设置复制上一行(CTRL+D) 阅读全文
posted @ 2020-05-23 18:38 技术研究与问题解决 阅读(4135) 评论(0) 推荐(0) 编辑
摘要:--2.5版本采用如下命令 Kafka常用命令之kafka-console-producer.sh --1.9.3版本使用如下命令: kafka-console-producer.sh --broker-list node21:9092,node22:9092,node23:9092 --topic 阅读全文
posted @ 2020-05-23 16:32 技术研究与问题解决 阅读(5109) 评论(0) 推荐(0) 编辑
摘要:Kafka常用命令之kafka-topics.sh 阅读全文
posted @ 2020-05-23 15:34 技术研究与问题解决 阅读(1595) 评论(0) 推荐(0) 编辑
摘要:Kafka常用命令之kafka-console-consumer.sh 阅读全文
posted @ 2020-05-23 15:06 技术研究与问题解决 阅读(3996) 评论(0) 推荐(0) 编辑
摘要:maven idea设置查找依赖优先从指定的本地仓库获取选择Setting>Build,Execution,Deployment>Build Tools >Maven>Runner,设置Maven启动虚拟机的选项:VMOption,设置所有资源先从本地仓库查找,如果本地仓库中没有才去互联网找。 -D 阅读全文
posted @ 2020-05-23 13:51 技术研究与问题解决 阅读(18751) 评论(0) 推荐(0) 编辑
摘要:Java isAlive()方法的作用 阅读全文
posted @ 2020-05-23 00:09 技术研究与问题解决 阅读(223) 评论(0) 推荐(0) 编辑
摘要:1.格式化import列表Ctrl+Alt+O 2.格式化代码Ctrl+Alt+L。 阅读全文
posted @ 2020-05-22 19:19 技术研究与问题解决 阅读(145) 评论(0) 推荐(0) 编辑
摘要:kafka如果直接启动会出现问题,就是信息会打印在控制台,就会出现在控制台。 然后关闭窗口,kafka随之关闭,然后启动以下的命令就可以实现。 nohup ./kafka-server-start.sh ../config/server.properties 1>/dev/null 2>&1 & 发 阅读全文
posted @ 2020-05-21 21:15 技术研究与问题解决 阅读(1155) 评论(0) 推荐(0) 编辑
摘要:Kafka 集群部署,启动,关闭,命令行操作 阅读全文
posted @ 2020-05-21 20:15 技术研究与问题解决 阅读(642) 评论(0) 推荐(0) 编辑
摘要:jquery请求ajax对返回数据解析 对返回数据进行读取与打印输出 jquery ajax发送post和get请求成功之后返回的data数据类型为object 如果想取出里面的数据,那么需要用object.yourdata_key 例如: 假设返回数据格式为:{'code': 0, 'total' 阅读全文
posted @ 2020-05-21 16:55 技术研究与问题解决 阅读(492) 评论(0) 推荐(0) 编辑
摘要:在做kafka测试的时候,使用命令bin/kafka-console-consumer.sh --zookeeper 192.168.0.140:2181,192.168.0.141:2181 --topic test --from-beginning启动消费者,发现一只报错consumer zoo 阅读全文
posted @ 2020-05-20 22:14 技术研究与问题解决 阅读(433) 评论(0) 推荐(0) 编辑
摘要:ORACLE分区表、分区索引ORACLE对于分区表方式其实就是将表分段存储,一般普通表格是一个段存储,而分区表会分成多个段,所以查找数据过程都是先定位根据查询条件定位分区范围,即数据在那个分区或那几个内部,然后在分区内部去查找数据,一个分区一般保证四十多万条数据就比较正常了,但是分区表并非乱建立,而 阅读全文
posted @ 2020-05-15 09:26 技术研究与问题解决 阅读(1506) 评论(0) 推荐(0) 编辑
摘要:To check your hdfs port use the following command in linux hdfs getconf -confKey fs.default.name 阅读全文
posted @ 2020-05-12 22:35 技术研究与问题解决 阅读(134) 评论(0) 推荐(0) 编辑
摘要:命令基本格式: 1 hadoop fs -cmd < args > 1. ls 列出hdfs文件系统根目录下的目录和文件 1 hadoop fs -ls /dir 1 hadoop fs -ls -R /dir --列出hdfs文件系统所有的目录和文件 2.put hadoop fs -put <l 阅读全文
posted @ 2020-05-12 21:56 技术研究与问题解决 阅读(330) 评论(0) 推荐(0) 编辑
摘要:在scala中,"".split("\\s+").size == 1, 而" ".split("\\s+").size == 0 (\s是用来匹配任何空白字符,当\放在最前面,前面得再放个\,或者在scala中用"""\s+""") 正则表达式 - 语法 正则表达式(regular expressi 阅读全文
posted @ 2020-05-12 20:08 技术研究与问题解决 阅读(578) 评论(0) 推荐(0) 编辑
摘要:一、创建Series # 参数# - Series (Series)是能够保存任何类型的数据(整数,字符串,浮点数,Python对象等)的一维标记数组。轴标签统称为索引。 - data 参数 - index 索引 索引值必须是唯一的和散列的,与数据的长度相同。 默认np.arange(n)如果没有索 阅读全文
posted @ 2020-05-09 19:59 技术研究与问题解决 阅读(490) 评论(0) 推荐(0) 编辑
摘要:基于sklearn岭回归的波士顿房价预测 阅读全文
posted @ 2020-05-09 10:07 技术研究与问题解决 阅读(698) 评论(0) 推荐(0) 编辑
摘要:nginx+keepalive实现高可用负载均衡 阅读全文
posted @ 2020-05-08 22:13 技术研究与问题解决 阅读(135) 评论(0) 推荐(0) 编辑
摘要:crontab -e 配置定时任务 阅读全文
posted @ 2020-05-08 19:52 技术研究与问题解决 阅读(403) 评论(0) 推荐(0) 编辑
摘要:生产环境中进行机器学习模型部署(using Flask) 阅读全文
posted @ 2020-05-08 14:17 技术研究与问题解决 阅读(280) 评论(0) 推荐(0) 编辑
摘要:机器学习基本流程 流程图链接 众所周知,ML是一个流程性很强的工作(所以很多人后面会用PipeLine),数据采集、数据清洗、数据预处理、特征工程、模型调优、模型融合、模型验证、模型持久化; 而在这些基本的步骤内,又存在很多种方式,比如数据采集可以是爬虫,可以是数据库拉取,可以是通过API获取等等, 阅读全文
posted @ 2020-05-08 11:20 技术研究与问题解决 阅读(556) 评论(0) 推荐(0) 编辑
摘要:用vi filename 进入文件后,使用命令:“:set nu” 阅读全文
posted @ 2020-05-08 09:18 技术研究与问题解决 阅读(141) 评论(0) 推荐(0) 编辑
摘要:两台Linux 环境搭建 安装keepalived 1.下载keepalived wget http://www.keepalived.org/software/keepalived-1.2.18.tar.gz 2.解压安装: tar -zxvf keepalived-1.2.18.tar.gz - 阅读全文
posted @ 2020-05-08 08:43 技术研究与问题解决 阅读(340) 评论(0) 推荐(0) 编辑
摘要:from itertools import islice f=open("pyhpd.txt") for a in islice(f,2,6): print(a) 阅读全文
posted @ 2020-05-07 15:52 技术研究与问题解决 阅读(1743) 评论(0) 推荐(0) 编辑
摘要:赶时间不细看系列: 直接按 SHIFT+ALT+LEFT即可退回之前的光标位置 情景当在pycharm中按F4查找某个函数定义时,总是不知道怎样在跳回到查看定义之前的那个函数的位置. 比如,光标在nn.LSTM函数的位置: 当按F4键后查看定义: 但是却不知如何再跳转回含有nn.LSTM函数的位置. 阅读全文
posted @ 2020-05-07 15:38 技术研究与问题解决 阅读(1178) 评论(0) 推荐(0) 编辑
摘要:python中yield的用法详解——最简单,最清晰的解释 阅读全文
posted @ 2020-05-07 15:04 技术研究与问题解决 阅读(160) 评论(0) 推荐(0) 编辑
摘要:np.random.permutation():随机排列序列。 例1:对0-5之间的序列进行随机排序 例2:对一个list进行随机排序 多维度的咋回事? 来看一个例子: a矩阵输出为: 现在看c矩阵,我运行了两次:第一次运行结果: 然后,我又运行了一次: 通过这个例子可以看出,对于一个多维的输入,只 阅读全文
posted @ 2020-05-07 14:45 技术研究与问题解决 阅读(398) 评论(0) 推荐(0) 编辑
摘要:处理文本分类数据集——THUCNews数据 阅读全文
posted @ 2020-05-06 20:25 技术研究与问题解决 阅读(887) 评论(1) 推荐(0) 编辑
摘要:[深度学习] PyTorch 实现双向LSTM 情感分析 阅读全文
posted @ 2020-05-06 18:40 技术研究与问题解决 阅读(1682) 评论(0) 推荐(0) 编辑
摘要:lstm模型与情感分析实例 阅读全文
posted @ 2020-05-06 15:45 技术研究与问题解决 阅读(410) 评论(0) 推荐(0) 编辑
摘要:跑Bert还得用tensorflow-1.11.0版本,否则报错 跑Bert还得用tensorflow-1.11.0版本,否则报错 跑Bert还得用tensorflow-1.11.0版本,否则报错 阅读全文
posted @ 2020-05-06 14:21 技术研究与问题解决 阅读(1231) 评论(0) 推荐(0) 编辑
摘要:常用命令模式快捷键: y: 单元进入代码状态 m: 转入markdown状态 r:转入raw状态 a: 上方插入新单元 b:下方插入新单元 x:剪切选中单元 c: 复制选中单元 shift-v:粘贴到上方单元 v:粘贴到下方单元 d,d(连续按两次d):删除选中单元 z:恢复最后删除单元 l: 为当 阅读全文
posted @ 2020-05-06 12:21 技术研究与问题解决 阅读(296) 评论(0) 推荐(0) 编辑
摘要:NLP之BERT中文文本分类超详细教程 阅读全文
posted @ 2020-05-05 20:40 技术研究与问题解决 阅读(1592) 评论(0) 推荐(0) 编辑
摘要:THUCTC: 一个高效的中文文本分类工具包 阅读全文
posted @ 2020-05-05 19:07 技术研究与问题解决 阅读(548) 评论(0) 推荐(0) 编辑
摘要:BERT模型fine-tuning代码解析(一) 阅读全文
posted @ 2020-05-05 18:31 技术研究与问题解决 阅读(544) 评论(0) 推荐(0) 编辑
摘要:使用BERT获取中文词向量 阅读全文
posted @ 2020-05-05 07:02 技术研究与问题解决 阅读(2572) 评论(0) 推荐(0) 编辑
摘要:使用BERT获取中文词向量 阅读全文
posted @ 2020-05-05 07:00 技术研究与问题解决 阅读(1577) 评论(0) 推荐(0) 编辑
摘要:中文情感分类任务如何对bert语言模型微调,微调后的模型如何使用 阅读全文
posted @ 2020-05-04 20:15 技术研究与问题解决 阅读(352) 评论(0) 推荐(0) 编辑
摘要:Tencent_AILab_ChineseEmbedding使用 阅读全文
posted @ 2020-05-04 20:01 技术研究与问题解决 阅读(907) 评论(0) 推荐(0) 编辑
摘要:中文自然语言处理数据集 阅读全文
posted @ 2020-05-04 19:21 技术研究与问题解决 阅读(149) 评论(0) 推荐(0) 编辑
摘要:Anaconda环境的创建 conda create -n py3 python=3.5 其中py3表示创建环境的名字,后面python=3.5表示创建的版本。这个是在创建环境的时候同时安装包 conda create -n py3 python=3.5 numpy pandas Anaconda环 阅读全文
posted @ 2020-05-04 17:44 技术研究与问题解决 阅读(229) 评论(0) 推荐(0) 编辑
摘要:Thymeleaf和vue不是一类事务。 模板引擎:Thymeleaf、freemarker、JSP。 前端框架:vue、angularjs、react。 Thymeleaf是一个替代JSP的模板引擎。 使用Thymeleaf或其他模板的时候也可以使用前端框架。 现在github上很多工程就是spr 阅读全文
posted @ 2020-05-03 17:05 技术研究与问题解决 阅读(10915) 评论(7) 推荐(1) 编辑
摘要:最近在pycharm里面创建了一个Python项目,pycharm会自动搭建一个新的Python环境,在当前的目录下使用正常的pip升级命令:python -m pip install --upgrade pip出现下面错误 之前用终端敲正常的升级命令没有问题,这里在pycharm创建的虚拟环境目录 阅读全文
posted @ 2020-05-02 12:06 技术研究与问题解决 阅读(463) 评论(0) 推荐(0) 编辑
摘要:可以通过配置auto_activate_base关闭自动进入conda基础环境:conda config --set auto_activate_base false如要开启,将其设为true就可以了:conda config --set auto_activate_base true 另:可通过c 阅读全文
posted @ 2020-05-01 17:34 技术研究与问题解决 阅读(3362) 评论(0) 推荐(0) 编辑
摘要:Details: https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/ TUNA 提供了 Anaconda 仓库的镜像,运行以下命令: conda config --add channels https://mirrors.tuna.tsinghua 阅读全文
posted @ 2020-05-01 16:55 技术研究与问题解决 阅读(965) 评论(0) 推荐(0) 编辑
摘要:6:pip安装模块速度慢 经常在使用Python的时候需要安装各种模块,而pip是很强大的模块安装工具,但是由于国外官方pypi经常被墙,导致不可用,所以我们最好是将自己使用的pip源更换一下,这样就能解决被墙导致的装不上库的烦恼。 01:国内源 新版ubuntu要求使用https源,要注意。 清华 阅读全文
posted @ 2020-05-01 16:43 技术研究与问题解决 阅读(473) 评论(0) 推荐(0) 编辑
摘要:通过如下命令查看当前已经装好的python环境 conda info -e 此时会显示安装所有python版本 通过python -V 查看当前所处的版本 以已经安装好了anaconda3,即已经有了python3.x环境为例,现在要安装python2.x环境,命令如下 #创建一个名为python2 阅读全文
posted @ 2020-05-01 15:35 技术研究与问题解决 阅读(3606) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示