06 2019 档案
摘要:不起作用的原因很多,这里列举几个 这里的hanlp我虽然用的maven建立的但是要添加自定义词典,所以没有用maven引入的方式,而是下载了data+hanlp.jar文件 data下载地址https://pan.baidu.com/s/1o8Rri0y 1、没有删除custom文件夹下的所有bin
阅读全文
摘要:如果正常引入后在依赖中能够找到包,但是打不开 1、有可能是包下载不完整 把maven下载源由国外转成阿里镜像源找到 maven 的配置文件: settings.xml 文件; 2、也 可以试着更新maven项目 项目右键点击》maven》update project 参考:https://blog.
阅读全文
摘要:需要安装jpype先,这个是python调用java库的桥梁。 结果: 转自:https://www.jianshu.com/p/d7e7cc747e56
阅读全文
摘要:至于处理doc文件直接转存成docx文件就可以了 参考: https://blog.csdn.net/qq_40925239/article/details/83279957 https://blog.csdn.net/qq_15969343/article/details/81673970
阅读全文
摘要:刚开始用都不知道要怎么安装,包括什么文件。百度了下发现正常安装就可以用,不用下多余的东西,但是但是但是但是但是但是但是但是 用pycharm安装不行,pip安装不行,也是见鬼了。 解决方法: 1、手动安装JPype1 这个安装包可以在这里下 https://www.lfd.uci.edu/~gohl
阅读全文
摘要:先上个图: 具体区别: IRichBolt/IBasicBolt 区别IRichBolt和IBasicBolt IRichBolt继承自IBolt和IComponent。IBasicBolt继承自IComponent,和IBolt没有继承关系。 实现IRichBolt的Bolt有:BaseRichB
阅读全文
摘要:单机本地运行storm报错: 错误如下: 解决方法: 1、确认是否初始化collector 2、确认是否是运行本地而不是集群的启动方式 open方法 * 1、在任务集群的工作进程内被初始化,提供spout执行所需要的环境 * 2、conf参数是这个spout的strom配置,提供给拓扑与这台主机上的
阅读全文
摘要:Fields,个人理解,类似于一张表,你取那些字段以及这些字段所对应的数据给后面的bolt用 这个Field通常和fieldsGrouping分组机制一起使用,这个Field特别难理解,我自己也是在网上看了好多文章,感觉依旧讲的不是很清楚,是似而非,没有抓到重点。这个问题足足困扰了我3-4天时间,一
阅读全文
摘要:在Hadoop中,有一些命名不好的模块,Secondary NameNode是其中之一。从它的名字上看,它给人的感觉就像是NameNode的备份。但它实际上却不是。很多Hadoop的初学者都很疑惑,Secondary NameNode究竟是做什么的,而且它为什么会出现在HDFS中。 从它的名字来看,
阅读全文
摘要:1、查询jdk版本号 两条命令都会产生输出,把输出的文件删除就可以卸载openjdk了 假如两条命令列出文件为A和B 在运行命令 卸载完毕
阅读全文
摘要:Storm并行度 wordcount 统计job代码 public class WordCountTopology { private static final String SENTENCE_SPOUT_ID = "sentence-spout"; private static final Str
阅读全文
摘要:Kafka参数详解 每个kafka broker中配置文件server.properties默认必须配置的属性如下: broker.id=0 num.network.threads=2 num.io.threads=8 socket.send.buffer.bytes=1048576 socket.
阅读全文
摘要:flume参数: 此配置定义名为a1的单个代理。a1有一个侦听端口44444上的数据的源,一个缓冲内存中事件数据的通道,以及一个将事件数据记录到控制台的接收器。 根据scource、channel、sink划分 1、Sources Flume中常用的Source有NetCat,Avro,Exec,S
阅读全文
摘要:通过flume收集其他机器上flume的监测数据,发送到本机的kafka进行消费。 环境:slave中安装flume,master中安装flume+kafka(这里用两台虚拟机,也可以用三台以上) 通过监控test.log文件的变化,收集变化信息发送到主机的flume中,再发送到kafka中进行消费
阅读全文
摘要:环境:两台虚拟机( 每台都有flume) 第一台slave作为消息的产生者 第二台master作为消息的接收者 IP(192.168.83.133) 原理:通过监听slave中文件的变化,获取变化信息,发送到另一台电脑。 1、slave上配置conf里面的example.conf(标红的注意下) 2
阅读全文