摘要: 1.启动zookeeper 2.启动kafka服务(broker) 3.启动kafka的producer(前提:已经创建好topic 4.启动kafka的consumer 5.打jar包,将带有依赖的jar包上传到集群上 6.编写启动脚本,启动任务 sh run_receiver.sh 监控任务及查 阅读全文
posted @ 2018-12-01 08:48 王马扎 阅读(230) 评论(0) 推荐(0) 编辑
摘要: Python 处理excel的第三包有很多,比如XlsxWriter、xlrd&xlwt、OpenPyXL、Microsoft Excel API等,最后综合考虑选用了Pandas。 Pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标 阅读全文
posted @ 2018-11-21 10:52 王马扎 阅读(6157) 评论(0) 推荐(0) 编辑
摘要: 1.右键你的项目,如果你之前安装git成功的话,右键会出现两个新选项,分别为Git Gui Here,Git Bash Here,这里我们选择Git Bash Here,进入如下界面 2.接下来输入如下代码(关键步骤),把github上面的仓库克隆到本地 git clone https://gith 阅读全文
posted @ 2018-11-13 17:26 王马扎 阅读(252) 评论(0) 推荐(0) 编辑
摘要: 一 Scala简述 Scala (斯卡拉)是一门多范式(multi-paradigm)的编程语言。 这里所谓的范式,指的是编写程序的方式,不同的编程语言,方式也不尽相同,也就意味着Scala编程语言是融合了多种不同编程方式的语言。所以Scala语言的设计初衷是要集成面向对象编程和函数式编程的各种特性 阅读全文
posted @ 2018-11-10 15:26 王马扎 阅读(13503) 评论(0) 推荐(0) 编辑
摘要: 问题: ImportError: libSM.so.6: cannot open shared object file: No such file or directory 解决: 阅读全文
posted @ 2018-11-09 15:36 王马扎 阅读(295) 评论(0) 推荐(0) 编辑
摘要: 1 # -*- coding: utf-8 -*- 2 3 from py2neo import Graph 4 import json 5 import re 6 7 8 class Neo4jToJson(object): 9 """知识图谱数据接口""" 10 11 def __init__(self): 12 ... 阅读全文
posted @ 2018-11-07 10:56 王马扎 阅读(5487) 评论(0) 推荐(0) 编辑
摘要: 在spark目录下./spark-shell 运行后 报错: 阅读全文
posted @ 2018-11-01 14:59 王马扎 阅读(1278) 评论(0) 推荐(0) 编辑
摘要: 环境 1.操作系统Ubuntu14 2.py2neo版本4.1 3.python版本python3.4 问题 pip install py2neo==4.1 安装失败,提示: Cannot uninstall 'urllib3'. It is a distutils installed projec 阅读全文
posted @ 2018-10-31 14:27 王马扎 阅读(478) 评论(0) 推荐(0) 编辑
摘要: 1.安装JAVA运行环境 配置环境变量及安装jdk 解决配置环境变量,用java -version查看版本报错问题 2.安装Tomcat 3.部署mysql 1.切换到root用户,进入 /etc/mysql/mysql.conf.d目录2.打开mysqld.cnf文件,在【mysqld】下面增加一 阅读全文
posted @ 2018-10-24 10:44 王马扎 阅读(3501) 评论(0) 推荐(0) 编辑
摘要: Pthon知识积累,遇到的各种python问题汇总 json.dumps()和json.loads()是json格式处理函数 python2与python3编码 数据结构与算法之快速排序算法 最优时间复杂度:O(nlogn)最坏时间复杂度:O(n2)稳定性:不稳定 代码 Python super() 阅读全文
posted @ 2018-10-06 10:21 王马扎 阅读(375) 评论(0) 推荐(0) 编辑