随笔分类 - data analysis
摘要:基本步骤 ubuntu1604 部署cdh ntp ssh vim jdk openssh-server openssh-client 离线软件源构建 # 下载离线deb 包, 下载所有的依赖 httpd 支持 /var/www/html/apt/pools 该目录下为deb 包文件 -rw-r--
阅读全文
摘要:wget https://mirror.bit.edu.cn/apache/kafka/2.5.0/kafka_2.12-2.5.0.tgz tar xvf kafka_2.12-2.5.0.tgz ln -sv `pwd`/kafka_2.12-2.5.0 `pwd`/kafka cd kafak
阅读全文
摘要:安装jieba 使用 常用词统计分析 根据已创建好的字典分词
阅读全文
摘要:pandas 参考文档: https://pandas.pydata.org/pandas docs/stable/ 简易教程: https://www.yiibai.com/pandas/python_pandas_quick_start.html 快速入门 环境准备 对象创建 series da
阅读全文
摘要:《Python数据分析基础教程,munpy学习指南(第二版)》:代码 http://www.pudn.com/Download/item/id/2742220.html numpy 学习指南 http://www.pudn.com/Download/item/id/2742220.html http
阅读全文
摘要:数据来源 数据:https://pan.baidu.com/s/1DNoRDu 7IJAnY6NP7Slphg 提取码:vqxw 分析平台: jupyter lab anaconda 版本: Anaconda3 2019.07 Linux x86_64.sh 用了之前的版本发现绘图比较模糊,更换版本
阅读全文
摘要:妈的 anaconda 版本太低,导致matlotlib 画图不清晰, 换个就好了,不然图形总是一坨 wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3 2019.07 Linux x86_64.sh 操作 下载字
阅读全文