摘要: 在数据挖掘中,Python和Scala语言都是极受欢迎的,本文总结两种语言在Spark环境各自特点。 本文翻译自 https://www.dezyre.com/article/Scala-vs-Python-for-apache-Spark/213 1.性能对比 由于Scala是基于JVM的数据分析 阅读全文
posted @ 2018-03-10 14:31 Joshua王子 阅读(18591) 评论(0) 推荐(2) 编辑
摘要: 一个HDF5文件是一种存放两类对象的容器:dataset和group. Dataset是类似于数组的数据集,而group是类似文件夹一样的容器,存放dataset和其他group。在使用h5py的时候需要牢记一句话:groups类比词典,dataset类比Numpy中的数组。 HDF5的datase 阅读全文
posted @ 2018-03-10 13:55 Joshua王子 阅读(5219) 评论(0) 推荐(0) 编辑
摘要: yum源仓库里的Git版本更新不及时,最新版的Git是1.8.3,但是官方的最新版早已经更新到2.9.5。想要安装最新版本Git,只能下载源码进行安装 建议最好更新git为较新版本,便于使用 1.查看yum源仓库的Git信息 2.查看本地Git是否已经安装,以及版本号是多少 3.依赖库安装 4.下载 阅读全文
posted @ 2018-03-10 13:27 Joshua王子 阅读(262) 评论(0) 推荐(0) 编辑
摘要: GitHub使用指南 一.把本地代码上传到GitHub 0. 提前配置好上传地址 【git config --global user.name “username”】 【git config --global user.email “your email”】 【查看用户名和邮箱】 $ git con 阅读全文
posted @ 2018-03-10 13:11 Joshua王子 阅读(248) 评论(0) 推荐(0) 编辑
摘要: 【写在前面】 用Tensorflow(TF)已实现好的卷积神经网络(CNN)模型来训练自己的数据集,验证目前较成熟模型在不同数据集上的准确度,如Inception_V3, VGG16,Inception_resnet_v2等模型。本文验证Inception_resnet_v2基于菜场实拍数据的准确性 阅读全文
posted @ 2018-03-10 13:04 Joshua王子 阅读(29822) 评论(10) 推荐(1) 编辑
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2018-03-10 12:57 Joshua王子 阅读(3) 评论(0) 推荐(0) 编辑