摘要: 第1步 - 安装MongoDB Ubuntu的官方软件包存储库包含最新版本的MongoDB,这意味着我们可以使用apt来安装必要的软件包。 首先,更新软件包列表以获取最新版本的存储库列表: sudo apt update 现在安装MongoDB包本身: sudo apt install -y mon 阅读全文
posted @ 2018-12-27 09:21 iDataSharing 阅读(470) 评论(0) 推荐(0) 编辑
摘要: 1. CIFAR-10 & CIFAR-100 CIFAR-10包含10个类别,50,000个训练图像,彩色图像大小:32x32,10,000个测试图像。 (类别:airplane,automobile, bird, cat, deer, dog, frog, horse, ship, truck) 阅读全文
posted @ 2018-09-11 09:02 iDataSharing 阅读(1304) 评论(0) 推荐(0) 编辑
摘要: 本文主要是整理了GPS轨迹数据集免费资源库,从这些库中能够免费下载到GPS数据,同时还整理出了这些数据的格式,数据集的简单描述等等。如果你发现更好的相关数据资源,欢迎共享 :) 1. GeoLife GPS Trajectories 该GPS轨迹数据集出自微软研究GeoLift项目。从2007年四月 阅读全文
posted @ 2018-09-11 08:54 iDataSharing 阅读(4385) 评论(0) 推荐(0) 编辑
摘要: 金融 美国劳工部统计局官方发布数据 上证A股日线数据,1999.12.09 至 2016.06.08,前复权,1095支股票 深证A股日线数据,1999.12.09 至 2016.06.08,前复权,1766支股票 深证创业板日线数据,1999.12.09 至 2016.06.08,前复权,510支 阅读全文
posted @ 2018-09-11 08:36 iDataSharing 阅读(2297) 评论(0) 推荐(0) 编辑
摘要: 一、SanFrancisco Bay Area 1.数据集包括500辆出租车近30天的(2008年5月17日-6月10日)行驶数据 2.车辆行驶数据的采样时间间隔1min 3.车辆轨迹数据包含:车辆ID-经纬度(位置)-是否载客-时间 4.无瞬时速度 下载链接:点击打开链接 二、Shanghai 1 阅读全文
posted @ 2018-09-11 08:33 iDataSharing 阅读(6379) 评论(0) 推荐(0) 编辑
摘要: 参考网址: https://www.e-learn.cn/content/python/786199 阅读全文
posted @ 2018-09-03 17:17 iDataSharing 阅读(496) 评论(0) 推荐(0) 编辑
摘要: 在本地运行pyspark程序查询没问题,但在Hadoop YARN 运行pyspark出现上述问题,希望有关大神看到,指点一下迷津。十分感谢~~~ 下面附上我的yarn-site.xml设置 阅读全文
posted @ 2018-08-16 09:32 iDataSharing 阅读(3202) 评论(4) 推荐(0) 编辑
摘要: 分布式 http://www.cnblogs.com/rjzheng/p/9041659.html 阅读全文
posted @ 2018-06-06 11:06 iDataSharing 阅读(130) 评论(0) 推荐(0) 编辑
摘要: 应用Aprion算法实现大规模数据库关联规则挖掘的技术研究(知网) 数据关联是信息技术发展模式下各种软件数据库中存在的一纵横能够反映一个或其他事件之间依赖性和关联性的一种信息。关联规则挖掘Aprion算法是一种比较全面的分析模式算法,它能够发现记录中不同数据属性之间的关联性,而且能够反映出给定数据集 阅读全文
posted @ 2018-06-03 12:52 iDataSharing 阅读(248) 评论(0) 推荐(0) 编辑
摘要: 相似度量的研究及其在数据挖掘中的应用(知网) 常见的相似度量方法:Minkowski距离、Euclidean距离(处理数值型数据)、Mahalanobis距离、 Manhattan距离和Cosine Angle距离本文从数据空间覆盖关系的角度提出一种相似度量方法,并在此基础上设计和实现了相应的俩中算 阅读全文
posted @ 2018-06-01 14:16 iDataSharing 阅读(514) 评论(0) 推荐(0) 编辑