摘要: 详情请查看如下链接或关注微信公众号:大数据技术宅机器学习——逻辑回归 阅读全文
posted @ 2018-05-03 08:48 大数据技术宅 阅读(250) 评论(0) 推荐(0) 编辑
摘要: 新增深度学习文本、图片、语音数据集 阅读全文
posted @ 2018-04-30 19:33 大数据技术宅 阅读(2322) 评论(0) 推荐(0) 编辑
摘要: 原文链接:SparkSQL—用之惜之 SparkSql作为Spark的结构化数据处理模块,提供了非常强大的API,让分析人员用一次,就会为之倾倒,为之着迷,为之至死不渝。在内部,SparkSQL使用额外结构信息来执行额外的优化。在外部,可以使用SQL和DataSet 的API与之交互。本文笔者将带你 阅读全文
posted @ 2018-04-22 21:57 大数据技术宅 阅读(6518) 评论(0) 推荐(1) 编辑
摘要: 原文链接:HDFS架构及原理 引言 进入大数据时代,数据集的大小已经超过一台独立物理计算机的存储能力,我们需要对数据进行分区(partition)并存储到若干台单独的计算机上,也就出现了管理网络中跨多台计算机存储的文件系统:分布式文件系统(distributed filesystem)。基于hado 阅读全文
posted @ 2018-04-16 16:56 大数据技术宅 阅读(841) 评论(0) 推荐(0) 编辑
摘要: 欢迎关注作者的微信公众号:大数据技术宅 阅读全文
posted @ 2018-04-16 10:23 大数据技术宅 阅读(1456) 评论(0) 推荐(1) 编辑
摘要: 正则表达式的分类 1、基本的正则表达式(Basic Regular Expression 又叫Basic RegEx 简称BREs) 2、扩展的正则表达式(Extended Regular Expression 又叫Extended RegEx 简称EREs) 3、Perl的正则表达式(Perl R 阅读全文
posted @ 2018-03-20 16:54 大数据技术宅 阅读(374) 评论(1) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2018-01-31 16:43 大数据技术宅 阅读(8) 评论(0) 推荐(1) 编辑
摘要: LDA思想 阅读全文
posted @ 2018-01-30 13:13 大数据技术宅 阅读(77) 评论(0) 推荐(0) 编辑
摘要: 逻辑回归主要分为三步: 第一步:选定 阅读全文
posted @ 2018-01-26 09:04 大数据技术宅 阅读(134) 评论(0) 推荐(0) 编辑
摘要: 1、报错18/01/25 14:56:58 ERROR executor.CoarseGrainedExecutorBackend: Driver 127.0.0.1:37159 disassociated! Shutting down. 这个错误比较隐晦,归根结底还是内存的问题,有两个方法可以解决 阅读全文
posted @ 2018-01-25 16:55 大数据技术宅 阅读(379) 评论(0) 推荐(0) 编辑