04 2019 档案

摘要:常用数学输入符号: ≈ ≡ ≠ = ≤≥ < > ≮ ≯ ∷ ± + - × ÷ / ∫ ∮ ∝ ∞ ∧ ∨ ∑ ∏ ∪ ∩ ∈ ∵ ∴ ⊥ ‖ ∠ ⌒ ≌ ∽ √ () 【】{} Ⅰ Ⅱ ⊕ ⊙∥α β γ δ ε ζ η θ Δ 大写 小写 英文注音 国际音标注音 中文注音 Α α alpha 阅读全文
posted @ 2019-04-30 13:54 西瓜哥119 阅读(6039) 评论(0) 推荐(0)
摘要:spark的机器学习库,包含常见的学习算法和工具如分类、回归、聚类、协同过滤、降维等使用算法时都需要指定相应的数据集,下面为大家介绍常用的spark ml 数据类型。1.本地向量(Local Vector)存储在单台机器上,索引采用0开始的整型表示,值采用Double类型的值表示。Spark MLl 阅读全文
posted @ 2019-04-26 15:37 西瓜哥119 阅读(1185) 评论(0) 推荐(0)
摘要:一.Spark2.0的新特性Spark让我们引以为豪的一点就是所创建的API简单、直观、便于使用,Spark 2.0延续了这一传统,并在两个方面凸显了优势: 1、标准的SQL支持; 2、数据框(DataFrame)/Dataset (数据集)API的统一。 在SQL方面,我们已经对Spark的SQL 阅读全文
posted @ 2019-04-22 14:55 西瓜哥119 阅读(1030) 评论(0) 推荐(0)
摘要:Vi t1.txt1,101,5.01,102,3.01,103,2.52,101,2.02,102,2.52,103,5.02,104,2.03,101,2.53,104,4.03,105,4.53,107,5.04,101,5.04,103,3.04,104,4.54,106,4.05,101, 阅读全文
posted @ 2019-04-17 13:30 西瓜哥119 阅读(674) 评论(0) 推荐(0)
摘要:snapshot其实就是一组metadata信息的集合,它可以让管理员将表恢复到以前的一个状态。snapshot并不是一份拷贝,它只是一个文件名的列表,并不拷贝数据。一个全的snapshot恢复以为着你可以回滚到原来的表schema和创建snapshot之前的数据。 应用场景: 1获取:该操作尝试从 阅读全文
posted @ 2019-04-02 17:03 西瓜哥119 阅读(1796) 评论(0) 推荐(0)