上一页 1 2 3 4 5 6 7 8 ··· 10 下一页
摘要: 例子 SELECT cust_name,cust_contact FROM Customers,Orders,OrderItems WHERE Customers.cust_id=Orders.cust_id AND OrderItems.order_num=Orders.order_num AND 阅读全文
posted @ 2020-10-19 15:59 猫七的blog 阅读(75) 评论(0) 推荐(0) 编辑
摘要: 联结: SQL最强大的功能之一:在数据查询中联结(join)多个存储不同信息的表。 最简单的例子:检索供应商的名字,产品的名字,产品的地址。 一:使用“where”子句: select prod_name,vend_name,vend_address from vendors,products wh 阅读全文
posted @ 2020-10-13 14:06 猫七的blog 阅读(173) 评论(0) 推荐(0) 编辑
摘要: 使用Impala shell 输入impala-shell,即可进入impala-shell环境,impala-shell默认连接localhost:21000 如果要连接一个不同的主机(host) ,请使用使用impala-shell -i 主机名:端口号 如果要退出impala shell,请使 阅读全文
posted @ 2020-10-12 15:57 猫七的blog 阅读(187) 评论(0) 推荐(0) 编辑
摘要: Dense层 输入1*3维的Tensor,变成1*2维度,再变成1*2维,再变成1*2维 阅读全文
posted @ 2020-10-09 15:16 猫七的blog 阅读(384) 评论(0) 推荐(0) 编辑
摘要: 传统方法的局限性: 一:数据稀疏性: 语言是离散的符号系统,每个字符,单词都是离散型随机变量。而机器学习模型只接受向量。所以为了将文本转换成向量,通常要将离散符号按照其索引编码为One-hot向量。 然而近义词之间并不能通过这种方式编码成相似的向量。 将任意词语表示为固定长度为n的稠密向量,并且稠密 阅读全文
posted @ 2020-10-03 23:59 猫七的blog 阅读(74) 评论(0) 推荐(0) 编辑
摘要: 词向量: GloVe词向量:2014年的英文维基百科上训练。400k词,每个词用100维向量表示。 数据集: 20种新闻文本数据。 建模步骤: 1.把新闻样本转化为词索引序列。 词索引:每个词依次分配一个ID,只保留最常见的词(设置vocabulary_size)。 2.生成一个词向量矩阵。第i行表 阅读全文
posted @ 2020-09-29 22:36 猫七的blog 阅读(275) 评论(0) 推荐(0) 编辑
摘要: Lambda架构介绍 https://blog.csdn.net/rav009/article/details/85690985 从业务角度,数据的应用有实效性,常见电子商务。有的数据的应用对实效性要求比较低。比如客户画像分析。 所以lambda架构分为两种解决方法。 第一种是speed layer 阅读全文
posted @ 2020-09-29 14:59 猫七的blog 阅读(423) 评论(0) 推荐(0) 编辑
摘要: Keras介绍 keras建立变量后,会建立一个“计算图”。计算图规定了各个变量之间的计算关系。之后往计算图中输入数据,在整个模型形成数据。 https://github.com/MoyanZitto/keras-cn Moyan等大佬的翻译 http://blog.keras.io/ keras作 阅读全文
posted @ 2020-09-28 17:19 猫七的blog 阅读(122) 评论(0) 推荐(0) 编辑
摘要: Kalfka是一个集群模式。 生产者生产数据放到消息系统(Kalfka)中,消费者从Kalfka中读取数据。 阅读全文
posted @ 2020-09-28 15:59 猫七的blog 阅读(366) 评论(0) 推荐(0) 编辑
摘要: 模式设计基础 1.表至少有一个主键。 2.只有主键才会被索引。(考虑查询会使用什么作为条件) 3.不能更新主键。 4.只有主键才能被用来做表分区。 主键和列的设计 设计表模式,最重要的一项是决定你的主键。你只能将主键用作分区模式的一部分,但无法更新它们。 其他列可以通过update和upsert选项 阅读全文
posted @ 2020-09-25 17:11 猫七的blog 阅读(6) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 10 下一页