猫七的blog

2020年10月19日

摘要：例子 SELECT cust_name,cust_contact FROM Customers,Orders,OrderItems WHERE Customers.cust_id=Orders.cust_id AND OrderItems.order_num=Orders.order_num AND 阅读全文

posted @ 2020-10-19 15:59 猫七的blog 阅读(75) 评论(0) 推荐(0) 编辑

2020年10月13日

SQL联结

摘要：联结： SQL最强大的功能之一：在数据查询中联结（join）多个存储不同信息的表。最简单的例子：检索供应商的名字，产品的名字，产品的地址。一：使用“where”子句： select prod_name,vend_name,vend_address from vendors,products wh 阅读全文

posted @ 2020-10-13 14:06 猫七的blog 阅读(173) 评论(0) 推荐(0) 编辑

2020年10月12日

Kudu建表操作

摘要：使用Impala shell 输入impala-shell，即可进入impala-shell环境，impala-shell默认连接localhost:21000 如果要连接一个不同的主机(host) ，请使用使用impala-shell -i 主机名:端口号如果要退出impala shell，请使阅读全文

posted @ 2020-10-12 15:57 猫七的blog 阅读(187) 评论(0) 推荐(0) 编辑

2020年10月9日

TensorFlow------------Dense层

摘要： Dense层输入1*3维的Tensor，变成1*2维度，再变成1*2维，再变成1*2维阅读全文

posted @ 2020-10-09 15:16 猫七的blog 阅读(384) 评论(0) 推荐(0) 编辑

2020年10月3日

自然语言处理——使用深度学习解决NLP问题

摘要：传统方法的局限性：一：数据稀疏性: 语言是离散的符号系统，每个字符，单词都是离散型随机变量。而机器学习模型只接受向量。所以为了将文本转换成向量，通常要将离散符号按照其索引编码为One-hot向量。然而近义词之间并不能通过这种方式编码成相似的向量。将任意词语表示为固定长度为n的稠密向量，并且稠密阅读全文

posted @ 2020-10-03 23:59 猫七的blog 阅读(74) 评论(0) 推荐(0) 编辑

2020年9月29日

Keras——词向量与CNN介绍

摘要：词向量： GloVe词向量：2014年的英文维基百科上训练。400k词，每个词用100维向量表示。数据集： 20种新闻文本数据。建模步骤： 1.把新闻样本转化为词索引序列。词索引：每个词依次分配一个ID，只保留最常见的词(设置vocabulary_size）。 2.生成一个词向量矩阵。第i行表阅读全文

posted @ 2020-09-29 22:36 猫七的blog 阅读(275) 评论(0) 推荐(0) 编辑

Kudu实时分析举例

摘要： Lambda架构介绍 https://blog.csdn.net/rav009/article/details/85690985 从业务角度，数据的应用有实效性，常见电子商务。有的数据的应用对实效性要求比较低。比如客户画像分析。所以lambda架构分为两种解决方法。第一种是speed layer 阅读全文

posted @ 2020-09-29 14:59 猫七的blog 阅读(423) 评论(0) 推荐(0) 编辑

2020年9月28日

Keras

摘要： Keras介绍 keras建立变量后，会建立一个“计算图”。计算图规定了各个变量之间的计算关系。之后往计算图中输入数据，在整个模型形成数据。 https://github.com/MoyanZitto/keras-cn Moyan等大佬的翻译 http://blog.keras.io/ keras作阅读全文

posted @ 2020-09-28 17:19 猫七的blog 阅读(122) 评论(0) 推荐(0) 编辑

Kalfka

摘要： Kalfka是一个集群模式。生产者生产数据放到消息系统（Kalfka）中，消费者从Kalfka中读取数据。阅读全文

posted @ 2020-09-28 15:59 猫七的blog 阅读(366) 评论(0) 推荐(0) 编辑

2020年9月25日

Kudu的模式设计

摘要：模式设计基础 1.表至少有一个主键。 2.只有主键才会被索引。(考虑查询会使用什么作为条件) 3.不能更新主键。 4.只有主键才能被用来做表分区。主键和列的设计设计表模式，最重要的一项是决定你的主键。你只能将主键用作分区模式的一部分，但无法更新它们。其他列可以通过update和upsert选项阅读全文

posted @ 2020-09-25 17:11 猫七的blog 阅读(6) 评论(0) 推荐(0) 编辑

https://www.cnblogs.com/liuguangshou123/

公告