CQL语句

CQL中默认忽略大小写,若需要大小写敏感,可使用双引号将对象包起来,引用的时候也要用双引号包住

tips: 使用CQL需要预装Python环境

Ⅰ、基本知识点

1.1 数据类型

这边和关系型数据库相近的就不列出来了,只列出Cassandra特色的,重要的

CQL类型 常用类型 说明
list(T) n/a 有序集合,T可以是任意分集合CQL数据类型,例如,int,text等
map(K,V) n/a 哈希表,K和V可以是任意非集合CQL数据类型,例如,int,text等
set(T) n/a 无序集合,T可以是任意分集合CQL数据类型,例如,int,text等

1.2 命名规则

字母或数字开头,满足正则表达式[a-zA-Z0-9_]*

1.3 注释

  • 单行注释://或者-
  • 多行注释:/** xxx **/

1.4 关键字和保留字

定义column和keyspace时候不能使用关键字和保留字,一定要用可以使用双引号包起来,但不建议这么用

具体的关键字和保留字见官网表格

Ⅱ、数据定义语句

2.1 KeySpace

语法:create keyspace (if not exists)? <identifier> with <properties>;
注意:identifier长度需要小于等于32,默认大小写不敏感,可以使用双引号让它对大小写敏感
create keyspace test 
with replication = {'class':'SimpleStrategy', 'replication_factor': 3} 
and durable_writes = true;

查看当前所有KeySpace
desc keyspaces;

查看KeySpace的创建语句
desc <identifier>;

修改KeySpace
alter keyspace <identifier> with <properties>;

切换KeySpace
use <identifier>;

删除名为teset的KeySpace
drop keyspace (if exsits)? <identifier>;

create keyspace的两个属性

  • replication

复制策略(SimpleStrategy(单一数据中心,测试用),NetworkTopologyStrategy(默认,强烈推荐,方便数据扩展),OldNetworkTopologyStrategy(官方已弃用))
这个属性是强制的,至少包括class属性,其他属性依class改变,replication决定了多节点的情况下,新写入的数据如何在节点之间复制保存
replication_factor属性,他是SimpleStrategy这种策略的一个属性,叫做副本因子,决定了每个row有多少个副本,这个值不可以超过节点数

  • durable_writes

是否使用commit log持久化写入,默认为true

2.2 Column Family

语法:create (table|columnfamily) (if not exists)? <tablename>
	'('<column-definition>(','<column-definiton>)*')'
	(with<option>(and <option>)*)?;

一般把第一个column作为primary key,当作行的标识,也就是row key,也可以指定多个列组成复合键

create table timeline(
	userid uuid,
	posted_month int,
	poster_time uuid,
	body text,
	poster_by text,
	primary key(userid, posted_month, posted_time)
)with compaction = {'class':'LeveldCompactionStrategy'};

查看column family的创建语句
desc <tablename>;

修改column family
alter (table|columnfamily)<tablename><instruction>;

alter table table_name
add columnname varchar;

alter table table_name
drop columnname;

alter table table_name
with comment = 'xxx'
and read_repair_chance = 0.2;

alter table table_name
rename old_column_name to new_column_name;

下面这种修改column数据类型的语法新版本已不再支持
alter table table_name
alter column_name type uuid;

删除column family
drop table (if exists)? <tablename>;

清空column family
truncate <tablename>;

column family的属性

接在with后面,了解即可

属性 说明
commnet 对column family的描述信息
bloom_filter_fp_chance 指定bloom_filter算法的容错率,一般设置为0.01或者0.1
caching 设置缓存方案
compactioin 数据压缩策略
compression 数据压缩算法
default_time_to_live 存活时间,单位是秒,默认0(永久存活)
memtable_flush_period_in_ms 内存数据刷新时间间隔
read_repair_chance 0-1之间的数值,与数据一致性有关

注意

  • create table也可以写成create columnfamily,但建议使用前者
  • 可使用if not exists规避错误
  • 名字和keyspace一样不能超过32个字符
  • 可使用create table keyspace.tablename在指定keyspace中创建,不指定则代表在当前keyspace创建

2.3 create index

语法:create (custom)? index (if not exists)? (<indexname>)?
	on <tablename> '('<index-identifier>')'
	(using<string>(with options=<map-literal>)?)?;
	
create index idx_name on columnfamily_name(column_name);
create index on columnfamily_name(column_name); 给一个默认idx_name
create index on columnfamily_name(keys(column_name)); 针对map类型column的键值进行索引
create custom index on columnfamily_name(column_name) using 'path.to.the.IndexClass';
create custom index on columnfamily_name(column_name) using 'path.to.the.IndexClass' with options = {'storage':'/mnt/ssd/indexes'};

删除index
drop index(if exsists)?(<keyspace>'.')?<identifier>;

2.4 create type

语法:create type (if not exists)? <typename>
	'('<field-definition>(',' <field-definiton>)*')';
	
修改type
alter type <typename> <instruction>;

alter type type_name alter zip type varint;
alter type type_name add xxx text;
alter type type_name rename old_name to new_name and old2_name to new2_name;

查看当前所有自定义type
desc types;

查看指定type信息
desc type type_name;

删除type
drop type (if exsists)? <typename>;
注意:如果type还在使用,drop会报错

Ⅲ、数据操作语句

3.1 增删改

INSERT
insert into <tablename>
'('<identifier>(',' <identifier>)*')'
values '('<term-or-literal>(',' <term-or-literal>)*')'
(if not exists)?
(using <option> (AND <option>)*)?

using ttl 86400	表示这行数据过了86400秒自动删除
cassandra中没有duplicate,插入数据的主键已经存在,则会将老数据直接覆盖

UPDATE
update <tablename>
(using <option> (AND <option>*))?
set <assignment> (',' <assignment>)*
where <where-clause>
(if <condition> (AND condition)*)?

update的using语句是放在set之前,不在最后,这点要和insert区别

DELETE
delete (<selection> (',' <selection>)*)?
from <tablename>
(using timestamp <integer>)?
where <where-clause>
(if (exists|(<condition> (AND <condition>)*)))?

delete from column_family_name where column_name = xxx;
delete column_name from column_family_name where column_name = xxx;

BATCH 批量操作,要么全部成功,要么全部失败
begin (unlogged|counter) batch
(using <option> (and <options>)*)?
<modification_statement> (';' <modification_statement>)* 
apply batch

3.2 查询

语法:
select <select-clause>
from <tablename>
(where <where-clause>)?
(order by <order-by>)?
(limit <integer>)?
(allow filtering)?

select column_name from column_family_name where column_name in (xxx,xxx,xxx);
select column_name as xxx from column_family_name;
select column_name from column_family_name where column_name = 'xxx' and column_name > 'xxx';
select count(*) from column_family_name;
select count(*) as xxx from column_family_name;

select注意点

  • 可以使用count计算函数,目前唯一一个函数
  • 可以使用limit关键字限制返回行数
  • where中出现的column必须是primary key中的第一个列,或者是建立了索引的column,若两者都不满足,则须在结尾加上allow filtering关键字
  • 通常primary key中指定的第一个column叫parition key,它对数据在节点上的分布起关键作用
  • where中对于类型为set/list的column可以使用contains关键字,对于类型为map的column可以使用contains key关键字,对于partition key可以用in关键字
  • 集合类型不能用作primary key,但是可以create index
posted @ 2019-04-24 16:18  91洲际哥  阅读(1666)  评论(0编辑  收藏  举报