面试汇总 - sonofthesea

公告

面试汇总

网络基础

对象的内存布局

对象头（header）、实例数据（Instance Data）、对齐填充

java对象头里的Mark Word里默认存储对象的HashCode、分代年龄和锁标记位（包括锁标志位和是否是偏向锁）

锁一共4种状态，级别从低到高分依次是：无锁状态，偏向锁状态，轻量级锁状态和重量级锁状态

jvm垃圾收集

1、内存划分：栈内存，堆内存，方法区

2、堆内存划分

新生代，老年代和永久代

新生代又可划分为Eden区，Survivor 1区和Survivor 2区。新创建的对象会分配在Eden区,在经历一次Minor GC后会被移到Survivor 1区，再经历一次Minor GC后会被移到Survivor 2区，直到升至老年代,需要注意的是，一些大对象(长字符串或数组)可能会直接存放到老年代

大多数情况下，对象在新生代Eden区中分配，当Eden没有足够空间进行分配时，虚拟机将发起一次Minor GC(发生在新生代的垃圾收集动作)

新的对象实例会优先分配在新生代，在经历几次Minor GC后(默认15次)，还存活的会被移至老年代

Full GC:指发生在老年代的GC

Minor GC发生在新生代，当Eden区没有足够空间时，会发起一次Minor GC，将Eden区中的存活对象移至Survivor区。Major GC发生在老年代，当升到老年代的对象大于老年代剩余空间时会发生Major GC

表的优化

1、定长与变长分离

定长：int,char,time

变长：varchar,text,blob

2、常用字段和不常用字段分离

3、一对多，需要关联统计的字段上，添加冗余字段（论坛版块列表，回复数）

4、列选择原则：

1）字段类型优先级：整型>date,time>char,enum>varchar>blob.text

2）够用就行，不用慷慨

3）尽量避免使用NULL()：在磁盘上占用更大的空间，NULL()不利于索引，要用特殊的字符来表示

5、MYSQL索引类型：BTree索引、Hash索引

hash索引是在memory表里的，即在内存中存在

hash索引的弊端：

1）无法对范围查询进行优化

2）无法利用前缀索引

3）无法对排序进行优化

4）必须回行，即通过索引拿到表的位置，必须回到表中取数据

6、BTree索引常见误区

1）在where条件常用的列上都加上索引——独立索引只能用上一个

2）在多列上建立联合索引后，查询哪个列，索引都能发挥作用——必须依照索引的顺序，且满足左前缀要求

索引可以提高查询速度，排序速度和分组统计的速度

7、创建联合索引

create table t4 (
c1 tinyint(1) not null default 0,
c2 tinyint(1) not null default 0,
c3 tinyint(1) not null default 0,
c4 tinyint(1) not null default 0,
c5 tinyint(1) not null default 0,
index c1234(c1,c2,c3,c4)
);

8、分析索引的使用情况：explain

Innodb和myisam都是使用的BTree索引

但是myisam使用的是非聚簇索引——索引表和数据表分离，其索引指向某行在磁盘上的位置，不同索引树之间并无关联

innodb使用的是聚簇索引，数据和索引一块存放，不用回行，其索引，指向对主键的引用，非主键索引树指向主键索引

叶子比较重，且主键无规律，容易出现叶分裂

索引覆盖，优化的目的在于尽量少从磁盘上拿数据
性能分析工具：show profiles—— set profiling=1

9、理想的索引：

1）查询频繁

2）区分度高

3）长度小

4）尽量能覆盖常用查询字段

index(cat_id,price)，index(cat_id,brand_id,shop_price)；

10、索引与排序

排序可能发生两种情况：

1）对于索引覆盖，直接在索引上查询时，就是有顺序的，using index

2）如果没有索引，先取出临时数据，形成临时表做firesort（文件排序，可能在磁盘上，也可能在内存中）

我们的争取目标——取出来的数据本身就是有序的，利用索引来排序

对于myisam而言，对所有数据排序时并不是每取一次索引然后去磁盘上取相应数据，而是将所有数据都取出来进行filesort

独立的索引在每次查询中只能使用一个，应该尽量避免查询中出现filesort

where 后面的字段和 order by后面的字段不一致的时候，也会出新filesort现象，因为独立索引只能使用一个，查询时用到了一个索引，在排序时就不能使用排序字段的索引了

11、索引相关的操作语句

冗余索引较为常见，常用的为两个相同字段按先后顺序分别建立不同的索引

12、表修复——索引碎片及维护

方式一：nop操作，不对数据产生实际影响——alter table xxx engine InnoDB

方式二：optimize table name

注意: innodb来说,

1: 主键索引既存储索引值,又在叶子中存储行的数据

2: 如果没有主键, 则会Unique key做主键

3: 如果没有unique,则系统生成一个内部的rowid做主键.

4: 像innodb中,主键的索引结构中,既存储了主键值,又存储了行数据,这种结构称为”聚簇索引”

13、SQL语句优化

sql语句的执行时间花在哪了？

查找——沿着索引查找，慢者可能全表扫描

取出——查到行后，把数据取出来

如何查询快？

1）查询——联合索引的顺序，区分度，长度

2）取的快，索引覆盖

3）传输更少，更少的行和列

尽量走索引进行查询

14、explain 解释一个查询语句的执行计划

字段详解：

id:查询的序号，表明select语句

　　select_type:

　　　　　　simple：不含子查询

　　　　　　primary：含子查询

　　　　　　　　dependent subquery：非from子查询

　　　　　　　　derived：from子查询

　　　　　　　　union 和 union result

　　table:查询的表名

　　　　实际的表名，表的别名，derived（from类型的子查询），null （union）

　　type:索引所发挥的作用

　　　　all:做全表扫描，where后面查询条件列中没有索引。利用索引来排序，但是取出来是所有的节点，所以也会出现all的情况

　　　　Index:比all性能稍微好点，all扫描所有的数据行，相当于data_all，indux扫描所有的索引节点，相当于index_all

　　　　range:索引范围扫描

　　　　ref：精准查询，可以直接引用到某些行数据

　　　　eq_ref:

　　　　const,system,null:查询优化到常量级别，甚至不需要查询时间，一般按主键查询时，能出现这种情况

　　possible_keys:可能用到的键

　　key：真正用到的键

　　key_len：表的长度

　　ref：两表联查时候的引用关系

　　rows:本次查询返回的行数

　　extra:额外的信息

　　　　index：用到了索引覆盖，效率非常高

　　　　using where：光靠索引定位不了，还得where进行判断

　　　　using temporary：是指用上了临时表，order by与group by不同列时，或group by，order by别的表的列

　　　　using filesort：文件排序（文件可能在磁盘，也可能在内存）

　　如果取出的列含有text，或者更大的如mediumtext等，filesort将会发生在磁盘上

　　show status like '%_table%'：查看磁盘使用情况

15、In型子查询的误区：

mysql的查询优化器，针对In型做了优化，被改成了exists子查询的执行效果，当goods表越大时，查询速度越慢

改进：用连接查询代替子查询

explain select goods_id,g.cat_id,g.goods_name from goods as g

inner join (select cat_id from ecs_category where parent_id=6) as t

using(cat_id) \G

16、from型子查询

注意::内层from语句查到的临时表, 是没有索引的.

所以: from的返回内容要尽量少.

17、count（*）优化

18、group by、order by

19、union总是要产生临时表

尽量使用union all，不去重，不排序

20、limit 及翻页优化

limit offset,N, 当offset非常大时, 效率极低,

原因是mysql并不是跳过offset行,然后单取N行,

而是取offset+N行,返回放弃前offset行,返回N行.

效率较低,当offset越大时,效率越低

show profiles;

set profiling=1;

show profile for query 5

尽量沿着索引爬行

select id,name from lx_com where id>5000000 limit 10;

非要物理删除,还要用offset精确查询,还不限制用户分页,怎么办?

select id,name from lx_com inner join (select id from lx_com limit 5000000,10) as tmp using(id);

数据库底层原理，调优

数据表设计原则

1、从空间上考虑用varchar，从效率上考虑，用char

varchar类型的实际长度，是它的值的实际长度+1，+1的字节用于保存实际用了多大长度

2、存储过程

可移植性较差

定义存储过程：

delimiter %

create procedure 过程名（参数1，参数2）

begin

　　sql语句

end

调用方式：

call 过程名(参数1，参数2)

存储过程参数传递；

IN参数

in传入参数，把参数传递到过程内部

特点：读取外部变量值，且有效范围仅限存储过程内部

out：传出参数

inout：传入传出参数

into：赋值

mysql中的变量

1)局部变量。

局部变量一般用在sql语句块中，比如存储过程的begin/end。其作用域仅限于该语句块，在该语句块执行完毕后，局部变量就消失了。

局部变量一般用declare来声明，可以使用default来说明默认值。

drop procedure if exists add;

create procedure add( in a int, in b int)

begin

declare c int default 0;

set c = a + b;

select c as c;

end;

2)用户变量

用户变量的作用域要比局部变量要广。用户变量可以作用于当前整个连接，但是当当前连接断开后，其所定义的用户变量都会消失。

用户变量使用如下(这里我们无须使用declare关键字进行定义，可以直接这样使用):

select @变量名

对用户变量赋值有两种方式，一种是直接用"="号，另一种是用":="号。其区别在于使用set命令对用户变量进行赋值时，两种方式都可以使用；当使用select语句对用户变量进行赋值时，只能使用":="方式，因为在select语句中，"="号被看作是比较操作符。

3)会话变量

4)全局变量

触发器

与数据表有关，当表出现变化的时候（增、删、改），自动执行其他的特定的操作

触发器的格式

语法：create trigger 触发器名称触发的时间触发的动作

on 表名 for each row 触发器状态

触发器状态：随便起名字

触发的时机：before/after 在执行动作之前还是之后

触发的动作：

指的激发触发程序的语句类型：insert,update,delete

触发器创建语法四要素：

1）监视地点（table）

2）监视事件（insert/update/delete）

3）触发时间（after/before）

4）触发事件（insert/update/delete）

查看触发器：show triggers \G

查看触发器创建过程：show create trigger triggername \G

事务：（只有InnoDB引擎支持）

开启事务：START TRANSACTION

提交当前事务：COMMIT

关闭自动提交：set autocommit=0;

回滚：rollback

MySQL相关的配置文件：

主配置文件：/etc/my.cnf

进程通讯文件：/var/lib/mysql/mysql.sock

日志文件：/var/log/mysqld.log

进程ID文件：/var/run/mysqld/mysqld.pid

二进制文件：在my.cnf中增加

log-bin=mysql-bin.log

慢查询日志文件：在my.cnf中增加

log-slow-queries

存储引擎层：存储和提取数据以及事务处理

MyISAM的特性：

1）不支持事务，宕机时会破坏表

2）使用较小的内存和磁盘空间

3）基于表的锁，表级锁（加锁与并发）表级锁定影响性能

4）只缓存index，数据由os缓存

5）不支持外键约束，但是支持全文索引。

MyISAM调优精要：

1、设置合适的索引（缓存机制）

2、调整读写优先级，根据实际需求确保重要操作更优先执行

3、启用延迟插入，改善大批量写入性能

4、尽量顺序操作，让insert数据都写入到尾部，减少阻塞

5、降低并发数，减少对数据库的访问，使用消息队列

6、对于相对静态的数据库数据，充分利用Query Cache或者memcached缓存服务可以极大提高访问速率

7、

InnoDB存储引擎的特性

1）支持事务四个级别ACID

2）支持行锁（行级锁定）

3）聚簇索引

4）支持外键

5）支持崩溃数据自修复

6）具有高效的缓存特性，能缓存索引，也能缓存数据。

默认使用InnoDB引擎配置

default-storage-enigine=innodb

类加载器及其加载过程

Hibernate 机制

MYSQL

ORACLE

多线程技术，各种锁机制

1、moniterenter和moniterexit 指令对应于synchronized，更深一步是lock和unlock

2、执行moniterenter指令时，首先要尝试获取对象锁。如果这个对象没被锁定，或者当前已经拥有了那个对象的锁，把锁的计数器加1，相应的，在执行moniterexit指令时会将计数器减1，当计数器为0时，锁就被释放。

3、和synchronized相比，ReentrantLock增加了一些高级功能，主要有等待可中断，可实现公平锁，以及锁可以绑定多个条件。

4、自旋锁：为了让线程等待，只需让线程执行一个忙循环（自旋），但并不放弃处理器的执行时间，这项技术就是自旋锁

自旋锁可以在时间上和自旋次数上进行控制，自适应自旋锁

5、

大数据相关组件及其原理

设计模式

zookeeper原理

数据库和缓存保持数据的一致性

Concurrent包

虚拟机和调优

缓存一致性问题（如何解决数据库和redis缓存的双写操作）

一致性Hash算法

内存高占用率分析

java内存模型

1、Java内存模型规定了所有变量都存储在主内存中，每条线程还有自己的工作内存，线程的工作内存中保存了被该线程使用到的变量的主内存副本拷贝，线程对变量的所有操作都必须在工作内存中进行，而不能直接读写准内存中的变量。

2、内存间交互操作

lock、unlock

read、load：两者不能单独出现

use、assign

store、write：两者不能单独出现

3.volatile不保证原子性

特性1：保证此变量对所有线程的可见性

特性2：禁止指令重排序优化

Executor

1.Executor框架的结构

2.ThreadPoolExecutor

ThreadPoolExecutor通常使用工厂类Executors来创建，可以创建的三种类型

SingleThreadExecutor:只有一个线程，适用于需要保证顺序地执行各个任务，并且在任意时间点，不会有多个线程是活动的应用场景

FixedThreadPool:用于需要限制当前线程数量的应用场景，它适用于负载比较重的服务器

CachedThreadPool：是大小无界的线程池，适用于执行很多的短期异步任务的小程序，或者是负载较轻的服务器

HashMap和ConcurrentHashMap

在并发编程中使用HashMap可能导致程序死循环，而使用线程安全的HashTable效率又非常低下

在多线程中使用HashMap进行put操作会引起死循环，导致CPU利用率接近100%，因为多线程会导致HashMap的Entry链表形成环形数据结构，一旦形成环形数据结构，Entry的next节点永远不为空。

ConcurrentHashMap的锁分段技术可有效提升并发访问率

chm由Segment数组结构和HashEntry数组结构组成，Segment是一种可重入锁(ReentrantLock)。

Segment的结构和HashMap类似，是一种数组和链表结构，一个Segment里包含一个HashEntry数组，每个HashEntry是一个链表结构的元素。

定位Segment：

在插入和获取元素的时候，必须先通过散列算法定位到Segment，之所以进行再散列，目的是减少散列冲突，使元素能够均匀的分布在不同的Segment上，从而提高容器的存取效率，通过这种再散列能让数字的每一位都参加到散列运算当中，从而减少散列冲突。

get操作：get操作不需要加锁，因为get方法中要使用的共享变量都定义成立volatile类型，因此可以在多线程中保持可见性，可以被多线程同时读

因为根据Java内存模型的先行发生原则，对volatile字段的写入操作先于读操作，即使两个线程同时修改和获取volatile变量，get操作也能拿到最新的值。

put操作：判断是否需要对HashEntry数组进行扩容，第二步定位添加元素的位置

先行发生原则

1）程序次序规则

2）管程锁定规则

3）volatile变量规则:对一个volatile变量的写操作先行发生于后面这个变量的读操作

Synchronized

同步代码块使用了 monitorenter 和 monitorexit 指令实现。

同步方法中依靠方法修饰符上的 ACC_SYNCHRONIZED 实现

锁的四种状态：无锁状态，偏向锁状态，轻量级锁状态，重量级锁状态

轻量级锁能提升程序同步性能的依据是“对于绝大部分的锁，在整个同步周期内都是不存在竞争的”，轻量级锁使用CAS 操作避免了使用互斥量的开销

monitor是线程私有的数据结构，每一个线程都有一个可用的monitor列表，同时还有一个全局可用的列表

每个线程的当前栈帧中都有一个Lock Record锁记录，用于存储锁对象目前的Mark Word的拷贝

虚拟机将使用CAS操作将Mark Word更新为指向Lock Record的指针，如果成功，则拥有轻量级锁

如果有两条以上的线程争用同一个锁，那轻量级锁就不再有效，要膨胀为重量级锁

轻量级锁：利用了CPU原语Compare-And-Swap(CAS，汇编指令CMPXCHG)

如果说轻量级锁是在无竞争的情况下使用CAS操作去消除同步使用的互斥量，那偏向锁就是在无竞争的情况下把整个同步都消除掉，连CAS操作都不做了

CAS（Compare and swap）原理

思想，三个参数，一个当前内存值V、旧的预期值A、即将更新的值B，当且仅当预期值A和内存值V相同时，将内存值修改为B并返回true，否则什么都不做，并返回false

CAS是通过unsafe类的compareAndSwap方法实现的

Unsafe是CAS的核心类，由于Java方法无法直接访问底层系统，需要通过本地（native）方法来访问，Unsafe相当于一个后门，基于该类可以直接操作特定内存的数据

compareAndSwap:第一个参数是要修改的对象，第二个参数是对象中要修改变量的偏移量，第三个参数是修改之前的值，第四个参数是预想修改后的值

CAS的缺点：ABA问题

如果变量V初次读取的时候是A，并且在准备赋值的时候检查到它仍然是A，那能说明它的值没有被其他线程修改过了吗？

解决办法：java并发包中提供了一个带有标记的原子引用类AtomicStampedReference，它可以通过控制变量值的版本来保证CAS的正确性

LOCK(AQS)

当通过lockInterruptibly()方法获取某个锁时，如果不能获取到，只有进行等待的情况下，是可以响应中断的。

而用synchronized修饰的话，当一个线程处于等待某个锁的状态，是无法被中断的，只有一直等待下去。

REDIS哨兵的主要作用：集群监控和故障转移

SHELL命令

posted on 2018-03-28 00:53 sonofthesea 阅读(295) 评论(0) 编辑收藏举报

刷新页面返回顶部