java web项目通常采用的技术概述
序:
网站的架构一般来说,分为前端和后端。前端负责页面的展示,后端则是业务逻辑的实现。由于HTML5的兴起,前端领域发展极快,在经典的java web的开发模式中,我们使用JSP技术作为展现层的实现,其实就是前端。除了JSP,还要懂得HTML,CSS,JS,AJAX等前端的基础知识。JSP在其中扮演外层包装的角色。后端是由一些实现了业务逻辑的java代码和数据库组成,说到这,就可以推出web开发中经典的MVC模式:model-view-controller。view就是表现层,model是用来承载数据的抽象结构,而controller则是view和model的桥梁。view存在于前端代码中,controller和model存在于后端代码中,
在后端代码中,为了保证代码的整洁,易读性,一般会采用分层。自顶向下分别为controller层,service层,dao层,数据层或者叫持久层(直接与数据库打交道)。有时候为了达到解耦的目的,会在上述基层中间加入响应的接口层,。在更加大型的网站,会在dao层和数据层之间出现缓存层。或者访问压力增大后,需使用集群,负载均衡等高级技术。
综上,一个web项目前端需要表现层,后端有controller层,service层,dao层,持久层。在表现层,除了提到的HTML,css,js,jsp,ajax等基础知识,还会用到许多框架,比如tiles,velocity,freemaker等模板。在持久层,除了jdbc,还有mybatis,hibernate等框架。在java web中最耀眼的当属spring,spring作为一个贯穿始终的框架,为项目开发带来依赖注入,面向切面编程等功能,除了这些还要掌握一种关系型数据库,如MySQL Oracle等,能掌握非关系型数据库更好 如Redis mongodb等。
掌握了上述知识点,恭喜你,你已经可以开始写java web项目了。但是只会写而不会部署,我们的项目仍然不能拿出来用。需要一个容器来运行我们的代码。这里所说的容器不是java里的数据类型,而是指应用服务器,此处要区分应用服务器和web服务器。目前比较流行的应用服务器有Tomcat等,常用的web服务器有Nginx,Apache等。
java web技能树:
大后台:
web后台属于后台,但后台的范围非常广泛。两者是包含关系,从网络协议的角度来看,web后台更多关注的是http,而C++后台关注的是tcp协议。
参考书籍:《C++ primer》,《effective C++》,《STL源码解析》,《深度搜索C++对象模型》
- extern关键字作用
- static关键字作用
- volatile是干啥的
- 说说const的作用,越多越好
- new与malloc区别
- C++多态性与虚函数表
- C++多态的实现?
- 虚函数的作用?
- 虚函数用于实现多态,这点大家都能答上来但是虚函数在设计上还具有封装和抽象的作用。比如抽象工厂模式。
- 动态绑定是如何实现的?
- 静态多态和动态多态。静态多态是指通过模板技术或者函数重载技术实现的多态,其在编译器确定行为。动态多态是指通过虚函数技术实现在运行期动态绑定的技术。
- 虚函数表
- 虚函数表是针对类的还是针对对象的?同一个类的两个对象的虚函数表是怎么维护的?
- 编译器为每一个类维护一个虚函数表,每个对象的首地址保存着该虚函数表的指针,同一个类的不同对象实际上指向同一张虚函数表。
- 纯虚函数如何定义,为什么对于存在虚函数的类中析构函数要定义成虚函数
- 析构函数能抛出异常吗
- 构造函数和析构函数中调用虚函数吗?
- 指针和引用的区别
- 指针与数组千丝万缕的联系
- 智能指针是怎么实现的?什么时候改变引用计数?
- 构造函数中计数初始化为1;
- 拷贝构造函数中计数值加1;
- 赋值运算符中,左边的对象引用计数减一,右边的对象引用计数加一;
- 析构函数中引用计数减一;
- 在赋值运算符和析构函数中,如果减一后为0,则调用delete释放对象。
- share_prt与weak_ptr的区别?
- C++四种类型转换:static_cast, dynamic_cast, const_cast, reinterpret_cast
- 内存对齐的原则
- 内联函数有什么优点?内联函数与宏定义的区别?
- C++内存管理
- STL里的内存池实现
- STL里set和map是基于什么实现的。红黑树的特点?
- STL里的其他数据结构和算法实现也要清楚
这个问题,把STL源码剖析好好看看,不仅面试不慌,自己对STL的使用也会上升一个层次。 - 必须在构造函数初始化式里进行初始化的数据成员有哪些
- 模板特化
- 定位内存泄露
(1)在windows平台下通过CRT中的库函数进行检测;
(2)在可能泄漏的调用前后生成块的快照,比较前后的状态,定位泄漏的位置
(3)Linux下通过工具valgrind检测 - 手写strcpy,memcpy,strcat,strcmp等函数
数据结构与算法
这一块考察范围太广,主要靠多刷题吧,牛客网,剑指OFFER,LeetCode等。
Hash表
- Hash表实现(拉链和分散地址)
- Hash策略常见的有哪些?
- STL中hash_map扩容发生什么?
(1) 创建一个新桶,该桶是原来桶两倍大最接近的质数(判断n是不是质数的方法:用n除2到sqrt(n)范围内的数) ;
(2) 将原来桶里的数通过指针的转换,插入到新桶中(注意STL这里做的很精细,没有直接将数据从旧桶遍历拷贝数据插入到新桶,而是通过指针转换)
(3) 通过swap函数将新桶和旧桶交换,销毁新桶。
树
- 二叉树结构,二叉查找树实现;
- 二叉树的六种遍历;
- 二叉树的按层遍历;
- 递归是解决二叉树相关问题的神级方法;
- 树的各种常见算法题(http://blog.csdn.net/xiajun07061225/article/details/12760493);
- 什么是红黑树?
- 红黑树与AVL树的区别
- Trie树(字典树)
链表
- 链表和插入和删除,单向和双向链表都要会
- 链表的问题考虑多个指针和递归
(1) 反向打印链表(递归)
(2) 打印倒数第K个节点(前后指针)
(3) 链表是否有环(快慢指针)等等。
栈和队列
- 队列和栈的区别?(从实现,应用,自身特点多个方面来阐述,不要只说一个先入先出,先入后出,这个你会别人也会,要展现出你比别人掌握的更深)
- 典型的应用场景
海量数据问题
- 十亿整数(随机生成,可重复)中前K最大的数
- 十亿整数(随机生成,可重复)中出现频率最高的一千个
排序算法
- 排序算法当然是基础内容了,必须至少能快速写出,快排,建堆,和归并
- 每种算法的时间空间复杂度,最好最差平均情况
位运算
布隆过滤器
几十亿个数经常要查找某一个数在不在里面,使用布隆过滤器,布隆过滤器的原理。布隆过滤器可能出现误判,怎么保证无误差?
网络与TCP/IP
参考书籍:《图解TCP/IP》,《TCP/IP详解 卷一》,《图解HTTP》,《HTTP权威指南》
- TCP与UDP之间的区别
(1) IP首部,TCP首部,UDP首部
(2) TCP和UDP区别
(3) TCP和UDP应用场景
(4) 如何实现可靠的UDP - TCP三次握手与四次挥手
- 详细说明TCP状态迁移过程
(1) 三次握手和四次挥手状态变化;
(2) 2MSL是什么状态?作用是什么?
(3)三次握手为什么不是两次或者四次? - TCP相关技术
- TCP重发机制,Nagle算法
- TCP的拥塞控制使用的算法和具体过程
- TCP的窗口滑动
- TCP客户与服务器模型,用到哪些函数
- UDP客户与服务器模型,用到哪些函数
- 域名解析过程,ARP的机制,RARP的实现
- Ping和TraceRoute实现原理
HTTP
- http/https 1.0、1.1、2.0的特点和区别
- get/post 区别
- HTTP返回状态码
- http 协议头相关
http数据由请求行,首部字段,空行,报文主体四个部分组成
首部字段分为:通用首部字段,请求首部字段,响应首部字段,实体首部字段
- https与http的区别?如何实现加密传输?加解密方式?
- 浏览器中输入一个URL发生什么,用到哪些协议?
安全相关
至少了解攻击的原理和基本的防御方法,常见的攻击方法有一下几种
- SQL注入
- XSS
- CSRF
- SYN洪水攻击
- APR欺骗
数据库
主要参考书籍:《数据库系统概念》,《高性能MySQL》
- SQL语言(内外连接,子查询,分组,聚集,嵌套,逻辑)
- MySQL索引方法?索引的优化?
- InnoDB与MyISAM区别?
- 事务的ACID
- 事务的四个隔离级别
- 查询优化(从索引上优化,从SQL语言上优化)
- B-与B+树区别?
- MySQL的联合索引(又称多列索引)是什么?生效的条件?
- 分库分表
Linux
主要参考书籍:《现代操作系统》,《APUE》,《UNP》,《LINUX内核设计与实现》,《深入理解LINUX内核》
(1) 进程与线程区别?
(2) 线程比进程具有哪些优势?
(3) 什么时候用多进程?什么时候用多线程?
(4) LINUX中进程和线程使用的几个函数?
(5) 线程同步?
在Windows下线程同步的方式有:互斥量,信号量,事件,关键代码段
在Linux下线程同步的方式有:互斥锁,自旋锁,读写锁,屏障(并发完成同一项任务时,屏障的作用特别好使) 知道这些锁之间的区别,使用场景?
- 匿名管道与命名管道的区别:匿名管道只能在具有公共祖先的两个进程间使用。
- 共享文件映射mmap
mmap建立进程空间到文件的映射,在建立的时候并不直接将文件拷贝到物理内存,同样采用缺页终端。mmap映射一个具体的文件可以实现任意进程间共享内存,映射一个匿名文件,可以实现父子进程间共享内存。 - 常见的信号有哪些?:SIGINT,SIGKILL(不能被捕获),SIGTERM(可以被捕获),SIGSEGV,SIGCHLD,SIGALRM
- 虚拟内存的作用?
- 虚拟内存的实现?
- 操作系统层面对内存的管理?
- 内存池的作用?STL里内存池如何实现?
- 进程空间和内核空间对内存的管理不同?
- Linux的slab层,VAM?
- 伙伴算法
- 高端内存
- 进程调度
- Linux进程分为两种,实时进程和非实时进程;
- 优先级分为静态优先级和动态优先级,优先级的范围;
- 调度策略
- 交互进程通过平均睡眠时间而被奖励;
(1) 死锁产生的条件;
(2) 死锁的避免;
- 命令行
- Linux命令 在一个文件中,倒序打印第二行前100个大写字母
cat filename | head -n 2 | tail -n 1 | grep '[[:upper:]]' -o | tr -d '\n'| cut -c 1-100 | rev
- 与CPU,内存,磁盘相关的命令(top,free, df, fdisk)
- 网络相关的命令netstat,tcpdump等
- sed, awk, grep三个超强大的命名,分别用与格式化修改,统计,和正则查找
- ipcs和ipcrm命令
- 查找当前目录以及字母下以.c结尾的文件,且文件中包含”hello world”的文件的路径
- 创建定时任务
- IO模型
- 五种IO模型:阻塞IO,非阻塞IO,IO复用,信号驱动式IO,异步IO
- select,poll,epoll的区别
- 线程池,内存池 自己动手实现一遍
Linux的API
- fork与vfork区别
fork和vfork都用于创建子进程。但是vfork创建子进程后,父进程阻塞,直到子进程调用exit()或者excle()。
对于内核中过程fork通过调用clone函数,然后clone函数调用do_fork()。do_fork()中调用copy_process()函数先复制task_struct结构体,然后复制其他关于内存,文件,寄存器等信息。fork采用写时拷贝技术,因此子进程和父进程的页表指向相同的页框。但是vfork不需要拷贝页表,因为父进程会一直阻塞,直接使用父进程页表。 - exit()与_exit()区别
exit()清理后进入内核,_exit()直接陷入内核。 - 孤儿进程与僵死进程
- 孤儿进程是怎么产生的?
- 僵死进程是怎么产生的?
- 僵死进程的危害?
- 如何避免僵死进程的产生?
- Linux是如何避免内存碎片的
- 伙伴算法,用于管理物理内存,避免内存碎片;
- 高速缓存Slab层用于管理内核分配内存,避免碎片。
- 共享内存的实现原理?
- 系统调用与库函数(open, close, create, lseek, write, read)
- 同步方法有哪些?
- 互斥锁,自旋锁,信号量,读写锁,屏障
- 互斥锁与自旋锁的区别:互斥锁得不到资源的时候阻塞,不占用cpu资源。自旋锁得不到资源的时候,不停的查询,而然占用cpu资源。
- 死锁
其他
- ++i是否是原子操作
明显不是,++i主要有三个步骤,把数据从内存放在寄存器上,在寄存器上进行自增,把数据从寄存器拷贝会内存,每个步骤都可能被中断。 - 判断大小端
设计模式
- 单例模式线程安全的写法
- STL里的迭代器模式,适配器模式
分布式系统
- map_reduce原理 (这篇文章讲的很通俗易懂)
- 负载均衡
- CDN