Java程序员应该掌握的底层知识

CPU的制作过程

https://haokan.baidu.com/v?vid=11928468945249380709&pd=bjh&fr=bjhauthor&type=video

CPU是如果制作的

https ://www.sohu.com/a/255397866_468626

CPU的原理

计算机需要解决的最根本问题：如何代表数字

晶体管是如何工作的：

https://haokan.baidu.com/v?vid=16026741635006191272&pd=bjh&fr=bjhauthor&type=video

晶体管的工作原理：

https://www.bilibili.com/video/av47388949?p=2

汇编语言的执行过程

汇编语言的本质：机器语言的助记符其实就是机器语言

执行过程：计算机通电->cpu读取内存中的程序（电信号输入）->时钟发生器不断震荡通电->推动cpu内部一步一步执行（执行多少取决于指令需要的时钟周期）->计算机完成->写回（信号）->写给显卡输出（图形）

计算机的组成

CPU的组成

PC -> Program Counter 程序计数器（记录当前指令地址）

Registers -> 暂时存储CPU计算需要用到的数据

ALU -> Arithmetic & Logic Unit 运算单元

CU -> Control Unit 控制单元

MMU -> Memory Management Unit 内存管理单元

CPU的乱序执行

cpu在进行读等待的同时执行指令，是cpu乱序的根源不是乱，而是提高效率

禁止乱序

CPU层面：Intel -> 原语(mfence lfence sfence) 或者锁总线

JVM层级：8个hanppens-before原则 4个内存屏障（LL LS SL SS）

as-if-serial : 不管硬件什么顺序，单线程执行的结果不变，看上去像是serial

CPU 合并写

Write Combining Buffer

一般是4个字节

由于ALU速度太快，所以在写入L1的同时，写入一个WC Buffer，满了之后，再直接更新到L2

UMA:统一访问内存

NUMA

Non Uniform Memory Access

ZGC - NUMA aware

分配内存会优先分配该线程所在CPU的最近内存

系统启动过程

通电 -> bios uefi 工作 -> 自检 -> 到硬盘固定位置加载bootloader -> 读取可配置信息 -> CMOS-》0x7c00（系统内存引导地址）-》操作系统

内核分类

微内核 - 弹性部署 5G IoT

宏内核 - PC phone

外核 - 科研实验中为应用定制操作系统 (多租户 request-based GC JVM)

用户态与内核态

cpu分不同的指令级别

linux内核跑在ring 0级，用户程序跑在ring 3，对于系统的关键访问，需要经过kernel的同意，保证系统健壮性

内核执行的操作 - > 200多个系统调用 sendfile read write pthread fork

JVM -> 站在OS老大的角度，就是个普通程序

进程线程纤程中断

面试高频：进程和线程有什么区别？

答案：进程就是一个程序运行起来的状态，线程是一个进程中的不同的执行路径。专业：进程是OS分配资源的基本单位，线程是执行调度的基本单位。分配资源最重要的是：独立的内存空间，线程调度执行（线程共享进程的内存空间，没有自己独立的内存空间）

纤程：用户态的线程，线程中的线程，切换和调度不需要经过OS

优势：1：占有资源很少 OS : 线程1M Fiber：4K 2：切换比较简单 3：启动很多个10W+

目前2020 3 22支持内置纤程的语言：Kotlin Scala Go Python(lib)... Java? （open jdk : loom）

进程调度

2.6采用CFS调度策略：Completely Fair Scheduler

按优先级分配时间片的比例，记录每个进程的执行时间，如果有一个进程执行时间不到他应该分配的比例，优先执行

默认调度策略：

实时（急诊）优先级分高低 - FIFO (First In First Out)，优先级一样 - RR（Round Robin）普通： CFS

中断

硬件跟操作系统内核打交道的一种机制

软中断（80中断） == 系统调用

系统调用：int 0x80 或者 sysenter原语

通过ax寄存器填入调用号

参数通过bx cx dx si di传入内核

返回值通过ax返回

java读网络 – jvm read() – c库read() - >

内核空间 -> system_call() （系统调用处理程序）

-> sys_read()

从汇编角度理解软中断

搭建汇编环境

yum install nasm

 
;hello.asm
;write(int fd, const void *buffer, size_t nbytes);fd 文件描述符 file descriptor - linux下一切皆文件​section data    msg db "Hello", 0xA    len equ $ - msg​section .textglobal _start_start:​    mov edx, len    mov ecx, msg    mov ebx, 1 ;文件描述符1 std_out    mov eax, 4 ;write函数系统调用号 4    int 0x80​    mov ebx, 0    mov eax, 1 ;exit函数系统调用号    int 0x80

编译：nasm -f elf hello.asm -o hello.o

链接：ld -m elf_i386 -o hello hello.o

一个程序的执行过程，要么处于用户态，要么处于内核态

内存管理

DOS时代 - 同一时间只能有一个进程在运行（也有一些特殊算法可以支持多进程）

windows9x - 多个进程装入内存 1：内存不够用 2：互相打扰

为了解决这两个问题，诞生了现在的内存管理系统：虚拟地址分页装入软硬件结合寻址

分页（内存不够用），内存中分成固定大小的页框（4K），把程序（硬盘上）分成4K大小的块，用到哪一块，加载那一块，加载的过程中，如果内存已经满了，会把最不常用的一块放到swap分区，把最新的一块加载进来，这个就是著名的LRU算法
1. LRU算法 LeetCode146题，头条要求手撕，阿里去年也要求手撕
2. Least Recently Used 最不常用
3. 哈希表（保证查找操作O(1)） + 链表（保证排序操作和新增操作 O(1)））
4. 双向链表（保证左边指针指向右边块）
虚拟内存（解决相互打扰问题）
1. DOS Win31 ... 互相干掉
2. 为了保证互不影响 - 让进程工作在虚拟空间，程序中用到的空间地址不再是直接的物理地址，而是虚拟的地址，这样，A进程永远不可能访问到B进程的空间
3. 虚拟空间多大呢？寻址空间 - 64位系统 2 ^ 64，比物理空间大很多，单位是byte
4. 站在虚拟的角度，进程是独享整个系统 + CPU
5. 内存映射：偏移量 + 段的基地址 = 线性地址（虚拟空间）
6. 线性地址通过 OS + MMU（硬件 Memory Management Unit）
缺页中断（不是很重要）：
1. 需要用到页面内存中没有，产生缺页异常（中断），由内核处理并加载

ZGC

算法叫做：Colored Pointer

GC信息记录在指针上，不是记录在头部， immediate memory use

42位指针寻址空间4T JDK13 -> 16T 目前为止最大16T 2^44

CPU如何区分一个立即数和一条指令

总线内部分为：数据总线地址总线控制总线

地址总线目前：48位

颜色指针本质上包含了地址映射的概念

内核同步机制

关于同步理论的一些基本概念

•临界区（critical area）: 访问或操作共享数据的代码段简单理解：synchronized大括号中部分（原子性）

•竞争条件（race conditions）两个线程同时拥有临界区的执行权

•数据不一致：data unconsistency 由竞争条件引起的数据破坏

•同步（synchronization）避免race conditions

•锁：完成同步的手段（门锁，门后是临界区，只允许一个线程存在）上锁解锁必须具备原子性

•原子性（象原子一样不可分割的操作）

•有序性（禁止指令重排）

•可见性（一个线程内的修改，另一个线程可见）

互斥锁排他锁共享锁分段锁

内核同步常用方法

1.原子操作 – 内核中类似于AtomicXXX，位于<linux/types.h>

2.自旋锁 – 内核中通过汇编支持的cas，位于<asm/spinlock.h>

3.读-写自旋 – 类似于ReadWriteLock，可同时读，只能一个写读的时候是共享锁，写的时候是排他锁

4.信号量 – 类似于Semaphore(PV操作 down up操作占有和释放）重量级锁，线程会进入wait，适合长时间持有的锁情况

5.读-写信号量 – downread upread downwrite upwrite （多个写，可以分段写，比较少用）(分段锁）

6.互斥体(mutex) – 特殊的信号量（二值信号量）

7.完成变量 – 特殊的信号量（A发出信号给B，B等待在完成变量上） vfork() 在子进程结束时通过完成变量叫醒父进程类似于(Latch)

8.BKL：大内核锁（早期，现在已经不用）

9.顺序锁（2.6）： – 线程可以挂起的读写自旋锁序列计数器（从0开始，写时增加(+1)，写完释放(+1)，读前发现单数，说明有写线程，等待，读前读后序列一样，说明没有写线程打断）

10.禁止抢占 – preempt_disable()

11.内存屏障 – 见volatile

posted on 2020-07-27 22:42 不停地朝前走阅读(424) 评论(1) 编辑收藏举报

刷新页面返回顶部

Java程序员应该掌握的底层知识

禁止乱序

内核分类

用户态与内核态

进程线程纤程中断

进程调度

中断

从汇编角度理解软中断

搭建汇编环境

内存管理

ZGC

CPU如何区分一个立即数和一条指令

内核同步机制

关于同步理论的一些基本概念

内核同步常用方法

导航

公告

Java程序员应该掌握的底层知识

禁止乱序

内核分类

用户态与内核态

进程 线程 纤程 中断

进程调度

中断

从汇编角度理解软中断

搭建汇编环境

内存管理

ZGC

CPU如何区分一个立即数 和 一条指令

内核同步机制

关于同步理论的一些基本概念

内核同步常用方法

导航

公告

进程线程纤程中断

CPU如何区分一个立即数和一条指令