CSP 初赛要点复习
位运算
逻辑与、按位与之类的东西是不同的!“逻辑”的是判断两个数都不为 \(0\),“按位”的是判断两个数的每一个二进制位与的结果,是不同的。其他运算也类似。
运算符优先级如图所示:
注意,~ 和 ! 是同级的。
加法位运算表示:a+b=(a^b)+((a&b)<<1)
。
与的符号开口向下,和交集的符号 \(∩\) 的方向相同。或的开口向上,和并集的符号 \(∪\) 的方向相同。非是一个横线加一个直角:\(\lnot\)。
逻辑运算符优先级:非、与、或。(没有异或)
编码
原码:第一位符号位,其他位正常表示数字。正数第一位 \(0\),负数第一位为 \(0\),\(0\) 的原码有两种(即第一位为 \(1\) 或 \(0\) 都可以)。比如:\(10\to00001010,-10\to 10001010\)。
反码:正数时就是原码,负数时将其原码的符号位不变,其他位全部取反。\(0\) 的反码有两种,全 \(0\) 和全 \(1\)。比如:\(2\to 00000010,-2 \to 11111101\)。
补码:正数的补码就是其原码,负数的补码等于其反码加 \(1\)。\(0\) 的补码只有 \(1\) 个:全 \(0\)。比如:\(1 \to 00000001,-1 \to 11111111\)。
浮点数编码:阶码和尾数。阶码:小数点的位置,尾数:小数的有效位数。
表示范围:
- 原码、反码:\([-2^{31}+1,2^{31}-1]\),因为 \(0\) 占了两个编码。
- 补码:\([-2^{31},2^{31}-1]\),因为 \(0\) 多的一个编码给了负数。
无符号整型的范围是 \([0,2^{32}-1]\)。
注意:最高位产生进位不一定意味着运算溢出。
进制
十进制转 \(K\) 进制:短除法,记录下每次短除的余数。结果最终要倒过来。
十进制小数部分转 \(K\) 进制小数部分处理方法:每次将小数部分乘 \(K\),记录下每次整数部分是啥,然后再砍掉整数部分继续进行,直到小数部分为 \(0\)。结果最终不用倒过来。如果是循环小数,就算到需要的精度就停下。
\(2^i\) 进制之间可以通过每 \(i\) 位合并一次的方式快速转化。
十六进制 H,十进制 D,八进制 O,二进制 B。
代码中,十六进制 0x...
,十进制 ...
,八进制 0...
,二进制 0b...
。
未知进制的做题技巧,设 \(x\) 进制,然后用 \(k \times x^i\) 表示各位数。
计算机软件系统
自求多福吧。
常用文件扩展名:
- 文本:
.pdf , .doc , .txt , .md , .docx
。 - 图片:
.jpg , .png , .gif
。 - 音频:
.wav , .mp3 , .ogg
。 - 视频:
.avi , .wmv , .mp4
。 - 程序:
.exe
。
注意:Linux 下程序默认没有扩展名!!!
代表性系统软件分类:
- 操作系统,很大程度上决定了计算机系统的性能。
- 语言处理程序
- 数据库管理系统
常用操作系统:
- Windows
- Windows XP
- MacOs
- Linux
- Unix
- NOI Linux
- DOS
- iOS
- Android
- Solaris
操作系统作用:控制和管理系统资源。
P2P:对等网络。
QQ、MSN、微信:即时通信软件。
BIOS:Basic Input Output System,基本输入输出系统。
计算机语言
低级语言:依赖硬件,可读性差,可移植性差。
- 机器语言,用二进制表示的代码。灵活、直接执行、速度快。
- 汇编语言,有简单的字母、单词的代码。应用于底层。
高级语言:可移植性好。
- 面向过程:自顶向下、逐步求精的模块化思想。如 C,Pascal,Fortran,Basic。
- 面向对象:把事物抽象成类,把实例化为对象。如 C++,C#,Java,Python,Javascript。
第一个高级语言:Fortran。
第一个面向对象的语言:Smalltalk。面向对象的设计雏形来自 Simula。
高级语言的翻译过程:
- 编译型语言:直接转化为机器语言,效率高,依赖编译器,跨平台性差。如 C++,C,Pascal。
- 解释型语言:执行一句翻译一句,不需要编译器,效率低,不产生目标文件。如 Python,Javescript,Java,C#。
信息编码
1Byte(字节)=8bit(比特),1Byte=1B,1bit=1b。
1KB(千字节)=1024Byte
1MB(兆字节)=1024KB
1GB(千兆字节)=1024MB
1TB(太字节)=1024GB
1PB(拍字节)=1024TB
如果要区别 Mib 与 Mb 之类的东西,Mib 为 1024 进 1 位,Mb 为 1000 进 1 位。不区别的话默认我们描述的 1Mb 之类的是 1024 进 1 位。
英文字符用 ASCII 码,用 \(7\) 位二进制数表示,共 \(128\) 个元素。多余的最高位取 \(0\)。占 \(1\) 个字节。
汉字用 \(2\) 个字节表示,类别:
- 区位码,我国汉字交换统一标准。有区号、位号。
- 国标码,也叫交换码,等于十六进制的区位码加 2020H。
- 机内码,计算机内部识别汉字的编码,最高位是 \(1\),与 ASCII 区别开了。
字形码:显示汉字时计算机用的字模。是 \(n \times n\) 的点阵。
图像数据数字化过程:
- 采样,扫描线划分成 \(M \times N\) 的格子。
- 量化:把像素值离散化为整数值。离散取值的个数叫做量化级数,表示量化的亮度值所需的二进制位数叫量化字长。量化字长越长,就越能反应图像的原有效果。
- 编码:把离散的像素矩阵编制成二进制编码组。
颜色深度=图片的位数。
一个 \(M \times N\) 像素的 \(D(位)\) 位图片,大小为 \(\frac{M \times N \times D}{8} Byte\)。
如果是视频,假设每秒帧数为 \(S(帧)\),拍了 \(T(s)\) 秒的视频,那么大小就是:\(\frac{M \times N \times D \times S \times T}{8} Byte\)。
声音数据数字化过程:
- 采样:将连续的数字信号,每隔一段时间抽出一个信号,让他成为时间上离散的脉冲序列。
- 量化:将离散的信号幅度用二进制数表示出来。每个采样点能表示的二进制位数叫做采样位数(量化位数),反映了声音的精度。
- 编码:把信号转化为数字编码脉冲。
设音频的采样频率为 \(P(Hz)\),采样位数为 \(D(位)\),声道数为 \(N(个)\),时间为 \(T(s)\)。
那么数据率 \(S=\frac{P\times D \times N}{8}Byte\)。
数据量 \(K=S\times T=\frac{P\times D \times N \times T}{8}Byte\)。
哈夫曼编码:每次选定两个权值最小的 node 合并,这两个 node 指向合并之后的 node,一个 node 边赋 \(0\),另一个赋 \(1\)。最后建出一棵树。哈夫曼编码不唯一,但必须满足以下条件:
- 任何编码都不为其他编码的前缀
- 编码最短
编码最短,是指我们自己建出来的树算出来的各字母编码长度等于他给的长度,就算满足要求。
Unicode 码,也叫万国码,是世界统一的二进制编码方式。UTF-8 最常用。
计算机储存的基本单位是 Byte,最小单位是 bit。