CSP 初赛要点复习

位运算

逻辑与、按位与之类的东西是不同的!“逻辑”的是判断两个数都不为 \(0\),“按位”的是判断两个数的每一个二进制位与的结果,是不同的。其他运算也类似。

运算符优先级如图所示:

image

注意,~ 和 ! 是同级的。

加法位运算表示:a+b=(a^b)+((a&b)<<1)

与的符号开口向下,和交集的符号 \(∩\) 的方向相同。或的开口向上,和并集的符号 \(∪\) 的方向相同。非是一个横线加一个直角:\(\lnot\)

逻辑运算符优先级:非、与、或。(没有异或)

编码

原码:第一位符号位,其他位正常表示数字。正数第一位 \(0\),负数第一位为 \(0\)\(0\) 的原码有两种(即第一位为 \(1\)\(0\) 都可以)。比如:\(10\to00001010,-10\to 10001010\)

反码:正数时就是原码,负数时将其原码的符号位不变,其他位全部取反。\(0\) 的反码有两种,全 \(0\) 和全 \(1\)。比如:\(2\to 00000010,-2 \to 11111101\)

补码:正数的补码就是其原码,负数的补码等于其反码加 \(1\)\(0\) 的补码只有 \(1\) 个:全 \(0\)。比如:\(1 \to 00000001,-1 \to 11111111\)

浮点数编码:阶码和尾数。阶码:小数点的位置,尾数:小数的有效位数。

表示范围:

  • 原码、反码:\([-2^{31}+1,2^{31}-1]\),因为 \(0\) 占了两个编码。
  • 补码:\([-2^{31},2^{31}-1]\),因为 \(0\) 多的一个编码给了负数。

无符号整型的范围是 \([0,2^{32}-1]\)

注意:最高位产生进位不一定意味着运算溢出。

进制

十进制转 \(K\) 进制:短除法,记录下每次短除的余数。结果最终要倒过来。

十进制小数部分转 \(K\) 进制小数部分处理方法:每次将小数部分乘 \(K\),记录下每次整数部分是啥,然后再砍掉整数部分继续进行,直到小数部分为 \(0\)。结果最终不用倒过来。如果是循环小数,就算到需要的精度就停下。

\(2^i\) 进制之间可以通过每 \(i\) 位合并一次的方式快速转化。

十六进制 H,十进制 D,八进制 O,二进制 B。

代码中,十六进制 0x...,十进制 ...,八进制 0...,二进制 0b...

未知进制的做题技巧,设 \(x\) 进制,然后用 \(k \times x^i\) 表示各位数。

计算机软件系统

自求多福吧。

常用文件扩展名:

  • 文本:.pdf , .doc , .txt , .md , .docx
  • 图片:.jpg , .png , .gif
  • 音频:.wav , .mp3 , .ogg
  • 视频:.avi , .wmv , .mp4
  • 程序:.exe

注意:Linux 下程序默认没有扩展名!!!

代表性系统软件分类:

  • 操作系统,很大程度上决定了计算机系统的性能。
  • 语言处理程序
  • 数据库管理系统

常用操作系统:

  • Windows
  • Windows XP
  • MacOs
  • Linux
  • Unix
  • NOI Linux
  • DOS
  • iOS
  • Android
  • Solaris

操作系统作用:控制和管理系统资源。

P2P:对等网络。
QQ、MSN、微信:即时通信软件。
BIOS:Basic Input Output System,基本输入输出系统。

计算机语言

低级语言:依赖硬件,可读性差,可移植性差。

  • 机器语言,用二进制表示的代码。灵活、直接执行、速度快。
  • 汇编语言,有简单的字母、单词的代码。应用于底层。

高级语言:可移植性好。

  • 面向过程:自顶向下、逐步求精的模块化思想。如 C,Pascal,Fortran,Basic。
  • 面向对象:把事物抽象成类,把实例化为对象。如 C++,C#,Java,Python,Javascript。

第一个高级语言:Fortran。
第一个面向对象的语言:Smalltalk。面向对象的设计雏形来自 Simula。

高级语言的翻译过程:

  • 编译型语言:直接转化为机器语言,效率高,依赖编译器,跨平台性差。如 C++,C,Pascal。
  • 解释型语言:执行一句翻译一句,不需要编译器,效率低,不产生目标文件。如 Python,Javescript,Java,C#。

信息编码

1Byte(字节)=8bit(比特),1Byte=1B,1bit=1b。
1KB(千字节)=1024Byte
1MB(兆字节)=1024KB
1GB(千兆字节)=1024MB
1TB(太字节)=1024GB
1PB(拍字节)=1024TB

如果要区别 Mib 与 Mb 之类的东西,Mib 为 1024 进 1 位,Mb 为 1000 进 1 位。不区别的话默认我们描述的 1Mb 之类的是 1024 进 1 位。

英文字符用 ASCII 码,用 \(7\) 位二进制数表示,共 \(128\) 个元素。多余的最高位取 \(0\)。占 \(1\) 个字节。

汉字用 \(2\) 个字节表示,类别:

  • 区位码,我国汉字交换统一标准。有区号、位号。
  • 国标码,也叫交换码,等于十六进制的区位码加 2020H。
  • 机内码,计算机内部识别汉字的编码,最高位是 \(1\),与 ASCII 区别开了。

字形码:显示汉字时计算机用的字模。是 \(n \times n\) 的点阵。

图像数据数字化过程:

  • 采样,扫描线划分成 \(M \times N\) 的格子。
  • 量化:把像素值离散化为整数值。离散取值的个数叫做量化级数,表示量化的亮度值所需的二进制位数叫量化字长。量化字长越长,就越能反应图像的原有效果。
  • 编码:把离散的像素矩阵编制成二进制编码组。

颜色深度=图片的位数。

一个 \(M \times N\) 像素的 \(D(位)\) 位图片,大小为 \(\frac{M \times N \times D}{8} Byte\)

如果是视频,假设每秒帧数为 \(S(帧)\),拍了 \(T(s)\) 秒的视频,那么大小就是:\(\frac{M \times N \times D \times S \times T}{8} Byte\)

声音数据数字化过程:

  • 采样:将连续的数字信号,每隔一段时间抽出一个信号,让他成为时间上离散的脉冲序列。
  • 量化:将离散的信号幅度用二进制数表示出来。每个采样点能表示的二进制位数叫做采样位数(量化位数),反映了声音的精度。
  • 编码:把信号转化为数字编码脉冲。

设音频的采样频率为 \(P(Hz)\),采样位数为 \(D(位)\),声道数为 \(N(个)\),时间为 \(T(s)\)
那么数据率 \(S=\frac{P\times D \times N}{8}Byte\)
数据量 \(K=S\times T=\frac{P\times D \times N \times T}{8}Byte\)

哈夫曼编码:每次选定两个权值最小的 node 合并,这两个 node 指向合并之后的 node,一个 node 边赋 \(0\),另一个赋 \(1\)。最后建出一棵树。哈夫曼编码不唯一,但必须满足以下条件:

  • 任何编码都不为其他编码的前缀
  • 编码最短

编码最短,是指我们自己建出来的树算出来的各字母编码长度等于他给的长度,就算满足要求。

Unicode 码,也叫万国码,是世界统一的二进制编码方式。UTF-8 最常用。

计算机储存的基本单位是 Byte,最小单位是 bit。

posted @ 2024-09-16 15:48  KS_Fszha  阅读(20)  评论(0编辑  收藏  举报