C语言离散化

最近看到STL就不想用, 于是写个C语言离散化, 居然能过主席树板子, 就写个博客介绍一下.

qsort和bsearch都在<stdlib.h>或<cstdlib>里.

什么是离散化

一种映射, 可以把值域从 \([1, Val_{\max}]\) 变成 \([1, N]\) 且保留大小关系, 多用于值域线段树和各种需要从值域考虑的数据结构.

如何离散化

1. 排序

可以用C语言的排序函数void qsort(void *bg, int len, int sz, int *cmp(const void *, const void *)).

先讲一下qsort.

bg为开始地址, 比如数组 \(a\) 从 \(1\) 开始就是 \(a + 1\) .
len为数组长度, 一般用 \(N\) .
sz为元素大小, 直接sizeof(type)简单粗暴, 如sizeof(long long).
cmp为比较函数, 传入两个void*类型的地址需要转换成原类型, 以下称第一个参数强转后访问到的值为\(x\)第二个为 \(y\), \(x < y\) 时返回负数, \(x = y\) 返回 \(0\), \(x > y\) 时返回正数, 比如排序字符串可以直接用strcmp, 排序整数则可以直接返回 \(x - y\).

那么很显然, 排序的代码就写出来了.

int cmp(const void *x, const void *y) // 比较
{return *(int*)(x) - *(int*)(y);}

void lsh() { // 离散化
  // b 是离散化用的辅助数组, 已经在输入时就是 a 的复制了
  // S 是输入的长度
  qsort(b + 1, S, sizeof(int), cmp);
  /*
    有一种逆天的写法, 感兴趣的同学可以探索一下匿名函数, 仅限C++11以上
    qsort(b + 1, S, sizeof(int), [](const void *x, const void *y){return *(int*)(x) - *(int*)(y);});
  */
  // 待续写
}

2. 降重

这里我们使用在原数组直接降重, 类似

if (a[i] ^ a[i - 1]) // 如果 a[i] 不等于 a[i - 1]
  stk[++tp] = a[i] // 在栈顶加入 a[i]

所以很容易写出去重代码.

int cmp(const void *x, const void *y)
{return *(int*)(x) - *(int*)(y);}

void lsh() {
  qsort(b + 1, S, sizeof(int), cmp);
  N = 1; // N 是离散化后的值域大小
  lim (i, 2, S, 1) // for (int i(2); i <= S; i += 1)
    if (b[i] ^ b[i - 1]) // 如果这个元素没有重复
      b[++N] = b[i]; // 放在上一个不重复的后面
  // 待续写
}

二分查找在离散化后的值域中的大小

二分查找可以用C语言的void* bsearch(void *val, void *bg, int len, int sz, int cmp(const void *, const void *)).

bsearch和qsort基本一样, 这里只讲一下不一样的地方.

val是要找的值的地址.
返回的是void*类型的地址, 需要强转再使用.

那么也可以写出最后完成的代码.

int cmp(const void *x, const void *y)
{return *(int*)(x) - *(int*)(y);}

void lsh() {
  qsort(b + 1, S, sizeof(int), cmp);
  N = 1;
  lim (i, 2, S, 1)
    if (b[i] ^ b[i - 1])
      b[++N] = b[i];
  lim (i, 1, S, 1) // 原数组 a 的每个元素的离散化值都要找
    // 二分查找后强转然后减去头地址 (b + 1) 后加 1 避免 0
    // 稍微优化一下 - (b + 1) + 1 就是 - b
    a[i] = (int*)bsearch(a + i, b + 1, N, sizeof(int), cmp) - b;
}

posted @ 2024-12-01 10:15 指针神教教主Defad 阅读(15) 评论(0) 编辑收藏举报

刷新页面返回顶部

指针神教教主Defad的博客站

少年心性岁岁长何必虚掷惊和慌

C语言离散化

C语言离散化

什么是离散化

如何离散化

1. 排序

2. 降重

二分查找在离散化后的值域中的大小

公告

指针神教教主Defad的博客站

少年心性岁岁长 何必虚掷惊和慌

C语言离散化

C语言离散化

什么是离散化

如何离散化

1. 排序

2. 降重

二分查找在离散化后的值域中的大小

公告

少年心性岁岁长何必虚掷惊和慌