bitset 的妙用:乱搞字符串匹配
最近碰到了几次 bitset 乱搞字符串匹配的情况,故写文以记之。
1. 算法简介
核心思想:假设文本串为
用多个模式串
这实际上就是将暴力匹配用 bitset 优化了一下。对于
- 冷知识:bitset 有数值类型的
_Find_first()
和_Find_next(x)
函数(后者如果没有找到下一个位置会返回 bitset 的大小)。这可以非常方便地帮助我们在 的复杂度内找到 bitset 中所有为 的位置。具体使用可以看例题 II。
废话不多说,来两道例题感受一下 bitset 的神奇之处。
2. 例题
I. CF914F Substrings in a String
题意简述:给出文本串
,多次询问 求 在 中出现了多少次。带修。 。
太经典了。
注意到这个带修就很恶心,普通的 SAM 做不起来。接下来有两个选择:
- 巨大多难写的分块 SAM。这里安利一下 我的 SAM 学习笔记。
- 注意到时限竟然有 6s,而数据范围只有
,于是 bitset 暴力硬莽就完事了嗷!!!!11
具体实现方法和上题几乎一模一样,带修直接修改 bitset,查询的时候将
这样我们就用非常简单的方法切掉了一道 *3000 的题目。
#include <bits/stdc++.h>
using namespace std;
const int N=1e5;
const int S=26;
int n,q,len,tp,l,r;
char s[N],t[N],ch;
bitset <N> c[S],ans;
int main(){
scanf("%s%d",s,&q),n=strlen(s);
for(int i=0;i<n;i++)c[s[i]-'a'][i]=1;
while(q--){
scanf("%d%d",&tp,&l),l--;
if(tp==1)scanf("%s",&ch),c[s[l]-'a'][l]=0,c[(s[l]=ch)-'a'][l]=1;
else{
scanf("%d%s",&r,t),len=strlen(t),ans.set();
for(int i=0;i<len;i++)ans&=c[t[i]-'a']<<len-i-1;
cout<<max(0,(int)((ans>>l+len-1).count()-(ans>>r).count()))<<"\n";
}
}
return 0;
}
II. CF963D Frequency of String
题意简述:给出
,多次询问 求出 至少出现了 次的 的子串的最小长度。 。
这里给出一个引理:互不相同的长度之和为
证明:互不相同的长度为
那么可以 SAM + 线段树合并 or ACAM or bitset 求出 endpos 集合,然后直接暴力枚举即可。如果使用 bitset 则要用到上面提到的 _Find_first()
与 _Find_next(x)
函数,时间复杂度为
bitset,永远滴神!!!!!11111
#include <bits/stdc++.h>
using namespace std;
const int N=1e5;
const int S=26;
int n,q,len,k,cnt,p[N];
char s[N],t[N];
bitset <N> c[S],ans;
int main(){
scanf("%s%d",s,&q),n=strlen(s);
for(int i=0;i<n;i++)c[s[i]-'a'][i]=1;
while(q--){
scanf("%d%s",&k,t),ans.set(),len=strlen(t),cnt=0;
for(int i=0;i<len;i++)ans&=c[t[i]-'a']<<len-i-1;
for(int it=ans._Find_first();it!=N;it=ans._Find_next(it))p[++cnt]=it;
int ans=1e9; for(int i=k;i<=cnt;i++)ans=min(ans,p[i]-p[i-k+1]);
cout<<(ans==1e9?-1:ans+len)<<endl;
}
return 0;
}
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术
· .NET周刊【3月第1期 2025-03-02】