字符串编码---hash函数的应用 - acrush_fighter

之前就听说过有个叫做hash表的东西，这段时间在上信息论与编码，也接触了一些关于编码的概念，直到今天做百度之星的初赛的d题时，才第一次开始学并用hash

　　一开始我用的是mutimap和mutiset，先对字符串从小到大排序，再存进mutimap中，之后遍历mutimap的键，结果都超时了，代码如下：

#include <cstdio>
#include <cstdlib>
#include <cstring>
#include <cmath>
#include <ctime>
#include <iostream>
#include <algorithm>
#include <string>
#include <vector>
#include <deque>
#include <list>
#include <set>
#include <map>
#include <stack>
#include <queue>
#include <numeric>
#include <iomanip>
#include <bitset>
#include <sstream>
#include <fstream>
using namespace std;
#define rep(i,a,n) for (int i=a;i<n;i++)
#define per(i,a,n) for (int i=n-1;i>=a;i--)
#define in(n) scanf("%d",&(n))
#define in2(x1,x2) scanf("%d%d",&(x1),&(x2))
#define inll(n) scanf("%I64d",&(n))
#define inll2(x1,x2) scanf("%I64d%I64d",&(x1),&(x2))
#define inlld(n) scanf("%lld",&(n))
#define inlld2(x1,x2) scanf("%lld%lld",&(x1),&(x2))
#define inf(n) scanf("%f",&(n))
#define inf2(x1,x2) scanf("%f%f",&(x1),&(x2))
#define inlf(n) scanf("%lf",&(n))
#define inlf2(x1,x2) scanf("%lf%lf",&(x1),&(x2))
#define inc(str) scanf("%c",&(str))
#define ins(str) scanf("%s",(str))
#define out(x) printf("%d\n",(x))
#define out2(x1,x2) printf("%d %d\n",(x1),(x2))
#define outf(x) printf("%f\n",(x))
#define outlf(x) printf("%lf\n",(x))
#define outlf2(x1,x2) printf("%lf %lf\n",(x1),(x2));
#define outll(x) printf("%I64d\n",(x))
#define outlld(x) printf("%lld\n",(x))
#define outc(str) printf("%c\n",(str))
#define pb push_back
#define mp make_pair
#define fi first
#define se second
#define SZ(x) ((int)(x).size())
#define mem(X,Y) memset(X,Y,sizeof(X));
typedef vector<int> vec;
typedef long long ll;
typedef pair<int,int> P;
const int dx[4]={1,0,-1,0},dy[4]={0,1,0,-1};
const int INF=0x3f3f3f3f;
const ll mod=1e9+7;
ll powmod(ll a,ll b) {ll res=1;a%=mod;for(;b;b>>=1){if(b&1)res=res*a%mod;a=a*a%mod;}return res;}
const bool AC=true;

int n,ans;
string str;
/*int main(){
    in(n);
    multimap <string, int> mp;
    rep(i,0,n){
        cin>>str;
        sort(str.begin(),str.end());
        ans=0;
        multimap <string, int>:: iterator it;
        for(it=mp.begin(); it != mp.end(); it++) {
        if(string((*it).first)==string(str)) ans++;
       }
       out(ans);
       mp.insert(pair<string, int>(str,i));
    }
}*/
int main(){
    in(n);
    multiset <string> s;
    rep(i,0,n){
        cin>>str;
        sort(str.begin(),str.end());
        ans=0;
        multiset <string>:: iterator it;
        for(it=s.begin(); it != s.end(); it++) {
        if(*it==str) ans++;
       }
       out(ans);
       s.insert(str);
    }
}

　　　　后来在讨论区看到有一个叫做hash的东西，才开始百度现学hash，找了一个经典的hash函数，交了一发，A了，内心还是有点小激动的，毕竟第一次用，可能是数据比较弱再加上hash函数比较好吧，并没有发生传说中的冲突情况，在没接触过hash之前也想过对字符串进行编码，但发现不好编码，后来就放弃了这种思想，没想到最后还是通过hash函数编码来解决的

#include <cstdio>
#include <cstdlib>
#include <cstring>
#include <cmath>
#include <ctime>
#include <iostream>
#include <algorithm>
#include <string>
#include <vector>
#include <deque>
#include <list>
#include <set>
#include <map>
#include <stack>
#include <queue>
#include <numeric>
#include <iomanip>
#include <bitset>
#include <sstream>
#include <fstream>
using namespace std;
#define rep(i,a,n) for (int i=a;i<n;i++)
#define per(i,a,n) for (int i=n-1;i>=a;i--)
#define in(n) scanf("%d",&(n))
#define in2(x1,x2) scanf("%d%d",&(x1),&(x2))
#define inll(n) scanf("%I64d",&(n))
#define inll2(x1,x2) scanf("%I64d%I64d",&(x1),&(x2))
#define inlld(n) scanf("%lld",&(n))
#define inlld2(x1,x2) scanf("%lld%lld",&(x1),&(x2))
#define inf(n) scanf("%f",&(n))
#define inf2(x1,x2) scanf("%f%f",&(x1),&(x2))
#define inlf(n) scanf("%lf",&(n))
#define inlf2(x1,x2) scanf("%lf%lf",&(x1),&(x2))
#define inc(str) scanf("%c",&(str))
#define ins(str) scanf("%s",(str))
#define out(x) printf("%d\n",(x))
#define out2(x1,x2) printf("%d %d\n",(x1),(x2))
#define outf(x) printf("%f\n",(x))
#define outlf(x) printf("%lf\n",(x))
#define outlf2(x1,x2) printf("%lf %lf\n",(x1),(x2));
#define outll(x) printf("%I64d\n",(x))
#define outlld(x) printf("%lld\n",(x))
#define outc(str) printf("%c\n",(str))
#define pb push_back
#define mp make_pair
#define fi first
#define se second
#define SZ(x) ((int)(x).size())
#define mem(X,Y) memset(X,Y,sizeof(X));
typedef vector<int> vec;
typedef long long ll;
typedef pair<int,int> P;
const int dx[4]={1,0,-1,0},dy[4]={0,1,0,-1};
const int INF=0x3f3f3f3f;
const ll mod=1e9+7;
ll powmod(ll a,ll b) {ll res=1;a%=mod;for(;b;b>>=1){if(b&1)res=res*a%mod;a=a*a%mod;}return res;}
const bool AC=true;

int n,ans,len;
char s[44];
unsigned int hash(char *str) 
{ 
register unsigned int h; 
register unsigned char *p;

for(h=0, p = (unsigned char *)str; *p ; p++) 
h = 31 * h + *p;

return h; 
} 
int main(){
    in(n);
    map <int, int> mp;
    rep(i,0,n){
        getchar();
        scanf("%s",&s);
        len=strlen(s);
        sort(s,s+len);
        out(mp[hash(s)]);
        mp[hash(s)]++;
    }
}

　　　　下面来科普一下hash吧

　　　　Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的信息的函数。

　　　　hash是一种采用空间换时间的思想，通过hash可以转化为O（1）的时间复杂度，常用于在较大的字符串集合中查找是否含有特定字符串。

　　　　上面用的是一种类似times33的经典算法hash[i]=33*hash[i-1]+str[i](本题乘以的是31），除外还有Perl、Berkeley DB 、Apache、MFC、STL 等等。

发表于 2016-05-14 17:04 acrush_fighter 阅读(525) 评论(0) 收藏举报