Codeforces Round #166 (Div. 2) D - Good Substrings

题意说的很清楚了,就是要寻找满足某一条件的不同字串个数。

方法一:

寻找不同字串个数体型很直接的一种方法就是把字符串hash值保存在set或者数组中,统计其中不同的个数。

//一个长为n的字符串的字串个数为n*(n+1)/2
#include
#include
#include
#include
#include
#define multiple 1000000007   //这里multiple如果选的太小(31,37,41)效果不如大点(131,1000000003,1000000007)好
using namespace std;
int main(){
    int i,j;
    int n,k;
    char str[2000],str1[50];
    int sum[2000];
    memset(sum,0,sizeof(sum));
    scanf("%s",str);
    scanf("%s",str1);
    scanf("%d",&k);
    for(i=1;i<=strlen(str);i++){
        sum[i]=sum[i-1]+(str1[str[i-1]-'a']=='0');
    }
    long long h[1500*1500];
    int pos=0;
    for(i=1;i<=strlen(str);i++){
        long long tem=0;
        for(j=i;j<=strlen(str);j++){
            if(sum[j]-sum[i-1]>k)break;
            tem=tem*multiple+str[j-1];
            h[pos++]=tem;
        }
    }
    sort(h,h+pos);
    printf("%d\n",unique(h,h+pos)-h);
}


方法二:

如果直接用set存放所有的hash值,再统计大小则会超时,解决办法是,只把长度不同的字符串的hash值放到不同的set中统计则会快很多。

//一个长为n的字符串的字串个数为n*(n+1)/2
//strlen卡了我十倍的时间,一定要预处理
#include
#include
#include
#include
#include
#define multiple 1000000007   //这里multiple如果选的太小(31,37,41)效果不如大点(131,1000000003,1000000007)好
typedef long long ll;
using namespace std;
int main(){
    int i,j;
    int n,k;
    char str[2000],str1[50];
    int sum[2000];
    memset(sum,0,sizeof(sum));
    scanf("%s",str);
    scanf("%s",str1);
    scanf("%d",&k);
    n=strlen(str);
    for(i=1;i<=n;i++){
        sum[i]=sum[i-1]+(str1[str[i-1]-'a']=='0');
    }
    int ans=0;
    //ll s[2000];
    //int pos=0;
    sets;
    ll head=0,tem=0,last=1;
    for(i=1;i<=n;i++){
        s.clear();
        //pos=0;
        head=head*multiple+str[i-1];
        if(sum[i]-sum[0]<=k){
            s.insert(head);
            //s[pos++]=head;
        }
        tem=head;
        for(j=2;j+i-1<=n;j++){
            tem=(tem-str[j-2]*last)*multiple+str[j+i-2];
            if(sum[i+j-1]-sum[j-1]>k)continue;
            s.insert(tem);
            //s[pos++]=tem;
        }
        //sort(s,s+pos);
        //ans+=unique(s,s+pos)-s;
        ans+=s.size();
        last*=multiple;
    }
    printf("%d\n",ans);
}

方法三:用trie图统计字串

#include
#include
#include
#define MAXN 2000
#define ALP 26
typedef long long ll;
using namespace std;
int n,k;
char s[2000];
int next[MAXN*MAXN][ALP],pos;
int sum[2000];
int ans;
int newnode(){
    for(int i=0;ik)break;
        int k=s[i]-'a',&x=next[p][k];
        if(x==0){
            x=newnode();
            p=x;
            ans++;
        }
        else
            p=x;
    }
}
int main(){
    int i,j;
    char str[50];
    pos=0,newnode();
    memset(sum,0,sizeof(sum));
    scanf("%s",s);
    scanf("%s",str);
    scanf("%d",&k);
    n=strlen(s);
    for(i=1;i<=n;i++){
        sum[i]=sum[i-1]+(str[s[i-1]-'a']=='0');
    }
    ans=0;
    for(int i=0;i



方法四:用后缀数组统计子串

#include
#include
#include
using namespace std;
#define MAXN 2010
char r[MAXN];
int sa[MAXN];
int wa[MAXN],wb[MAXN],wv[MAXN],ws[MAXN];
int height[MAXN],rank[MAXN];
int sum[2000],k;
inline bool cmp(int *r,int a,int b,int len){
    return r[a]==r[b]&&r[a+len]==r[b+len];
}
void SA(int n,int m){
    int i,j,p,*x=wa,*y=wb,*t;
    for(i=0;i=0;i--)
        sa[--ws[x[i]]]=i;
    for(j=p=1;p=j)
                y[p++]=sa[i]-j;
        }
        for(i=0;i=0;i--)
            sa[--ws[wv[i]]]=y[i];
        for(t=x,x=y,y=t,x[sa[0]]=0,p=i=1;ik)break;
            ans++;
        }
    }
    printf("%d\n",ans);
}
int main(){
    int i,j,n;
    char str[50];
    memset(sum,0,sizeof(sum));
    scanf("%s",r);
    scanf("%s",str);
    scanf("%d",&k);
    n=strlen(r);
    for(i=1;i<=n;i++){
        sum[i]=sum[i-1]+(str[r[i-1]-'a']=='0');
    }
    memset(height,0,sizeof(height));
    SA(n+1,130);
    Height(n);
    solve(n);
}



你可能感兴趣的:(codeforces,Rabin,Karp)