码题集-AC自动机(模板)

AC自动机:

(1)一个长串,多个短串,求长串中匹配了几个短串(包括分别匹配了几个,总共匹配了几类)

(2)此处模板为长串中匹配了几个短串;

(3)复杂度为O(n);

(4)理论基础

  1. Trie树
  2. KMP
  3. 链表

思路:

(1)问题分析:给定1e6模式长串,多个短串,求其中匹配的各模式串中个数最大者及其个数;

(2)分析:多模式串匹配问题,考虑AC自动机;

(3)过程:

  1. 建立string数组与int数组统计短串及其个数;
  2. 先建立短串与标记的map映射;
  3. 对于多个子串,建立Trie树,并将短串在Trie树中的终点映射到短串标记;
  4. 建立链式关系;
  5. 查询时查到后对该节点对应短串进行计数;
  6. 找到最大出现次数及其节点;

代码:


#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include
using namespace std;
typedef long long ll;
const int maxn =  2*1e6+9;

int trie[maxn][26]; //字典树
int cntword[maxn];  //记录该单词出现次数
int fail[maxn];     //失败时的回溯指针
int cnt = 0;
int n;
string s;
map qq;
map node_i;
int ccnt[50];
string ss[50];

void insertWords(string s)
{
    int root = 0;
    for(int i=0;iq;
    for(int i=0;i<26;i++){      //将第二层所有出现了的字母扔进队列
        if(trie[0][i]){
            fail[trie[0][i]] = 0;
            q.push(trie[0][i]);
        }
    }

//fail[now]    ->当前节点now的失败指针指向的地方
//tire[now][i] -> 下一个字母为i+'a'的节点的下标为tire[now][i]
    while(!q.empty()){
        int now = q.front();
        q.pop();

        for(int i=0;i<26;i++){      //查询26个字母
            if(trie[now][i]){
                //如果有这个子节点为字母i+'a',则
//让这个节点的失败指针指向(((他父亲节点)的失败指针所指向的那个节点)的下一个节点)
                //有点绕,为了方便理解特意加了括号

                fail[trie[now][i]] = trie[fail[now]][i];
                q.push(trie[now][i]);
            }
            else//否则就让当前节点的这个子节点
                //指向当前节点fail指针的这个子节点
                trie[now][i] = trie[fail[now]][i];
        }
    }
}


void query(string s)
{
    int now = 0,ans = 0;
    for(int i=0;i 0)
            {
            	int t = node_i[j];
            	ccnt[t] += 1; 
			}
        }
    }
}

void solve()
{
	cnt = 0;
	memset(trie,0,sizeof trie);
	memset(cntword,0,sizeof cntword);
	memset(fail,0,sizeof fail);
	memset(ccnt,0,sizeof ccnt);
	
	node_i.clear();
	qq.clear();
    for(int i=0;i> s ;
        qq[s] = i;
        ss[i] = s; 
        insertWords(s);
    }
    fail[0] = 0;
    getFail();
    cin >> s ;
    query(s);
    
    int maxn = 0;
    for(int i = 0;i < n;i ++)
    {
    	maxn = max(maxn,ccnt[i]);
	}
	cout << maxn << endl;
	for(int i = 0;i < n;i ++)
	{
		if(ccnt[i] == maxn)
		{
			cout << ss[i] << endl;
		}
	}
 } 

int main() 
{
 	while(cin >> n,n != 0)
	{
		solve();	 	
	}   
    return 0;
}


你可能感兴趣的:(算法,数据结构)