bzoj 5496 字符串问题

$SAM$ 优化连边 + $DAG$ 上 $dp$ .

  • 首先可以搞一个 $n_a+n_b$ 个节点的图.如果一个 $A$ 串支配了一个 $B$ 串,就从这个 $A$ 串对应的点向 $B$ 串对应的点连一条有向边.如果一个 $B$ 串是一个 $A$ 串的前缀,就从这个 $B$ 串对应的点向 $A$ 串对应的点连一条有向边.
  • 然后判环,如果没有环就在 $DAG$ 上 $dp$ 找最长路径.节点数目为 $O(n_a+n_b)$ ,可以接受.
  • 但是暴力连边的时间复杂度高达 $O(n_an_b)$ ,于是获得 $40$ 分好成绩.
  • 考虑利用 $SAM$ 的 $parent$ 树自带的树形结构来优化连边.
  • 第一类边,对于一个 $A$ 串,我们可以在 $SAM$ 上倍增找到它对应的节点,然后对于每个它支配的 $B$ 串也用倍增找到节点,从 $A$ 串节点向 $B$ 串节点连一条有向边.
  • 第二类边,要求 $B$ 串是 $A$ 串前缀.我们如果把主串反过来,就变成了 $B$ 串是 $A$ 串的后缀.在 $parent$ 树上显然表现为 $B$ 对应的节点是 $A$ 对应的节点的祖先.那么建 $parent$ 树时就从父亲到儿子连有向边,边自动就连好了.
  • 这样连边的时间复杂度为 $O(|S|log|S|)$ ,节点数目为 $O(|S|)$ ,均可以接受.
  • 但还存在一个问题. $parent$ 树上一个节点对应的子串不止一个.可能出现两个 $A$ 串都被定位到一个节点上.于是每次 $A$ 串定位到一个位置时就新建一个节点栽上去.新建 $n_a​$ 个节点,不会爆炸.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
#include<bits/stdc++.h>
using namespace std;
#define ll long long
inline ll read()
{
ll out=0,fh=1;
char jp=getchar();
while ((jp>'9'||jp<'0')&&jp!='-')
jp=getchar();
if (jp=='-')
fh=-1,jp=getchar();
while (jp>='0'&&jp<='9')
out=out*10+jp-'0',jp=getchar();
return out*fh;
}
typedef pair<int,int> pii;
const int Siz=26,MAXN=1e6+10;
int lst,idx,tmp;
int n,m,K;
int siz[MAXN],pos[MAXN];
int ch[MAXN][Siz],fa[MAXN];
int len[MAXN];
void Extend(int c,int id)
{
int p=lst,np=++idx;
lst=np;
pos[id]=np;
siz[np]=1;
len[np]=len[p]+1;
while(p && ch[p][c]==0)
ch[p][c]=np,p=fa[p];
if(p==0)
fa[np]=1;
else
{
int q=ch[p][c];
if(len[q]==len[p]+1)
fa[np]=q;
else
{
int nq=++idx;
len[nq]=len[p]+1;
fa[nq]=fa[q];
fa[q]=fa[np]=nq;
memcpy(ch[nq],ch[q],sizeof ch[q]);
while(p && ch[p][c]==q)
ch[p][c]=nq,p=fa[p];
}
}
}
int L;
int Lg[MAXN];
int ecnt=0,head[MAXN],to[MAXN],nx[MAXN],eval[MAXN],indeg[MAXN];
ll dp[MAXN];
int val[MAXN],dep[MAXN],g[MAXN];
vector<pii> d[MAXN];
vector<int> v[MAXN];
set<pii> s;
int l[MAXN],r[MAXN],p[MAXN];
int A[MAXN],t[MAXN];
void topsort()
{
for(int i=1;i<=idx;++i)
t[len[i]]++;
for(int i=1;i<=L;++i)
t[i]+=t[i-1];
for(int i=idx;i>=1;--i)
A[t[len[i]]--]=i;
for(int i=1;i<=idx;++i)
{
int u=A[i];
dep[u]=dep[fa[u]]+1;
v[fa[u]].push_back(u);
}
for(int i=1;i<=L;++i)
t[i]=0;
}
inline void addedge(int u,int v,int w)
{
++ecnt;
to[ecnt]=v;
nx[ecnt]=head[u];
++indeg[v];
eval[ecnt]=w;
head[u]=ecnt;
}
const int Logn=20;
int f[MAXN][Logn];
int jump(int u,int l)
{
for(int i=Lg[dep[u]];i>=0;--i)
if(len[f[u][i]]>=l)
u=f[u][i];
pii t=make_pair(u,l);
if(s.find(t)==s.end())
{
g[u]++;
s.insert(t);
}
return u;
}
void dfs(int u,int Fa)
{
if(Fa)
addedge(Fa,u,0);
int h=0;
sort(d[u].begin(),d[u].end());
if(d[u].size())
{
p[d[u][0].second]=u;
for(int i=1;i<d[u].size();++i)
{
if(d[u][i].first!=d[u][i-1].first)
{
h=i;
break;
}
p[d[u][i].second]=u;
}
}
int pre=u;
while(g[u]>1)
{
++idx;
--g[u];
p[d[u][h].second]=idx;
for(int i=h+1;i<d[u].size();++i)
{
if(d[u][i].first!=d[u][i-1].first)
{
h=i;
break;
}
p[d[u][i].second]=idx;
}
addedge(pre,idx,0);
pre=idx;
}
for(int i=0;i<v[u].size();++i)
dfs(v[u][i],pre);
}
char buf[MAXN];
void init()
{
s.clear();
ecnt=0;
for(int i=1;i<=idx;++i)
{
dep[i]=0;
head[i]=0;
indeg[i]=0;
dp[i]=0;
val[i]=0;
}
for(int i=1;i<=tmp;++i)
{
v[i].clear();
d[i].clear();
memset(ch[i],0,sizeof ch[i]);
fa[i]=0;
g[i]=0;
}
lst=idx=1;
}
int q[MAXN];
void solve()
{
scanf("%s",buf+1);
L=strlen(buf+1);
for(int i=L;i>=1;--i)
Extend(buf[i]-'a',i);
topsort();
for(int i=2;i<=idx;++i)
f[i][0]=fa[i];
for(int j=1;j<=Lg[L];++j)
for(int i=2;i<=idx;++i)
f[i][j]=f[f[i][j-1]][j-1];
n=read();
for(int i=1;i<=n;++i)
{
l[i]=read();
r[i]=read();
p[i]=jump(pos[l[i]],r[i]-l[i]+1);
}
m=read();
for(int i=n+1;i<=n+m;++i)
{
l[i]=read();
r[i]=read();
p[i]=jump(pos[l[i]],r[i]-l[i]+1);
}
for(int i=1;i<=n+m;++i)
d[p[i]].push_back(make_pair(r[i]-l[i]+1,i));
tmp=idx;
dfs(1,0);
for(int i=1;i<=n;++i)
val[p[i]]=r[i]-l[i]+1;
K=read();
for(int i=1;i<=K;++i)
{
int x=read(),y=read();
addedge(p[x],p[y+n],r[x]-l[x]+1);
}
int tot=0;
ll ans=0;
q[++tot]=1;
for(int i=1;i<=tot;++i)
{
int U=q[i];
ans=max(ans,dp[U]+val[U]);
for(int j=head[U];j;j=nx[j])
{
int V=to[j];
indeg[V]--;
dp[V]=max(dp[V],dp[U]+eval[j]);
if(!indeg[V])
q[++tot]=V;
}
}
if(tot<idx)
puts("-1");
else
printf("%lld\n",ans);
}
int main()
{
for(int i=2;i<MAXN;++i)
Lg[i]=Lg[i>>1]+1;
int T=read();
while(T--)
{
init();
solve();
}
return 0;
}