后缀自动机学习

下载本文档

阅读 74
下载 24
格式 pdf
大小 1.06 MB
约9页
2025-02-10 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/9页

2/9页

3/9页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

文本预览下载提示常见问题

后缀自动机实质上是字母树,记录的字符串是某个字符串s 的所有后缀.这里以字符串ACADD为例: 这样很浪费空间和时间(实际上都是O(n^2)).但是,注意:这棵字母树的结点虽然多,但大部分结点都只有一个儿子,而且有很多段是一样的.那么,利用公共部分,就可以对空间进行压缩,具体地说,就是把自己连到儿子的边删掉(并把该儿子及其后代删掉),再把这条边连到别的子树,这样就能充分利用公共部分,节省空间.但是,如何保证这样做和原来的笨做法是等价的,又如何把时间复杂度和空间复杂度降到 O(n)?这是个问题.幸运的是,后缀自动机出现了. 后缀自动机是这样的:在后缀自动机中,为了节省空间,某个点有可能成为多个结点的儿子,可以保证在后缀自动机中遍历出来的所有字符串不会重复,而且刚好是原串s 的所有子串. 先讲讲后缀自动机的大致做法:假设当前已经建好了 s 的某个前缀的后缀自动机t,那么就要通过某种算法,添加一个字符x,得到 s 另一前缀tx 的后缀自动机,这样每次插入一个字符,最后把 s 的所有字符按顺序插入完毕就得到了 s 的后缀自动机. 这样的话,建造后缀自动机的过程是在线的,就是说,可以任意时刻询问 s 的某些信息,也可以任意时刻在 s 的结尾插入一些字符,变成新的字符串.不过,删除是不支持的. 在后缀自动机中,每个结点储存的信息有: son[26]:返回该结点对应的子串加上某个字符后生成的合法子串在后缀自动机中所对应的位置(其实就和字母树一样),如果该指针不存在,就说明这样的子串是不存在的(即不是s 的子串) pre:注意这不是返回它的父结点(因为某个点有可能成为多个结点的儿子),而是返回上一个可以接收后缀的结点(如果当前结点可以接收新的后缀,那么 pre 指向的结点也一定可以接收后缀). step:返回的是从根结点走到该结点,最多需要多少步. 为了方便下面的叙述,这里先提出三个后缀自动机的性质: ①从 root 到任意结点 p 的每条路径上的字符组成的字符串,都是当前串 t 的子串. ②因为满足性质一,所以如果当前结点 p 是可以接收新后缀的结点,那么从 root 到任意结点 p的每条路径上的字符组成的字符串,都是必定是当前串 t 的后缀. ③如果结点 p 可以接收新的后缀,那么 p 的 pre 指向的结点也可以接收后缀,反过来就不行. 下面的叙述中,将直接应用这两个性质. 当前建立的后缀自动机是对应字符串 t 的,现在要插入字符 x,把 t 的后缀自动机变成 tx 的后缀自动机. 首先建立储存当前字符 x 的结点 np,找...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

后缀自动机学习

后缀自动机实质上是字母树,记录的字符串是某个字符串s 的所有后缀

这里以字符串ACADD为例: 这样很浪费空间和时间(实际上都是O(n^2))

但是,注意:这棵字母树的结点虽然多,但大部分结点都只有一个儿子,而且有很多段是一样的

那么,利用公共部分,就可以对空间进行压缩,具体地说,就是把自己连到儿子的边删掉(并把该儿子及其后代删掉),再把这条边连到别的子树,这样就能充分利用公共部分,节省空间

但是,如何保证这样做和原来的笨做法是等价的,又如何把时间复杂度和空间复杂度降到 O(n)

幸运的是,后缀自动机出现了

后缀自动机是这样的:在后缀自动机中,为了节省空间,某个点有可能成为多个结点的儿子,可以保证在后缀自动机中遍历出来的所有字符串不会重复,而且刚好是原串s 的所有子串

先讲讲后缀自动机的大致做法:假设当前已经建好了 s 的某个前缀的后缀自动机t,那么就要通过某种算法,添加一个字符x,得到 s 另一前缀tx 的后缀自动机,这样每次插入一个字符,最后把 s 的所有字符按顺序插入完毕就得到了 s 的后缀自动机

这样的话,建造后缀自动机的过程是在线的,就是说,可以任意时刻询问 s 的某些信息,也可以任意时刻在 s 的结尾插入一些字符,变成新的字符串

不过,删除是不支持的

在后缀自动机中,每个结点储存的信息有: son[26]:返回该结点对应的子串加上某个字符后生成的合法子串在后缀自动机中所对应的位置(其实就和字母树一样),如果该指针不存在,就说明这样的子串是不存在的(即不是s 的子串) pre:注意这不是返回它的父结点(因为某个点有可能成为多个结点的儿子),而是返回上一个可以接收后缀的结点(如果当前结点可以接收新的后缀,那么 pre 指向的结点也一定可以接收后缀)

step:返回的是从根结点走到该结点,最多需要多少步

为了方便下面的叙述,这里先提出三个后缀自

小辰3 + 关注: 实名认证
内容提供者

出售各种资料和文档

收藏店铺进入空间

后缀自动机学习

后缀自动机学习

您可能关注的文档

相关文档

热门下载

相关标签