我成了五个大佬的祖宗_我家可能有位大佬

我成了五个大佬的祖宗_我家可能有位大佬Lumpy_Trie 详解 —— 由Ciyang大佬发明(不一定是首次)

大家好,又见面了,我是你们的朋友全栈君。


原题解地址及本文目的

https://ciyang.blog.luogu.org/solution-p2580

本文目的:留作日后自用,翻译一下大佬清奇的码风。


正文

Lumpy_Trie是边压缩的Trie, 可以省空间, 各Node存的是字符串。

现在来翻译(解释及简化(我是懒癌))一下Ciyang的源码。(源码及原注释在Ciyang神犇的题解里, 这里的注释是我自己加的, 这里的码是我抄的, 不保证完全一致)

先翻译节点定义

//这是Ciyang的define #define clear(a) memset(a, 0, sizeof a) #define copy(a, b) memcpy(a, b, sizeof a) //这是Ciyang的节点定义 char allstr[10001][51];//这是Ciyang的腐竹内存 char tmp[51];//这是本文中不会用到的东西 struct Lumpy_Tnode { const char *pStr;//指针,指向辅助内存中的地址,即各Node保存的字符串都是存在腐竹内存中的 int length, isEnd;//length就是本节点中存的字符串的长度,即pStr后多少位, isEnd就和Trie的“终结标记”一样(isEnd的定义浅显易懂 Lumpy_Tnode *children[26];//这是子节点,像Trie一样, 存储后继节点的地址 inline Lumpy_Tnode() { pStr = 0, length = isEnd = 0, clear(children);//这段构造函数是用在根节点上的 } inline Lumpy_Tnode(const char *str, int len, int end) { pStr = str, length = len, isEnd = end, clear(children);//这段构造函数是用在除根节点之外的节点上的 } } mNode;//这个我想是 main Node, 即 root Node 

接下来翻译insert函数

//这个函数在主程序里这样调用 insert(要插入的串, 要插入的串的长度, mNode(root)); inline void insert(const char *str, int length, Lumpy_Tnode *bNode) { //bNode是当前节点, 和Trie完全一样, str就是指针啦 if(!length) { bNode->isEnd = 1; return; } //建议先看后面的翻译 int ch = str[0] - 'a';//这个就是懒癌的象征了, 当然确实快 if(bNode->children[ch]) { //已经存在以 str[0] 为首字母的后继子串,请看下面翻译 bNode = bNode->children[ch];//转移焦点,开始协调 register int sptr = 0;//指针 while(sptr < length && sptr < bNode->length//循环来找当前字符串和节点存储的字符串最长前缀(Ciyang的注释 && bNode->pStr[sptr] == str[sptr] ) ++sptr; if(sptr != bNode->length) { //当节点存储的字符串不是插入字符的子串时……(由上面那个while的结束条件表明 //于是就要将最大公共前缀变成此节点, 两个后缀都变成子节点 Lumpy_Tnode *nNode = new Lumpy_Tnode(bNode->pStr + sptr, bNode->length - sptr, bNode->isEnd); //上一行那句就是讲此节点的后缀拆一出来作为子节点,此时原节点的子节点信息应被继承 copy(nNode->children, bNode->children); // 这就是继承了, 为什么继承大家都清楚 bNode->isEnd = 0, bNode->children[bNode -> pStr[sptr] - 'a'] = nNode; //此时新节点要接到父节点上 } //以下应该是代码的简化, 如果想看的清楚明白一点就把以下代码加个完全复制到上面那个if里; bNode->length = sptr; insert(str+sptr, length - sptr, bNode); //将去掉与原bNode公共前缀的str插入 } else//并不存在以 str[0] 为首字母的后继子串(第一次的象征 bNode->children[ch] = new Lumpy_Tnode(str, length, 1); //于是就要新建节点, 并把整个串当数据 return; }

以下翻译find函数(简单多了

inline int find(const char *str, int length, Lumpy_Tnode *bNode) { if(!length) { if(bNode->isEnd == 1) return bNode->isEnd++;//这句带有题目的局限性,用时应怎么写大家都清楚 return bNode->isEnd; } int ch = str[0] - 'a'; if(bNode->children[ch]) { bNode= bNode->children[ch]; if(length < bNode->length) return 0; //自带剪枝,若当前查找字符串长度小于当前公共前缀,那么字典树中不存在当前查找的字符串(Ciyang的注释 //好吧, 我的解释:当前查找的字符串若存在(被插入过), 那么公共前缀一定比当前串长短或等长 register int sptr = 0; while(sptr < bNode->length && bNode->pStr[sptr] == str[sptr]) ++sptr; if(sptr != bNode->length) return 0; //最长公共前缀必须是当前查找的字符串的子串(Ciyang的注释) // 即……好吧看while条件吧,写不下去了 return find(str+sptr, length-sptr, bNode); //无需解释(写不下去了啊啊啊 } //这里可以加个else,更浅显 return 0; } 

以下是以我的码风(受Ciyang影响极深, 并认为Ciyang马蜂简洁的我的马蜂)抄写的Ciyang代码(luogu P2580

#include<bits/stdc++.h> using namespace std; #define clear(a) memset(a, 0, sizeof a) #define copy(a, b) memcpy(a, b, sizeof a) struct node{ const char *Sp; int len, isEnd; node *ch[26]; node() { Sp = 0, len = isEnd = 0, clear(ch); } node(const char *str, int length, int end) { Sp = str, len = length, isEnd = end, clear(ch); } } root; char AllStr[10001][60], s[60]; void insert(const char *str, int length, node* u) { if(!length) { u->isEnd = 1; return; } int v = str[0] - 'a'; if(u->ch[v]) { u = u->ch[v]; register int sptr = 0; while(sptr < u->len && sptr < length && str[sptr] == u->Sp[sptr]) ++sptr; if(sptr != u->len) { node *nNode = new node(u->Sp + sptr, u->len - sptr, u->isEnd); copy(nNode->ch, u->ch), clear(u->ch); u->isEnd = 0, u->ch[u->Sp[sptr] - 'a'] = nNode; } u->len = sptr; insert(str+sptr, length - sptr, u); } else u->ch[v] = new node(str, length, 1); return; } int find(const char *str, int length, node* u) { if(!length) { if(u->isEnd == 1) return u->isEnd++; return u->isEnd; } int v = str[0] - 'a'; if(u->ch[v]) { u = u->ch[v]; if(length < u->len) return 0; register int sptr = 0; while(sptr < u->len && str[sptr] == u->Sp[sptr]) ++sptr; if(sptr != u->len) return 0; return find(str + sptr, length - sptr, u); } return 0; } int main() { int n, m; scanf("%d", &n); for(int i = 1; i <= n; ++i) { scanf("%s", AllStr[i]); insert(AllStr[i], strlen(AllStr[i]), &root); } scanf("%d", &m); for(int i = 1; i <= m; ++i) { scanf("%s", s); switch(find(s, strlen(s), &root)) { case 0: cout << "WRONG\n";break; case 1: cout << "OK\n";break; case 2: cout << "REPEAT\n";break; } } return 0; }

转载于:https://www.cnblogs.com/tztqwq/p/11088418.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/106753.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • MAC安装Ruby Rails brew gem

    MAC安装Ruby Rails brew gem

    2021年5月11日
    106
  • Java的常用输入输出语句

    Java的常用输入输出语句一、概述  输入输出可以说是计算机的基本功能。作为一种语言体系,java中主要按照流(stream)的模式来实现。其中数据的流向是按照计算机的方向确定的,流入计算机的数据流叫做输入流(inputStream),由计算机发出的数据流叫做输出流(outputStream)。Java语言体系中,对数据流的主要操作都封装在java.io包中,通过java.io包中的类可以实现计算机对数据的输入、输出操作…

    2022年5月26日
    39
  • 数仓建设 | ODS、DWD、DWM等理论实战(好文收藏)

    数仓建设 | ODS、DWD、DWM等理论实战(好文收藏)本文目录:一、数据流向二、应用示例三、何为数仓DW四、为何要分层五、数据分层六、数据集市七、问题总结导读数仓在建设过程中,对数据的组织管理上,不仅要根据业务进行纵向的主题域划分,还需要横向的数仓分层规范。本文作者围绕企业数仓分层展开分析,希望对你有帮助。因文章太长,本文不是完结版,文末可获取完整PDF版从事数仓相关工作的人员都知道数仓模型设计的首要工作之一就是进行模型分层,可见模型分层在模型设计过程中的重要性,确实优秀的分层设计是一个数仓项目能否建设成功的核心要素,让数

    2022年6月26日
    74
  • openwrt旁路由的设置「建议收藏」

    openwrt旁路由的设置「建议收藏」1:旁路由必须和主路由在同一网段2:旁路由的网关必须指向主路由3:防火墙开启IP动态伪装

    2022年6月6日
    323
  • Matlab fitrsvm自带支持向量回归[通俗易懂]

    Matlab fitrsvm自带支持向量回归[通俗易懂]简介fitrsvm在中低维预测变量数据集上训练或交叉验证支持向量机(SVM)回归模型。fitrsvm支持使用内核函数映射预测变量数据,并支持通过二次编程实现目标函数最小化。要在高维数据集(即包含许多预测变量的数据集)上训练线性SVM回归模型,请改用fitrlinear。用法Mdl=fitrsvm(Tbl,ResponseVarName)返回使用表Tbl中的自变量值和表中对应变量名…

    2022年5月26日
    39
  • Git的下载安装 (图文教程)

    Git的下载安装 (图文教程)git的下载安装目录git的下载git的安装步骤git的下载如果你还没有下载Git,可直接到git官网进行下载。如图直接按下Downloads选项这是页面会跳转到相应的页面按下Windows或DownloadforWindows选项,页面会自动跳转下载页面,当然其它系统类型根据需要下载相应的版本即可。下载完成双击运行点击运行…

    2022年5月27日
    75

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号