feiler包(prim算法)

背景Weisfeiler-Lehman算法(威斯费勒-莱曼算法)是测试图同构的经典算法之一,我在这儿记录一下它的实现原理,参考文章为Weisfeiler-LehmanGraphKernels伪代码论文中的伪代码如下所示假设要测试同构的两张图为G和G`,那么在结点v的第i次迭代里,算法都分别做了四步处理:标签复合集定义、复合集排序、标签压缩和重标签。标签复合集定义如果是第一次迭代,v的标签复合集里只有一个元素,就是v的标签。如果不是第一次迭代,v的标签复合集元素就是v的..

大家好,又见面了,我是你们的朋友全栈君。

背景

Weisfeiler-Lehman算法(威斯费勒-莱曼算法)是测试图同构的经典算法之一,我在这儿记录一下它的实现原理,参考文章为Weisfeiler-Lehman Graph Kernels

伪代码

论文中的伪代码如下所示

feiler包(prim算法)

 假设要测试同构的两张图为G和G`,那么在结点v的第i次迭代里,算法都分别做了四步处理:标签复合集定义、复合集排序、标签压缩和重标签。

标签复合集定义

如果是第一次迭代, v的标签复合集里只有一个元素,就是v的标签。

如果不是第一次迭代,v的标签复合集元素就是v的所有邻居在上一轮迭代里,生成的标签。

复合集排序

首先,对复合集里的元素进行升序排序,并把排序好的元素拼接为一个字符串s;然后把v在上一轮迭代生成的标签作为前缀,添加到这个s里。

标签压缩

对两张图G和G`中所有结点的字符串s,进行升序排列;然后通过映射函数f,把每一个s映射成一个压缩标签,并且当且仅当s1 = s2时,生成的压缩标签才一样。

也是说,压缩标签类似于s的标识符,而映射函数f完全可以用计数函数来实现。其实只要能让s和压缩标签一一对应,前面的对s进行升序排列这一步就没必要做了。

重标签

将压缩标签作为结点v在两张图中的第i轮标签。

如果G和G`在这一轮生成的标签集不一样,那么这两张图就不是同构的,算法直接结束。

举例

以下面的图为例,图a到图d显示了威斯费勒-莱曼算法在G和G`上的第一轮迭代过程

feiler包(prim算法)

 

图a是初始形态,结点的标签对应结点类型。

图b则是复合集的生成与排序拼接的结果。对于某个结点v,他的复合集是邻居在上一轮迭代生成的标签集。但是这里的上一轮迭代为初始化,那么邻居在上一轮迭代生成的标签就是邻居的初始标签(也就是结点类型)。因此,以图G为例,两个1号结点的复合集就都是{4},4号结点的复合集就是{1, 1, 3, 5}(要升序排列),其余以此类推。完成之后,把排序好的复合集中的元素,依次拼接成字符串s,然后把结点标签本身,作为前缀拼接到s前面。在G中,对于结点1,生成的s就是”1, 4″;对于结点4,生成的s就是”4, 1135″。最后,用s替代结点v的标签。

图c则是标签压缩过程,把G和G`中所有的复合集按升序排列,并且按顺序依次标号。这里的排序规则是按元素数值的升序进行排列,因此{2, 3}在{1, 4}前面,{2, 4, 5}在{2, 3, 5}前面。由于经过上一轮迭代(初始迭代),图中已经出现了5类结点,那么这里的编号从6开始。

图d则是最后一步重排序,用生成的编号代替每个结点的复合集,得到结点在这一轮迭代中生成的新标签。

对于上面的两张图来说,第1轮生成的新标签集合就已经不一样了,因此他们俩是异构图。
 

时间复杂度

由于每一轮迭代主要处理的是排序,那么假设对于某个图G,每一次迭代可以生成的复合集中有m个元素,根据计数排序,迭代时间复杂度就是O(m)。每一轮生成的复合集的元素数量m是>=结点数n的,因为每个结点的复合集都至少包含自己的标签。

如果迭代次数为h,那么威斯费勒-莱曼算法计算复杂度就是O(hm)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/127546.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 基于Python获取局部点云平面的上位机软件

    基于Python获取局部点云平面的上位机软件

    2020年11月8日
    204
  • Sublime Text3 编译运行java程序

    Sublime Text3 编译运行java程序SublimeText3编译运行java程序一、必须的准备工作1.计算机上成功安装好javaJDK,并且设置好环境变量。2.计算机上安装的有SublimeTtext3。二、配置SublimeTtext31.找到SublimeTtext3的安装目录下的“Packages”文件夹2.在“Packages”文件夹中找到Java.sublime-packag…

    2022年7月27日
    16
  • idea 2021.9 激活码【2021免费激活】

    (idea 2021.9 激活码)本文适用于JetBrains家族所有ide,包括IntelliJidea,phpstorm,webstorm,pycharm,datagrip等。IntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,下面是详细链接哦~https://javaforall.net/100143.html…

    2022年3月26日
    63
  • 自己动手写操作系统在线阅读_如何理解写作是一个整体系统

    自己动手写操作系统在线阅读_如何理解写作是一个整体系统最近开始看《自己动手写操作系统》,虽然很早以前就读过一点点,但一直没有机会动手实践。本着光说不练假把式的原则,今天动手实践了开头的一部分。(说得这么正经其实你就是看了一点点吧!囧)废话不多说,在这里做一个小小的总结。实验环境:操作系统:win7旗舰版64位 汇编编译器:NASM 2.12.02虚拟机:VirtualPC_2007软盘/虚拟软盘写引导扇区工具:Flopp

    2022年8月30日
    4
  • 第一、二、三范式

    第一、二、三范式范式(NormalForm)是范式是符合某一种级别的关系模式的集合。通俗一点就是对数据库中表的属性的约束条件。第一范式1NF第一范式的条件:元组中的每一个分量都必须是不可分割的数据项。反例:应该修改为:第二范式2NF第二范式的条件:在第一范式的基础上,所有的非主属性完全依赖于主键。完全依赖意味着不能依赖于主键的一部分属性。反例:对于该表,学号和课程号组合在一起是主键,但…

    2022年5月12日
    72
  • 线程通信(ITC)

    线程通信(ITC)为什么要通信通信是人的基本需求。而进程作为人的发明,自然脱离不了人的习性,也有通信需求。如果进程之间不进行任何通信,那么进程所能完成的任务就要大打折扣。例如,父进程在创建子进程后,通常须要监督子进程的状态,以便在子进程没有完成给定的任务时,可以再创建一个子进程来继续。这就需要父子进程间通信。而线程间的通信则需要更多。由于一个进程通常包括多个线程,这多个线程之间因资源共享自然地就存在一种合作关系。这种合作关系虽然可以表现为相互独立,但更多地时候是互相交互。这就是通信。就像舞台上的多个演员,他们之间是一种

    2022年6月19日
    54

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号