feiler包(prim算法)

背景Weisfeiler-Lehman算法(威斯费勒-莱曼算法)是测试图同构的经典算法之一,我在这儿记录一下它的实现原理,参考文章为Weisfeiler-LehmanGraphKernels伪代码论文中的伪代码如下所示假设要测试同构的两张图为G和G`,那么在结点v的第i次迭代里,算法都分别做了四步处理:标签复合集定义、复合集排序、标签压缩和重标签。标签复合集定义如果是第一次迭代,v的标签复合集里只有一个元素,就是v的标签。如果不是第一次迭代,v的标签复合集元素就是v的..

大家好,又见面了,我是你们的朋友全栈君。

背景

Weisfeiler-Lehman算法(威斯费勒-莱曼算法)是测试图同构的经典算法之一,我在这儿记录一下它的实现原理,参考文章为Weisfeiler-Lehman Graph Kernels

伪代码

论文中的伪代码如下所示

feiler包(prim算法)

 假设要测试同构的两张图为G和G`,那么在结点v的第i次迭代里,算法都分别做了四步处理:标签复合集定义、复合集排序、标签压缩和重标签。

标签复合集定义

如果是第一次迭代, v的标签复合集里只有一个元素,就是v的标签。

如果不是第一次迭代,v的标签复合集元素就是v的所有邻居在上一轮迭代里,生成的标签。

复合集排序

首先,对复合集里的元素进行升序排序,并把排序好的元素拼接为一个字符串s;然后把v在上一轮迭代生成的标签作为前缀,添加到这个s里。

标签压缩

对两张图G和G`中所有结点的字符串s,进行升序排列;然后通过映射函数f,把每一个s映射成一个压缩标签,并且当且仅当s1 = s2时,生成的压缩标签才一样。

也是说,压缩标签类似于s的标识符,而映射函数f完全可以用计数函数来实现。其实只要能让s和压缩标签一一对应,前面的对s进行升序排列这一步就没必要做了。

重标签

将压缩标签作为结点v在两张图中的第i轮标签。

如果G和G`在这一轮生成的标签集不一样,那么这两张图就不是同构的,算法直接结束。

举例

以下面的图为例,图a到图d显示了威斯费勒-莱曼算法在G和G`上的第一轮迭代过程

feiler包(prim算法)

 

图a是初始形态,结点的标签对应结点类型。

图b则是复合集的生成与排序拼接的结果。对于某个结点v,他的复合集是邻居在上一轮迭代生成的标签集。但是这里的上一轮迭代为初始化,那么邻居在上一轮迭代生成的标签就是邻居的初始标签(也就是结点类型)。因此,以图G为例,两个1号结点的复合集就都是{4},4号结点的复合集就是{1, 1, 3, 5}(要升序排列),其余以此类推。完成之后,把排序好的复合集中的元素,依次拼接成字符串s,然后把结点标签本身,作为前缀拼接到s前面。在G中,对于结点1,生成的s就是”1, 4″;对于结点4,生成的s就是”4, 1135″。最后,用s替代结点v的标签。

图c则是标签压缩过程,把G和G`中所有的复合集按升序排列,并且按顺序依次标号。这里的排序规则是按元素数值的升序进行排列,因此{2, 3}在{1, 4}前面,{2, 4, 5}在{2, 3, 5}前面。由于经过上一轮迭代(初始迭代),图中已经出现了5类结点,那么这里的编号从6开始。

图d则是最后一步重排序,用生成的编号代替每个结点的复合集,得到结点在这一轮迭代中生成的新标签。

对于上面的两张图来说,第1轮生成的新标签集合就已经不一样了,因此他们俩是异构图。
 

时间复杂度

由于每一轮迭代主要处理的是排序,那么假设对于某个图G,每一次迭代可以生成的复合集中有m个元素,根据计数排序,迭代时间复杂度就是O(m)。每一轮生成的复合集的元素数量m是>=结点数n的,因为每个结点的复合集都至少包含自己的标签。

如果迭代次数为h,那么威斯费勒-莱曼算法计算复杂度就是O(hm)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/127546.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 【转载】Win10强制删除文件夹

    【转载】Win10强制删除文件夹目前比较主流的Windows系统中,我们常常会遇到要对文件以及文件夹进行整理的时候,偶尔会遇到这种奇葩的问题:删除一个文件夹的时候吧,这个文件提示需要提供管理权限,问你是否继续。当点击了那个带盾牌的(就是赋予管理权限)的那个Button之后,仍然提示需要权限……简直不讲道理。因为这个东西是偶然出现的,所以这里留几个解决方法备用。1.重启重启能解决99%的问题!!!亘古不变的真理!2.修改权限右键要删除的文件,选择属性——在属性页面可以看到上方有安全权限,点击之后选择一个.

    2022年6月9日
    30
  • Java 中 Boolean 和 boolean的区别

    Java 中 Boolean 和 boolean的区别上次一个同学问 Boolean 类型的值不是只有 true 和 false 两种吗 为什么他定义的属性出现了 null 值 我们应该先明确一点 boolean 是 Java 的基本数据类型 Boolean 是 Java 的一个类 boolean 类型会在 赋零值 阶段给属性赋 false 而 Boolean 是一个类 会在 赋零值 阶段给对象赋 null 如果是静态属性 会在类加载时被赋值 如果是普通类属性 会在实例化对象时赋值 这两点可以了解一下 类加载机制 和 对象创建过程 类加载机制

    2025年6月14日
    0
  • 0xffffffff颜色值是怎么读的「建议收藏」

    0xffffffff颜色值是怎么读的「建议收藏」平常看到的大多数是十六进制的,#f5f5f5。但是在自定义控件的时候,有些地方使用了像0xffffffff,这些设置颜色,在百度给的也不太明确,后来查找发现,原来是在C语言中十六进制数必需以0x开头,以0x开头的数即表明它是一个十六进制的数,真正的数是0x后的值,所以,这种颜色值,0x不用管,接着的两位数ff是表示透明度,再接着的六位数就是平常看的#ffffff了。

    2022年5月17日
    47
  • 关于Postgresql默认端口5432你所不知道的一点

    关于Postgresql默认端口5432你所不知道的一点关于Postgresql端口5432的定义:5432端口,已经在IANA(TheInternetAssignedNumbersAuthority,互联网数字分配机构)注册,并把该端口唯一分配给Postgres。这意味着,一台安装了linuxOS的服务器,哪怕没有安装过postgresql数据库,也会有这个预留端口。查看这个预留端口的方法如下:new@newdb->cat/etc/ser

    2022年6月19日
    30
  • 检测死链的工具[通俗易懂]

    检测死链的工具[通俗易懂]
    XenuLinkSleuth:一种很小很强大的检查网站死链接的工具
    在测试网站的过程中,常常需要检查网站里的所有链接是否正常,如果一个个去点击各个页面来测试,不仅让测试人员感到非常枯燥,也浪费时间。举例来说,如果一个门户网站,首页有100个链接,每个二级页面又有50个链接,那么这样简单一算就是5000次点击,一个测试人员每2秒检查一个页面,要花10000秒,约2.8个小时,还不能100%保证所有的页面都check到位,多少会有点担心:是不是有漏掉的。
    这里借用xenul

    2022年7月23日
    5
  • SQL基础语句大全

    SQL基础语句大全SQL基础语句大全此文章基本涵盖SQL的基础应用语句你好!这是本人在大学自学Java时记录的SQL基础语句,希望可以对自学的小白们给与一定帮助,有错误也欢迎大家可以帮助纠正。数据类型1.整数:int和bigintbigint等效Java中的long2.浮点数:double(m,d)m总长度d小数长度eg:double(5,3)26.789decimal是一个超高…

    2022年5月1日
    40

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号