空间回归与地理加权_地理加权回归处理点数据

空间回归与地理加权_地理加权回归处理点数据本章有数学公式……对数学过敏者慎入……前文再续,书接上一回……上一次说到,在改进全局回归的基础上,GWR终于横空出世了,从此空间分析领域终于有了自己专用的回归算法。如果说,空间统计有别于经典统计学的两大特征:空间相关性和空间异质性,莫兰指数等可以用来量化空间相关性,那么地理加权回归,就可以用来量化空间异质性。在对全局回归问题的改进中,局部回归可以说是最简单的方法,GWR继续应用了局

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

本章有数学公式……对数学过敏者慎入……

前文再续,书接上一回……上一次说到,在改进全局回归的基础上,GWR终于横空出世了,从此空间分析领域终于有了自己专用的回归算法。如果说,空间统计有别于经典统计学的两大特征:空间相关性和空间异质性,莫兰指数等可以用来量化空间相关性,那么地理加权回归,就可以用来量化空间异质性。

在对全局回归问题的改进中,局部回归可以说是最简单的方法,GWR继续应用了局部回归的思想,但是在局部窗口的模式下,遵循了所谓的“地理学第一定律”,在回归的时候,使用了空间关系作为权重加入到运算中,下面通过一个示例来讲讲GWR的基本思想。

首先看看全局回归和局部回归:
空间回归与地理加权_地理加权回归处理点数据
在局部回归里面,设定一个窗口,然后按照设定的窗口大小,分别在每个局部中进行回归计算,实际上看来,就是一个缩小版的全局回归。

在看看地理加权回归:

空间回归与地理加权_地理加权回归处理点数据



地理加权和其他回归分析一样,首先要划定一个研究区域,当然,通常这个区域也可以包含整个研究数据的全体区域(以此扩展,你可以利用空间关系(比如k-临近),进行局部地理加权计算)……接下去最重要的就是利用每个要素的不同空间位置,去计算衰减函数,这个是一个连续的函数,有了这个衰减函数,当你把每个要素的空间位置(一般是坐标信息(x,y))和要素的值带入到这个函数里面之后,就可以得到一个权重值,这个值就可以带入到回归方程里面去。

 

所以可以看到,最重要的就是这个距离衰减函数,正因为有个这个衰减函数,得出不同权重,这个方法才会被叫做“地理加权回归分析”。这个衰减函数的理论基础,正是Tobler提出所谓的“地理学第一定律(Tobler’s First Law或者Tobler’s First Law of Geography):位置越接近的数据,比远处的数据对结果的影响更大。这个影响在数学上,就化为了权重。

 

利用这些公式,就可以对所有的样本点进行逐点的计算,每个样本点计算的时候,其他的参与计算的样本都会根据与这个样本点不同的空间关系赋予不同的权值,这样最后就可以得出每个不同样本的相关回归系数了。最后通过解读这些个系数,完成整个地理加权回归分析整个分析过程。

 

一直在强调这个衰减函数,那么考虑一下如果没有衰减呢?没有衰减的话,就发现所有的权重都是一样的(权重全部为1,1乘以任何数,都等于其本身)……那这个方程就变成了全局回归方程了。这样脱离了地理学第一定律,就立马变回了经典统计理论。

 

现在看看这个衰减函数如何来计算?

下面先贴公式,有数学恐惧症的同学请略过:

空间回归与地理加权_地理加权回归处理点数据

其中,W(ui,vi)是空间权重矩阵,这个概念请大家回头去看白话空间统计十七……不过鉴于大家难回头翻,我这里直接贴出来以前的内容吧:


权重矩阵,我们看看看这个空间权重矩阵到底是个啥东东:


空间回归与地理加权_地理加权回归处理点数据


左边这个东西,叫做无向图,由边那个,就是所谓的距离矩阵了。因为我们以前说过,在空间分析里面,需要进行空间关系的概念化,所以也通常称为空间权重矩阵。

当然这个权重矩阵为了简单明了,所以用的直接就是用最短距离作了矩阵里面的元素,比如B和C的距离,直接通过矩阵可以查询到WBC = 2 。

有权重矩阵之后,带入到矩阵中,得出如下方程:


空间回归与地理加权_地理加权回归处理点数据

在实际应用中,常见的空间权重函数主要有以下几种:


1、高斯函数:


空间回归与地理加权_地理加权回归处理点数据


其中,b是带宽(窗口大小),dij是样本点i和j的距离(至于是哪种距离,就看选择了(欧式、曼哈顿、闵可夫斯基、球面、余弦等))。

2、双重平方函数(bi-square)


空间回归与地理加权_地理加权回归处理点数据


这两种距离函数都非常倚赖带宽b,那么这个带宽和确定呢?国际上最普遍的方法就是用Cleveland(1979)和Bowman(1984)提出的交叉确认(cross-validation,CV)方法来确定:


空间回归与地理加权_地理加权回归处理点数据

这个方法,利用了拟合值来进行计算,其中

空间回归与地理加权_地理加权回归处理点数据


就是i处的拟合值,(为什么不用观测值?答:观测值还要跟着一个非线性的残差……直接用拟合值,更容易计算),当CV值到达最小的时候,对应的b就是所需要的带宽。由于采用不同的空间加权函数会得到不同的带宽,那么为了取得最优的带宽,Fotheringham等在2002的论文中提出了这样一个准则:当GWR模型的AIC最小的时候,就是最佳带宽。

好吧,这里又蹦出了一个新名词:AIC。。。那么这篇文章就以简介一下这个东东是个啥,来做一个结尾:

Akaike information criterion、简称AIC,是衡量统计模型拟合优良性的一种标准,是由日本统计学家赤池弘次创立和发展的。赤池信息量准则建立在熵的概念基础上,可以权衡所估计模型的复杂度和此模型拟合数据的优良性。(这句话来自百度)


听完之后,反正虾神我的感觉是这样的:


空间回归与地理加权_地理加权回归处理点数据

大家有兴趣自己去研究,最后贴出历史科普信息:

下面这个老爷子就是赤池弘次,日文原版:


空间回归与地理加权_地理加权回归处理点数据

有兴趣的同学,可以去他的纪念站点去看看

http://www.ism.ac.jp/akaikememorial/

本文的公式,摘自北京大学出版社的《空间计量经济学》沈体雁等编著,在虾神共享的书单里面有,有兴趣的同学之间去看。

最后需要共享书单的,还是老规矩,通过公众号获取邮箱,然后发送一封需要啥东西的邮件即可。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/184957.html原文链接:https://javaforall.net

(0)
上一篇 2022年10月7日 下午1:46
下一篇 2022年10月7日 下午1:46


相关推荐

  • 对于三极管饱和状态的理解「建议收藏」

    对于三极管饱和状态的理解「建议收藏」对于三极管饱和状态的理解https://zhidao.baidu.com/question/172715750.html问题来源对于三极管饱和状态的理解三极管如工作在饱和状态也就是开的状态,那么就是双结正偏这是书上的解释我自己的理解是这样的:饱和状态和从放大状态转变过来的,极电结和发射结正偏是结果,而不是原因就是说,三极管首先工作在放大状态,极电结反偏,发射结正偏当基级电流增大时,一直增大到三极管的非线性区(这里指的是饱和区),注意,在这一瞬间偏置情况并未改变,也就是说依然是极电结反偏,

    2025年10月23日
    7
  • Linux磁盘简介「建议收藏」

    Linux磁盘简介「建议收藏」转载请标明出处:http://blog.csdn.net/forezp/article/details/94174577本文出自方志朋的博客个人博客纯净版:https://www.fangzhipeng.com/db/2019/09/10/linux-disc.html本文主要从以下几个方面介绍Linux磁盘:磁盘的接口硬盘的设备名称文件系统RAID独立冗余磁盘阵列磁盘…

    2022年5月28日
    43
  • java map 二维数组_Java二维数组实现简单Map

    java map 二维数组_Java二维数组实现简单Map这些天频繁的在使用二维数组,让我觉得二维数组要比Map更灵活多变,以前和别人提起“数据结构”总能听到有人问:“如果编程语言里没有HashMap,你能自己实现一个Map来用么?”。熟练了二维数组,今天我就来尝试实现一个最简单的Map吧,我没有参考网上的例子,也没去想数据结构书中是怎么讲的,纯粹的自己个一个设计方案,中途遇到很多问题,但还是逐个解决了,还有很多不足之处,希望大家能帮我指点指点,一起交流…

    2022年5月24日
    46
  • 对计算机专业来说学历真的重要吗?

    对计算机专业来说学历真的重要吗?我本科学校是渣渣二本,研究生学校是985,现在毕业五年,校招笔试、面试,社招面试参加了两年了,就我个人的经历来说下这个问题。这篇文章很长,但绝对是精华,相信我,读完以后,你会知道学历不好的解决方案,记得帮我点赞哦。先说结论,无论赞不赞同,它本质就是这样:对于技术类工作而言,学历五年以内非常重要,但有办法弥补。五年以后,不重要。目录:张雪峰讲述的事实 我看到的事实 为什么会这样…

    2022年5月28日
    98
  • linux安装p12,用命令行安装mobileprovision和p12证书

    linux安装p12,用命令行安装mobileprovision和p12证书我这边使用python来编写的,基本达到了最大化程度的解耦,其他人或者其他地方都可以直接使用。先创建installMobileProfile.py#!/usr/bin/python#-*-coding:UTF-8-*-importsysimportcommandsimportosparamsCount=len(sys.argv)if(paramsCount!=5):prin…

    2022年6月22日
    55
  • coze 工作流里的循环怎么使用

    coze 工作流里的循环怎么使用

    2026年3月13日
    11

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号