Python之深入解析一行代码计算每个省面积的神器Geopandas

Python之深入解析一行代码计算每个省面积的神器Geopandas一 前言 GeoPandas 是一个基于 pandas 针对地理数据做了特别支持的第三方模块 它继承 pandas Series 和 pandas Dataframe 实现了 GeoSeries 和 GeoDataFrame 类 使得其操纵和分析平面几何对象非常方便 二 准备 Python 安装在 windows 上安装 Python 下载 Python 的最新版本 访问链接 Python 官网 在 Windows 操作系统上安装 Python3 10 0 大家也可以自行选择最新版

一、前言

  • GeoPandas 是一个基于 pandas,针对地理数据做了特别支持的第三方模块。
  • 它继承 pandas.Series 和 pandas.Dataframe,实现了 GeoSeries 和 GeoDataFrame 类,使得其操纵和分析平面几何对象非常方便。

在这里插入图片描述

二、准备

① Python 安装

  • 在 windows 上安装 Python:
    • 下载 Python 的最新版本:访问链接 Python 官网,在 Windows 操作系统上安装 Python 3.10.0,大家也可以自行选择最新版的下载。

在这里插入图片描述

    • 进入下一个页面后,拉到最下面,选择 Windows embeddable package (64-bit) 下载:

在这里插入图片描述

    • 双击下载完成的应用程序,记得一定要勾选 ADD Python 3.7 to PATH,否则 cmd 无法运行 Python,然后选择 Install Now 进行安装,默认会安装 pip,而且将安装到 C 盘(推荐)。如果希望换一个盘安装,可以点击 Customize installation 在里面选择其他的盘。
  • 在 macOS 上安装 Python:
    • 其实 macOS 上是默认安装了 Python 的,只不过版本是 Python2.7,其相对于现在的 Python 3 缺少了很多特性,而且速度也比 Python 3 慢,因此还是建议大家装 Python 3。
    • 同样地,下载 Python 的最新版本,访问链接:Python 官网,在 macOS 操作系统上安装 Python 3.7.4,大家也可以自行选择最新版的下载。

在这里插入图片描述

    • 进入下一个页面后,拉到最下面,选择 macOS 64-bit universal2 installer 下载:

在这里插入图片描述

    • 下载完成后得到一个 pkg 文件,双击打开,按照指示步骤进行安装即可。

② 安装依赖

  • 请选择以下任一种方式输入命令安装依赖:
    • Windows 环境打开 Cmd (开始 – 运行 – CMD);
    • MacOS 环境打开 Terminal (command + 空格输入 Terminal);
    • 如果使用的是 VSCode 编辑器或 Pycharm,可以直接使用界面下方的 Terminal。
pip install rich 
  • 由于 geopandas 涉及到许多第三方依赖,pip 安装起来非常麻烦,因此这里推荐使用 conda 安装 geopandas,一行语句即可完成安装:
conda install geopandas 

三、基本使用

  • 设定坐标绘制简单的图形:
import geopandas from shapely.geometry import Polygon p1 = Polygon([(0, 0), (1, 0), (1, 1)]) p2 = Polygon([(0, 0), (1, 0), (1, 1), (0, 1)]) p3 = Polygon([(2, 0), (3, 0), (3, 1), (2, 1)]) g = geopandas.GeoSeries([p1, p2, p3]) # g: # result: # 0 POLYGON ((0 0, 1 0, 1 1, 0 0)) # 1 POLYGON ((0 0, 1 0, 1 1, 0 1, 0 0)) # 2 POLYGON ((2 0, 3 0, 3 1, 2 1, 2 0)) # dtype: geometry 
  • 这些变量所形成的图形如下:

在这里插入图片描述

  • 这里有一个重要且强大的用法,通过 area 属性,geopandas 能直接返回这些图形的面积:
>>> print(g.area) 0 0.5 1 1.0 2 1.0 dtype: float64 
  • 不仅如此,通过 plot 属性函数,还可以直接生成 matplotlib 图:
>>> g.plot() 
  • 通过 matplot 的 pyplot,可以将图片保存下来:
import matplotlib.pyplot as plt g.plot() plt.savefig("test.png") 
  • 学会上面的基本用法, 就可以进行简单的地图绘制及面积的计算。

四、绘制并算出每个省的面积

  • 此外,它最大的亮点是可以通过 Fiona(底层实现,用户不需要管),读取比如 ESRI shapefile(一种用于存储地理要素的几何位置和属性信息的非拓扑简单格式)。
import geopandas import matplotlib.pyplot as plt from shapely.geometry import Polygon maps = geopandas.read_file('1.shx') # 读取的数据格式类似于 # geometry # 0 POLYGON ((.341 .278, .591... # 1 POLYGON ((-.375 .367, -.3... # 2 POLYGON ((.092 .843, .873 4... # 3 POLYGON ((-34477.046 .963, -41105.128 4... # ... ... maps.plot() plt.savefig("test.png") 
  • 如代码所示,通过 read_file,可以读取 shx、gpkg、geojson 等数据。读取出来的图形如下:

在这里插入图片描述

  • 同样,这个 shapefile 是省级行政区的,每一个省级行政区都被划分为一个区块,因此可以一行语句算出每个省级行政区所占面积:
print(maps.area) # 0 4.e+11 # 1 1.e+12 # 2 1.e+11 # 3 4.e+10 # 4 1.e+12 # 5 1.e+11 # 6 1.e+11 # 7 9.e+10 # 8 1.e+11 # 9 1.e+11 # 10 1.015979e+11 # ... ... 
  • GeoPandas 的更多特性,请参考:GeoPandas。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/233048.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • c# MD5加密

    c# MD5加密usingSystem;usingSystem.Collections.Generic;usingSystem.Linq;usingSystem.Security.Cryptography;usingSystem.Text;usingSystem.Threading.Tasks;/****************************** *概要:MD5加密 *设…

    2022年7月11日
    17
  • 软件项目管理知识点总结

    软件项目管理知识点总结软件项目管理第1章软件项目管理概述1、项目的基本概念(注意与日常运作的区分)和特征;2、软件项目及特征;3、项目管理的基本概念;4、项目管理知识体系(以2017年发布的PMBOK6的十个知识领域为准);5、适用于软件项目管理的知识体系。​第2章项目确立&第3章生存期模型【项目初始】1、理解项目启动的基本过程(项目评估、项目立项、招投标、发布项目章程);2、项目章程的主要内容和作用;3、理解各生存期模型的优缺点及适用场景。第4章软件项目需求管理1、软件需求的概念及层次;2、需求工程的组成。需

    2022年5月9日
    41
  • Hough变换-理解篇

    Hough变换-理解篇霍夫变换 HoughTransfo 是图像处理中的一种特征提取技术 它通过一种投票算法检测具有特定形状的物体 该过程在一个参数空间中通过计算累计结果的局部最大值得到一个符合该特定形状的集合作为霍夫变换结果 霍夫变换于 1962 年由 PaulHough 首次提出 53 后于 1972 年由 RichardDuda 和 PeterHart 推广使用 54 经典霍夫变换用来检测图像中的直线 后来霍夫变换

    2025年10月18日
    3
  • python中for循环加速_如何提高python 中for循环的效率[通俗易懂]

    python中for循环加速_如何提高python 中for循环的效率[通俗易懂]对于某个城市的出租车数据,一天就有33210000条记录,如何将每辆车的数据单独拎出来放到一个专属的文件中呢?思路很简单:就是循环33210000条记录,将每辆车的数据搬运到它该去的文件中。但是对于3000多万条数据,一个一个循环太消耗时间,我花了2个小时才搬运了60万数据,算算3000万我需要花费100个小时,也就需要4-5天。并且还需要保证这五天全天开机,不能出现卡机的事故。因此,需要使用并行…

    2022年8月12日
    11
  • pycharm运行py文件报错_项目怎么运行

    pycharm运行py文件报错_项目怎么运行换电脑和换了Python解释器后,Pycharm运行项目报错:CreateProcesserror=2,系统找不到指定的文件运行其它都可以正常,唯独运行main函数报错file->setting设置如下此时需要Run->Run,修改成与上图一致的…

    2022年8月27日
    6
  • mac 版本 idea 2021.4激活码免费【在线破解激活】[通俗易懂]

    mac 版本 idea 2021.4激活码免费【在线破解激活】,https://javaforall.net/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

    2022年3月16日
    78

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号