Skip to content

Tutorial of geospatial data processing using python 用python分析时空数据的教程(in Chinese and English )

License

Notifications You must be signed in to change notification settings

ni1o1/pygeo-tutorial

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

English
本教程的b站视频地址:https://www.bilibili.com/video/BV1A5411a7xz
本教程的github地址:https://github.com/ni1o1/pygeo-tutorial
本教程的gitee地址(国内访问快):https://gitee.com/ni1o1/pygeo-tutorial
由于网速或者各种问题,网页打开本教程可能会出现图片或文件显示不能,因此建议各位下载教程到本地后用jupyter notebook打开教程观看

如何使用本教程

本教程是在python的Jupyter notebook上编写,有些python的基础环境需要配置:

  1. Python环境: Python3.6/3.7均可,这里推荐装一个Anaconda,点击这个链接下载安装(Python是个编程语言,Anaconda是一个打包了数据分析常用功能的Python平台,安装Anaconda就已经包含Python本体)
    关于如何使用anaconda的Jupyter notebook可以看这个链接
  2. 把本教程搞到本地,点击本网页右上角的Clone or download,用git clone或者直接Download ZIP下载到本地。
  3. 安装本教程最核心的包:Python的geopandas包,点击这个链接,按照上面的方法安装(比较推荐里面的Installing from source的方法安装)。
  4. 打开教程,enjoy!

教程目录

基础的数据处理

  1. 出租车数据的基础处理,由gps生成OD(pandas)
  2. 出租车数据的集计与基础图表绘制(matplotlib)
  3. 出租车数据的地理信息处理(geopandas)
  4. 基于出租车GPS的OD期望线绘制与底图添加(plot_map)
  5. 绘制数据分布的散点图和热力图(contourf)
  6. 结构化数据的存储及处理的思维训练(理论课)

用python实现GIS处理

  1. 轨道客流可视化!shapely初探
  2. 用道路切分地块!shapely的线转面处理!
  3. 利用osmnx与plot_map计算并可视化街道方向_by_YuanLianggg

爬虫

  1. 爬虫爬API抓取行政区划(urllib)
  2. 抓抓抓包!用百度迁徙数据计算人口恢复率
  3. 抓微博!微博评论关系可视化(微博api)

可视化

  1. 基于folium的可交互地图可视化(folium)
  2. 基于pyecharts的可交互可视化(pyecharts)
  3. 利用pandana可视化城市设施的可达性_by_fff2zrx
  4. 好看又高大上的可视化pydeck入门

项目

  1. 实战项目:怎么当一个优秀的出租车手-1
  2. 实战项目:怎么当一个优秀的出租车手-2

学术课

  1. 主成分分析PCA的原理、实现、缺陷及改进
  2. 谱聚类的原理及实现
  3. 基于自表达性的深度子空间聚类
  4. 社区发现!Fast unfolding算法分析出租车社区

教程说明

大数据时代到来,随着数据的逐步开放,数据工作者们或多或少都要接触到时空数据。

小旭学长曾经说:The data is data since it's data.

是的!数据处理是一门艺术!在处理时空数据的时候,你不仅要数据处理,还需要会GIS,最重要的它是一门艺术,要用你的审美,要出很好看的可视化图!

以前,我要用sql数据库处理数据,导出到excel画图表,再导出到arcgis出图,一套流程下来得开好几个软件,工作效率极低。

上次老师跟我说:小旭啊,我们这个项目你给我出800张图吧,我这周五就要。这个其实画出来也没什么用,主要是想放我们项目文本的附录里显示我们的工作量
我当场把桌子掀起来,画你妹!老子这博不读了
不,以上是做梦,现实情况是: 我微笑着说,好的老师,我通宵画

现在,python出现了,有了python里面的pandas,geopandas,matplotlib包,只需要用python就能实现数据的批量计算,批量出gis图等等。

哇!太棒了!简直是读研、读博、设计院画图、数据分析、闲着没事、居家旅行时候都必须会的技能,别说800张图了,电脑空间有多少我就能生成多少图,包您满意

通过本教程,你将从头开始,会学到一些时空数据的处理技巧,用python进行数据清洗,数据集计,数据整合,可视化!教程的后半段介绍了几个常用的python可视化包,最后是实战项目

本教程的可视化效果图展示

使用数据

本教程的数据来源(公开数据集可直接下载):
深圳出租车数据
Urban Data Release V2
Taxi GPS Data Format: 22223,2013-10-22 08:49:25,114.116631,22.582466,0
Taxi ID, Time, Latitude, Longitude, Occupancy Status, Speed; Occupancy Status: 1-with passengers & 0-with passengers;

学习本教程需要的基础

在学习本教程之前,强烈建议各位已经掌握了python的最基础的编程语法。如果你还没有掌握,下面建议你完成:

小甲鱼的python入门视频(看到35P)

另外,推荐课程:

  1. imooc的Python数据分析-基础技术篇教程
  2. udacity的数据分析入门课程
  3. coursera的机器学习课程
  4. 莫烦PYTHON的pytorch动态神经网络课程

友情链接

小旭学长的Echarts作品

贡献者

About

Tutorial of geospatial data processing using python 用python分析时空数据的教程(in Chinese and English )

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published