行业动态
地理空间信息的发展现在高度依赖AI技术,人工智能不只是地理空间信息科学的一大手段。空间智能是一个大的方向,偏向智慧城市领域则有地理学、社会学等的智能体。不足之处请大家多多批评指正。
0 前言
地理空间智能通过结合空间科学、人工智能方法、数据挖掘和高性能计算等技术,从空间大数据中提取知识,利用技术和数据治理的进步来支持创建更智能的地理信息以及用于各种下游任务的方法、系统和服务,帮助城市管理者更好地理解城市运行状态,优化决策过程当下已有了很多具体应用。
目前。机器学习和NLP的出现促进了从非结构化文本数据中提取地理信息的能力,而语义网、本体论和关联数据则改进了地理信息检索和构建高级地理知识图谱;随着 空间智能研究的深入,问答和智能数字助理以及社会感知领域也显示出其重要性。
1、空间智能概念
空间智能(Spatial Intelligence)通常指的是能够观察、理解三维空间,并在三维空间中自主采取行动的智慧能力。这一概念最早由美国哈佛大学心理学家霍华德·加德纳提出。通过对机械能力和操作能力的研究的启发,Howard Gardner教授第一次明确提出了“空间智能”的概念,他认为空间智能是人类大脑的技能之一,它通常是指一个人准确感受视觉空间并将所见形象表现出来的能力,当然它不止于记忆能力,最主要的是人有能力以三维空间的方式来思考,使人知觉到外在和内在的影像,并能重现这些影像。
斯坦福大学教授李飞飞在空间智能领域的研究是基于霍华德·加德纳提出的“空间智能”概念,致力于使人工智能(AI)能够理解和互动三维世界。她的研究聚焦于两个核心领域:具身智能和空间智能。
(1)具身智能:李飞飞团队开发了一种将大模型接入机器人的技术,使机器人能够直接理解并执行人类的复杂指令,无需额外数据和训练。这项技术允许机器人在未经过传统“培训”的情况下,通过3D空间分析来规划行动,识别目标和障碍。此外,团队推出的VoxPoser智能机器人,整合了通用语言模型、计算机视觉和机器人技术,显著提升了机器人的理解和执行任务的能力。
(2)空间智能:李飞飞教授在2024年的TED演讲中介绍了BEHAVIOR框架,强调了计算机视觉的重要性,并展示了她对空间智能的深刻理解。她定义空间智能为机器在三维空间和时间中感知、推理和行动的能力,使机器能够理解物体在四维空间中的位置和交互方式。她的研究目标是使AI能够高级推理视觉信息,在复杂环境中导航和操作,从而实现从“看到”到“洞察”,再到“理解”和“行动”的转变。李飞飞教授认为,空间智能是实现AI高级功能和解决其挑战的关键。
李飞飞所研究的空间智能核心概念与技术基础主要包括以下内容:
智能的本质是智能体与环境的复杂互动,这种互动涉及到感知、理解、决策、适应和学习等多个方面!!!
智能的本质是指个体对环境的感知、理解和响应的能力!!!
即,我们常提及的空间智能是一种利用三维空间进行思维的能力,是表明人类如何感知、理解、操作和导航三维空间的能力,人的空间智能是生物学上的,更多依赖于生物学上的感知和认知机制。而机器人的空间智能则依赖于先进的计算技术和算法,通过传感器、视觉学习等与环境互动来学习如何更有效地感知环境、做出决策和执行任务。尽管两者在实现方式上有所不同,但都致力于提高对三维空间的理解和操作能力。
空间智能不仅是实现通用人工智能的关键步骤之一,而且将为人类的生活和工作带来革命性的变化。随着技术的发展,空间智能的应用涵盖了生物学、心理学、社会学、地理信息科学等多个领域且还在不断扩展。
(推荐李飞飞教授 24年5月TED视频——《空间智能让AI理解真实世界》B站链接:https://www.bilibili.com/video/BV1wr421j76Y/?vd_source=2063a5c690b6a7c90df11263c90d1742)
2、地理空间智能
地理信息科学旨在揭示地理信息生成的机制,并探索空间信息处理与分析的框架。香港中文大学黄波教授曾提出,空间智能把地理空间作为模型空间进行研究,通过智能计算、优化以及模式发现,形成具体化和系统化的知识,从而发现地学规律。因此空间智能可以看成是联系空间分析与地学规律之间的桥梁。
空间智能强调发现与应用空间模式以增强GIS处理复杂数据和解决复杂问题的能力。是一种能够发现与应用空间模式能力并能通过外部环境和经验不断进行学习的能力。空间智能主要的技术体系由空间分析、空间优化和基于智能主体的模拟三大模块构成,相对于空间统计分析,空间智能强调在隐含的、复杂的条件下对空间数据分析客观规律的挖掘,发现与应用空间模式。其技术基础包括空间统计与索引、智能代理、高级启发式以及数学规划等系列智能技术。
人工智能与地理空间科学的交叉研究具有深厚的历史背景。20世纪80年代,地理信息科学家与城市规划研究者借助当时的人工智能技术,如知识专家系统和元胞自动机,开展智能地理信息系统的开发,探讨城市扩展模式的多样性。进入20世纪90年代至21世纪初,研究者们进一步应用遗传算法、模糊逻辑、本体论与语义分析,以及混合智能系统,推动了地理空间科学的发展。自2015年以来,结合深度学习技术(例如卷积神经网络、生成对抗网络及图神经网络)的地理空间科学研究逐渐兴起,推动了该领域的创新与进步。
地理空间人工智能(geospatial artificial intelligence,GeoAI)是指地理空间科学与人工智能相结合的交叉学科研究方向,通过研究与开发机器的空间智能,提升对于地理现象和地球科学过程的动态感知、智能推理和知识发现能力,并寻求解决人类和地球环境系统相互作用中的重大科学和工程问题。数据输入端的主要任务是数据采集和数据标注。算法模块的任务包含非监督学习、深度学习和迁移学习等一系列技术方法。应用服务端的任务包括部署模型、共享地理信息数据和训练好的模型等。
地理空间人工智能(GeoAI)通过结合地理空间科学与人工智能技术,提升了对地理现象和地球科学过程的动态感知、智能推理和知识发现能力。人工智能技术在很多情况下能比传统方法更有效地解决地理空间科学问题。
3、GeoAI模型分类
地理空间位置是连接多专题图层(如天气、水文、土壤、城市建筑等)、多要素(如人、事件、地理对象等)以及多异构数据(如图像、文字、视频等)的关键纽带。在地理空间研究中应用人工智能技术,主要涉及两类建模方法:空间隐式模型和空间显式模型。
(1)空间隐式模型(Spatially Implicit Models):这类模型在构建过程中,将地理空间位置视为多维特征向量中的普通维度,并没有特别对待空间位置或引入空间关系和其他空间约束。
(2)空间显式模型(Spatially Explicit Models):与空间隐式模型不同,空间显式模型在构建时明确考虑了空间位置的特殊性和空间关系。空间显式模型之所以重要,是因为地理空间数据具有空间依赖性和空间异质性,这些特性对于地理空间现象的分析和理解至关重要,空间显式模型能够更好地捕捉这些空间特性,从而提供更准确的分析结果。
4、GeoAI研究共性技术
地理空间数据与人工智能的频繁接触,堪比“金风玉露一相逢”,改变了人间的无数场景。GeoAI的技术基础,主要包含地理空间科学、人工智能、机器学习、深度学习及数据挖掘等。
从空间大数据中提取知识,地理空间智能的研究可分为地理空间感知智能(perception)、地理空间认知智能(cognition)及地理空间决策智能(decision)3个方面。
4.1 感知智能
地理空间感知智能关注于从具有地理属性的数据中提取空间目标和识别模式。该阶段涉及影像分类、语义分割、地物提取和实例分割等任务,主要通过空间特征工程或表征学习来提炼地理空间特征。对于土地覆盖/土地利用分类和城市功能区分类方面通常采用全连接神经网络进行像素级分类。空间目标提取研究涵盖地理要素提取(例如建筑物、道路网)和关键感兴趣目标提取(例如飞机、舰船、野生动物等)。激光点云智能方法分为传统机器学习方法和基于多层感知机的语义分割两类,前者依赖人工提取的几何特征进行分类,而后者则直接输入点云数据,以多层感知机为基础模型,以加权交叉信息熵作为代价函数,预测每个激光点的标签概率。此外,可从海量自然语言文本和社交媒体大数据中自动采集和提取地理文本信息。具体的应用实例包括:
(1)利用POI2Vec模型输出作为机器学习特征输入进行城市土地利用分类;
(2)应用Road2Vec模型于大规模出租车运营轨迹数据,量化道路间的隐性交通相互作用关系;
(3)采用Mot2Vec模型基于大规模人群移动数据训练生成活动场所的特征向量,刻画场所方的关联特性和相似性;
(4)基于多尺度空间位置编码方法pace2Vec,通过表征学习模型编码地方的绝对位置和空间关系;
4.2 认知智能
地理空间认知智能的研究内容包括利用空间数据挖掘和智能分析技术,从空间数据中挖掘隐藏的模式关系和趋势。基于人工智能的空间数据挖掘研究展现了较强的知识发现能力,在关联分析、聚类分析、异常检测等方面取得了进展。具体应用包括:
(1)利用深度学习监测城市大气污染物浓度并预测污染态势。
(2)利用街景影像分析北京市内出租车的轨迹模式,在地理空间和人类活动特征间建立联系。
(3)基于社交媒体数据的智能时空分析,应用于上海外滩踩踏事件社会舆情分析、居民行为模式分析等。
4.3 决策智能
地理空间决策智能的研究进展涵盖空间态势建模、智能预测,直接服务于多样化的地理信息产业应用需求。
其中,时空间预测的基本思想是根据多维属性变量估计目标对象或地理变量在未知地点(时空)的数值,而空间插值则是利用已知位置的属性数值推测未知点相同属性的数值。具体应用包括:
(1)从稀疏采样的手机位置数据中提取人群活动地点和移动模式,并提出新的模糊长短期记忆网络轨迹预测模型。
(2)利用带有地理标签的社交媒体数据构建BiLSTM-CNN模型,提升用户区域位置预测精度。
(3)使用基于GIS的模糊多准则逐层分析方法为伊斯坦布尔城区消防站提供选址建议。
(4)基于城市街景图片数据训练深度卷积模型,进行沿街交通流量时空类型预测。
此外,三维场景智能重建方面的研究集中在单像深度恢复、基于室内点云和轨迹的室内建模、有语义信息的三维地图重建等。地理空间智能系统结合地图、影像情报、参战各方的地理位置数据等还可对战场态势进行可视化和仿真。再者,利用生成对抗网络模型可进行地图样式风格的迁移学习,以及地形图的阴影自动渲染,并利用合成信息来改进制图风格设计或实现国土安全领域的地图位置电子欺骗。
参考文献
(1)https://cloud.tencent.com/developer/article/2218991;
(2)空间智能:地理信息科学的新进展。黄波等;
(3)地理空间人工智能的近期研究总结与思考。高松;
(4)https://www.geospatialworld.net/blogs/geospatial-ai/;
(5)地理空间智能研究进展和面临的若干挑战。张永生等;
(6)https://mp.weixin.qq.com/s/ixbFTFC_myXn9tWTo41PGg。
转发自公众号数字孪生城市小铺