當(dāng)前位置: >首頁 >精選報告
宋關(guān)福:探索空間智能體技術(shù),重塑GIS應(yīng)用范式
發(fā)布時間:2025-07-07     來源:宋關(guān)福GIS筆記     作者:宋關(guān)福      瀏覽:2845次

圖片

進(jìn)入2025年,AI智能體熱度持續(xù)攀升,備受各界矚目。百度的李彥宏、Open AI的山姆·奧特曼、華為的汪濤等行業(yè)領(lǐng)軍人物,均在不同時間節(jié)點、各類場合中表達(dá)過類似觀點:2025年是AI智能體元年。

在地理信息領(lǐng)域,AI智能體技術(shù)進(jìn)展如何,有哪些應(yīng)用場景?在2025空間智能軟件技術(shù)大會(GISTC 2025)上,自然資源部地理信息系統(tǒng)技術(shù)創(chuàng)新中心主任、超圖軟件董事長宋關(guān)福作《探索空間智能體技術(shù),重塑GIS應(yīng)用范式》報告。以下為報告圖文,分享給大家。

智能體這個名字看起來有些“玄乎”,它究竟具有怎樣的內(nèi)涵?在GIS領(lǐng)域又有怎樣的應(yīng)用場景?下面,我將為大家匯報。

圖片

智能體的英文名是“AI Agent”,Agent意為“代理”,即代表他人開展工作的人。哲學(xué)家亞里士多德曾在書中提到,Agent是一個可以通過理性推理實現(xiàn)目標(biāo)的行動者,這種說法更是給智能體擁有自主思考能力提供了理論依據(jù)。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_03.png

盡管今年被認(rèn)為是智能體元年,但早在一年前的2024空間智能軟件技術(shù)大會(GISTC 2024)上,超圖便發(fā)布了空間智能體(技術(shù)預(yù)覽版)。在介紹地理空間AI技術(shù)底座時,我分享了五項技術(shù)/產(chǎn)品,其中第四項就是空間智能體。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_04.png

當(dāng)時我們給它的定義為:能夠理解人類意圖、自主規(guī)劃和分解任務(wù),然后自動調(diào)用地理信息軟件工具來達(dá)成目標(biāo)、完成任務(wù)的一項智能技術(shù)。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_05.png

我們說的空間智能體,就是地理空間智能體的簡稱。空間智能體能給我們帶來什么價值?有的人講了很多特性,但歸根結(jié)底來講:大語言模型可以告訴我們怎么做,而空間智能體能替我們做。

自主地開展工作、提升人類的工作效率,就是空間智能體的核心價值。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_06.png

空間智能體技術(shù)的原理是什么?

從下圖可以清晰地看出,左側(cè)為輸入端,右側(cè)為輸出端,而中間核心部分需要依托大語言模型來實現(xiàn)關(guān)鍵功能。

在構(gòu)建空間智能體時,我們需要搭建四大系統(tǒng):首先是認(rèn)知系統(tǒng),它能夠精準(zhǔn)地理解人類的意圖;其次是規(guī)劃系統(tǒng),它負(fù)責(zé)對任務(wù)進(jìn)行合理規(guī)劃與分解;接著是執(zhí)行系統(tǒng),它能夠調(diào)用地理信息軟件工具來高效完成既定任務(wù);最后,還需要一個記憶系統(tǒng)來存儲和調(diào)用相關(guān)信息。

這四大系統(tǒng)與大語言模型相互配合、協(xié)同工作,共同支撐空間智能體的功能實現(xiàn)。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_07.png

一個完整的空間智能體應(yīng)用由“應(yīng)用層”“空間智能體層”和“地理信息軟件工具層”構(gòu)成。

在中間的空間智能體層,我們依托大語言模型,打造了知識問答式、工作流式以及自主規(guī)劃式三類空間智能體,以滿足多樣化的應(yīng)用需求;在地理信息軟件工具層,我們不僅封裝了SuperMap GIS和遙感APIs,還預(yù)留了接口,便于將第三方APIs靈活注冊進(jìn)來,從而進(jìn)一步拓展空間智能體技術(shù)的應(yīng)用范圍和功能邊界。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_08.png

下面,我來簡單地給大家匯報一下三類智能體。

01 知識問答式智能體

智能知識問答這幾年在各個領(lǐng)域應(yīng)用非常廣泛,大家或許會有疑問,智能體要調(diào)用工具,這也算是智能體嗎?智能知識問答要調(diào)用RAG,可以被認(rèn)為是一種弱智能體。通過RAG+專業(yè)知識庫降低大語言模型的幻覺,避免“一本正經(jīng)地胡說八道”,提升專業(yè)度。因此,智能知識問答算是空間智能體的一種初階應(yīng)用。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_11.png

讓我們來看一個具體場景。超圖的門戶產(chǎn)品SuperMap iPortal,融入了AI聯(lián)機(jī)幫助功能。以往,用戶在使用聯(lián)機(jī)幫助時,需要先輸入關(guān)鍵詞進(jìn)行搜索,操作相對繁瑣;而現(xiàn)在,借助智能體技術(shù),可以直接以提問的方式獲取所需信息。

比如,詢問“如何給城市建立一個大型可視化展示平臺”,它不僅能推薦對應(yīng)產(chǎn)品,還會詳細(xì)地介紹產(chǎn)品所具備的功能和優(yōu)勢,為用戶提供參考。

再例如,用戶有一臺Linux服務(wù)器,咨詢?nèi)绾慰焖俨渴餝uperMap iPortal,它也會給出專業(yè)答案,包括如何拉取鏡像、啟動服務(wù)等等。

0707-005-001.png

SuperMap iPortal平臺中,我們提供了一種通用的專業(yè)知識庫構(gòu)建工具。借助該工具,用戶能夠自主創(chuàng)建專業(yè)知識庫。

以國土空間規(guī)劃專業(yè)知識庫的創(chuàng)建為例,我們將大量行業(yè)標(biāo)準(zhǔn)、指南等文檔作為語料輸入至大模型中,使其具備回答國土空間規(guī)劃相關(guān)問題的能力。面對較為簡單直接的背景、意義等問題,該工具可基于知識庫檢索結(jié)果輸出現(xiàn)有答案并附上參考文獻(xiàn);面對建設(shè)路徑等深度問題,該工具亦能對知識進(jìn)行重新理解和組織,從而給出專業(yè)答案。

0707-005-002.png

以不動產(chǎn)登記智能問答為為例,連云港不動產(chǎn)登記平臺支持專業(yè)水平的精準(zhǔn)問答和多輪對話,并且遇到疑難問題時,可以自動轉(zhuǎn)接人工。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_14.png

02 工作流式智能體

工作流式智能體作為智能體的中級應(yīng)用形態(tài),通過融合人工設(shè)計的工作流程,有效降低了大語言模型的思考復(fù)雜度。盡管其自主性相對較弱,但卻擁有較高的執(zhí)行成功率,能夠應(yīng)對較為復(fù)雜的問題,是當(dāng)前較為切實可行的應(yīng)用模式之一。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_16.png

舉幾個例子:

在跨平臺桌面軟件SuperMap iDesktopX(可運(yùn)行于Linux環(huán)境)中,嵌入了智能制圖AI助理功能。用戶僅需在界面右下角的文本框內(nèi)輸入相應(yīng)指令,例如要求其依據(jù)全國人口數(shù)據(jù)制作分段專題圖,系統(tǒng)將迅速呈現(xiàn)制圖結(jié)果。

隨后,用戶還可進(jìn)一步指令生成標(biāo)簽專題圖,標(biāo)注省份名稱,或基于近年GDP數(shù)據(jù)繪制亮色系統(tǒng)計圖。相較于傳統(tǒng)的鼠標(biāo)與鍵盤操作方式,這種基于指令的制圖方法更為便捷、直觀,顯著提升了操作效率與用戶體驗。

圖片

這是智能制圖的內(nèi)部工作流程,除了可以制作專題圖,它還支持調(diào)整圖層的屬性、地圖的配置等參數(shù)。

圖片

那么,我們能不能構(gòu)建更復(fù)雜的工作流程、完成更復(fù)雜的任務(wù)?這就涉及到很多GIS軟件都具備的地理空間處理自動化功能(Geo-Processing Automation,即“GPA”)。將空間智能體與GPA結(jié)合,能高效地完成比較復(fù)雜的任務(wù)。

具體而言,任務(wù)執(zhí)行分為兩步:首先,空間智能體將傳統(tǒng)GPA人工進(jìn)行可視化建模構(gòu)建處理流程的步驟,借助空間自律性轉(zhuǎn)為自動構(gòu)建流程,將第一步的人工操作交由AI完成,人工審核確認(rèn)參數(shù)及工具;第二步,系統(tǒng)自動執(zhí)行任務(wù)。這種結(jié)合方式顯著增強(qiáng)了GPA的自動構(gòu)建能力,使其在處理復(fù)雜任務(wù)時表現(xiàn)更為出色。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_20.png

以下為桌面軟件中GPA AI助理的應(yīng)用實例。該軟件界面右下角設(shè)有輸入框,用戶可在此處輸入指令,要求其導(dǎo)入F盤中的道路數(shù)據(jù),并基于該數(shù)據(jù)構(gòu)建一條寬度為40米的道路,同時計算該道路占用各類土地的面積。

用戶發(fā)出指令后,GPA AI助理并非立即執(zhí)行任務(wù),而是先進(jìn)行思考,進(jìn)而構(gòu)建一個GPA工作流程。用戶點擊“添加”按鈕后,工作流程即構(gòu)建完成。

隨后,用戶可對相關(guān)參數(shù)進(jìn)行檢查,確認(rèn)無誤后點擊“執(zhí)行”,系統(tǒng)隨即運(yùn)行,最終生成結(jié)果,用戶可查看道路占用的耕地面積及各類土地面積的統(tǒng)計數(shù)據(jù)。

0707-005-003.png    

再來看一個相對復(fù)雜的服務(wù)器軟件WebGIS中AI助理的應(yīng)用實例。我們指定構(gòu)建一個土地適宜性評價模型,該模型需利用DEM數(shù)據(jù)進(jìn)行坡度和坡向計算,同時結(jié)合土壤質(zhì)地數(shù)據(jù),構(gòu)建一個GPA模型。

經(jīng)過思考,AI助理構(gòu)建出該模型,我們將數(shù)據(jù)配置妥當(dāng),之后啟動運(yùn)行,運(yùn)行結(jié)束后再查看運(yùn)行結(jié)果。這便是工作流式智能體的應(yīng)用過程。

0707-005-004.png   

WebGPA工作流式智能體的內(nèi)部邏輯如下,它要去不斷地循環(huán)迭代,構(gòu)建一個比較復(fù)雜的工作流程。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_23.png

下面我要介紹一個內(nèi)置空間智能體的新產(chǎn)品——SuperMap TransformX(空間數(shù)據(jù)轉(zhuǎn)換處理軟件)。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_24.png

SuperMap TransformX有以下特性:

一是支持點對點的數(shù)據(jù)格式轉(zhuǎn)換。例如,當(dāng)需要將SuperMap之外的兩個軟件的數(shù)據(jù)格式進(jìn)行轉(zhuǎn)換時,以往使用超圖的桌面軟件通常需要分兩步操作:首先將a數(shù)據(jù)導(dǎo)入SuperMap,再將SuperMap中的數(shù)據(jù)導(dǎo)出為b格式,這一過程較為復(fù)雜。而SuperMap TransformX能夠直接將a數(shù)據(jù)轉(zhuǎn)換為b軟件的格式,實現(xiàn)高效的點對點轉(zhuǎn)換;

二是在數(shù)據(jù)格式轉(zhuǎn)換過程中,可同步進(jìn)行空間分析和處理。例如,用戶可以同時進(jìn)行投影系轉(zhuǎn)換、Overlay操作以及數(shù)據(jù)拆分等操作。此外,SuperMap TransformX還支持可視化建模和自動化執(zhí)行,類似于GPA的功能。

三是具備廣泛的硬件和操作系統(tǒng)兼容性,不僅支持傳統(tǒng)的X86架構(gòu)CPU,還支持ARM 架構(gòu)及其他類型的CPU,并兼容多種操作系統(tǒng)。

SuperMap TransformX的定位包括以下三個方面:其一,作為空間數(shù)據(jù)遷移工具;其二,作為空間數(shù)據(jù)治理工具之一;其三,作為FME的升級替代工具。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_25.png

以下是SuperMap TransformX的一個界面,分為深色系和淺色系,中間也是一個構(gòu)建工作流程框,可以自動執(zhí)行非常復(fù)雜的工作任務(wù)。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_26.png

SuperMap TransformX之所以能替代FME,是因為它不僅具有豐富的空間數(shù)據(jù)處理轉(zhuǎn)換功能,還擁有全面的跨平臺兼容性,支持華為鯤鵬、飛騰等ARM架構(gòu)指令集芯片,及涵蓋龍芯、海光、兆芯等國產(chǎn)處理器。

此外,它兼容各類國產(chǎn)操作系統(tǒng)與數(shù)據(jù)庫,同時對開源數(shù)據(jù)庫及操作系統(tǒng)提供支持,也兼容國外主流商業(yè)基礎(chǔ)軟硬件。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_27.png

在SuperMap TransformX中進(jìn)行數(shù)據(jù)轉(zhuǎn)換與處理時,界面右下角設(shè)有輸入框。用戶可在此處指定將一個三維模型文件與一個二維數(shù)據(jù)導(dǎo)入系統(tǒng)。

處理流程包括首先執(zhí)行坐標(biāo)轉(zhuǎn)換,隨后將二維數(shù)據(jù)中的屬性賦予三維模型。構(gòu)建好整個流程并檢查參數(shù)無誤后,即可執(zhí)行。執(zhí)行完成后,導(dǎo)入的模型將攜帶二維數(shù)據(jù)的屬性,整個過程實現(xiàn)了一體化處理。

圖片

03 自主規(guī)劃式智能體

自主規(guī)劃式智能體的工作邏輯如下:首先進(jìn)行任務(wù)規(guī)劃,隨后生成任務(wù)并執(zhí)行第一步。執(zhí)行完成后,系統(tǒng)將重新規(guī)劃,再次生成任務(wù)并執(zhí)行第二步。每執(zhí)行一步,系統(tǒng)都會評估結(jié)果,以優(yōu)化下一步的執(zhí)行策略。這一過程會循環(huán)進(jìn)行若干次,直至任務(wù)完成。

與工作流式智能體相比,自主規(guī)劃式智能體具有更高的自主性,用戶無需構(gòu)建流程,系統(tǒng)會自行思考并規(guī)劃任務(wù)執(zhí)行方式。然而,目前自主規(guī)劃式智能體的執(zhí)行成功率相對較低,這主要源于大語言模型在思考和調(diào)用工具方面的局限性。盡管如此,自主規(guī)劃式智能體仍被視為一種高級應(yīng)用模式。

相比之下,工作流式智能體在任務(wù)執(zhí)行成功率和應(yīng)用落地性方面表現(xiàn)更為出色,是一種較為成熟的中間過渡形態(tài)。而自主規(guī)劃式智能體的進(jìn)一步發(fā)展和完善仍需持續(xù)探索和研究。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_30.png

在此演示三個例子:

第一個,是利用SuperMap iPortal門戶產(chǎn)品中的AI助理開展三維建模與分析。具體任務(wù)如下:以房屋建筑數(shù)據(jù)資源中的高度字段作為拉伸高度,以tTexture字段作為頂面紋理貼圖,以sTexture字段作為側(cè)面紋理貼圖,從而拉伸出三維模型。隨后,利用新生成的三維模型場景,在松一小區(qū)26號樓、高度86米的位置設(shè)置觀察點,設(shè)定觀察距離為600米,水平視角為90度,垂直視角為60度,開展可視域分析。

該任務(wù)被分解為兩個步驟:第一步,構(gòu)建白模與紋理貼圖;第二步,執(zhí)行可視化及可視域分析。盡管整個流程看似簡單,僅包含兩步操作,但對于大模型而言,這一過程仍具有相當(dāng)?shù)膹?fù)雜性。

0707-005-005.png    

第二個例子包含更多步驟:首先,利用鄉(xiāng)村土地利用的影像數(shù)據(jù)集進(jìn)行地物分類;接著,計算其中4類地物的占地面積;最后,繪制一個環(huán)狀統(tǒng)計圖。當(dāng)我們將指令輸入系統(tǒng)后,系統(tǒng)便開始進(jìn)行迭代思考。

在解析出幾類地物之后,系統(tǒng)在執(zhí)行第二步思考的同時,還可以操作可視化的縮放功能。完成面積計算之后,第三步是繪制圖表。這一過程包含三個步驟,相較于前一個例子,稍顯復(fù)雜。

0707-005-006.png   

能不能做更復(fù)雜的?我們再看一個例子:分析北京市小學(xué)和行政區(qū)劃數(shù)據(jù),統(tǒng)計各行政區(qū)內(nèi)各小學(xué)數(shù)量并制作分段專題圖;告訴我哪個行政區(qū)內(nèi)小學(xué)數(shù)量最多,并列出這個行政區(qū)內(nèi)的小學(xué)的清單;分析這些小學(xué)周邊5千米范圍內(nèi)的住宅均價,查看該區(qū)域?qū)W區(qū)房均價地圖。

我們也試了幾次,因為這種復(fù)雜場景的自主規(guī)劃任務(wù)很難一次成功,要不斷地修改提示詞。我們來看它執(zhí)行的結(jié)果,第一做匯總分析,查找范圍內(nèi)有多少個小學(xué)的點,查出來點后做分段專題圖,然后做統(tǒng)計分析,最后再做鄰近分析,統(tǒng)計小學(xué)周圍的房價,形成一個符號專題圖。這5個步驟在我們看來可能比較簡單,但是對目前的智能體說還是蠻復(fù)雜的,它可以讓我們擺脫復(fù)雜的軟件操作,讓AI幫我們思考。

0707-005-007.png  

以上是我們提供給大家的三種智能體能力,如果落到具體的行業(yè)里,我們該怎么用智能體去解決行業(yè)的問題?能不能夠定制一個行業(yè)智能體或者特殊應(yīng)用場景的智能平臺?

這就涉及到一個今天發(fā)布的另一個新產(chǎn)品:空間智能體服務(wù)平臺——SuperMap AgentX Server。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_35.png

SuperMap  AgentX  Server在SuperMapGIS云邊端產(chǎn)品體系里,屬于云GIS服務(wù)器產(chǎn)品。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_36.png

以下簡要介紹相關(guān)內(nèi)容。在大語言模型方面,我們接入了千問系列和DeepSeek系列。綜合測試結(jié)果顯示,這兩個模型在當(dāng)前階段表現(xiàn)較為出色。其中,經(jīng)過我們的測試,千問系列(Qwen)在調(diào)用工具方面的成功率較高,而DeepSeek系列在推理邏輯方面表現(xiàn)更為優(yōu)異。

在架構(gòu)的第三層,我們將SuperMap GIS和遙感能力封裝為一種標(biāo)準(zhǔn)接口,命名為“MCP服務(wù)”。行業(yè)擴(kuò)展同樣基于MCP服務(wù)進(jìn)行封裝,從而實現(xiàn)對Agent技術(shù)本身不具備的能力的調(diào)用與擴(kuò)展。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_37.png

剛才我們提到目前自主規(guī)劃式智能體的任務(wù)執(zhí)行成功率不是很高,那么執(zhí)行成功率取決于什么?取決于三個因素,體現(xiàn)為三個“率”。

第一個是意圖識別準(zhǔn)確率,即能不能理解我們想要做的事;第二個是工具調(diào)用準(zhǔn)確率,即能不能準(zhǔn)確找到調(diào)用工具;第三個是工具的完備率,即是不是具備完成任務(wù)所需的工具。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_38.png

假設(shè)平均每一個部分成功率為80%,這三個80%乘起來成功率就小很多。但是我們也在想辦法去提高各部分的成功率。

首先我們微調(diào)了大語言模型來提升意圖識別準(zhǔn)確率和工具調(diào)用準(zhǔn)確率。我們把千問做了一些微調(diào),使意圖識別準(zhǔn)確率提升1-12個百分點、工具調(diào)用準(zhǔn)確率提升1-9個百分點。每提升一個百分點都很難,我們后面還會用其它方式進(jìn)一步提高準(zhǔn)確率。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_39.png

在工具完備度上,我們在SuperMap GIS里面封裝了一些 MCP工具,包括我們跟華為聯(lián)合開發(fā)的一個開源空間數(shù)據(jù)庫——禹貢,我們封裝了一些MCP服務(wù)。在

SuperMap iServer MCP工具中,共接入了200多個算子;在SuperMap iPortal門戶產(chǎn)品里,接入了60多個算子,我們以后還會不斷迭代和完善MCP的工具數(shù)量。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_40.png

那么在行業(yè)應(yīng)用中,遇到我們沒有的業(yè)務(wù)功能怎么辦?我們用第三方擴(kuò)展的方式,把業(yè)務(wù)API封裝成MCP Server,然后把它注冊到SuperMap AgentX Server里,如此我們的SuperMap AgentX Server便可以去理解和調(diào)用業(yè)務(wù)工具,來實現(xiàn)行業(yè)擴(kuò)展。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_41.png

我們來看一個例子,接入高德的MCP服務(wù),結(jié)合本地數(shù)據(jù)和功能聯(lián)合去完成一個任務(wù)。

第一步注冊高德MCP服務(wù);第二步輸入指令:我要去北京參加大會,幫我查一下北京地鐵線路分布;第三步查一下北京市國家會議中心和故宮博物院兩個坐標(biāo)點的位置,這是本地數(shù)據(jù)的計算;第四步把本地數(shù)據(jù)的兩個坐標(biāo)點傳送給高德,讓它去做一個地鐵的路線規(guī)劃(這只是個演示,這些任務(wù)高德都可以做,我們說這個演示就是為了說明外部的MCP能力可以接入進(jìn)來,與SuperMap GIS能力互補(bǔ))。

 0707-005-008.png     

SuperMap AgentX Server平臺具備以下三大特點:其一,支持多類智能體,涵蓋知識問答式、工作流式以及自主規(guī)劃式三類空間智能體;其二,支持二次開發(fā),在服務(wù)器后端可擴(kuò)展MCP服務(wù),在前端可定制應(yīng)用界面,并將其嵌入業(yè)務(wù)系統(tǒng);其三,支持跨平臺,兼容英特爾X86芯片、華為鯤鵬ARM芯片等多種運(yùn)行環(huán)境。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_43.png

以下簡要介紹SuperMap AIF地理空間AI技術(shù)底座的最新進(jìn)展。去年,我們發(fā)布了基礎(chǔ)底座,其能夠在各類軟件中實現(xiàn)AI能力的共享。下文中以紅字標(biāo)注的部分,即為此次升級的具體內(nèi)容。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_47.png

第一項優(yōu)化是基于AI的建筑自動單體化三維建模:去年,我們的建模支持已達(dá)到LOD2.0級別,涵蓋坡屋頂結(jié)構(gòu),但尚未實現(xiàn)側(cè)面紋理的精準(zhǔn)貼合。今年,我們已完成紋理映射技術(shù)的升級,可實現(xiàn)側(cè)面紋理的精確貼合,進(jìn)一步提升了建模的真實感與細(xì)節(jié)表現(xiàn)。

0707-005-010.png

第二項是AI紋理修復(fù),我們在建模的過程中會有一些樹擋住建筑,可以通過AI來修復(fù)三維建模紋理,從而解決三維模型紋理遮擋問題,通過修復(fù)前后對比可以看出,優(yōu)化效果較為明顯。

圖片

第三項優(yōu)化是在遙感影像處理技術(shù)方面,我們對AI影像匹配技術(shù)進(jìn)行了升級。去年,我們推出了AI影像匹配算法,與傳統(tǒng)算法相比,該算法能夠匹配更多的同名點,成功率顯著提高。

今年,我們進(jìn)一步優(yōu)化了這一算法,使得匹配的同名點數(shù)量進(jìn)一步增加。特別值得一提的是,在沙漠、密林等難以匹配的區(qū)域,該算法能夠更加穩(wěn)定地實現(xiàn)影像匹配。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_50.png

第四項是相比去年,對遙感影像處理中DSM算法做了AI方面的進(jìn)一步升級,可以讓右圖高架橋的輪廓更加清晰。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_51.png

第五項,在山區(qū)地區(qū),基于新的算法,右圖山脊線更加清晰。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_52.png

第六項為遙感智能解譯功能的優(yōu)化。我們新增了若干預(yù)訓(xùn)練模型,涵蓋備受關(guān)注的光伏板、道路等要素,對影像超分辨率技術(shù)也提供了相應(yīng)的算法支持。此外,建筑物變化檢測作為新推出的預(yù)訓(xùn)練模型,以“開箱即用”的模式為用戶帶來便捷。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_53.png

這是超分辨率重建的效果展示。經(jīng)過超分辨率重建處理后,原始影像的清晰度顯著提升。

然而,當(dāng)我們進(jìn)一步放大圖像進(jìn)行觀察時,左側(cè)的圖像若用于地物檢測,其目標(biāo)識別難度較大,邊界線不夠清晰;而中間的圖像在清晰度和邊界線的明確度上則有顯著改善,表現(xiàn)更為出色。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_54.png

第七項升級是支持對SAR影像的目標(biāo)檢測。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_55.png

第八項優(yōu)化涉及去年發(fā)布的地物分類大模型——SuperMap LIM地物分類大模型,去年的模型參數(shù)量為1億,而今年的參數(shù)量增至5億,各項指標(biāo)與精度均有所提升。

圖片

下圖從左到右依次是:傳統(tǒng)監(jiān)督分類模型、去年的1億參數(shù)規(guī)模大模型、今年的5億參數(shù)規(guī)模大模型,我們可以看到建筑物的識別精準(zhǔn)很多。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_57.png

在探討是否進(jìn)一步擴(kuò)大參數(shù)規(guī)模的過程中,我們曾考慮將參數(shù)量從5億提升至10億甚至20億。然而,在與部分研究成果進(jìn)行對比分析后,我們發(fā)現(xiàn),當(dāng)使用相同的公開數(shù)據(jù)集進(jìn)行測試時,模型精度的提升并不顯著。

基于此,我們判斷,單純增加參數(shù)規(guī)模對于模型性能的提升作用有限。因此,我們決定探索其他方法來進(jìn)一步提高模型的準(zhǔn)確度。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_59.png

第九項是AI規(guī)劃生圖的優(yōu)化。去年,我們發(fā)布了AI規(guī)劃生圖,它確實能夠顯著提高生產(chǎn)效率。

今年,我們新增了基于白模生成渲染圖的功能,該功能通過將二維建筑物矢量面拉伸生成白模,進(jìn)而生成三維渲染圖。用戶在選擇參數(shù)和效果后,即可等待生成的結(jié)果。

最終,系統(tǒng)會提供兩個方案供用戶選擇。與傳統(tǒng)的手工繪制渲染圖相比,這一功能的效率大幅提升,能夠在幾十秒內(nèi)完成出圖。

0707-005-009.png

去年,我們將空間AI技術(shù)的發(fā)展與AI的成熟度模型進(jìn)行了對標(biāo)。具體分級如下:L1級為初始級,略優(yōu)于無經(jīng)驗者;L2級為熟練級,超越了50%的熟練者;L3級為專家級,超越了90%的熟練者;L4級為大師級,超越了99%的熟練者;L5級為超人級。

目前,像AlphaZero處于L5級,而AlphaGo處于L4級。專業(yè)的空間AI目前大多處于L2和L3級別。

那么,空間智能體處于何種成熟度呢?知識問答式智能體尚未完全達(dá)到L3級,尚不能解決90%的問題,但后續(xù)將通過迭代進(jìn)一步發(fā)展;工作流式智能體目前處于L2級水平;自主規(guī)劃式智能體仍處于L1級,其成功率有待提高,但一旦成功,將帶來諸多驚喜。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_63.png

以下簡要闡述這三類智能體的現(xiàn)狀與展望。

知識問答式智能體雖能力有限,無法直接采取行動,但其應(yīng)用范圍廣泛,未來仍將延續(xù)其存在,并有望成為復(fù)雜智能體的重要組成部分。

自主規(guī)劃式智能體具備較強(qiáng)的自主規(guī)劃能力,盡管目前尚未成熟,但其迭代速度有望加快,且被視為最終理想的智能體形態(tài)。

工作流式智能體則處于過渡階段,在自主規(guī)劃式智能體尚未成熟之際,它能夠承擔(dān)任務(wù)且成功率相對較高。待自主規(guī)劃式智能體發(fā)展成熟后,工作流式智能體可能會逐漸淡出歷史舞臺,但在某些特定場景下,它或許仍將得以保留。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_65.png

從宏觀角度來看,智能體主要分為三大類:通用水平智能體、領(lǐng)域水平智能體以及垂類智能體。

通用水平智能體,例如近期備受關(guān)注的Manus和扣子空間,具備廣泛的適用性;超圖的空間智能體則屬于領(lǐng)域水平智能體,其優(yōu)勢在于能夠跨行業(yè)應(yīng)用;此外,還有針對特定行業(yè)的垂類智能體,如自然資源、水利、住建、交通和文旅等領(lǐng)域,均可基于底層的水平智能體構(gòu)建相應(yīng)的行業(yè)垂類智能體。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_66.png

空間智能體技術(shù)重塑了GIS的應(yīng)用范式,這一新的應(yīng)用范式可概括為“三自”:自然交互、自主思考、自動執(zhí)行。

自然交互是一個螺旋式上升的過程,最早的GIS采用命令行交互,對使用者要求極高,需熟悉成百上千的命令,且參數(shù)輸入需精準(zhǔn)無誤,否則無法運(yùn)行。Windows出現(xiàn)后,GIS升級為圖形界面交互,通過菜單和工具欄操作,降低了使用者要求,但仍較為復(fù)雜。而自然交互則更為簡便,只需發(fā)出指令,系統(tǒng)即可執(zhí)行,極大地提升了用戶體驗。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_67.png

新的范式究竟意味著什么?舊的范式要求我們既需精通業(yè)務(wù),又要熟練操作軟件。對于像GIS這樣復(fù)雜的軟件系統(tǒng)來說,熟練掌握操作并非易事。因此,通常需要兩人協(xié)作:領(lǐng)導(dǎo)負(fù)責(zé)理解業(yè)務(wù)并發(fā)出指令,信息中心的工程師則負(fù)責(zé)操作軟件,依據(jù)領(lǐng)導(dǎo)的意圖完成任務(wù)。任務(wù)完成后需提交給領(lǐng)導(dǎo)審核,若不符合要求還需修改,往往需多次往返才能完成任務(wù),耗時較長。

而新的范式則只需用戶會提出需求,無需深入了解軟件操作,系統(tǒng)便能自動執(zhí)行任務(wù)。領(lǐng)導(dǎo)在終端發(fā)出指令后,后臺信息中心的機(jī)器隨即開始計算。若計算結(jié)果不符合預(yù)期,只需調(diào)整提示詞重新計算,迭代效率大幅提升。這無疑是未來理想的應(yīng)用場景,我們可逐步推進(jìn)其落地實施。這一切,僅僅是開始。

20250624-宋關(guān)福-空間智能體技術(shù)探索@GISTC-V1.0.73(1)_68.png

今年被視為智能體發(fā)展的元年,但我們有理由預(yù)見,在未來3到5年的時間跨度內(nèi),空間智能體有望開啟GIS軟件應(yīng)用的新紀(jì)元,并將對我們的工作方式產(chǎn)生革命性的變革。


主管部門:
自然資源部
民政部
中國科協(xié)
京ICP備14037318號-1 京公網(wǎng)安備 11010802031220號
主辦:中國測繪學(xué)會    技術(shù)支持 :江蘇潤溪時空智能科技股份有限公司
聯(lián)系電話:010-63881345      郵箱地址:zgchxh1401@163.com
聯(lián)系地址:北京市海淀區(qū)蓮花池西路28號西裙樓四層
枣庄市| 合水县| 邓州市| 丹阳市| 西昌市| 浦县| 长武县| 广宗县| 通山县| 永城市| 玉环县| 青田县| 抚州市| 福鼎市| 灵璧县| 灵山县| 桂阳县| 左贡县| 江北区| 临猗县| 库车县| 永丰县| 沁源县| 武清区| 内乡县| 陆丰市| 泌阳县| 岳阳县| 军事| 渝中区| 乐东| 广东省| 鹤庆县| 布尔津县| 榕江县| 吉安县| 建昌县| 潮安县| 海安县| 新邵县| 堆龙德庆县|