<tt id="84k2u"></tt>
公司新聞
公司新聞

公司新聞

新基建驅動產業轉型升級 | AI賦能共創遙感新時代

2021-06-12 343

新基建成為科技領域的焦點話題。作為新基建的重要內容,人工智能的發展愈發受到人們關注,不過與基礎設施相比,人工智能很難將其具象化而出。但伴隨圖像處理技術、光學成像技術、傳感器技術等的發展,以及算法的不斷優化,使人工智能的兩大分支(自然語言處理與機器視覺)擁有了感知物理世界的能力,作為圖像圖形領域中的重點內容之一,遙感應用行業也站在了產業智能化的風口。



圖來源網絡


1950年,科學家Alan Turing提出使用機器偽裝人類對話的能力來衡量機器的智能水平,掀起了人工智能(Artificial Intelligence,AI)的浪潮。概括而言,AI是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新技術科學,涉及到數學、語言學、神經科學、心理學、物理學、認知科學、計算機科學等學科。黨的十八大以來,黨和國家高度重視和大力扶持新一代信息技術發展,移動互聯網、云計算、大數據、物聯網等技術加速交叉融合發展,有效地推動人工智能技術快速成熟、產業快速發展和經濟社會領域廣泛應用。2021年3月5日,“十四五規劃”和2035年遠景目標綱要草案提請十三屆全國人大四次會議審查。其中,將新一代人工智能中的“前沿基礎理論突破、專用芯片研發、深度學習框架等開源算法平臺構建、學習推理與決策、圖像圖形、語音視頻、自然語言識別處理等領域的創新”作為了一項需要重點突破的科技前沿領域。作為圖像圖形領域中的重點內容之一,遙感應用行業站在了產業智能化的風口,AI與大數據技術賦能于遙感應用,也成為了行業以及學術界廣泛關注和研究的課題,而如何利用人工智能手段輔助挖掘這些豐富的信息也成為了遙感圖像分析與理解的重要內容。

以深度學習為主要應用的AI技術為遙感影像解譯提供了新的方法,適用于遙感大數據的自動化處理和數據挖掘,其能夠深度地挖掘遙感影像中的有效信息,從而快速賦能于行業應用。人工智能發展的三要素包括算力、算法和數據,而深度學習本質上是采用監督學習的方式,通過大量樣本數據來學習目標的本質特征,并據此對未知數據進行預測判別,其基礎性的研究主要分為兩大方面,一方面是樣本庫的設計與標注,另一方面是網絡結構與模型設計。


遙感影像樣本庫的設計與構建



在樣本庫的設計與標注研究中,在計算機視覺領域經過多年的發展已經構建了以ImageNet為代表的眾多自然圖像樣本庫,并多次作為深度模型訓練與驗證的數據集。樣本庫的數量和質量作為深度學習模型成功應用的重要決定因素,其標注應能夠客觀真實的反映實際地物情況,在標注過程中可以遵循以下原則:


(1)最大最小范圍原則:標注的目標區域要盡量大到包含目標區域的邊界,但也要小到除了目標區域邊界外,不包含其它物體特征;

(2)寧無不錯的原則:錯誤的標簽對于模型訓練的過程是很大的擾動,會導致模型訓練難以收斂,最終導致模型的泛化性極差、難以擬合等問題;

(3)所標即所見原則:標注過程中只標注從視覺上確定的目標物體,對于有遮擋或者無法分辨的地物不進行標注,也即是不添加主觀想象力和先驗知識。

在具體的遙感影像應用上,由于受到尺度效應、成像條件、地表場景等眾多因素的影響,使得遙感圖像包含了分布復雜的多種地物類型。在建立遙感圖像樣本庫時,學者們提出了不僅需要考慮更多的地物屬性特征,既標注單一地物,也應標注其特征的存在背景和關聯數據,也即是構建面向對象的遙感知識庫,為深度學習模型提供包括基礎圖形、對應的屬性類別、位置信息以及地物對象的物理和社會特征等輔助信息。目前,研究者們已經構建了大量用于目標探測和圖像分類的標記樣本庫,如針對車輛識別的TAS數據集(圖像數30,圖像大小792×636)、OIRDS數據集(圖像數900,圖像大小256~640×256~640)、DLR 3K Vehicle(圖像數20,圖像大小5616×3744);針對飛機識別的UCAS-AOD數據集(圖像數1510,圖像大小1280×659);針對建筑物識別的SZTAKI-INRIA數據集(圖像數9,圖像大小800×800);針對船只識別的HRSC2016數據集(圖像數1070,圖像大小>1000×600);針對多種地物提取的NWPUVHR-10數據集(圖像數800,圖像大小1000×1000)、VEDAI數據集(圖像數1210,圖像大小1024×1024)、ROSD數據集(圖像數976,圖像大小1280×1280)以及DOTA-v1.5數據集(圖像數2806,圖像大小800~4000×800~4000)等。


面向遙感解譯的深度學習網絡結構與模型設計



       在網絡結構與模型設計研究中,應用在遙感影像分類方面的深度學習模型主要有深度置信網絡

(Deep BeliefNetwork,DBN)、卷積神經網絡(Convolutional Neural Network,CNN)和棧式自編碼器網絡(Stacked Auto-encoder Network,SAE),各方法的原理、分類效果以及優缺點如表1所示。


表1 不同深度學習方法的特征比較


1998年,Lecun總結完善了經典卷積神經網絡在手寫體數字識別中的應用,作為深度學習方法中的典型代表,CNN可以接受圖像作為輸入數據,避免了傳統識別算法中復雜的特征提取和數據重建過程。此外,CNN采用卷積和權值共享訓練策略,極大地降低了模型復雜度,節省了訓練開支,且能夠識別圖像的空間特征。更重要的是,CNN具有局部連接和空間下采樣特點,使得CNN具有一定的平移、尺度和扭曲不變性,被廣泛的應用于圖像的目標識別和分類中。CNN模型通常由卷積層、池化層和全連接層組合而成:

(1)卷積層。卷積層是CNN的核心,目的是對輸入數據進行特征提取。在卷積層中,使用一組濾波器(即卷積核),與前一層中位置鄰接區域內的元素進行卷積操作,并使用非線性激活函數進行映射,獲取圖像的卷積特征;

(2)池化層。在卷積層進行特征提取后,采用空間池化方法對卷積特征圖進行下采樣,用于特征選擇和空間降維。池化層可以有效地降低模型復雜度,節省計算成本。常用的池化方法包括極大值池化和均值池化;

(3)全連接層。全連接層是將當前網絡層中的每個節點與上一層的所有節點相連,可以整合卷積層或者池化層中提取到的特征。

2012年,Hinton研究組構建了深度學習模型AlexNet并在ImageNet圖像識別中一舉奪冠,其采用ReLU激活函數,從根本上解決了梯度消失問題,并采用GPU極大的提高了模型的運算速度。在此后的幾年中,分別涌現出了諸如VGGNet、ResNet、GooleNet、MobileNet、DenseNet等特征自動提取網絡,并且在數據集測試上獲得了優秀的提取結果。近年來,深度學習網絡模型不斷完善,在圖像識別和信息提取方面取得了突破性進展,在很多任務上的精度已然超過人工識別精度。深度學習在計算機視覺領域的巨大成功為遙感大數據信息智能提取提供了重要機遇,然而,遙感影像具有其專業化特征,如遙感影像中的目標存在方向任意性、尺度多樣性、幾何形變和密集排列等特點,因此要求基于CNN模型的改進能夠結合遙感圖像目標的特點,有效地實現目標檢測。遙感學界的學者和從業者也對不同的深度學習模型進行了修改,將其應用于遙感影像解譯中。例如,針對遙感圖像目標方向的不確定性,可以提取旋轉不變特征實現水平框目標檢測,也可以設計能夠準確識別目標角度的方法來實現有向邊框目標檢測;針對目標的尺度差異性,采用多尺度方法對網絡結構進行改進,實現多尺度目標檢測;針對遙感目標的密集排列問題,采用自適應方法,實現密集目標檢測。此外,針對遙感影像存在紋理特征復雜的特點,為提高分類精度,現有研究通?;趦蓚€方向:一方面通過增加網絡層數,訓練更深的神經網絡來提取深層次的的語義信息;另一方面則采用結合更高效模塊提高網絡的特征提取能力。深度學習模型在遙感影像解譯中已經產生了大量的應用并獲得了優秀的解譯效果,其具有以下優勢:不需要人工設計特征,具有很強的特征學習和表達能力,可以直接從數據中學習更加抽象且含有語義信息的高層特征,模型預測性能高,具有較好的遷移學習能力。


遙感智能視覺平臺的構建



        目前,深度學習技術雖然在遙感影像解譯中取得了顯著的成果,但仍然存在著一些問題,如網絡模型大多依賴經驗設計;需要大量有標注的數據;網絡模型復雜度高,容易出現局部最優解或過擬合問題;訓練耗時,計算量大;存儲和計算資源要求高,通常需要GPU平臺;模型的超參數選擇多依賴于經驗和技巧。鑒于此,測繪地理信息行業涌現出類似中科北緯(北京)科技有限公司這樣的企業,以中科北緯為例,他們開發了面向用戶的遙感智能視覺平臺——天樞。在整體架構上,依托于國際領先的國產開源框架飛槳(PaddlePaddle),打造出了影像智能解譯閉環鏈路,如圖1所示。在對遙感數據進行挖掘提取過程中,經過大規模迭代優化,能夠避免季相變化、衛星型號對解譯效果造成的影響,地塊分割準確率達到90%以上,可對四個像素以上的影像變化進行提取和輸出。此外,遙感智能視覺平臺集成了改變大小、標準化、隨機翻轉、局部隨機放大、隨機高斯模糊、隨機銳化、波段數量降維、添加NDVI通道、添加NDWI通道、添加NDBI通道等17種方法,重新定制并優化了圖像增強方案。


圖1 影像智能解譯閉環鏈路


在功能上,中科北緯公司開發的天樞遙感智能視覺平臺采用B/S結構開發,面向非專業化用戶設計了友好的操作界面,提供了針對遙感數據的三大功能模塊:斜框檢測、地塊分割變化檢測,如圖2所示。該平臺構建了一體化的遙感影像特征自動提取流程,包括遙感影像預處理、模型訓練、模型下發和使用、精度評價、結果后處理等過程。在常規任務上,如建筑物、水體、道路等特征的提取以及變化檢測,無需用戶過多干預,模型能夠輸出高精度的地物提取結果;此外,產品具有可擴展性,也即是用戶可以按需訓練適應特定場景的模型,可用于不同尺度、不同分辨率、不同時期的遙感影像特征的提取及變化檢測。


圖2 遙感智能視覺平臺界面


可以預見,算法、算力和海量數據的沉淀使得AI與遙感應用的結合正當時。“可感知、能學習、易擴展” 的遙感解譯平臺,能夠實現多源影像數據中的變化特征及建筑、林地、水域、道路、農作物等多種目標信息的智能化解譯,一定會受到泛在自然資源應用和管理的歡迎。

未來十年,遙感是否可以深刻地影響社會發展,切實解決了生產生活中的問題,兼具普適性和經濟價值,其關鍵點在于對遙感數據的解譯和應用??萍歼M步給人類帶來的不止是效率的提升、生活質量的改善,更將為人類帶來別樣的認識世界的方式和視角。當腳下的地球被源源不斷地讀取進計算中心,一個全新的認知維度緩緩在我們面前展開,迎來新一輪的技術革新。人工智能技術的出現,恰逢其時,正如吳一戎院士所說,將AI賦能遙感技術,貫穿海量多源異構數據從處理分析到共享應用的全鏈路,將能夠大幅度縮短遙感圖像的解譯周期,催生一些新的遙感應用,并促進遙感數據服務模式的變革,從而共創遙感新時代。


圖文 / 岳漢秋