<var id="v1prt"></var><var id="v1prt"><dl id="v1prt"><listing id="v1prt"></listing></dl></var>
<var id="v1prt"></var>
<var id="v1prt"><strike id="v1prt"><listing id="v1prt"></listing></strike></var>
<var id="v1prt"></var>
<var id="v1prt"><strike id="v1prt"></strike></var><var id="v1prt"><strike id="v1prt"></strike></var>
<var id="v1prt"><strike id="v1prt"></strike></var><var id="v1prt"><video id="v1prt"><thead id="v1prt"></thead></video></var>

基于證據權和卡方自動交互檢測決策樹的滑坡易發性預測

2022-06-22 08:43黃發明石雨歐陽慰平洪安宇曾子強徐富剛
土木建筑與環境工程 2022年5期
關鍵詞:環境因子關聯分析

黃發明 石雨 歐陽慰平 洪安宇 曾子強 徐富剛

摘 要:滑坡與其環境因子間的非線性關聯計算影響滑坡易發性預測建模的不確定性。為研究不確定性因素下易發性建模規律,以中國延長縣為例,獲取82處滑坡和14種環境因子,通過頻率比(Frequency Ratio,FR)和證據權(Weight of Evidence,WOE)等關聯法與卡方自動交互檢測(Chi-squared Automatic Interaction Detector,CHAID)決策樹相耦合進行建模,并用原始環境因子(稱為“原始因子數據”)作為輸入變量的單獨CHAID決策樹進行對比。使用精度、易發性指數均值、標準差和平均秩等評價易發性建模的不確定性。結果表明:WOE-CHAID模型預測的滑坡易發性不確定性低于FR-CHAID模型,可見WOE具有較優秀的非線性關聯性能;單獨CHAID決策樹預測的易發性精度整體略低于WOE-CHAID和FR-CHAID模型,但其建模效率較高;在體現滑坡與其環境因子空間關聯性方面,考慮FR和WOE關聯法的CHAID決策樹模型優勢顯著。WOE是更優秀的關聯分析法,CHAID決策樹預測性能好且預測效率高,WOE-CHAID決策樹模型的易發性預測不確定性較低且更符合實際滑坡概率分布特征。

關鍵詞:滑坡易發性預測;關聯分析;CHAID決策樹;證據權;環境因子

中圖分類號:P642.22 文獻標志碼:A 文章編號:2096-6717(2022)05-0016-13

收稿日期:2021-09-02

基金項目:國家自然科學基金(52109089、41807285)

作者簡介:黃發明(1988- ),男,博士,副教授,主要從事地質災害風險預警研究,E-mail:faminghuang@ncu.edu.cn。

洪安宇(通信作者),女,博士,E-mail:honganyu@ncu.edu.cn。

Received:2021-09-02

Foundation items:National Natural Science Foundation of China (No. 52109089, 41807285)

Author brief:Huang Faming (1988- ), PhD, associate professor, main research interest: geological disaster risk warning, E-mail: faminghuang@ncu.edu.cn.

HONG Anyu (corresponding author), PhD, E-mail: honganyu@ncu.edu.cn.

Landslide susceptibility prediction modeling based on weight of evidence and chi-square automatic interactive detection decision tree

HUANG Faming, SHI Yu, OUYANG Weiping, HONG Anyu, ZENG Ziqiang, XU Fugang

(School of Civil Engineering and Architecture, Nanchang University, Nanchang 330031, P. R. China)

Abstract:

The calculation of the non-linear correlation between the landslide inventories and their environmental factors is an important factor that affects the uncertainty of the landslide susceptibility prediction (LSP) modeling. In order to study the changing patterns of LSP under the influence of the uncertain factors, taking Yanchang County of China as example, 82 landslides and 14 environmental factors are obtained, and the frequency ratio (FR) and weight of evidence (WOE) connection methods are coupled with the chi-squared automatic interaction detector (CHAID) decision tree model to carry out LSP. Then the original environmental factors data (hereinafter referred to as "original data") is used as the input variable to compare the individual CHAID decision tree model to realize the analysis of LSP modeling pattern. ROC accuracy, mean, standard deviation, and average rank are adopted to analyze the uncertainty characteristics in the LSP modeling process. Results show that: 1) LSP uncertainty of the WOE-CHAID model is lower than that of the FR-CHAID model, and WOE has relatively excellent nonlinear correlation performance. 2) The prediction accuracy of individual CHAID decision tree model is slightly lower than that of the WOE-CHAID and FR-CHAID models, but it has higher modeling efficiency. 3) In terms of reflecting the spatial correlation between landslides and its environmental factors, the CHAID decision tree model coupled with FR and WOE connection methods have significant advantages. Generally, WOE is a better connection method and CHAID decision tree model has good prediction performance and high prediction efficiency. Susceptibility prediction by the WOE-CHAID decision tree model is less uncertain and more in line with the actual landslide probability distribution characteristics.

Keywords:landslide susceptibility prediction; connection method; CHAID decision tree; weight of evidence; environmental factor

如何有效開展滑坡易發性預測制圖是現階段全世界范圍內區域滑坡研究的重點和難點。通過將GIS與數據驅動模型相結合,以圖像和數字的方式可構建出更高效準確的易發性預測模型。該易發性制圖的思路對滑坡高發地區的防災減災規劃具有重要意義。

滑坡易發性可定義為特定地點在環境因子非線性耦合作用下發生滑坡的空間概率?;诘乩硐嗨菩砸幝?,即“地理環境越相似,地理特征越相近”可知,通過已經發生滑坡的環境因子來建立預測模型,則潛在滑坡的空間位置有可能被預測。很明顯,從滑坡樣本點中確定滑坡易發性與其環境因子的關系式是易發性預測的關鍵所在,因此,選擇用以獲取輸入變量的滑坡環境因子關聯分析法非常重要。隨著遙感和GIS等基礎數據源獲取技術的進步,易發性建模的空間數據源及其質量有了較大提升。一般而言,具體研究區內的滑坡環境因子類型可通過相關文獻綜述和研究區的自然地理和地質條件確定。筆者重點關注滑坡易發性建模過程中滑坡與其環境因子的非線性關聯分析這一不確定性因素,并進一步研究其對滑坡易發性建模的影響。

啟發式模型、數理統計模型和機器學習模型是易發性預測過程中常用的3種類型。啟發式模型和數理統計模型被大量使用,主要有確定性因子(Certainty Factors,CF)、層次分析法和多元線性回歸等;機器學習相關模型包括邏輯回歸(Logistic Regression,LR)、C5.0決策樹、人工神經網絡、隨機森林(Random Forest,RF)、支持向量機(Support Vector Machines,SVM)、卡方自動交互檢測(Chi-squared Automatic Interaction Detector,CHAID)決策樹和貝葉斯網絡等。對于哪種類型的模型最適合易發性預測,現階段還沒有一致的意見,但優秀的機器學習模型能夠提高滑坡易發性預測精度,對滑坡易發性區間劃分有著顯著影響,并可能進一步改變滑坡易發性級別的劃分。筆者擬用CHAID決策樹這一被廣泛應用的典型機器學習方法構建滑坡易發性模型并探索建模不確定性特征。

在將建模預測出的滑坡易發性指數(Landslide Susceptibility Index,LSIs)與各類環境因子開展聯系時,需開展滑坡與其基礎環境因子(不考慮誘發因子)之間的非線性關聯分析,其關聯值可直接作為易發性模型的輸入變量。目前,常用的關聯分析法包括確定系數、頻率比(Frequency Ratio,FR)、熵指數(Index of Entropy,IOE)和證據權重(Weight of Evidence,WOE)等。不同關聯分析法的內部計算思路具有較大的差異性,導致各方法下的易發性建模存在不確定性。關聯分析法太粗糙會導致部分信息丟失,降低模型預測精度;優秀的關聯分析法能獲取較準確的環境因子影響滑坡發育的信息,進一步提高滑坡環境因子分析及其建模的可靠性??梢?,探討不同關聯分析法對易發性預測建模的影響規律具有重要意義。

學者們采用不同關聯分析法和模型開展易發性預測建模,例如:Zhang等應用IOE模型、LR-IOE和SVM-IOE模型獲得了中國陜西省府谷縣滑坡易發性圖,結果表明,LR-IOE模型的準確率最高,其次是IOE模型和SVM-IOE模型。李文彬等深入探討滑坡與其環境因子間的非線性聯接以及不同數據驅動模型對滑坡易發性預測建模不確定性的影響規律,結果表明,RF模型預測性能最優,WOE-RF模型預測的滑坡易發性不確定性較低。張鐘遠等基于地理信息系統平臺構建了云南省鎮康縣滑坡易發性預測指標體系,結果顯示,頻率比耦合LR模型具有更高的成功率和預測率。但大多數情況下,現有研究使用特定的關聯分析法開展易發性預測建模,而較少提供可信的依據和合理的解釋,并且較少深入探討這種不確定性因素對易發性預測建模的影響。通過探討關聯分析法耦合模型下的滑坡易發性結果的不確定性,更能深入理解易發性預測的可靠性和可行性,可降低關聯分析法不確定性因素帶來的影響。

筆者采用FR和WOE兩種非線性關聯分析法的計算數據值與原始環境因子數據(以下簡稱“原始因子數據”)作為CHAID決策樹模型的輸入變量,以陜西省延長縣為例,開展滑坡易發性預測建模的不確定性分析,包括精度評價、LSIs分布規律和平均秩等。

1 滑坡易發性建模分析

FR和WOE兩種關聯法耦合CHAID決策樹模型時的易發性預測建模流程(圖1)如下:

1)獲取研究區滑坡編錄及相關環境因子數據源以便構建易發性建模的空間數據集;

2)將FR、WOE和原始因子數據作為CHAID決策樹的輸入變量,形成3種耦合模型;

3)分別對3種耦合模型開展易發性預測建模,然后在GIS中繪制滑坡易發性圖并劃分易發性等級;

4)通過ROC精度、均值、標準差和平均秩等對易發性預測結果進行不確定分析;

5)通過對比分析找到最佳關聯分析法,為易發性建模提供指導。

1.1 滑坡與環境因子的關聯分析法

1.1.1 頻率比

頻率比(Frequency Ratio,FR)反映了滑坡在各環境因子類別的分布狀況,闡述環境因子各屬性區間對滑坡的相對影響度,并且能夠很好地解釋滑坡與各因子之間的內在聯系。FR>1代表在對應的環境因子條件下利于滑坡事件的發生;FR<1表明該環境因子區間的屬性與滑坡的發展關系較弱。利用環境因子的FR值作為各模型的輸入變量之一,其計算公式如式(1)。

FR=N/NS/S(1)

式中:N為環境因子某區間中出現的滑坡柵格數;N是全區已知滑坡所分布柵格的總數;S是環境因子的單元數;S是全區柵格總數。

1.1.2 證據權

證據權(Weight of Evidence,WOE)法在貝葉斯準則基礎上綜合各類證據層來實現定量計算某事件的發生概率。WOE法通過將滑坡編錄和各類環境因子層進行空間關聯,從而得到滑坡處各環境因子的詳細分布特征權重因子W+和W-,其在每個環境因子分級中的計算如式(2)、式(3)所示。

W+=lnB/(B+B)D/(D+D)(2)

W-=lnB/(B+B)D/(D+D)(3)

式中:W+和W-分別為環境因子存在區和不存在區的權重值,對于原始因子數據缺失的區域其權重值為0;B和D分別為環境因子存在區的滑坡和非滑坡單元數,B和D分別是環境因子不存在區的滑坡和非滑坡單元數。證據層和滑坡點正相關時,W+>0和W-<0,負相關時,W+<0和W->0,在不相關或數據缺失時,權重為0。進一步利用相對系數C=W+-W-實現證據層和滑坡間相關性的衡量。

1.2 卡方自動交互檢測決策樹

CHAID決策樹以卡方統計量為基礎實現最優決策樹構建,也就是通過自變量和因變量間的解釋性來實現因變量的自動判別。CHAID決策樹具有強大的非線性擬合預測性能,能容忍樣本數據缺失及樣本量不足等缺陷。CHAID模型設定樹生長的層數、分裂及聚合閾值等停止標準來構建準確高效的預測或分類模型,同時,為防止過擬合現象而用隨機分成的訓練樣本構建模型;最后再利用隨機分成的測試樣本對CHAID進行逐步檢驗,以修正模型參數。

1.3 不確定性分析方法

1.3.1 ROC 曲線精度分析

采用受試者工作特征(Receiver Operating Characteristic,ROC)曲線下面積(Area Under ROC,AUC)值作為一種量化指標來整體評估建模性能。ROC曲線對測試集中各樣例進行排序并依序選擇各截斷點,再逐個把樣例作為正例來進行計算,依據當前分類器的“真陽率”和“假陽率”進行ROC曲線的繪制,相關評價指標如表1所示。AUC值等于隨機挑選的正樣本的排名高于隨機挑選的負樣本的概率,AUC值越大,則易發性模型預測性能越好。

1.3.2 易發性指數統計規律分析

均值(Mean)是集中趨勢的測量,計算如式(4)所示(式中:X為第n個柵格單元的滑坡易發性指數值),其量化了研究區LSIs分布的整體偏向趨勢,反映了LSIs分布的平均水平。標準差(Standard Deviation)是對圍繞平均值的離差的測量,計算如式(5)所示(式中:μ為滑坡易發性指數均值;X為第i個柵格單元的滑坡易發性指數值),量化了LSIs分布的離散程度,標準差越小,說明LSIs越接近平均值,反之,則說明其與平均值的差異越大。采用均值和標準差從整體上分析LSIs的分布特征,揭示不同關聯分析法和模型耦合模型下的預測性能,為滑坡易發性研究提供理論指導。

Mean=X+X+…+Xn(4)

Standard Deviation=1N∑Ni=1X-μ(5)

1.3.3 易發性指數的差異顯著性

采用顯著性差異水平進一步分析各耦合模型下易發性建模的不確定性。具體采用Kendall協同系數檢驗法,對任意兩組不同耦合模型下預測出的LSIs進行差異顯著性檢驗。若Kendall秩相關系數W小于1及檢驗結果的顯著性小于0.05,說明這兩組耦合模型下LSIs的差異是顯著的,拒絕原假設。本文通過成對因子顯著性檢驗發現,W值為0.139,小于1,且P值均小于0.05,可見,各耦合模型下的LSIs間差異顯著。

2 延長縣簡介及環境因子分析

2.1 延長縣簡介及滑坡編錄

延長縣位于陜西東部,面積約2 368.7 km,地勢從西北向東南方向傾斜??h境內屬黃土高原丘陵溝壑區(河谷階地、黃土溝谷區、黃土溝間區和巖質丘陵區),出露三疊系中上統內陸湖相碎屑沉積巖和第四系風積、沖洪積和堆積黃土等地層,新近系砂礫巖在研究區出露較少(圖2)。另外,縣境內地質構造活動強度低,屬于暖溫帶干旱大陸性季風氣候,年均降雨量約564 mm且集中在7、8、9月份。

根據已有的滑坡野外調查資料和數據庫可知,延長縣共發生滑坡82處,主要類型為小型淺層覆蓋滑坡,主要運動方式為牽引式(59%)和推移式滑動(41%);縣境內的小型滑坡45處(占比54.8%),中型滑坡36處(占比43.9%),大型滑坡只有1處。延長縣滑坡分布位置如圖2所示,滑坡主要分布在縣域西部及周邊地區,東部和中部較少;大部分發生滑坡的位置地勢較高,距離河流水系也較近。延長縣滑坡的發生與地層巖性和工程活動密切相關。

2.2 環境因子分析

2.2.1 環境因子介紹

根據延長境內滑坡的特征及相關參考文獻的介紹,利用遙感影像和GIS軟件系統從數據源中提取14類滑坡環境因子,包括地形、水文、地表覆被和基礎地質等。其中,高程、NDVI、NDBI和MNDWI等12個因子為連續型數據,而距河流距離和地層巖性2個因子為離散型數據(表2)。對于連續型環境因子,先通過小間隔對該因子進行等分,再依據FR和WOE值將數值相近的區間合并成一個類別。對于離散型數據類型的環境因子,采用固有的自然分組來進行分級:距河流距離因子按照距河流距離100、300、400、500、800、900、1 000 m和大于1 000 m進行分類;地層巖性因子為三疊系砂巖夾砂質泥巖和油頁巖(Tt)、三疊系厚層砂巖夾泥巖(Th)、三疊系細砂層粉砂巖夾與泥巖互層(Ty)、三疊系厚層狀長石石英砂巖(Tw)和第四系更新統風積和洪積黃土(Q)。另外,在使用原始因子數據作為CHAID決策樹模型的輸入變量時,將距河流的距離和地層巖性兩種離散型數據類型的環境因子進行了“啞變量”處理。

2.2.2 地形地貌因子

高程、坡度、坡向、剖面曲率、平面曲率、地形起伏度、地形粗糙度、地形切割深度和地形濕度指數等環境因子均從DEM中提?。▓D3) 。以地形起伏度為例,分析其8個等級區間內的FR和WOE值(表2),發現滑坡發生概率與研究區的地形起伏度大小成正比。在20~4區間內發生滑坡的概率最大,為78.34%;其中,FR值均大于1,WOE值均為正值,35~40區域內FR和WOE值最大,分別為2.843和1.148。FR和WOE值都顯示出地形起伏度大小與滑坡發生有著較強的正向相關性,可見關聯分析法在表達滑坡與地形起伏度的非線性關聯性時具有較為一致的趨勢和計算效果。

2.2.3 水文環境因子

由于河流對邊坡的浸潤和侵蝕作用,越靠近河流的邊坡土壤含水量可能越高,導致斜坡體失穩的可能性更高。利用距河流距離和MNDWI來表征水文環境對滑坡發育的影響。以距河流的距離因子為例(表2),當距河流距離小于400 m時,滑坡發育的可能性更高(達74.41%),其中,FR值均大于1,WOE值均為正值;在100~300 m區域內,FR和WOE值最大,分別為1.873和0.992。

2.2.4 地表覆被因子

NDBI和NDVI分別反映了研究區域內的建筑分布和自然植被對滑坡地質災害發育的影響。從表2可知,當NDVI在0.121~0.424范圍內時,其與滑坡有較強的關系,該區間包括了研究區內近年來所有的已發生的滑坡;其中,在0.121~0.182范圍內,FR值大于1且WOE值為正數。NDBI能較好地反映研究區域內建筑的分布情況,當NBVI在0.730~0.949范圍內時幾乎囊括了近年來研究區內所有的滑坡,間接反映了人類工程建設對滑坡發育的影響。

2.2.5 基礎地質因子

巖土類型表征滑坡體的物質基礎,分析表2可知,Th和Ty巖性區域面積僅占延長縣面積的10.6%,而區域內滑坡發生的概率高達23.2%,且FR值均大于1、WOE值均為正值,說明Th和Ty巖性區域內滑坡發生的頻率較高;在Q巖性條件下,滑坡發生概率高達76.8%;在Tt巖性區域內,無滑坡分布;Tw巖性區域在研究區內占比比較小,結果不具有研究意義。

3 延長縣滑坡易發性預測建模

3.1 數據準備

30 m分辨率的柵格被廣泛用作滑坡易發性的制圖單元,基于30 m分辨率,整個延長縣被劃分為2 622 482個柵格,已發生的82處滑坡被劃分為3 403個滑坡柵格。通過FR和WOE兩種關聯法對14個環境因子各屬性區間進行重新賦值,作為CHAID決策樹開展易發性建模的輸入變量;同時,也以原始因子數據作為輸入變量開展單獨CHAID決策樹的滑坡易發性建模。通過SPSS modeler 18.0軟件把3 403個滑坡柵格單元賦值為1,同時隨機挑選與滑坡單元相同數量的非滑坡單元,并將其易發性賦值為0,作為模型輸出變量;然后按7∶3隨機劃分滑坡和非滑坡柵格單元(6 806個)及其相關屬性值,得到模型訓練集和測試集。最后將整個研究區柵格單元的FR和WOE關聯分析值以及原始因子數據代入訓練好的模型中,預測延長縣LSIs,并將其按照自然間斷點法劃分為5個易發性級別。

3.2 延長滑坡易發性預測結果

在SPSS modeler軟件中進行CHAID決策樹建模。以WOE樣本數據為例,首先需從外部源中讀取源節點,將6 806個滑坡非滑坡樣本數據導入SPSS modeler軟件中;接著對字段屬性、測量級別及各字段在建模中的角色進行選擇或修改;再經由分區選擇將樣本數據分為訓練集(70%)和測試集(30%);然后在CHAID建模節點字段選項卡中使用預定義角色,應用boosting算法創建一個整體,由其生成模型序列以增強模型預測的準確度;選擇CHAID樹生長算法并定制樹的最大深度值為5、父節點的最小記錄數為75、子節點的最小記錄數為15,以此來限制決策樹的增長;CHAID決策樹的其他參數使用SPSS modeler中的默認值;最后將整體環境因子的WOE帶入訓練好的CHAID決策樹模型中,實現延長縣滑坡LSIs的準確預測。FR-CHAID和單獨CHAID決策樹模型的建模步驟和參數設置與WOE-CHAID決策樹模型基本一致。

3.3 滑坡易發性制圖表達

分兩步開展滑坡易發性制圖,首先將3種耦合模型預測出的LSIs導入GIS軟件中,然后依據自然間斷點法將延長縣滑坡易發性劃分為極高、高、中等、低和極低5類等級區間。WOE-CHAID、FR-CHAID和單獨CHAID決策樹模型下的滑坡易發性結果如圖4所示。延長縣大部分地區屬于低和極低易發區,滑坡高和極高易發區主要位于坡度和高程中等且距離河流較近的山地丘陵地區。但3種耦合模型下得到的滑坡易發性級別存在顯著差異,圖4中延長縣內已發生的82處滑坡幾乎都落在WOE-CHAID和FR-CHAID決策樹模型預測的極高與高易發性等級區域內,而單獨CHAID決策樹模型預測的極高與高易發性等級區域與82處滑坡位置存在些許偏差。

4 滑坡易發性預測不確定性分析

4.1 ROC精度評價

采用測試集AUC值作為具體指標量化不同耦合模型的預測性能,AUC值越大,表明耦合模型預測性能越優。WOE-CHAID、FR-CHAID和單獨CHAID決策樹模型的滑坡易發性結果ROC曲線如圖5所示。從圖5中可知,3種耦合模型下的結果均較好且相對穩定,表現出良好的滑坡易發性性能。AUC精度從大到小依次為:AUC(WOE-CHAID)>AUC(FR-CHAID)>AUC(單獨的CHAID),說明FR和WOE兩種關聯分析法在CHAID決策樹模型中具有比原始因子數據更穩定的易發性預測性能。WOE耦合CHAID決策樹模型的易發性預測效果最好且預測效率最高,AUC精度較FR提高了2.1%,較原始因子數據提高了3.1%。

4.2 滑坡易發性指數分布規律

采用均值和標準差分別反映LSIs分布的平均水平和離散程度,并以此分析耦合模型下的易發性預測不確定性。WOE-CHAID、FR-CHAID和單獨CHAID決策樹模型預測的LSIs分布不確定性規律較為一致,在極低和低易發區分布較集中而在高和極高易發區分布逐漸減少。LSIs平均值從小到大排名為:單獨的CHAID (0.364)<FR-CHAID(0.385)<WOE-CHAID(0.399);標準差從小到大排名為:FR-CHAID(0.178)<WOE-CHAID(0.219)<單獨的CHAID(0.228)(圖6)。其中,WOE-CHAID決策樹模型預測的LSIs平均值較小,標準差較大,表明其對研究區內的滑坡均有較好

的識別能力,另外,對滑坡易發性的區分度也較好,能很好地反映出不同柵格單元內LSIs的差異,用較少的高LSIs反映盡可能多的滑坡編錄信息。結合AUC精度發現,WOE-CHAID決策樹模型預測效果略好于FR-CHAID決策樹模型,單獨的CHAID決策樹模型預測效果最差。

4.3 耦合模型預測易發性指數的差異性分析

采用顯著性差異水平來進一步分析各耦合模型下易發性建模的不確定性,通過該試驗計算各耦合模型下預測的LSIs的平均秩,以便對易發性模型性能排序。平均秩越小則模型性能越好,最終模型比較結果為:WOE-CHAID決策樹模型預測LSIs的平均秩(值為1.85)最小,其次是FR-CHAID(值為2.06) 和單獨的CHAID決策樹(值為2.09)模型。顯著性差異水平和平均秩顯示出各耦合模型的易發性建模存在不確定性,如何規避這些不確定性是獲得可靠的易發性模型的重要研究內容。

4.4 滑坡環境因子重要性分析

滑坡環境因子的重要性反映了已發生的滑坡事件受該環境因子影響程度的大小。由于原始因子數據和不同的關聯分析值在易發性預測建模中有著不同的表現,基于CHAID決策樹模型中自帶的分類器屬性來評估在原始因子數據、FR和WOE等輸入變量下各個環境因子的重要性。另外,易發性建模中共使用14個環境因子(原始因子數據含“啞變量”類型,共23個環境因子),排名10名之后的環境因子重要性均小于0.04,因此僅展示重要性排名前10的環境因子。從圖7可知,坡度、地形起伏度、距河流的距離(原始因子數據中為100~300 m和500~800 m的兩個“啞變量”因子)、地形切割深度和地形粗糙度等5個環境因子在單獨CHAID、FR-CHAID和WOE-CHAID決策樹易發性預測中有著較大的貢獻,占據重要性排名均在前5位,重要性均大于0.08。其次,平面曲率和地形濕度指數在所有決策樹模型中也發揮著相對重要的作用,重要性均大于0.04。

4.5 各關聯分析法的性能分析

關聯分析法通過定量統計可直觀表現各環境因

子不同屬性區間對滑坡易發性空間的影響性。Li等、Saha等對上述部分關聯分析法反映滑坡與其環境因子空間關聯的性能進行了對比分析,所得結果與筆者研究基本一致。由上述分析可知,環境因子與滑坡間的空間信息的關聯性表達越充分,則LSIs的區分度越大,進一步的易發性預測效果就越佳。在FR和WOE關聯分析法的環境因子分級中,WOE更能反映環境因子內部影響滑坡發育的空間信息的差異,具有更優的預測精度(AUC=86.3%);FR相較于WOE法更加簡潔高效,在保證易發性精度的同時能有效避免太復雜的統計分析;基于原始因子數據進行的單獨CHAID決策樹模型易發性預測精度略小于FR-CHAID和WOE-CHAID決策樹模型。此外,單獨的CHAID、FR-CHAID和WOE-CHAID決策樹模型預測的LSIs平均值逐漸減小而標準差逐漸增大,且平均秩也逐漸減小??梢婈P聯分析法的易發性預測建模效果較好,WOE優于FR,而原始因子數據的易發性建模效果較差。

由文獻[27,42]可知,滑坡與環境因子(不考慮誘發因子)之間的非線性關聯分析法種類繁多。筆者僅使用FR和WOE兩種關聯分析法耦合CHAID決策樹模型進行滑坡易發性的不確定性對比分析而并未考慮其他關聯分析法,在下一步研究中可以考慮使用概率法、信息量、確定性系數和熵指數等其他關聯分析法,耦合多種不同類型的模型開展更加全面的易發性預測不確定性分析。

5 結論

1)WOE-CHAID決策樹模型易發性預測的AUC精度最高,且均值和平均秩較小,標準差較大;FR-CHAID決策樹的AUC精度略低于WOE-CHAID,可見WOE具有更優秀的非線性關聯性能。

2)將原始因子直接用作輸入變量的單獨CHAID決策樹模型的易發性預測精度整體略低于關聯分析法的耦合模型。為了提高滑坡易發性建模效率,可直接使用單獨CHAID決策樹模型,但要體現滑坡與其環境因子的空間關聯性或分析環境因子各子區間對滑坡發育的影響規律,則使用關聯分析法和CHAID決策樹模型耦合建模的優勢顯著。

3)總體來說,WOE-CHAID決策樹模型的易發性預測結果可靠性最高,預測出的LSIs與實際的滑坡概率分布特征更加相符。

參考文獻:

[1] 黃發明, 殷坤龍, 蔣水華, 等. 基于聚類分析和支持向量機的滑坡易發性評價[J]. 巖石力學與工程學報, 2018, 37(1): 156-167.

HUANG F M, YIN K L, JIANG S H, et al. Landslide susceptibility assessment based on clustering analysis and support vector machine [J]. Chinese Journal of Rock Mechanics and Engineering, 2018, 37(1): 156-167. (in Chinese)

[2] 黃發明, 葉舟, 姚池, 等. 滑坡易發性預測不確定性:環境因子不同屬性區間劃分和不同數據驅動模型的影響[J]. 地球科學, 2020, 45(12): 4535-4549.

HUANG F M, YE Z, YAO C, et al. Uncertainties of landslide susceptibility prediction: Different attribute interval divisions of environmental factors and different data-based models [J]. Earth Science, 2020, 45(12): 4535-4549. (in Chinese)

[3] 李利峰, 張曉虎, 鄧慧琳, 等. 基于熵指數與邏輯回歸耦合模型的滑坡災害易發性評價: 以藍田縣為例[J]. 科學技術與工程, 2020, 20(14): 5536-5543.

LI L F, ZHANG X H, DENG H L, et al. Assessment of landslide susceptibility based on coupling model of index of entropy and logistic regression: A case study of Lantian County [J]. Science Technology and Engineering, 2020, 20(14): 5536-5543. (in Chinese)

[4] HUANG F M, CAO Z S, JIANG S H, et al. Landslide susceptibility prediction based on a semi-supervised multiple-layer perceptron model [J]. Landslides, 2020, 17(12): 2919-2930.

[5] HUANG F M, CAO Z S, GUO J F, et al. Comparisons of heuristic, general statistical and machine learning models for landslide susceptibility prediction and mapping [J]. CATENA, 2020, 191: 104580.

[6] 楊光, 徐佩華, 曹琛, 等. 基于確定性系數組合模型的區域滑坡敏感性評價[J]. 工程地質學報, 2019, 27(5): 1153-1163.

YANG G, XU P H, CAO C, et al. Assessment of regional landslide susceptibility based on combined model of certainty factor method [J]. Journal of Engineering Geology, 2019, 27(5): 1153-1163. (in Chinese)

[7] 許嘉慧, 孫德亮, 王月, 等. 基于GIS與改進層次分析法的奉節縣滑坡易發性區劃[J]. 重慶師范大學學報(自然科學版), 2020, 37(2): 36-44, 2, 142.

XU J H, SUN D L, WANG Y, et al. Landslide susceptibility mapping of Fengjie County based on GIS and improved analytic hierarchy process [J]. Journal of Chongqing Normal University (Natural Science), 2020, 37(2): 36-44, 2, 142. (in Chinese)

[8] 黃發明, 陳佳武, 唐志鵬, 等. 不同空間分辨率和訓練測試集比例下的滑坡易發性預測不確定性[J]. 巖石力學與工程學報, 2021, 40(6): 1155-1169.

HUANG F M, CHEN J W, TANG Z P, et al. Uncertainties of landslide susceptibility prediction due to different spatial resolutions and different proportions of training and testing datasets [J]. Chinese Journal of Rock Mechanics and Engineering, 2021, 40(6): 1155-1169. (in Chinese)

[9] 楊永剛, 殷坤龍, 趙海燕, 等. 基于C5.0決策樹-快速聚類模型的萬州區庫岸段鄉鎮滑坡易發性區劃[J]. 地質科技情報, 2019, 38(6): 189-197.

YANG Y G, YIN K L, ZHAO H Y, et al. Landslide susceptibility evaluation for township units of bank section in Wanzhou district based on C5.0 decision tree and K-means cluster model [J]. Geological Science and Technology Information, 2019, 38(6): 189-197. (in Chinese)

[10] 田乃滿, 蘭恒星, 伍宇明, 等. 人工神經網絡和決策樹模型在滑坡易發性分析中的性能對比[J]. 地球信息科學學報, 2020, 22(12): 2304-2316.

TIAN N M, LAN H X, WU Y M, et al. Performance comparison of BP artificial neural network and CART decision tree model in landslide susceptibility prediction [J]. Journal of Geo-Information Science, 2020, 22(12): 2304-2316. (in Chinese)

[11] 喬世范, 王超. 基于遺傳模擬退火算法的滑坡位移預測方法 [J]. 土木與環境工程學報(中英文), 2021, 43(1): 25-35.

QIAO S F, WANG C. Landslide displacement prediction based on the Genetic Simulated Annealing algorithm[J]. Journal of Civil and Environmental Engineering, 2021, 43(1): 25-35. (in Chinese)

[12] 吳潤澤, 胡旭東, 梅紅波, 等. 基于隨機森林的滑坡空間易發性評價:以三峽庫區湖北段為例[J]. 地球科學, 2021, 46(1): 321-330.

WU R Z, HU X D, MEI H B, et al. Spatial susceptibility assessment of landslides based on random forest: A case study from Hubei section in the Three Gorges reservoir area [J]. Earth Science, 2021, 46(1): 321-330. (in Chinese)

[13] 牛瑞卿, 彭令, 葉潤青, 等. 基于粗糙集的支持向量機滑坡易發性評價[J]. 吉林大學學報(地球科學版), 2012, 42(2): 430-439.

NIU R Q, PENG L, YE R Q, et al. Landslide susceptibility assessment based on rough sets and support vector machine [J]. Journal of Jilin University (Earth Science Edition), 2012, 42(2): 430-439. (in Chinese)

[14] ALTHUWAYNEE O F, PRADHAN B, AHMAD N. Landslide susceptibility mapping using decision-tree based Chi-squared automatic interaction detection (CHAID) and Logistic regression (LR) integration [J]. IOP Conference Series: Earth and Environmental Science, 2014, 20: 012032.

[15] CHEN W W, ZHANG S. GIS-based comparative study of Bayes network, Hoeffding tree and logistic model tree for landslide susceptibility modeling [J]. CATENA, 2021, 203: 105344.

[16] DEMIR G. GIS-based landslide susceptibility mapping for a part of the North Anatolian Fault Zone between Re?adiye and Koyulhisar (Turkey) [J]. CATENA, 2019, 183: 104211.

[17] 張玘愷, 凌斯祥, 李曉寧, 等. 九寨溝縣滑坡災害易發性快速評估模型對比研究[J]. 巖石力學與工程學報, 2020, 39(8): 1595-1610.

ZHANG Q K, LING S X, LI X N, et al. Comparison of landslide susceptibility mapping rapid assessment models in Jiuzhaigou County, Sichuan Province, China [J]. Chinese Journal of Rock Mechanics and Engineering, 2020, 39(8): 1595-1610. (in Chinese)

[18] HUANG F M, ZHANG J, ZHOU C B, et al. A deep learning algorithm using a fully connected sparse autoencoder neural network for landslide susceptibility prediction [J]. Landslides, 2020, 17(1): 217-229.

[19] 劉璐瑤, 高惠瑛. 基于證據權與Logistic回歸模型耦合的滑坡易發性評價[J/OL]. 工程地質學報. https://doi.org/10.13544/j.cnki.jeg.2020-482.

LIU L Y, GAO H Y. Landslide susceptibility assessment based on coupling of WOE model and Logistic regression model [J/OL]. Journal of Engineering Geology. https://doi.org/10.13544/j.cnki.jeg.2020-482. (in Chinese)

[20] 徐勝華, 劉紀平, 王想紅, 等. 熵指數融入支持向量機的滑坡災害易發性評價方法: 以陜西省為例[J]. 武漢大學學報·信息科學版, 2020, 45(8): 1214-1222.

XU S H, LIU J P, WANG X H, et al. Landslide susceptibility assessment method incorporating index of entropy based on support vector machine: A case study of Shaanxi Province [J]. Geomatics and Information Science of Wuhan University, 2020, 45(8): 1214-1222. (in Chinese)

[21] 楊華陽, 許向寧, 楊鴻發. 基于證據權法的九寨溝地震滑坡危險性評價[J]. 中國地質災害與防治學報, 2020, 31(3): 20-29.

YANG H Y, XU X N, YANG H F. The Jiuzhaigou co-seismic landslide hazard assessment based on weight of evidence method [J]. The Chinese Journal of Geological Hazard and Control, 2020, 31(3): 20-29. (in Chinese)

[22] ZHANG T Y, HAN L, CHEN W, et al. Hybrid integration approach of entropy with logistic regression and support vector machine for landslide susceptibility modeling [J]. Entropy, 2018, 20(11): 884.

[23] 李文彬, 范宣梅, 黃發明, 等. 不同環境因子聯接方法和數據驅動模型對滑坡易發性預測建模的影響規律[J/OL]. 地球科學. https://kns.cnki.net/kcms/detail/42.1874.P.20210506.1457.004.html.

LI W B, FAN X M, HUANG F M, et al. Influence law of different environmental factor connection methods and data-based models on landslide susceptibility prediction modeling [J/OL]. Earth Science. https://kns.cnki.net/kcms/detail/42.1874.P.20210506.1457.004.html. (in Chinese)

[24] 張鐘遠, 鄧明國, 徐世光, 等. 鎮康縣滑坡易發性評價模型對比研究 [J]. 巖石力學與工程學報, 2022, 41(1):157-171.

ZHANG Z Y, DENG M G, XU S G, et al. Comparison of landslide susceptibility assessment models in Zhenkang County, Yunnan Province, China [J/OL]. Chinese Journal of Rock Mechanics and Engineering. 2022, 41(1):157-171. (in Chinese)

[25] 郭子正, 殷坤龍, 黃發明, 等. 基于滑坡分類和加權頻率比模型的滑坡易發性評價[J]. 巖石力學與工程學報, 2019, 38(2): 287-300.

GUO Z Z, YIN K L, HUANG F M, et al. Evaluation of landslide susceptibility based on landslide classification and weighted frequency ratio model [J]. Chinese Journal of Rock Mechanics and Engineering, 2019, 38(2): 287-300. (in Chinese)

[26] KONTOES C, LOUPASAKIS C, PAPOUTSIS I, et al. Landslide susceptibility mapping of central and western Greece, combining NGI and WoE methods, with remote sensing and ground truth data [J]. Land, 2021, 10(4): 402.

[27] LI W B, FAN X M, HUANG F M, et al. Uncertainties analysis of collapse susceptibility prediction based on remote sensing and GIS: Influences of different data-based models and connections between collapses and environmental factors [J]. Remote Sensing, 2020, 12(24): 4134.

[28] 車文超, 秦勝伍, 苗強, 等. 滑坡敏感性評價中因子分類方法的研究 [J]. 工程地質學報, 2020, 28(Sup1): 116-124.

CHE W C, QIN S W, MIAO Q, et al. Research on factor classification method of landslide susceptibility mapping [J]. [J].Journal of Engineering Geology, 2020, 28(Sup1): 116-124. (in Chinese)

[29] 羅路廣, 裴向軍, 崔圣華, 等. 九寨溝地震滑坡易發性評價因子組合選取研究[J]. 巖石力學與工程學報, 2021, 40(11): 2306-2319.

LUO L G, PEI X J, CUI S H, et al. Combined selection of susceptibility assessment factors for Jiuzhaigou earthquake-induced landslides [J]. Chinese Journal of Rock Mechanics and Engineering, 2021, 40(11): 2306-2319. (in Chinese)

[30] GUO Z Z, SHI Y, HUANG F M, et al. Landslide susceptibility zonation method based on C5.0 decision tree and K-means cluster algorithms to improve the efficiency of risk management [J]. Geoscience Frontiers, 2021, 12(6): 101249.

[31] 郭天頌, 張菊清, 韓煜, 等. 基于粒子群優化支持向量機的延長縣滑坡易發性評價[J]. 地質科技情報, 2019, 38(3): 236-243.

GUO T S, ZHANG J Q, HAN Y, et al. Evaluation of landslide susceptibility in Yanchang County based on particle swarm optimization-based support vector machine [J]. Geological Science and Technology Information, 2019, 38(3): 236-243. (in Chinese)

[32] HUANG F M, TAO S Y, CHANG Z L, et al. Efficient and automatic extraction of slope units based on multi-scale segmentation method for landslide assessments [J]. Landslides, 2021, 18(11): 3715-3731.

[33] 沈玲玲, 劉連友, 許沖, 等. 基于多模型的滑坡易發性評價: 以甘肅岷縣地震滑坡為例[J]. 工程地質學報, 2016, 24(1): 19-28.

SHEN L L, LIU L Y, XU C, et al. Multi-models based landslide susceptibility evaluation: Illustrated with landslides triggered by Minxian earthquake [J]. Journal of Engineering Geology, 2016, 24(1): 19-28. (in Chinese)

[34] 楊世豪, 蘇立君, 張崇磊, 等. 強降雨作用下昔格達邊坡滲流特性及穩定性分析[J]. 土木與環境工程學報(中英文), 2020, 42(4): 19-27.

YANG S H, SU L J, ZHANG C L, et al. Analysis of seepage characteristics and stability of Xigeda formation slope under heavy rainfall [J]. Journal of Civil and Environmental Engineering, 2020, 42(4): 19-27. (in Chinese)

[35] 于憲煜, 胡友健, 牛瑞卿. 基于RS-SVM模型的滑坡易發性評價因子選擇方法研究[J]. 地理與地理信息科學, 2016, 32(3): 23-28, 2.

YU X Y, HU Y J, NIU R Q. Research on the method to select landslide susceptibility evaluation factors based on RS-SVM model [J]. Geography and Geo-Information Science, 2016, 32(3): 23-28, 2. (in Chinese)

[36] 吳雨辰, 周晗旭, 車愛蘭. 基于粗糙集神經網絡的IBURI地震滑坡易發性研究[J]. 巖石力學與工程學報, 2021, 40(6): 1226-1235.

WU Y C, ZHOU H X, CHE A L. Susceptibility of landslides caused by IBURI earthquake based on rough set-neural network [J]. Chinese Journal of Rock Mechanics and Engineering, 2021, 40(6): 1226-1235. (in Chinese)

[37] 黃發明, 汪洋, 董志良, 等. 基于灰色關聯度模型的區域滑坡敏感性評價[J]. 地球科學, 2019(2): 664-676.

HUANG F M, WANG Y, DONG Z L, et al. Regional landslide susceptibility mapping based on grey relational degree model [J]. Earth Science, 2019(2): 664-676. (in Chinese)

[38] 許英姿, 盧玉南, 李東陽, 等. 基于GIS和信息量模型的廣西花崗巖分布區滑坡易發性評價[J]. 工程地質學報, 2016, 24(4): 693-703.

XU Y Z, LU Y N, LI D Y, et al. GIS and information model based landslide susceptibility assessment in granite area of Guangxi Province [J]. Journal of Engineering Geology, 2016, 24(4): 693-703. (in Chinese)

[39] 解明禮, 巨能攀, 趙建軍, 等. 區域地質災害易發性分級方法對比分析研究[J]. 武漢大學學報·信息科學版, 2021, 46(7): 1003-1014.

XIE M L, JU N P, ZHAO J J, et al. Comparative analysis on classification methods of geological disaster susceptibility assessment [J]. Geomatics and Information Science of Wuhan University, 2021, 46(7): 1003-1014. (in Chinese)

[40] ZHU L, WANG G J, HUANG F M, et al. Landslide susceptibility prediction using sparse feature extraction and machine learning models based on GIS and remote sensing [J]. IEEE Geoscience and Remote Sensing Letters, 4029, PP(99): 1-5.

[41] SAHA A, SAHA S. Comparing the efficiency of weight of evidence, support vector machine and their ensemble approaches in landslide susceptibility modelling: A study on Kurseong region of Darjeeling Himalaya, India [J]. Remote Sensing Applications: Society and Environment, 2020, 19: 100323.

[42] SANDRIC I, IONITA C, CHITU Z, et al. Using CUDA to accelerate uncertainty propagation modelling for landslide susceptibility assessment [J]. Environmental Modelling & Software, 2019, 115: 176-186.

(編輯 胡玲)

猜你喜歡
環境因子關聯分析
玉米骨干親本及其衍生系中基因的序列變異及與株高等性狀的關聯分析
玉米骨干親本及其衍生系中基因的序列變異及與株高等性狀的關聯分析
基于隨機函數Petri網的系統動力學關聯分析模型
關聯分析技術在學生成績分析中的應用
桉樹人工林胸徑變化特征與環境因子的關系研究
基于關聯分析的學生活動參與度與高校社團管理實證研究
不同的數據挖掘方法分類對比研究
氨氧化微生物在氮循環中的生態功能及其影響因子
秦皇島海域夜光藻種群密度與環境因子的關系
亚洲欧洲无码精品Ⅴa