生存分析法在供水管網爆管分析中的應用
何 芳1 吳 徐2 戴 盛2 劉遂慶3
(1廣東省佛山市供水總公司 2江蘇省鎮江市自來水公司 3同濟大學環境科學與工程學院)
摘要:本文提出應用生存分析法對國內城市供水管網爆管事故進行分析,介紹了生存分析的概念以及生存分析的三種方法,闡述了采用生存分析法分析爆管的優越性,探索解決爆管問題的新思路和新方法。結合江蘇某市供水管道爆管數據記錄,用生存分析法中的非參數分析法對供水管道進行生存分析,繪制供水管道生存曲線和危險函數曲線,描述管道生存現狀和危險程度。
關鍵詞:供水管網 爆管 生存分析 模型
前言
我國對供水管網爆管分析研究一般以傳統的描述性統計方法為主。該方法用于爆管分析主要指按管徑、管材、爆管時間(年、月、日)、損壞原因而進行分類、分組、匯總統計,并通過圖表形式對所收集的數據進行加工處理和顯示,進而通過綜合、概括和分析得出反映客觀現象的規律性特征。因此,它只能估算預測某一組或某一類管道的損壞趨勢,而不能對單獨管道的損壞情況提供有效的信息,也不能解釋眾多影響因素(后面被稱為解釋性變量或協變量)之間復雜的相互關系。
在供水管網爆管分析中引入生存分析方法,可以在考慮多種爆管影響因素的條件下,對某單一管道損壞趨勢或事故危險性進行預測的水平。供水管道的生存分析是以爆管的維護記錄為管道生存數據樣本,繪制管道生存曲線、危險曲線,并建立管道危險函數方程,對管道的生存現狀進行估計預測。預測結果可以為制定有效的防治爆管措施提供依據。國外已有用生存分析法研究爆管問題的應用實例,例如挪威的S.Sagrov,加拿大的Genevieve Pelletiter等研究者,其研究的成果已應用到供水管網的運行管理中【1】。
本文研究內容是該方法在國內爆管分析中應用的一次探索性嘗試,以期為解決目前供水管網普遍存在的爆管問題開拓了一條新思路。
1 生存分析方法簡介
生存分析目前廣泛應用于生物醫學、工業、社會科學、商業等領域,尤其以在醫學、生物和保險學領域應用最頻繁。隨著工程上對可靠性要求的不斷提高,生存分析的方法已經開始在工程中被采用。
生存分析就是對收集來的生存數據進行處理,生存數據包括生存時間以及其影響因素。此時,生存是一個廣義的概念,是某事件某狀態的持續。生存分析是研究多種影響因素與生存時間有無聯系以及聯系程度的大小,是一種既考慮時間又考慮結果的統計方法,并可充分利用截尾數據提供的不完全信息。生存時間是指從某起點事件開始到被觀測對象出現終點事件所經歷的時間。生存時間的單位可以用年,月,周,日,甚至時,分,秒等表示。
生存分析的方法包括2種:【5】(1)非參數法:包括生命表法、乘積極限法(K-M法)和Log-rank檢驗,其中生命表法、乘積極限法用于估計生存率,Log-rank檢驗用于單因素預后分析;(2)參數法;參數法包括兩類,即生存時間T的比例危險模型和LogT的位置-尺度模型。比例危險模型又包括Cox模型、指數模型、威布爾模型、對數正態模型、對數logistic模型等,其中以COX比例危險模型應用最為靈活,故被廣泛使用。
COX比例危險模型是一種不考慮壽命分布類型的方法,故又被稱為半參數法。該模型可以辨認與壽命時間強相關的多個協變量,并分析生存時間(或生存率)與多個危險因素之間的定量關系。其模型的基本結構為:
h(t,X)=ho(t)·exp(b1X1+b2X2+…+bpXp)
式中,X1,X2…,Xp為影響預后因素,h(t,x)為危險度,即時刻t的失效率;
ho(t)為當所有因素(自變量)Xk都取0時的危險度,是時刻t的基準失效率(或稱本底失效率);
bi為偏回歸系數,代表該因素作用的大小(不隨時間變化)。
exp(bkXk)表示第k個因素Xk所產生的作用,此項作用就是使失效率ho(t)增至ho(t)·exp(bkXk),k=1,2,…,p。參數bk采用極大似然法進行估計。
LogT的位置-尺度模型也稱加速失效時間模型(Accelerated Failure Time Models),通常以下列模型表示:
Y=LnT=
其中,βi是未知參數;σ叫做刻度參數;Z是隨機項,其分布通常叫基準分布。
常用的壽命基準分布函數有:Weibull型、對數正態型、對數logistic型、指數型等。參數估計采用極大似然法。
2 供水管道的生存分析
2.1 供水管道生存數據的特點
在供水管道的生存分析過程中,管道壽命一般是指從管道安裝之日起到管道第一次發生爆管的時間,時間單位為年。供水管道的生存數據以管齡作為生存時間,管道特征參數包括管材、管徑、管長、埋設時間、爆管時間、道路類型、路面交通量、壓力狀況等,可以作為參數回歸模型中的協變量。
生存數據分為完全數據和截尾數據(或稱為刪失數據)。對供水管道而言,完全數據是指被觀測管道對象從觀察起點至出現終點事件(即爆管)所經歷的時間。完全數據提供了管道確切的生存時間,是管道生存分析的主要依據。如果在出現終點事件之前,被觀測對象的觀測過程終止了,此時被觀測對象提供的信息是不完全的,就稱之為截尾數據。供水管網的生存數據樣本經常會遇到截尾數據的處理,截尾數據又分為左截尾數據和右截尾數據。由于管網維護管理記錄的不完整,從管道安裝到維護數據開始記錄的這段時間里無維護記錄,而在開始觀測之前,事故可能已經發生了,但是沒有這方面的記錄,這樣會導致左截尾數據;當維護記錄中止的時候管道沒有發生任何事故,發生事故的確切時間未知,但是肯定是屬于一個時間段【t,+∞】,則導致右截尾數據,如圖1所示。
2.2 供水管道爆管生存分析的優點
將生存分析方法引入供水管道爆管分析有如下優勢:
(1) 分析生存分析既能考慮觀測對象的觀測結果,又能考慮得到該結果經歷的時間;把管道是否爆管作為觀測目的,將管道爆管視為管道“失效”,管道正常運行視為“生存”,可以考察管道“失效”或“生存”和時間的關系;
(2) 生存分析可以充分利用截尾數據所提供的不完全信息;供水管道的爆裂畢竟只占供水管網所有管道中的一小部分,其它的大量未發生事故的管段就成為了截尾數據,生存分析可以充分利用這些數據信息;
(3) 生存分析可以對多個危險因素同時進行分析,亦可對混雜因素進行控制。導致供水管網管道發生爆裂原因十分復雜,通常與多種因素相關,生存分析可以考慮這些相關因素,并對這些因素進行篩選,剔除其中影響程度小的因素后,建立爆管比例危險模型或LogT的位置-尺度模型。
目前我國管網運行管理科學水平相對較低,管道維護有效數據記錄歷時年限較短,相關信息記錄收集指標過于簡單,且以往的爆管分析通常只把分析對象局限于管網中爆管的管段,故用于分析數據在數量方面和質量方面都十分有限。實際上,那些從未爆裂過的管段數據也極具研究價值,也應列為爆管分析的研究對象,這樣就能最大限度的擴展爆管分析對象,在一定程度上緩解了爆管分析數據數量不足的問題。
2.3 供水管道生存分析方法的選擇
生存時間的分布是一般偏態的,不服從正態分布,常用指數分布、Weibull分布、gamma分布、logistic分布、對數正態分布等來描述。但是,對于一批未知壽命分布的總體趨勢的生存數據,不易判斷應該采用何種模型,一般可以直接采用非參數方法或半參數法。如果一批數據確實符合一定的參數模型,用參數方法即可得到較高的分析精度。
供水管道的生存分析既可以采用非參數方法繪制管道的生存曲線及壽命表,從管道使用時間角度對管道的生存趨勢進行分析,也可以采用參數法建立管道生存分析模型。因為管道的生存時間除了與管道使用年限密切相關,還與諸多管道內部和外部因素(COX稱之為協變量)相關,如土壤類型、環境壓力等因素。因此,對某一組同管齡的每個管道而言,假定它們具有相同的生存函數,既僅用壽命表、用K-M估計就會帶來較大的偏差,所以應同時考慮多個影響因素對管道生存時間的影響。
在爆管分析的國外研究中,生存分析的非參數法、參數法中COX模型、指數模型、威布爾模型以及LogT的位置-尺度模型均被采用過,其中以非參數法、指數模型和威布爾模型采用的相對較多【3】。如果已知樣本資料的生存時間服從某種特定的分布,如指數分布、威布爾分布等,可以用參數統計方法中相應的模型來確定其分布參數和各危險因素之間的定量關系。如果樣本資料的生存時間服從某種特定的分布未知,可以采用Cox回歸模型,該模型的優越性之一就是對基準生存分布沒有特殊要求,所以稱為半參數回歸模型,在實用方面比其它參數回歸模型更為靈活,能夠迅速方便地提供影響預后的參考因素。
由于本研究的爆管生存數據樣本量較少,不易判斷服從何種分布,故采用非參數生存分析法進行分析。
2.4 供水管道非參數法分析實例
表1是某市爆管數據記錄,經過數據整理,有效數據記錄共計147條,且所有記錄都是完全數據。
爆管數據記錄 表1
爆管日期
管徑
管材
管齡
安裝日期
埋深
其它
2001.5.16
200
鑄鐵管
2
1999
0.6
水泥接口
2001.7.4
100
鋼管
2
1999
0.6
腐爛
2002.2.20
100
鋼管
3
1999
0.5
腐爛
2003.12.15
150
鑄鐵管
4
1999
0.8
環向斷裂
2002.3.7
600
水泥管
4
1998
1.2
水泥接口
2002.11.18
150
鑄鐵管
4
1998
0.6
環向斷裂
對以上數據進行生存分析,得到以下分析成果:
(1)壽命表法:按不同的管材進行分組、時間間隔為3年建立管道壽命表,估計不同管材管段的生存概率。因篇幅所限,僅列出鑄鐵管壽命表,見表2。
鑄鐵管道壽命表 表2
生存時間分段
進入區間例數
期內截尾數量
歷險例數
期內失效例數
失效概率
生存概率p
累計生存率s
概率密度
危險率
.0
105.0
.0
105.0
1.0
.0095
.9905
.9905
.0032
.0032
3.0
104.0
.0
104.0
6.0
.0577
.9423
.9333
.0190
.0198
6.0
98.0
.0
98.0
9.0
.0918
.9082
.8476
.0286
.0321
9.0
89.0
.0
89.0
4.0
.0449
.9551
.8095
.0127
.0153
12.0
85.0
.0
85.0
10.0
.1176
.8824
.7143
.0317
.0417
15.0
75.0
.0
75.0
22.0
.2933
.7067
.5048
.0698
.1146
18.0
53.0
.0
53.0
23.0
.4340
.5660
.2857
.0730
.1847
21.0
30.0
.0
30.0
12.0
.4000
.6000
.1714
.0381
.1667
24.0
18.0
.0
18.0
3.0
.1667
.8333
.1429
.0095
.0606
27.0
15.0
.0
15.0
3.0
.2000
.8000
.1143
.0095
.0741
30.0
12.0
.0
12.0
6.0
.5000
.5000
.0571
.0190
.2222
33.0
6.0
.0
6.0
1.0
.1667
.8333
.0476
.0032
.0606
36.0
5.0
.0
5.0
4.0
.8000
.2000
.0095
.0127
.4444
39.0
1.0
.0
1.0
1.0
1.0000
.0000
.0000
.0032
.6667
(2)乘積極限法(K-M法)
該方法只估計失效時間點的生存率或危險率。按管徑進行分組,不同級別管徑管道生存曲線如圖2,不同級別管徑管道危險曲線如圖3;按管材進行分組,不同管材管道生存曲線如圖4,不同管材管道危險曲線如圖5;
圖2 按管徑分組K-M法生存曲線
圖3 按管徑分組K-M法危險曲線
圖4 按管材分組K-M法生存曲線
圖5 按管材分組K-M法危險曲線
2.5 分析結論
(1)通過對不同的管材壽命表的比較可知,不同管材生存經歷有所區別,水泥管與鑄鐵管相比,其生存概率下降較快。由表2鑄鐵管壽命表可見,鑄鐵管生存經歷中管齡15-21年及36年后,爆裂危險率較高。對于不同的管材,鑄鐵管和水泥管的生存情況相近,鋼管的情況較差,危險概率隨時間上升最快,如圖4、圖5所示。
(2)管徑級別不同生存曲線有所差別,如圖2、圖3所示。從管道生存曲線和危險曲線上均可看出:對不同管徑的管道,大管徑管道(DN700以上)管道累計生存率下降最快、危險概率隨時間上升最快,故危險程度最高,其次是小管徑(DN100-DN250)的管道。
(3)不同管材、不同管徑的管道生存情況變化規律不同,如果樣本量足夠,應按管材、管徑分組分別進行分析。由于觀測量較少,一般采用K-M方法進行分析。K-M法一般適合用于小樣本,適合于目前爆管維護數據量有限的情況。
(4)非參數估計所得結果是跳躍性的,采用參數估計所得的結果可以是連續性的。
3 結束語
用生存分析法對供水管網爆管問題進行分析是探索爆管內在規律、解決爆管問題的一種新方法,可以為防治爆管決策的制定提供有效的依據。但不論是何種分析方法,其分析結果的準確性和有效性都極大的依賴于管道生存數據數量和質量。我國各供水管理部門應當重視管道維護運行數據的收集和整理工作,建立完整、嚴格、詳細的相關數據庫,為有效的決策分析提供豐富的數據資源。
【參考文獻】
1. Jianhua Lei,.etc,Statistical Approach for Describing Failures and Life times of Water Mains,Wat.Sci.Tech. Vol.38.No.6.pp.209-217
2. Genevieve Pelletier,.etc, Modeling Water Pipe Breaks –Three Case Studies, Water Resources Planning and Management,2003,115-123
3. Yehuda Kleiner & Balvant Rajani, comprehensive review of structural deterioration of water mains: statistical models, Urban Water 3(2001), 151-164 .
4. SPSS for Windows 統計分析軟件,盧紋岱主編,電子工業出版社
5. 壽命數據中的統計模型與方法,J.F.Lawless著,中國統計出版社
論文作者:何芳
工作單位:廣東佛山供水總公司調度中心;
地址:廣東省佛山市禪城區同濟西路16號;郵政編碼:528000;
聯系電話:0757-82187282;郵箱地址:hyhefang@tom.com
論文搜索
月熱點論文
論文投稿
很多時候您的文章總是無緣變成鉛字。研究做到關鍵時,試驗有了起色時,是不是想和同行探討一下,工作中有了心得,您是不是很想與人分享,那么不要只是默默工作了,寫下來吧!投稿時,請以附件形式發至 paper@h2o-china.com ,請注明論文投稿。一旦采用,我們會為您增加100枚金幣。