人工神經(jīng)網(wǎng)絡(luò)法預(yù)測(cè)多氯代二苯并對(duì)二噁英logKow值的研究
論文類型 | 技術(shù)與工程 | 發(fā)表日期 | 2001-11-01 |
來(lái)源 | 第二屆環(huán)境模擬與污染控制學(xué)術(shù)研討會(huì) | ||
作者 | 黃俊,余剛,張彭義 | ||
摘要 | 黃俊 余剛 張彭義 (清華大學(xué)環(huán)境科學(xué)與工程系 環(huán)境模擬與污染控制國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100084) 1 前言 氯代二苯并對(duì)二噁英(polychlorinated dibenzo-p-dioxins,簡(jiǎn)稱PCDDs)是國(guó)際上首批列入控制的12種持久性有機(jī)污染物之一,同時(shí)也是很強(qiáng)的內(nèi)分泌干擾物。因氯原子的取代數(shù)目及位 ... |
黃俊 余剛 張彭義
(清華大學(xué)環(huán)境科學(xué)與工程系 環(huán)境模擬與污染控制國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100084)
1 前言
氯代二苯并對(duì)二噁英(polychlorinated dibenzo-p-dioxins,簡(jiǎn)稱PCDDs)是國(guó)際上首批列入控制的12種持久性有機(jī)污染物之一,同時(shí)也是很強(qiáng)的內(nèi)分泌干擾物。因氯原子的取代數(shù)目及位置的不同,PCDDs共有75種分子結(jié)構(gòu)[1],其中2,3,7,8-TCDD被認(rèn)為是已知化合物中毒性最強(qiáng)的物質(zhì),同時(shí)還是很強(qiáng)的多位點(diǎn)致癌物,動(dòng)物實(shí)驗(yàn)證明,它易誘發(fā)肝、肺、粘膜和皮膚癌的發(fā)生,1997年國(guó)際癌癥研究機(jī)構(gòu)(IARC)將其確認(rèn)為一級(jí)致癌物。
logKow值即正辛醇是進(jìn)行污染物環(huán)境風(fēng)險(xiǎn)評(píng)價(jià)時(shí)考察其環(huán)境行為的一個(gè)重要參數(shù),由于單一PCDDs純物質(zhì)通常難以制備或購(gòu)得,而且有些共存的PCDDs即使是用GC/MS方法中仍不容易分開,因此目前還有相當(dāng)數(shù)量的PCDDs化合物難以獲得logKow實(shí)驗(yàn)數(shù)據(jù)。在這種情況下,借助定量構(gòu)效關(guān)系(QSAR)方法來(lái)預(yù)測(cè)logKow很有必要。從已發(fā)表的PCDDs的logKow定量模型看,主要有采用基團(tuán)/原子貢獻(xiàn)法的經(jīng)驗(yàn)方法和熱力學(xué)方法兩類[2]。本文以單苯環(huán)氯取代指數(shù)作為分子結(jié)構(gòu)描述符,采用人工神經(jīng)網(wǎng)絡(luò)思想建立數(shù)學(xué)模型,并用于尚未有實(shí)驗(yàn)值的PCDD分子的logKow的預(yù)測(cè)。
2 研究方法
2.1 建模樣本:本研究中利用了Rulle等[3]所收集整理的42種PCDDs及母體化合物二苯并對(duì)二噁英(Dibenzo-p-dioxin)共43種化合物構(gòu)成建模樣本,這是目前文獻(xiàn)報(bào)道中最為完整的PCDDs的logKow實(shí)驗(yàn)數(shù)據(jù)集。
2.2 分子結(jié)構(gòu)描述:采用Liang等[4]在Hale等最先提出的單苯環(huán)取代描述規(guī)則基礎(chǔ)上改進(jìn)后的分子結(jié)構(gòu)描述符,具體的取值規(guī)則參見文獻(xiàn)[4]。對(duì)于一個(gè)PCDD分子,有G1~G10共10個(gè)算符來(lái)描述其結(jié)構(gòu)。
2.3 建模方法:采用目前應(yīng)用最廣泛、理論最完善的誤差反向傳播人工神經(jīng)網(wǎng)絡(luò)(BP-ANN),其建模算法及相應(yīng)的程序參見文獻(xiàn)[5-6]。首先計(jì)算43種分子的G1~G10描述符,并與其相應(yīng)的logKow值組織成訓(xùn)練樣本;然后采用帶一個(gè)偏置節(jié)點(diǎn)的10-6-1體系進(jìn)行樣本學(xué)習(xí),10個(gè)分子描述符加載到10個(gè)輸入節(jié)點(diǎn)上,而logKow實(shí)驗(yàn)值則加載到輸出節(jié)點(diǎn)上。向量均采用線性歸一化方法,其中輸入向量歸一化至-2~2區(qū)間,輸出向量歸一化至0~1區(qū)間。學(xué)習(xí)步長(zhǎng)η取為0.2,動(dòng)量因子α取0.5。采用隨機(jī)數(shù)矩陣進(jìn)行權(quán)值矩陣的初始化,設(shè)置隨機(jī)數(shù)發(fā)生器的區(qū)間為-3~-3,網(wǎng)絡(luò)精度(目標(biāo)誤差)取為0.05。訓(xùn)練完畢后就得到了PCDDs分子結(jié)構(gòu)與logKow值之間的定量模型,精度檢驗(yàn)后對(duì)樣本集外的33種PCDD的logKow值進(jìn)行預(yù)測(cè)。
3 結(jié)果與討論
3.1 訓(xùn)練結(jié)果
經(jīng)過(guò)57585次迭代(在128M內(nèi)存、Celeron 466微機(jī)上約耗時(shí)22秒),網(wǎng)絡(luò)訓(xùn)練完畢,輸出各項(xiàng)參數(shù)。模型值與實(shí)驗(yàn)值的相對(duì)誤差絕對(duì)值的平均值為0.4%,最大值為3.1%,精度符合建模目標(biāo)要求。相對(duì)誤差的頻數(shù)分布圖如圖1所示,以模型值對(duì)實(shí)驗(yàn)值所作的相關(guān)關(guān)系圖如圖2所示。從圖1和圖2可以看出,誤差大多數(shù)集中在±0.5%之間(共36個(gè)樣本,占樣本總數(shù)的84%),明顯地優(yōu)于文獻(xiàn)[3]中MOD模型的建模精度。模型值與實(shí)驗(yàn)值之間的相關(guān)性相當(dāng)好,說(shuō)明所建立的BP-ANN模型較好地反演了蘊(yùn)含在PCDD分子結(jié)構(gòu)與logKow之間的數(shù)學(xué)關(guān)系,可以用于預(yù)測(cè)。
3.2 BP-ANN的預(yù)測(cè)結(jié)果
利用上述模型,對(duì)尚未有實(shí)驗(yàn)值報(bào)道的其它33種PCDD分子的logKow值進(jìn)行預(yù)測(cè),結(jié)果列于表1中。
8.17 2,3,7 - 6.55 1,2,3,4,6,9 -
6.26 1,7,8 - 4.45 1,2,3,7,8,9 - 8.18 1,3,6 - 5.99 1,2,3,4,6,7 - 5.54 1,3,7 - 4.36 1,2,3,4,6,7,9 - 8.12 1,3,8 - 4.36
參 考 文 獻(xiàn)
1 鄭明輝, 劉鵬巖, 包志成等. 科學(xué)通報(bào), 1999, 44(5): 455-463
2 黃俊, 余剛, 張彭義等. 計(jì)算機(jī)與應(yīng)用化學(xué), 2001, 18(4): 289-292
3 Rulle P. Chemosphere, 2000, 40(5): 457-512
4 Liang X., Wang, W. Wu W., et., al. Chemosphere, 2000, 41(6): 923-929
5 黃俊, 周申范, 國(guó)振雙等. 色譜, 2000,18(1): 1-4
6 黃俊, 周申范, 唐婉瑩. 環(huán)境科學(xué)研究, 2000, 13(2): 3-5
論文搜索
發(fā)表時(shí)間 至
月熱點(diǎn)論文
論文投稿
很多時(shí)候您的文章總是無(wú)緣變成鉛字。研究做到關(guān)鍵時(shí),試驗(yàn)有了起色時(shí),是不是想和同行探討一下,工作中有了心得,您是不是很想與人分享,那么不要只是默默工作了,寫下來(lái)吧!投稿時(shí),請(qǐng)以附件形式發(fā)至 paper@h2o-china.com ,請(qǐng)注明論文投稿。一旦采用,我們會(huì)為您增加100枚金幣。