第四章 結果與討論
4.1 資料庫與外插法的運用
4.1.10 三點外插法
從以上結果得知對 PT2 能量三點外插的效果並不明顯後,我們也對 HDFT 能量進行三點外插;理論上,將 HDFT 和 PT2 能量都以三點外插 進行計算時,其計算效果最好。於MC-DFT 的三點外插法中,由於使用 的基底函數並不受限,因此 MC-DFT 所使用的基底函數為 cc-pVDZ、
cc-pVTZ 和 aug-cc-pVDZ,藉由使用 aug-cc-pVDZ 基底函數增加擴散函數 的計算,而獲得較好的計算結果。但於Infinity Basis Extrapolation 中,使 用的基底函數必須為低階到高階的關係;因此我們使用 cc-pVDZ、
cc-pVTZ 和 cc-pVQZ 三種基底函數進行外插,檢視是否能夠獲得較好的 計算程度。
而對於三點外插的計算,雖然能夠估算到 cc-pVQZ 以上的計算程 度,可是其花費的計算時間比cc-pVQZ 多出約 10 %,但相較於
表28 利用 B2K-PLYP 以三點外插法計算 Training set 之最佳誤差值(in kcal/mol) Extrapolation AE109 IP13 EA13 HTBH38 NHTBH38 MUE(211) power3+power3b 1.70
(3.07)
1.44 (1.70)
1.88 (2.27)
0.88 (1.09)
1.46 (2.19)
1.50 (2.42) mixed3+mixed3c 1.71
(3.08)
1.45 (1.66)
1.82 (2.15)
0.90 (1.13)
1.41 (2.16)
1.50 (2.42) CBS[D|T|Q] 1.65
(2.69)
1.36 (1.54)
3.89 (4.73)
0.79 (1.01)
1.96 (2.74)
1.67 (2.45) MC-DFT d
pdz/ptz/apdz 1.80 1.83 1.62 0.98 1.70 1.62 (2.33)
a Number in parentheses are the RMSD errors.
b α1 = 2.5, α2 = 3.7, β1 = 2.8, β2 = 6.7.
c α1 = 2.2, α2 = 2.1, β1 = 0.9, β2 = 6.8.
d Ref. [51].
cc-pV[T|Q]Z 多出 cc-pVQZ 約 8.8 %,其實計算成本並沒有很大的上升,
而且許多文獻都認為三點外插擁有較準確的外插結果,因此三點外插還 是擁有一定的可行性。
表28 為三點外插的結果,我們使用 cc-pVDZ、cc-pVTZ 和 cc-pVQZ 外插後,整體所得的誤差值下降至1.50 kcal/mol,而 MC-DFT 所使用的 cc-pVDZ、cc-pVTZ 和 aug-cc-pVDZ 外插的誤差值也達到 1.62 kcal/mol,
以 CBS 三點外插公式計算,其 MUE 為 1.67 kcal/mol。但我們也發現,
使用三點外插後,部分資料庫並無法獲得相當好的外插效果,而且三點 外插法必須使用到cc-pVQZ 的基底函數進行計算,因此其計算資源與時 間都大幅度的上升。
表29 中利用 Test set 進行計算,並使用 Training set 的參數於三點外 插上的結果,於power3+power3 和 mixed3+mixed3 的誤差分別為 1.39 和 1.27 kcal/mol,與 CBS 的三點外插的結果 1.32 kcal/mol 有相似的答案,
表29 利用 B2K-PLYP 以三點外插法計算 Test set 之最佳誤差值(in kcal/mol) Extrapolation PA8 DC10 ABDE4 NCCE31 MUE(53) MUE(264) power3+power3b 0.79
(0.94)
5.07 (6.10)
1.32 (1.56)
0.36 (0.57)
1.39 (1.74)
1.48 (2.29) mixed3+mixed3c 0.82
(0.98)
4.35 (5.08)
1.41 (1.63)
0.37 (0.56)
1.27 (1.56)
1.45 (2.24) CBS[D|T|Q] 0.50
(0.65)
5.09 (6.11)
1.41 (1.63)
0.30 (0.47)
1.32 (1.65)
1.60 (2.29) MC-DFTpdz/ptz/apdz 1.12 6.36 1.68
a Number in parentheses are the RMSD errors.
b α1 = 2.5, α2 = 3.7, β1 =2.8, β2 =6.7
c α1 = 2.2, α2 = 2.1, β1 =0.9, β2 =6.8
但卻比混合式外插法的結果略高一些,因此我們將三點外插進行參數最 佳化,發現當power3+power3 的外插法參數為 α1和 α2為1.8 和 4.9,而 β1和 β2為2.0 和 4.5 時,其 MUE 可以降至 1.10 kcal/mol;而
mixed3+mixed3 的參數為 α1和 α2為 0.7 和 9.5,而 β1和 β2為 0.8 和 3.6 時,其 MUE 可以降至 1.11 kcal/mol,比起利用 Training set 參數計算 的結果還要低一些;這表示三點外插的外插參數對於Test set 並非其最低 的參數。
對於NCCE31 資料庫而言,我們發現到利用三點外插後,其資料庫 的誤差值約為0.36 kcal/mol,約為平均能量的 9.9%,和 cc-pVQZ 所計算 的結果相差不多;而利用CBS 三點外插計算,其誤差值約為平均能量的 8.3%,也和 cc-pVQZ 的結果相似;這些都表示三點外插對於 NCCE31 中,
外插效果並不顯著。在九種資料庫中,利用Training set 的參數計算結果,
兩種外插法的MUE 都約為 1.45 kcal/mol,但我們經由參數最佳化後,誤 差值並沒有明顯改變,所以對於參數的運用,由於三點外插的參數自由 度較高,因此無法直接運用Training set 的參數組。
從以上結果可以得知,無論是Training set 或是 Test set,我們認為兩 點外插就已經足夠。若利用cc-pV[D|T]Z 計算,可以大幅度降低計算的誤 差值,甚至是到達cc-pVQZ 的計算層級,而若使用 cc-pV[T|Q]Z 可以獲 得更精準的計算值。倘若使用三點外插公式,雖然理論上其效果較為準 確,但由於其計算成本較高,而且其外插方法也較為複雜,就上述結果 表示與使用CBS 的三點外插的效果相近,因此之後我們以 CBS 的三點外 插表示三點外插的效果,檢視與兩點外插之間的效果。