• 沒有找到結果。

第四章 結果與討論

4.1 資料庫與外插法的運用

4.1.8 參數調整

在分別使用五組資料庫外插之後,我們發現每組資料庫的參數 α 與 β 值都不同,而代表的意思為每組資料庫所混合的HDFT 和 PT2 能量的 比例不一樣,以及其cc-pVDZ 和 cc-pVTZ 所混合的能量比例也不相同。

而為了避免資料庫過於繁複,因此希望可以藉由一組參數來整合這五組 資料庫;因此將AE109、IP13、EA13、HTBH38 和 NHTBH38 當作 Traning set,共計有 211 計算值,並以 Training set 進行參數最佳化,獲得一組最 佳的參數組。而我們的目標為將其誤差值降至2 kcal/mol 以下,獲得一個 高精準度的計算。於表20 可以發現,利用 cc-pVDZ 計算 211 個計算值,

其誤差高達16.62 kcal/mol,而使用 cc-pVTZ 與 cc-pVQZ 計算可以將誤差 值降至4.10 和 2.19 kcal/mol,其中 cc-pVQZ 的誤差值和我們期許的目標 2 kcal/mol 相當接近。

在計算Training set 之後,我們將探討基底函數組所計算的時間。因 此,我們使用七個的分子進行計算不同的基底函數,這些分子分別為:

C5H5N、C2Cl4、C4H4O、C4H4S、C4H5N、CF3CN 和 SiCl4。當中,發現

表20 利用 B2K-PLYP 計算 Training set 的誤差值(in kcal/mol)

Basis Set AE109 IP13 EA13 HTBH38 NHTBH38 MUE(211) Time Ratio DZ 26.23

(29.43)

4.24 (5.18)

25.36 (28.53)

1.63 (2.06)

5.31 (7.53)

16.62

(19.01) 1.0 TZ 4.70

(5.66)

1.70 (1.97)

13.23 (14.89)

0.75 (0.93)

3.43 (4.79)

4.10

(4.99) 7.9 QZ 2.09

(2.76)

1.31 (1.45)

7.29 (8.47)

0.70 (0.89)

2.52 (3.45)

2.19

(2.82) 89.3

a Number in parentheses are the RMSD errors.

cc-pVDZ、cc-pVTZ 和 cc-pVQZ 於 CPU 計算的時間分別為 201、1595、

17965 秒,所以利用越大的基底函數計算,所花費的計算時間就會越多。

而為了方便比較不同的基底函數組,我們將以cc-pVDZ 當作基準,以倍 率的方式表示不同的基底函數組之間的差異,如表20 所示。因此,利用 cc-pVTZ 所計算的時間為 cc-pVDZ 的 7.9 倍,而 cc-pVQZ 的計算時間為 cc-pVDZ 的 89.3 倍,表示利用 cc-pVQZ 進行計算雖然可以獲得較準確的 結果,但是耗費的計算資源與時間也都相當多。

表 21 我們利用三種外插法外插 211 個計算値,發現利用 cc-pVDZ 和cc-pVTZ 的 power2 + power2 外插法,其 α 和 β 值在 3.8 和 6.5 時有 一最低點2.63 kcal/mol,而 exp2 + power2 和 esqrt2 + power2 的 α 和 β 值分別在1.3 和 10.0,以及 4.1 和 9.7 時,其 MUE 為 2.51 kcal/mol;而在 五種資料庫中,可以發現大部份的資料庫在這三組參數中的MUE 至少近

表21 B2K-PLYP/cc-pV[D|T]Z 計算 Training set 的誤差值(in kcal/mol)

Extrapolation AE109 IP13 EA13 HTBH38 NHTBH38 MUE(211) power2 + power2b 2.31

(3.01)

1.48 (1.83)

10.68 (11.96)

0.76 (0.97)

3.05 (4.15)

2.63 (3.33) exp2 + power2c 2.16

(2.81)

1.55 (1.99)

10.08 (11.21)

0.84 (1.09)

2.91 (3.94)

2.51 (3.17) esqrt2 + power2d 2.16

(2.81)

1.55 (1.98)

10.08 (11.22)

0.84 (1.08)

2.92 (3.94)

2.51 (3.17) MC-DFT/pdz/ptz e 2.83 1.43 10.82 0.79 3.17 2.93

a Number in parentheses are the RMSD errors.

b α = 3.8, β = 6.5.

c α = 1.3, β = 10.0.

d α = 4.1, β = 9.7.

e Ref. [51].

似於cc-pVTZ 的計算程度,甚至有些誤差值比 cc-pVTZ 還要低,而整體 的誤差值更趨近於cc-pVQZ 的計算程度,達到降低誤差值的效果。而且 相較 Hu 團隊[51]所計算的 MC-DFT 的外插法,發現我們使用的外插法比 MC-DFT 計算略好一些,計算上確實是較為準確。因此在誤差值方面,

利用 cc-pV[D|T]Z 進行外插可以估算到 cc-pVQZ 的計算程度;而在計算 時間的倍率上,以 cc-pV[D|T]Z 和 cc-pVQZ 分別為 8.93 和 89.33 倍,可 以減少約90%的計算時間,因此可以減少相當多的計算資源。

而利用cc-pVTZ 和 cc-pVQZ 的進行外插,如表 22,當 power2 + power2 的 α 和 β 值分別在2.0 和 7.7、exp2 + power2 的 α 和 β 值為 0.6 和 7.5 時,以及esqrt2 + power2 的 α 和 β 值在 2.4 和 7.0 時,MUE 幾乎都在 1.63 kcal/mol 左右;可以發現利用 cc-pVTZ 和 cc-pVQZ 的外插即可將整 體MUE 降至 2 kcal/mol 以下,獲得相當準確的計算。另外,我們也發現 三種外插法的結果幾乎相同,這也表示當重新參數化後,三種不同的外

表22 B2K-PLYP/ cc-pV[T|Q]Z 計算 Training set 的誤差值(in kcal/mol) Extrapolation AE109 IP13 EA13 HTBH38 NHTBH38 MUE(211) power2 + power2b 1.88

(3.02)

1.49 (1.64)

2.05 (2.73)

0.91 (1.16)

1.53 (2.32)

1.63 (2.46) exp2 + power2c 1.85

(2.96)

1.48 (1.63)

2.21 (2.97)

0.89 (1.15)

1.58 (2.35)

1.63 (2.44) esqrt2 + power2d 1.81

(2.87)

1.47 (1.60)

2.52 (3.34)

0.87 (1.12)

1.66 (2.41)

1.64 (2.42)

a Number in parentheses are the RMSD errors.

b α = 2.0, β = 7.7.

c α = 0.6, β = 7.5.

d α = 2.4, β = 7.0.

插法都有相同的外插能力。在計算時間上,雖然使用cc-pV[T|Q]Z 的計算 效果會cc-pVQZ 準確一些,而且誤差值能夠降至 2 kcal/mol 以下,但其 計算時間的比率為97.3,比 cc-pVQZ 多出 8.8 %,因此對於 cc-pV[T|Q]Z 的計算時間是相當長的。

除了上述的五個資料庫之外,我們還利用了四個資料庫進行檢驗,

測試我們所獲得的參數組是否為最佳的參數組;而我們使用的Test set 分別為:PA8、ABDE4、DC10 和 NCCE31 四種資料庫,共計有 53 個計 算值,而九種資料庫則包含264 個計算值。而表 23 為顯示以 B2K-PLYP 計算之後的結果,當中cc-pVDZ 計算的 MUE 為 15.30 kcal/mol,以 DC10 的誤差最大,高達74.44 kcal/mol;而使用 cc-pVTZ 所計算的 MUE 為 3.72 kcal/mol,比 cc-pVDZ 降低 11.52 kcal/mol,而 DC10 的誤差從 74.44 降至 16.49 kcal/mol,減少了 77.8 %的誤差值;而使用 cc-pVQZ 所得的 MUE 為1.97 kcal/mol,可以降至 2 kcal/mol 左右,且 DC10 的誤差也可以降至 8.29 kcal/mol,比 cc-pVTZ 減少約一半的誤差值。而對於 NCCE31 資料 庫而言,當利用cc-pVDZ 計算時,誤差值雖然只有 1.14 kcal/mol,但是

表23 利用 B2K-PLYP 計算 Test set 之誤差值(in kcal/mol)

Basis Set PA8 DC10 ABDE4 NCCE31 MUE(53) MUE(264) DZ 2.64

(3.61)

74.44 (91.20)

2.57 (2.73)

1.14 (1.66)

15.30 (18.93)

16.36 (18.99) TZ 1.33

(1.58)

16.49 (21.38)

1.61 (1.70)

0.50 (0.69)

3.72 (4.81)

4.02 (4.96) QZ 0.70

(0.79)

8.29 (10.36)

1.47 (1.64)

0.33 (0.48)

1.97 (2.48)

2.15 (2.75)

a Number in parentheses are the RMSD errors.

比較於平均能量,其誤差值為平均能量的31.4%,表示誤差是相當大的;

而利用cc-pVTZ 和 cc-pVQZ 計算時,其誤差值分別為平均能量的 13.8%

和9.1%;也發現利用大的基底函數計算,誤差值可以明顯減少許多。若 對於九種資料庫的總誤差進行探討,可以發現到cc-pVDZ 的誤差值為 16.36 kcal/mol,其誤差值相當高;cc-pVTZ 可以減少約 75%的誤差值,

將誤差值降至4.02 kcal/mol;而 cc-pVQZ 則可以再降低約一半的誤差值,

將其值計算近似2 kcal/mol 左右。

接著我們使用IB 外插法進行基底函數的外插,並利用 Training set 所調整出的最佳參數作為外插參數,測試其外插效果。在表24 當中,使 用cc-pVDZ 和 cc-pVTZ 的 power2+power2 外插法時,其 MUE 可以降至 1.46 kcal/mol,當中的 DC10 誤差值更降至 5.06 kcal/mol;而使用

exp2+power2 和 esqrt2+power2 外插法的 MUE 皆為 1.39 kcal/mol,而 DC10 更可以降至5 kcal/mol 以下,獲得較準確的計算結果。而對於 NCCE31

表24 B2K-PLYP/cc-pV[D|T]Z 計算 Test set 的誤差值(in kcal/mol)

Extrapolation PA8 DC10 ABDE4 NCCE31 MUE(53) MUE(264) power2+power2b 1.19

(1.29)

5.06 (6.30)

1.87 (2.04)

0.31 (0.39)

1.46 (1.77)

2.38 (2.97) exp2+power2c 1.25

(1.36)

4.61 (5.83)

1.94 (2.09)

0.32 (0.41)

1.39 (1.70)

2.28 (2.87) esqrt2+power2d 1.25

(1.36)

4.62 (5.83)

1.94 (2.09)

0.32 (0.41)

1.39 (1.70)

2.29 (2.87) MC-DFT/pdz/ptz e 1.08 7.33 1.41

a Number in parentheses are the RMSD errors.

b α = 3.8, β = 6.5.

c α = 1.3, β = 10.0.

d α = 4.1, β = 9.7.

資料庫,利用IB 外插法後誤差值可以降至約 0.3 kcal/mol,而與 NCCE31 資料庫的平均能量比較,其誤差值為平均能量的8.5%,接近於 cc-pVQZ 的9.1%,獲得較準確的計算結果。另外,利用這三種外插方法所得到最 佳的誤差值,皆小於2 kcal/mol 以下,甚至比 cc-pVQZ 的計算還要來的 準確,是我們所期望最好的計算結果。我們隨後也對於這四種資料庫進 行參數最佳化,但是發現其MUE 的降幅並不明顯,甚至 Training set 的 參數值就是最佳化的參數值,因此我們認為利用Training set 的參數值進 行外插就可以獲得最好的結果。

對於九種資料庫進行探討,可以發現三種外插法的誤差值都相當接 近,而我們針對264 個計算值進行參數最佳化,也發現此參數值為最佳 的參數組,因此對於cc-pV[D|T]Z 的外插效果,只趨近於 cc-pVQZ 的計 算。雖然如此,外插法還是可以節省許多計算資源。

我們之後也利用cc-pVTZ 和 cc-pVQZ 進行外插,在表 25 當中,發

表25 B2K-PLYP/cc-pV[T|Q]Z 計算 Test set 的誤差值(in kcal/mol)

Extrapolation PA8 DC10 ABDE4 NCCE31 MUE(53) MUE(264) power2+power2b 0.83

(0.97)

4.34 (5.07)

1.62 (1.81)

0.32 (0.49)

1.26 (1.53)

1.55 (2.25) exp2+power2c 0.83

(0.97)

4.38 (5.11)

1.62 (1.81)

0.33 (0.49)

1.27 (1.54)

1.56 (2.26) esqrt2+power2d 0.81

(0.95)

4.28 (5.02)

1.61 (1.80)

0.32 (0.49)

1.24 (1.51)

1.55 (2.25)

a Number in parentheses are the RMSD errors.

b α = 2.0, β = 7.7.

c α = 0.6, β = 7.5.

d α = 2.4, β = 7.0.

現三種外插公式的結果都很相似,其MUE 都介於 1.26 kcal/mol 左右,當 中誤差較大的DC10,其 MUE 也降至 4.3 kcal/mol 左右,獲得相當低的 誤差值。我們也對264 個計算值進行探討,發現利用 cc-pV[T|Q]Z 計算可 以將誤差值降至1.55 kcal/mol,其值小於 2 kcal/mol,獲得一個相當高準 確度的計算。而對於NCCE31 資料庫而言,利用 cc-pV[T|Q]Z 外插後。

其誤差值約為0.32 kcal/mol,與 cc-pV[D|T]Z 差結果相似;而相較於 NCCE31 的平均能量,其誤差值約為平均能量的 8.8%,但與 cc-pVQZ 的 9.1% 相比,利用 cc-pV[T|Q]Z 外插以及利用 Training set 的參數值在 NCCE31 上似乎沒有太大的效果。

我們也對Test set 和九種資料庫進行參數最佳化,也發現其誤差值的 降幅並不大;這表示Training set 的參數值確實可以相當準確,因此之後 將以Training set 的參數值進行外插計算。