• 沒有找到結果。

行政院國家科學委員會補助 大專學生參與專題研究計畫研究成果報告

N/A
N/A
Protected

Academic year: 2021

Share "行政院國家科學委員會補助 大專學生參與專題研究計畫研究成果報告"

Copied!
7
0
0

加載中.... (立即查看全文)

全文

(1)

行政院國家科學委員會補助

大專學生參與專題研究計畫研究成果報告

*************************************

計畫

:一個知識管理現象的數學證明

名稱

*************************************

執行計畫學生:林柏佐

學生計畫編號:97-2815-C-003 -013 -M

研 究 期 間 :97 年 7 月 1 日至 98 年 2 月底止,計 8 個月 指 導 教 授 :陳界山

執 行 單 位:國立臺灣師範大學數學系(所)

中華民國 98 年 3 月 30 日

(2)

1. 研究動機與研究問題

現在各個大專院校都在積極爭取「邁向頂尖大學」5 年 500 億計畫,各個學校在第 一階段分配金額如下,台大 30 億、成大 17 億、清大 10 億、交大 8 億、陽明 5 億、

中央及中山各 6 億、中興 4 億、政大、台科大、長庚、元智各 3 億。從這樣的分配中,

我們可以看的出來教育部將重點學校分配大量的金額,而其他學校則是些微補助,那 是否這樣的補助方式對整體是最好的呢?有沒有數學根據能夠證明這件事?

現在我們考慮以下情形,如果有n所學校要分配 5 年 500 億,令x 代表每所學校成i 功的 probability(類似 random variable 的概念). 2

1

( ) ,

n i i

x μ

=

Δ =

這裡

1 , 0 1,

n i i

i

x n x

μ =

= < < Δ

就很類似 variation 的概念,也就是說其離散的程度。

Define

1

1 (1 )

n i i

H x

=

= −

− 代表的意思就是,會成功的 probability(及1− 皆失敗的 probability).

本計劃就是要來探討 H 與Δ 的關係,進而判斷教育部的暨定政策是不是符合數學

證明的結果。

2. 研究方法及步驟

本來想要證明∂H >0

∂Δ (即 increasing), 也就是說當Δ 越大(離散程度越大),H 也越大 (即成功的 probability 越大),採用 analysis 的手法,利用 concave analysis, 但在過程中

碰到了很大的阻礙,因為其Δ 並非一般分析手法可以解決的,因此在嘗試利用數學證

明的方法行不通的情形下,改而去分析教育部的補助經費與其學校辦學績效,是否有 很好的關聯,由於有些學校評鑑很難判別,本想要去教育部找一些相關資料(或是各大 學自行公佈的資料),但由於搜尋有困難,最後改採取從英國泰晤士報公佈的全世界大 學排名,來判別其是否這樣的補助是不錯可行的。因此我們預期補助越多,名次將會 越低,有明顯的改善。

底下我利用統計軟體 R, 利用 regression 的方法,來作 analysis.

X 代表各個學校的排名(rank),下標代表該年度

Y 代表各個學校補助的金額,下標代表第一期或第二期,單位為億元新台幣 底下輸入的順序依序為

台灣大學、成功大學、清華大學、交通大學、中央大學、中山大學、陽明大學、中興 大學、台灣科技大學、政治大學(只考慮公立學校,原因為一是兩次都有補助,二是大 部份可以查到世界排名)

底下將不再重複贅述。

如有需要說明,將會在後面加#加註說明

> x2005<-c(114,335,206,427,488,481,257,501,266,396)

> y1<-c(30,17,10,8,6,6,5,4,3,3)

> fm2005=lm(y1~x2005) #y1 對 x2005 做 regression

> summary(fm2005) Call:

lm(formula = y1 ~ x2005) Residuals:

(3)

Min 1Q Median 3Q Max -9.383 -4.624 1.388 2.261 11.651 Coefficients:

Estimate Std. Error t value Pr(>|t|) (Intercept) 22.82267 6.47852 3.523 0.00781 **

x2005 -0.03925 0.01754 -2.237 0.05564 . ---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 7.002 on 8 degrees of freedom

Multiple R-squared: 0.3849, Adjusted R-squared: 0.308 F-statistic: 5.006 on 1 and 8 DF, p-value: 0.05564

因為 slope p− value=0.05564 並非有很顯著的 linear relation

> plot(x2005,y1,main="2005")

> abline(coef(fm2005))

> x2006<-c(108,386,343,441,497,505,392,536,454,511)

> fm2006=lm(y1~x2006) #y1 對 x2006 做 regression

> summary(fm2006) Call:

lm(formula = y1 ~ x2006) Residuals:

Min 1Q Median 3Q Max

(4)

-5.7400 -2.9160 0.9469 2.0122 5.8948 Coefficients:

Estimate Std. Error t value Pr(>|t|) (Intercept) 34.600160 4.331329 7.988 4.41e-05 ***

x2006 -0.060868 0.009981 -6.098 0.00029 ***

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 3.756 on 8 degrees of freedom

Multiple R-squared: 0.823, Adjusted R-squared: 0.8008 F-statistic: 37.19 on 1 and 8 DF, p-value: 0.0002901

因為 slope p− value=0.0002901 有很顯著的 linear relation

> plot(x2006,y1,main="2006")

> abline(coef(fm2006))

> x2007<-c(102,336,334,450,398,450,450,450,450,450)

> fm2007=lm(y1~x2007) #y1 對 x2007 做 regression

> summary(fm2007) Call:

lm(formula = y1 ~ x2007) Residuals:

Min 1Q Median 3Q Max -3.0606 -1.6110 -0.2853 1.1390 4.0851

(5)

Coefficients:

Estimate Std. Error t value Pr(>|t|) (Intercept) 37.389364 3.043316 12.286 1.79e-06 ***

x2007 -0.072841 0.007589 -9.599 1.15e-05 ***

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 2.523 on 8 degrees of freedom

Multiple R-squared: 0.9201, Adjusted R-squared: 0.9101 F-statistic: 92.13 on 1 and 8 DF, p-value: 1.152e-05

因為 slope p− value≒0, 有很顯著的 linear relation

> plot(x2007,y1,main="2007")

> abline(coef(fm2007))

> y2<-c(30,17,12,9,7,6,5,4.5,2,2)

> x2008<-c(124,354,281,450,450,450,341,501,450,501)

> fm2008=lm(y2~x2008) #y2 對 x2008 做 regression

> summary(fm2008) Call:

lm(formula = y2 ~ x2008) Residuals:

Min 1Q Median 3Q Max -7.5903 -2.8193 0.8669 3.0557 5.2394

(6)

Coefficients:

Estimate Std. Error t value Pr(>|t|) (Intercept) 34.35546 4.93870 6.956 0.000118 ***

x2008 -0.06383 0.01217 -5.246 0.000777 ***

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 4.308 on 8 degrees of freedom Multiple R-squared: 0.7748, Adjusted R-squared: 0.7467 F-statistic: 27.53 on 1 and 8 DF, p-value: 0.0007772 因為 slope p− value=0.0007772 有很顯著的 linear relation

> plot(x2008,y2,main="2008")

> abline(coef(fm2008))

3. 結論

從 regression 的理論知道,教育部有越高的補助與世界大學的排名越前面高度的相 關,因此可以知道教育部這樣的補助政策看起來是有道理的,至少在排名這個要求 下,要集中在一些重點學校的政策是很合理的。

4. 建議與改進

首先當然是沒有一個很好的數學模型,或是理論性的證明去支持此建議,希望之 後能進一步去探討此問題。還有在 regression 中,我們需要去假設其為 normal

distribution, 並且每個 random variable 是 identical independent, 且必須是 equal variance;

(7)

但是 rank 這樣的 scale 比較接近是 ordinal 的資料,而且由於有些學校 rank 太過後面 並沒有排到,故我將 400~500 名皆設為 450 名,500 名以上皆設定為 501 名,但是事 實上其資迅並不齊全。改進的方式有三種,一種可能可以採用 EM(estimate-maximize) Algorithm, 把遺失的資料納近來考慮;再來就是可能用無母數的方法或許會更貼切,

會比 normal distribution 的假設來的貼切;最後一種可能就適用 generalized linear regression model, 是著去找 link function, 來解決資料型態不是 normal 的假設。

當然還有一個最大的問題,就是蒐集資料的困難,因為教育部與各個學校不願意 將此資料公佈給個人使用,使得我在蒐集資料上遇到不小的瓶頸,可是我覺得如果要 大家都能夠檢視到底 5 年 500 億是否達到成效,應該將其成果公佈給社會大眾知道。

在這次的過程中,讓我學習到很多,覺得自己必須要多充實 statistical method, 尤 其是在實務方面,可以學習例如像 Latent Class 等等,很多問題是真的去做了才知道 哪裡有問題,希望自己在這方面能夠多多學習。

參考文獻

相關文件

and Feng-Tsai Lin, “Analysis of the Transient Ground Surface Displacements Subject to a Point Sink in a Poroelastic Half Space,” Chung Hua Journal of Science and Engineering,

近年來,國內外已經有很多學術單位投入 3D 模型搜尋的研究,而且在網路 上也有好幾個系統提供人使用,例如台灣大學的 3D Model Retrieval

表 2.1 是近年來校園常見災害事件調查統計表,自 92 年 12 月至 98 年 9 月 間重大校園災害事件,計有 57 件,火災約有 17 件,化學性傷害約 6

本研究是以景觀指數進行對 1993 年、2008 年與擴大土地使用三個時期之評 估,其評估結果做比較討論。而目前研究提供研究方法的應用-GIS 與 FRAGSTATS 之使用方法。從 1993 年至

本研究計畫之目的是要以 MPEG-7 之 ART

歐盟和英國 無特別規定 每天 9 小時 每連續或累積 4.5 小時需休息 15 分鐘。.. 加拿大 15 小時 13 小時

Card, ”Bird song identification using artificial neural networks and statistical analysis”, in Proceedings of Canadian Conference on Electrical and Computer

綜合目標極重要-偏生態保育,且標記 3、4 綜合目標極重要-偏土地使用,且標記 3、4 綜合目標較重要-偏生態保育,且標記 3、4