藉由檢視當月最佳專案的活躍值曲線,除了兩個專案在六個月中活躍值過低 (實際上其活躍度值還可以維持在排行榜 90%以上)外,其他 17 個專案都符合持 續度(sustainability)的定義。用相同方式去檢視在活躍度排行榜不同區段的專案,
可以檢視出在排行榜不同區段,專案活躍值的大略值。透過活躍值與活躍度排行 榜的百分比,更能比較出開放程式碼中的 Pareto Distribution。
貢獻度分布方面,可以觀察到發展者貢獻比例仍超過 77%(此處的發展者只 包括專案首頁所列的資料),而貢獻者在核心與使用者介面的貢獻比例約為 5 比 3。使用者的貢獻佔了 22%左右,與預期不同的是使用者在核心與使用者介面的 貢獻比例約為 2 比 1。不管是發展者或者使用者在核心的貢獻都比使用者介面 多,與傳統核心與使用者介面比例不同。可能是擷取專案數太少,樣本數不足,
或只計貢獻筆數,而沒有考慮到每筆貢獻重要程度不同或加入的程式碼行數差 異。
雛型系統(Prototype)方面,可以觀察出一開始有雛型的專案,在活躍度排行 榜上會優於沒有雛形的專案,尤其在排行榜 99%以上的差異更大。若由排行榜為 主體去檢視符合雛型定義的專案,則有侷限性。較合理的方式是統計符合雛型定 義的所有專案,觀察排行榜區段分佈數量最多且符合定義的專案,更能看出符合 雛形定義專案呈現的活躍度。在排行低於 50%的專案,通常 CVS comments 數不 到 50,可以預期的是符合雛型定義的專案幾乎都至少會在排行榜 50%以上。有 問題的部分是定義是否恰當,再未來做實驗時,亦可變更標準—前兩個月所需的 cvs comments 的數量,可將 50 改成 30 或 70,看看符合跟不符合雛型定義專案 的差異度,也可藉此反推得到一開始具雛形的專案前兩個月合理的 cvs comments 數量須達到多少以上。
我們主要的貢獻在於確認開放程式碼中的高度偏移現象(high-skewed),以及
統計專案中貢獻度分布,並確認曾當選當月指標專案者是否都維持一定時間的活 躍值。
在擷取 SourceForge 上面的專案資料時需特別注意,有些專案的首頁可能未 使用到 SourceForge 所提供的空間。例如 OpenWebMail 只用 SourceForge 的 CVS,
而沒有利用下載的功能,該專案註冊至今下載數都是 0,也未提供任何 release。
而 P2P 軟體中的 Emule,下載數長時期高居第一名,Bug 次數在 SourceForge 上 面卻仍是0。但不顯示 OpenWebMail 沒有 release,而 Emule 也沒有 Bug,仍需 查看其他資訊來源。
後續可進行的工作,包括可藉由普遍度/生命力(popularity/vitality)的比值(參 照看 4.2 節),觀察不同軟體類型的比值是否會呈現差異。對於社群叢集大小的計 算方面,我們可透過 4.4 節的方法統計現今 SourceForge 上面的社群狀況,再與 [18]中的結論進行比較,判斷社群發展狀況是否已達到成熟的階段,藉此統計出 來的社群,使貢獻度分布的分析更加準確(原本視為使用者的帳號可能與該專案 發展者隸屬於同一個社群)。同時對於 SourceForge 上面的錯誤(Bug)報告,可藉 由 resolution_id 值或檢驗狀態有修改過的報告,統計出有效的比例。
可針對普遍度與生命力相差極大的專案進行探討,歸納出不同類型專案,所 具有的普遍度與生命力型態。在 SourceForge 上,P2P 軟體是屬於普遍度(下載數) 高但生命力不高者,而 OpenWebMail 由於沒有開放下載,因此普遍度不高但生 命力高。這些比較特殊的狀況都可深入討論,也可應用到所提到的水平(horizontal) 與垂直(vertical)應用程式(application) 。水平的應用程式代表使用者會利用該程 式來開發其他的軟體,例如系統開發軟體、軟體開發環境以及資料庫開發軟體 等。而垂直的應用軟體如普遍使用者應用的軟體,可以嘗試歸納兩者普遍度與生 命力的差異。
參考文獻
[1] Gregor J. Rothfuss , "A Framework for Open Source Projects" , Master Thesis in Computer Science of Zurich , November 12, 2002
[2] Bill Curtis , William E.Hefley ,Sally A. Miller , "People Capability Maturity ModelR (P–CMMR) Version 2.0 ",Software Engineering Institute ,2001 Available
WWW:http://www.sei.cmu.edu/pub/documents/01.reports/pdf/01mm001.pdf [3] Juric, R. , "Extreme programming and its development practices" , Information
Technology Inerfaces , 2000. Proceedings of the 22nd International Conference on , June 13-16 , Page(s): 97–104
[4] Laurie Williams , "The XP Programmer:The Few-Minutes Programmer" , IEEE Software,May/June 2003 (Vol. 20, No.3)Available WWW:
http://collaboration.csc.ncsu.edu/laurie/Papers/fewMinutes.pdf
[5] Mark C.Paulk , "Extreme Programming from a CMM Perspective" , IEEE Software , November/December 2001 (page 19-26)
[6] Rierson, L.K. , "Using the software capability maturity model for certification projects" , Digital Avionics Systems Conference, 1998. Proceedings. , 17th DASC.
The AIAA/IEEE/SAE , Volume:1,31 Oct.-7 Nov. 1998 Page(s): C24/1 -C24/8 vol.1 [7] Andrea Capiluppi,Patricia Lago,Maurizio Morisio , ”Characteristics of Open Source
Projects” , Proceedings of the Seventh European Conference On Software Maintenance And Reengineering (CSMR’03) , Available WWW:
http://softeng.polito.it/andrea/publications/csmr2003.pdf
[8] Gregory B. Newby, Jane Greenberg, and Paul Jones , ” Open Source Software Development and Lotka’s Law: Bibliometric Patterns in Programming” , Journal of the American Society for Information Science and Technology-January
2002
[9] Yunwen Ye, Kouichi Kishida , ” Toward an Understanding of the Motivation of Open Source Software Developers” , Proceedings of 2003 International Conference on Software Engineering (ICSE2003), Portland, OR, May 3-10, 2003 [10] Kumiyo Nakakoji,Yasuhiro Yamamoto,Yoshiyuki Nishinaka,Kouichi
Kishida,Yunwen Ye , ” Evolution Patterns of Open-Source Software Systems and Communities” , International Workshop on Principles of Software Evolution 2002 (IWPSE2002) , Orlando, FL, May 19-20, 2002
[11] Mario A. Maggioni , ” Open Source Software Communities and Industrial Districts:
a Useful Comparison?” , Universita Cattolica del Sacro Cuore, Milan, Italy February 2002
[12] Audris Mockus , Roy T Fielding , James D Herbslev , ” Two Case Studies of Open Source Software Development: Apache and Mozilla” , ACM Transactions on Software Engineering and Methodology, Vol. 11, No. 3, July 2002, Pages
309–346.
[13] F. Hunt and P. Johnson , “On the Pareto Distribution of SourceForge Projects” , in C. Gacek and B. Arief (eds.), Proc. Open Source Software Development
Workshop, 122-129, Newcastle, UK, February 2002
[14] K. Crowston, H. Annabi, and J. Howison, “Defining open source software project success.”, In Proc. of International Conference on Information Systems (ICIS),
2003.
[15] K. Crowston, H. Annabi, J. Howison, and C. Masano. “Towards a portfolio of FLOSS project sucess measures.” , In ICSE Open Source Workshop, 2004.
[16] K. Crowston and J. Howison. ,”The social structure of open source software development teams.” , In OASIS 2003 Workshop (IFIP 8.2 WG), 2003.
[17] Howison, J. & Crowston, K. (2004),“The perils and pitfalls of mining sourceforge.
“ , Workshop on Mining Software Repositories at the International Conference on Software Enginneering ICSE. Edinburgh, UK May 25
[18] G. Madey, Freeh, V., and Tynan, R. “The Open Source Software Development Phenomenon: An Analysis Based on Social Network Theory” , Americas
Conference on Information Systems (AMCIS2002) . Dallas, TX, 2002. pp. 1806-1813 [19] Francis Hunt and Paul Johnson. “On the pareto distribution of sourceforge
projects.”In Proceedings of the Open Source Software Development Workshop, pages 122-129 , Newcastle, UK, 2002.
[20] “Cooking pot market”: an economic model for the trade in free goods and services on the Internet URL:http://www.firstmonday.dk/issues/issue3_3/ghosh