大型國際評鑑(四):慎用國際評鑑的效益(Pixabay)

 國際評鑑亦對建立系統層面的教育監測十分重要,有助釐清教育投入、過程和結果的關係,也為設定教育目標提供了國際依據。

作者﹕何瑞珠 (2016年5月7日於《灼見名家》發表)

從國際評鑑研究中,參與國都直接或間接地受益。就直接效益而言,國際評鑑能促使各國開發更完整和精細的教育評鑑系統,評鑑的結果有助各國從國際視角確定學生所需知識與技能的基準。經過幾輪的評估,累積的數據有助參與國建立一套資料庫,用以考察學生學業表現的趨勢。尤其在各種教育改革開展時,這種資料庫的重要性特別高,它能夠提醒政策制定者當前推行的教育改革是否產生了效果,並作為檢視教育政策成效的依據;就參與國際評鑑的間接好處而言,參與的國家可以在教學評鑑和學校效能方面建立共同的準則及語言,而且 PISA 每一輪調查的研究結果發布後,都會引起本地及國際上不同持分者的熱烈討論。各國亦可藉此分享評估的經驗以取長補短,建立跨國的評估支援網絡。

教育成本效益分析的啟示

從教育成本效益分析來看,Hanushek & Woßmann(2007)綜合了 TIMSS 和 PISA 的資料進行跟進分析,以了解教育素質對經濟發展的影響。他們發現在迴歸分析模型中控制了 GDP 基數和國民平均受教育年限後, PISA 評鑑的結果顯示,在1960-2000年間國家平均分數與實際人均 GDP 的增長具有顯著正相關。他們在2007年發表的《不良教育的高代價(The High Cost of Low Educational Performance)》報告中指出,如果用受教育年期來代表教育的素質,那麼教育的素質對經濟增長的影響並不顯著。然而,若用 PISA 分數來量度教育素質的話,教育對經濟增長就有顯著貢獻。Hanushek & Woßmann 的研究展示了國際評鑑結果是如何用來作教育效能研究和跨地區分析。

國際評鑑亦對建立系統層面的教育監測十分重要,有助釐清教育投入、過程和結果的關係,也為設定教育目標提供了國際依據,但是處於不同社會經濟發展階段的國家,在利用國際評鑑的概念和方法時仍要三思:這些普遍認可的學生技能是否滿足當地社會的發展需求?而這些技能又能否切合青少年實際的生活經驗呢?

對國家評鑑及教學實踐的啟示

國際評鑑對發展國家評鑑及教育政策具有重大意義,這包括:(1)以國際視域及標準考察國家當前教育系統的現狀;(2)持續的國際評鑑,可為教育改革和干預提供及時的回饋資訊;(3)結合國際及國家評鑑的數據,可為國家的課程改革和資源配置提出方向性的指導;(4)識別教育系統內哪些群體處於弱勢,需要得到額外的支援。另外,向不同持分者公開評鑑的結果,並由教育當局、研究人員、教育工作者,甚至家長進行討論,更有利於教育的問責及改善(Postlethwaite & Kellaghan, 2008)。

此外,如果能恰當地使用國際評鑑,將有助於從國際視域監測學生成就和學校效能:(1)突破傳統框架,界定學業以外的其他非學業學習結果;(2)參照國際標準,檢驗國家教育水準;(3)評鑑技術的轉移及本土化,如嚴格的專案設計過程、具代表性的抽樣和高級的統計分析技術,均有助各國發展本身的大型評鑑機制。這些年, PISA、TIMSS、PIRLS 等大型國際評鑑已在全球教育系統中產生了重大影響。它們不同程度地影響了許多國家的評鑑實踐、教學、教師培訓規劃和教育財政分配。

參與國際評鑑的危機

然而,大型國際評估為各參與國帶來的風險似乎愈來愈高。以香港教育當局為例,教育局在 HKPISA 2018 的評估招標中一反過往原則,列明要辨認個別學校及個別學生的資料,一些持份者包括家長、校長、校董及部分辦學團體均質疑有關數據的可能用途。當局以往一直沒有上述的要求,故此以往六屆的 PISA 均能保持低風險。 OECD 曾派研究人員探討 PISA 對香港教育的影響,分別訪問了30多位各界人士 (Hopkins, et. al., 2008),他們發現香港學校的教師、家長及學生均不會為 PISA 而進行操練, HKPISA 研究團隊主要為學校提供保密的個別報告及網上數據作參考,學校是基於專業的承擔及判斷,自主地選擇參與這些國際性系統評估。若當局從這些評估中辨認個別學校的數據,在中學普遍收生不足的情況下,學校難免會將 PISA 視為異化了的 TSA 般,唯恐它成為學校存亡的重要指標之一。 PISA 將從此變成學校眼中的高風險評估,喪失了提供客觀數據的能力,甚至掀起另一片的催谷熱潮,成為老師、家長、學生又一個噩夢和負擔。

綜合各國近年參與的經驗,大型國際評鑑變得愈來愈高風險的原因來自:原意抽樣後由學校「自願性」變成立例「強制性」參與(見英國 PISA 的近況);原意系統層面的評鑑變成學校層面的監控 (見香港 TSA );原意不需要學生預備演化為坊間湧現練習本、試題本,甚或變為篩選學生的入校試題(見中澳台的近況);最終原意的「國際研究」就變成了「國際比試」(見筆者國際評鑑系列二提到的全球學者在《衛報》發表的公開信)。

此外, OECD/PISA 於2015年全面開展「PISA for Development」計劃,將 PISA 延伸至發展中國家,值得注意的是這些國際評鑑不宜全盤地複製到各地評鑑實踐中,正如 Van der Gaag & Adams(2010)所言:「工業國家發展評鑑工具時,通常會出現『地板效應(Floor effect)』……要麼是因為題目太難,要麼是因為考試內容跟當地的教育實踐的相關度很低。」(第5頁)發展中國家更應該特別注意發生這種喧賓奪主的可能性。

總括來看,若誤用國際系統評鑑,將令學校老師及學生百上加斤,不單不能改善教學,更會危害學生福祉。但若能在保持低風險的條件下,慎用國際評鑑及國家評鑑的數據,配合教師、學者及政策制定者的協作及參與,大型國際及國家的系統評鑑可以是驅動教育改革及教學改進的有力工具。

參考資料

  • Hanushek, E.A. & Woßmann, L. (2007). The role of education for economic growth. World Bank Policy Research. Working Paper No 4122. Washington D.C.: World Bank.
  • Hopkins, D., Pennock, D., Ritzen, J., Ahtaridou, E., & Zimmer, K. (2008). External Evaluation of the Policy Impact of PISA. Retrieved from: OECD doc. EDU/PISA/GB(2008)35/REV1. Paris: OECD.
  • Postlethwaite, T. N. & Kellaghan, T. (2008). National assessments of educational achievement. UNESCO- Educational Policy Series.
  • Van Der Gaag, J & Adams, A. (2010). Where is the Learning? Measuring schooling efforts in developing countries. Global Views: Policy Brief 2010-04.

作者的其他文章