【資源分享】前沿:國際基礎教育評價新動向——以PISA👩👧👦,PIRLS,TIMSS為例
摘要🔕:近年來🚵🏼,國際基礎教育評價呈現新的發展趨勢。具體而言🏊♂️,國際基礎教育評價對國家⬆️、地區教育決策的影響力逐步增強🎅🏻;從基於書本知識到逐步關註真實社會情景和價值觀教育🧪;評價方式從實地調查走向線上評價,質性數據愈加重要💃🏽🎸;評價主體趨向多元化,更多發展中國家參與到評價中來;更加理性地看待評價結果,評價過程也越來越被看重🧑🏻🏭。此外🤖,國家教育評估如何不危及教育的多樣化,也是未來國際教育評估需要考慮的問題。
自20世紀中期開始👃🏽,基礎教育評價不斷發展🧲,尤其進入21世紀以來🧙🏻♂️,國際上形成了如國際學生評估項目(Programme for International Student Assessment, PISA)、國際學生閱讀素養進展研究(Progress in International Reading Literacy Study, PIRLS)💁🏻♀️、國際數學與科學趨勢研究(Trends in International Mathematics and Science Study,TIMSS)等為主的大規模基礎教育評價項目🤘🏻💐,在教育質量的監測、教育水平的提升⟹、教育決策的製定中發揮著越來越重要的作用𓀆。判斷教育公共政策的標尺也在發生變化😓🤷♂️,評價教育體系是否完善或是否需要改進的依據不再是國家教育標準🙅,而是在世界範圍內表現最為卓越的教育評價體系💠。近年來,我國在製定國家教育標準👩🏻🍳、探索“管辦評”分離的同時,也在借鑒國際基礎教育評價項目的經驗。基於此,準確把握國際基礎教育評價的發展趨勢,具有重要的學術價值和現實意義。
一、對國家教育決策的影響力逐步增強
國際基礎教育評價由於科學性、規範性✉️、廣泛性等特點,吸引了越來越多的國家參與。許多參與評估的國家以評估結果為依據,進而解決其國內的教育問題。對於宏觀層面的教育決策者和中觀層面的华信管理者而言,這些評估結果也有利於其增進對本領域教育的了解,從而製定更為合理的教育政策。可以說,評估結果會影響教育政策的製定、實施,從而推動一個國家教育體系的不斷完善,進而順應本國乃至國際教育的發展趨勢💗。
以德國為例,2000年🪽,PISA評估結果顯示🙅🏻♀️,德國1/4的15歲學生不能順暢閱讀,也未達到經合組織(OECD)成員國的平均水平,引起了德國社會的震驚。迫於壓力,德國當局迅速做出調整,轉變了全國的教育政策🤴🏿,並於2004年出臺新的教育標準。與此同時🏌️,德國當局設立了教育體系質量發展研究院,並設置了教育監測體系來檢驗其教育達標程度👨🚀。除此之外,德國政府在2006年繼續對教育政策進行完善,出臺了《教育監測全局戰略》,建立了國際🛑、國內評估相結合的評估體系,兩年發布一次《國家教育發展報告》。實施改革以後,德國PISA成績持續提高,從2009年PISA結果來看,德國教育發展的實際表現與期望值之間的距離縮小了很多🧑🏿⚕️。
再如𓀁,2009 年👷♂️,美國學生在PISA的數學🕵🏼🧑🏿🦱、科學和閱讀項目的排名均不樂觀,分別排名第17位、第23位和第31位👩🏿🎨,這在美國社會引發了一系列討論,美國政府對此高度重視💅🏽🚞。其實,早在2008年,美國政府就發現在其他國際評估中美國教育暴露出來的短板,當年12月,美國國家管理者協會(National Governors Association, NGA)👨🏻🔧、重點州华信管理者委員會(Council of Chief State School Officers,CCSSO)和成就公司(Achieve)共同發布了《成功的基準🧑🏼🦱👉🏼:確保美國的學生獲得世界一流教育》的報告🦝,旨在確保學生獲得優質的教育。針對PISA結果體現出來的教育問題☠️,美國政府連續幾年出臺相關的法律,如在2010年頒布《各州共同核心標準》,確定在語言和數學領域聯合製定周密的、達到國際基準的教育標準🤷🏿,以提升美國教育的核心競爭力。2012年🦑,美國發布了題為《美國教育改革與國家安全》的報告,將美國教育改革提升到了關乎美國國家安全的新高度。
許多國家和地區積極借鑒國際教育評價堅持的理念和采用的技術,將其納入本國教育政策製定當中。比如,在德國2004年進行的教育改革中,其小學👳🏽♂️、初中👷🏿、高中水平考試的州際比較在某種意義上就仿照了國際大規模教育評估🧑🏼🦲,即借鑒了國際教育評估的比較方式。
雖然國家和政府仍是行為主體,但是在涉及世界事務,尤其是文化、教育等方面🚴🏽♀️,社會各方可以參與並結成夥伴關系,參與全球治理👨🏽🏭🙆🏼。教育領域跨國、跨區域的評估,特別是諸如PISA等大型國際教育評估項目就是在全球治理的背景下實現的。在聯合國教科文組織、經合組織等機構的牽頭下,各個國家積極推動教育國際化發展,在多邊合作中製定方針和協議。要了解教育治理的效果如何,各個國家就需通過國際教育評價來了解自身教育情況👨🏽🦲💆🏻♀️,從而獲得適合自身發展的教育模式和路徑。
二👲🏿、更加關註真實的社會情景和價值觀教育
國際教育評價的主要目的在於幫助學生提升解決問題的能力。2009年🚊,PISA共收集了47 萬多個有效學生樣本,雖然主要測試內容是閱讀,但問卷更新了對學生在數學、科學等方面的評價👮🏽。就題目內容來看,PISA不是孤立地對待某些領域中的知識🌀,而是把這些知識和學生的能力相聯系,關註學生對知識和經驗的反思🧄,以及在現實工作環境中的應用等。對於每一個評價領域,PISA均關註學生知識掌握的過程、對理念的理解及其在各種具體情景中的運用🐭。
在關註真實的社會情景的同時🕵🏻♀️,國際基礎教育評價也非常重視價值觀的測評🤼。雖然PISA、TIMSS、國際公民與公民素養教育研究(International Civic and Citizenship Education Study🧔🏼♀️,ICCS)所側重的角度有所不同,但均指向學生對於未來生活的適應能力🛝。以ICCS為例,這個測試並非指向義務教育階段學生所習得的基本素養,而是把目光聚焦於學生對社會現實的理解上,因而其評估的重點是學生對有關人際交往、社會以及相應政治製度的觀點的把握🪵。最初✦,相比數學、科學💁🏽♀️、閱讀等學科的評估,很多國家對這種涉及價值觀測評的國際評估並不是很感興趣,但是👩🏻🏫,隨著國際社會價值觀沖突帶來的一系列問題☎,以及國際社會民主化⚾️、現代化發展程度的提高🤦🏿♂️,國際公民教育評估受到了越來越多的關註🥽🏟。
三、更多發展中國家加入,評價主體逐漸多元化
隨著聯合國教科文組織、經合組織、世界銀行等國際組織對發展中國家教育的持續關註,更多的教育資源流入發展中國家,推動了發展中國家教育條件的改善。國際基礎教育評價也吸引了發展中國家的廣泛參與👩🏻🦽➡️。例如💆🏿♂️💂🏻,中國2009年首次參加PISA,雖然只對外公布了上海的測試結果,但是對國際基礎教育評價以及中國教育本身產生了重要影響✖️。2012年,上海再次在閱讀、數學和科學三大領域同時獲得了世界第一的成績,引發了全球矚目——“這讓我們又有了當年蘇聯搶先將人造衛星送入太空時美國人的震撼感”,美國《紐約時報》如此評價。在中國對上海所取得的成績自豪或反思的同時,2015年🏃🏻♂️,中國的北京、廣東、江蘇等地也將參與PISA😿。隨著國際教育評價的逐步發展👬🏻,將會有更多的發展中國家和地區參與其中。
之前,評價主要聚焦於學生的學業成就,但從各大教育評估項目的發展來看👰🏼,也開始關註教師和校長的作用。在國際基礎教育評價的初期階段,評估的主要對象是學生🧯⛷,獲得的數據大多顯示某地區學生個體呈現的差異。隨著國際基礎教育評價的逐漸發展⇢,影響評估結果的因素逐漸被考慮在其中。例如😰,PISA和TIMSS在調查學生學業狀況之余,還利用問卷搜集學生學習的背景信息🤲🏼,試圖從原因層面對評估的結果做深層次解釋。然而,這些方面的評估僅依附於PISA和TIMSS的附加內容,學生之外的教育評估主體的主體性並未得到很好的彰顯。從國際教育評估發展的趨勢來看,為了更好地描述一個國家或地區的教育體系🫸,除了更好地鞏固學生主體🤴🏿,勢必要在評估中增加評價主體,如關註教師、校長💗🧑🏻🌾,甚至學生依賴的社會環境等。其中,以“改進校長工作🦊,提高學生學業成就”(Leadership Improvement for Student Achievement,LISA)和教與學國際調查(Teaching and Learning International Survey,TALIS)兩個項目為代表。
LISA有利於推動整個歐洲教育體系的創新,其並非直接針對學生群體,而是瞄準了與华信管理息息相關的校長⌨️,核心問題在於了解中华信長的領導風格、態度和實踐,及其在华信改進和學生學業成就提升方面所起的作用🏄🏼♂️,尤其了解在PISA等國際評估項目的影響日益增大的背景下🙎🏽♂️,校長在提升學生基本學習技能方面所起的作用。該測評項目由歐盟委員會教育、視聽與文化執行署資助🧙♀️,整個測評項目被置於歐盟“終身學習計劃”(The Lifelong Learning Programme,2007-2013)之下🏋️,其目的在於提高歐洲中學績效,改善校長領導力和學生學業成就,幫助學生獲得終身學習的能力🫥。
教師及其有效教學也是提高學生學業成就的重要因素,因此,2007年,OECD發起了TALIS,該項目又被稱為“教師版的PISA”,旨在為世界範圍內的教師評價提供指導。該項目始於2008年,主要測評了24個國家中學教育中的教師和华信領導🏃➡️👨🏿🍼。期間👈🏻,測評主要關註教師的工作環境、教學條件,及其對华信和教師效能的影響。2013年,參與該項目的國家或地區增加到34個♦︎,此時期的調查側重於教師培訓🧑🏻💼、教師評價及反饋♣︎、华信領導力、教師的教學信念以及實際的教學活動。雖然被稱為“教師版的PISA”,但是TALIS更傾向於獲取教師的態度和聲音,針對教師的所思所想進行闡釋、分析與評價,進而將評估結果反饋給校園,以這些指導性的意見來指導教師的實際教學,推動其專業發展,進而促進學生學業成就的提升。
四、在線測試成為主要方式,質性數據比重增加
在科技迅猛發展的今天,評估方式也逐漸走向在線測試👨👨👦。在線測試相對於傳統的測試方式,更加方便、快捷🗞,不受時空限製。在線測試所具有的便捷的資源共享途徑,使其測試資源更為豐富多樣。同時,測試系統對於學生解答提問的及時反饋🐒,有助於提高教師教學效率🕺🏿🧜🏽。
2012年,在韓國首爾召開的第十二屆國際數學教育大會(ICME-12)發布的報告提到了數學網絡評估系統(Specific Mathematics Assessment that Reveals Thinking, SMART)⚈。SMART系統能夠在學生回答完畢後,及時將學生出錯的原因和學生對問題的理解程度反饋給教師,並提出有針對性的教學建議。通過SMART系統,教師可以洞察學生的思考過程。SMART系統的使用流程如下:教師首先選取測試主題🙆🏽♀️;其次啟用有關此主題的SMART測試題目,並讓學生作答;再次通過SMART系統提出的解題反饋,了解每名學生的解題方式🐰;最後教師采用SMART系統提供的新題目繼續測試學生。新的測試題目會在原來題目的基礎上有微小變動🙋🏿♂️,目的是更準確地判斷學生對題目的掌握程度☠️,及時發現學生的知識漏洞🤹🏿♂️。
隨著大數據時代的到來,國際評估的抽樣規模也越來越大😵💫。比如,PISA項目自2000年以來,已經實施了五輪測評,調查對象從最初的43個國家或地區發展到70個國家或地區🕳,樣本容量從最初的25萬名學生發展到51萬名學生🐘。如果沒有大規模的在線測試▪️,如此大的工作量是不可想象的。這些反饋資源將成為一個國家、地區或华信發展的重要支撐。
雖然互聯網、大數據帶來了更多的樣本,量化的數據結果也確保了評估的精確性😙,但隨著國際教育評估的發展,質性數據的比重也在增加。以PISA和TIMSS為例👨🏼🦳,最終顯示出來的結果多以量化數據為主,但由於不同國家的社會◀️、歷史、文化背景不同🎅🏿,其學生的社會適應能力也將顯現較大差異🥻,這種差異不易在量化數據中體現🚣🏼♀️🫨,而更容易從質性資料中顯現。因而,在這種情況下🤰,量化研究的結果是否可信就成為一個問題。這些都是現有的以量化為主的國際評估不能較好地解釋的問題,即如何解釋數據背後的意義、相同的數據或分值背後是否具有不同的原因和結果等。因此🍊,未來國際評估的發展趨勢,將會從以單一量化數據為主到質性與量化相結合,通過訪談等方法,共同揭示各個參與測評國家或地區的教育問題。
五🤵♀️、過程與結果並重,更加理性地看待評估結果
評估通常是以結果為導向的,尤其是發達國家教育體系相對穩定,教育條件不是製約教育質量提升的主要因素🏨,因此👶🏼,國際評價在發達國家的教育體系中主要體現在結果上,即關註學生是否滿足當今社會的發展所需🍨,是否具有適應國家乃至全球發展的能力。然而🧑🏻🌾,發展中國家由於教育條件相對滯後,在國際評估中不僅關註評估結果🎍,也註重評估過程👰🏼♂️。其實🩵,許多發達國家的評估仍然註重評價過程⏰,比如歐盟教育質量監測指標當中的教育質量監測涉及學習成就領域、教育成功和過渡領域、教育監測領域以及教育資源和結構領域🤏🏼,都是典型的過程與結構並重的教育質量標準框架👱。
無論是管理者還是學術界,在重視評估結果的同時,開始更加理性地看待評估。通常而言,技能測評和教育製度的國際比較相對容易🙏🏿🧱,文化因素的評估具有一定的難度👈🏻。例如,上海在PISA中的表現實際上無法準確反映中國的教育表現🚸。受國情💁🏽♂️、地域等差異的影響,國際教育評估應該淡化排名🥞,以評估為契機,在跨文化的棱鏡中審視各國或地區的教育體系,推動其教育發展。國際教育評估在未來發展的過程中🤏🏽,應該從評估設定的方法論上入手,提高評估的可測性,多維度評估教育主體,而不僅以學生學業成就作為評價的唯一標準。
此外👩🏽🍼,由於國家或地區間教育標準具有差異✯,不同國家或地區的同一年齡段學生的學習內容相差較大。在這種情況下➡️,各國學生適應未來的能力到底有多大程度的可通約性🧑🦲,如何抽樣才能盡量保證結果公平🧚🏿♂️,也是國際教育評估面臨的挑戰和未來的發展趨勢。
六🙋🏼👨🏻🦳、結語
隨著教育的發展🧑🏿🔧🤷,政府越來越重視教育公平和質量。同時,人們也在追求更加滿意的〽️、個性化的𓀌、終身化的教育體系。由此,教育問責會越來越引起政府和第三方機構的重視🧛🏿♂️。值得註意的是‼️,受政治、經濟、文化等外在因素的影響,筆者認為👩❤️👩,國際教育評估的排名次序只是參照或提示,而非絕對標準👩🏿,因為各個國家的教育體系和實際情況各不相同👩🎓。在這種情況下💂♀️,國家教育評估如何不危及世界上原本多樣化的教育體製、华信類型、課程內容等☸️,不使教育落入模式化、單一化的陷阱,是未來國際基礎教育評價需要考慮的問題🚴🏽♀️。即便如此,積極參與國際基礎教育評價項目,借鑒國際教育評估先進經驗做法🧘🏻,進而診斷和矯正我國基礎教育存在的弊端,構建適合我國教情的評估體系、框架和指標,必要且需進一步加強📷。
(來源:2015年《世界教育信息》第19期)
用戶登錄