編者按:近期美國教育界掀起一個顛覆性的改革與討論,由逾百所美國頂尖私立高中組成的MTC聯(lián)盟(Mastery Transcript Consortium)推出了一個全新的學(xué)生評價系統(tǒng)——素養(yǎng)成績單(Mastery Transcript),
與傳統(tǒng)的成績單相比,該系統(tǒng)不打分、不評級,只是持續(xù)追蹤、記錄、評估學(xué)生8項能力,目前已獲美國大學(xué)申請系統(tǒng)
Coalition for Access,Affordability and Success的支持。
MTC聯(lián)盟表示,未來素養(yǎng)成績單評價模式會擴展到公立中學(xué),全面改寫美國大學(xué)的錄取方式。
這個新的學(xué)生評價系統(tǒng)是否會完全取代標準化考試成為美國高校錄取的依據(jù)?這個評價系統(tǒng)對我國高校招生有哪些啟示?為此,我們特別邀請專家圍繞高校招生模式展開筆談,同時歡迎廣大專家學(xué)者就此問題展開更廣泛的討論。
作者:王曉平,美國愛荷華州教育部,教育研究與評估高級顧問;
齊森,美國華盛頓蓋勞德特大學(xué)原研究員;
謝小慶,北京語言大學(xué)教育測量研究所原所長,中國教育學(xué)會統(tǒng)計測量分會副理事長,研究員,博士生導(dǎo)師。
原文刊載于《中國考試》2018年第3期第1—4頁。
摘要:美國高校招生無統(tǒng)一模式,標準化考試以及新的測量模式與方法都可能成為美國高校錄取的依據(jù)。
SAT和ACT成績從來不是美國高校錄取的唯一依據(jù),由美國頂尖私立高中組成的MTC聯(lián)盟推出的高校招生“新模式”并非要取代SAT和ACT考試,而是為了改進高中的學(xué)生評價系統(tǒng),美國的高校招生不大可能出現(xiàn)革命性的變化。
中國需要借鑒美國高校招生中淡化分數(shù)、淡化學(xué)科的嘗試,探索符合中國國情的考試評價方式,以此引領(lǐng)基礎(chǔ)教育改革由知識傳授轉(zhuǎn)向能力發(fā)展。
關(guān)鍵詞:高校招生;標準化考試;考試評價;考試招生制度改革
2017年5月10日,由逾百所美國頂尖私立高中組成的MTC聯(lián)盟(Mastery Transcript Consortium)正式推出了一種新的學(xué)生評價體系——“新模式”(A New Model)。
“新模式”目前已獲幫助申請者擇校的美國“入學(xué)、資助以及成功聯(lián)盟”(Coalition for Access, Affordability and Success,CAAS)的支持。
CAAS的用戶包括哈佛大學(xué)、耶魯大學(xué)、普林斯頓大學(xué)等80余所美國著名高校。
“新模式”的發(fā)起人為全美排名前25的俄亥俄州霍肯高中的校長Scott Looney,他同時也是MTC聯(lián)盟發(fā)起人。
他于2016年3月在美國私立學(xué)校協(xié)會年度會議上首次提出自己的構(gòu)想,很快吸引到不少頂級私立高中的響應(yīng)。
“新模式”包含兩個突出特點:第一,沒有分數(shù),沒有級別,只是持續(xù)追蹤、記錄、評估學(xué)生的8項能力,報告學(xué)生在8項能力上的“掌握學(xué)分”(Mastery Credits),用描述性的評價取代分數(shù)評價,并配以直觀的放射圖說明。
第二,成績報告與課程脫鉤,在學(xué)生的成績報告中沒有課程、科目的名稱,僅僅包含學(xué)生的“掌握學(xué)分”和相關(guān)描述。
SAT和ACT是美國現(xiàn)行的“高考”。
有人說,“新模式”將逐漸取代SAT和ACT,成為美國大學(xué)錄取的新依據(jù)。
這種可能性有嗎?
美國高校招生不可能出現(xiàn)革命性變化
在美國,標準化考試SAT、ACT僅是美國大學(xué)招生的參考依據(jù),既不唯一,也非重要依據(jù)。
在美國考試行業(yè)的行業(yè)標準中規(guī)定:在高利益相關(guān)(high stakes)考試中,在將考試分數(shù)作為升學(xué)、安置依據(jù)時,不能僅僅依據(jù)考試分數(shù)作出決策,必須同時參考其他方面的證據(jù)。
對此,早在1985年,由美國教育研究協(xié)會(American Educational Research Association,AERA)、美國心理學(xué)會(American Psychological Association,APA)和美國國家教育測量學(xué)會(National Council on Measurement in Education,NCME) 共同制定的《教育與心理測驗標準》(Standards for Educational and Psychological Testing)就作出明確規(guī)定,
2014年修訂版的表述是:“在教育環(huán)境中,不能僅僅憑一個單獨的測驗分數(shù)去作出那些可能對學(xué)生產(chǎn)生重要影響的決定或定性,決策還需要依據(jù)其他的相關(guān)信息。
”這既是美國考試行業(yè)的規(guī)定,也是美國教育界以及整個美國社會的共識。
美國的大學(xué)招生并無統(tǒng)一模式,非常個性化,各個大學(xué)具有自己不同的特點,對標準化考試的重視程度也不同。
各個大學(xué)以及下屬的各學(xué)院、各系、各專業(yè)招生的標準與評估方式都有可能不同。
大學(xué)、學(xué)院、系、專業(yè)通常都有一個自己的招生計分算法,按照不同的加權(quán),計算得到錄取指數(shù)(Admission Index)。
通常,計分方式屬于內(nèi)部掌握,不會對外公布。
總體講,在大學(xué)招生中最看重的還是報考者在中學(xué)的平均分數(shù)(Grade Point Average,GPA)或平均等級(Rank)。
此外,還會考慮大學(xué)先修測試(Advanced Placement,AP)成績、學(xué)術(shù)活動獲獎、參與社會公益活動、文藝體育特長、教師推薦信、發(fā)表作品、自我陳述、面試等方面的信息。
許多大學(xué)要求申請者提交的申請材料包括高中所學(xué)所有課程的詳細列表和成績單。
美國有多種層次、多種類型的大學(xué),可以滿足普通大眾和精英人才的多種需求。
個人只要愿意讀大學(xué),總能找到適合自己的學(xué)校,不會出現(xiàn)“一考定終身”的現(xiàn)象,某個考生即使由于考試成績或經(jīng)濟原因而進入了社區(qū)大學(xué),只要肯努力,有很多機會可以最終考入自己心儀的名校。
近些年,報考SAT和ACT的人數(shù)不但沒有下降,而且每年都在增加,這是由于根據(jù)奧巴馬總統(tǒng)在2015年簽署的《每一個學(xué)生成功法案》(Every Student Succeeds Act),一些州將SAT和ACT成績用于教育問責(Accountability)。
在美國,對SAT等標準化考試的批評由來已久,用更有效、可靠的評價方式來取代標準化考試的呼聲一直不斷。
從20世紀90年代初開始,在美國教育界就興起了一股表現(xiàn)性評估(performance assessment)、真實性評估(authentic assessment)和檔案袋評估(portfolio assessment)的潮流。
不少人主張用一些更有效的評估辦法取代標準化考試,主張用一個覆蓋較長時間段的形成性評估(formative assessment)取代某一特定時間點的終結(jié)性評估(summative assessment)。
在成績報告方面,21世紀初美國各個主要的教育測量機構(gòu)就開始注意避免向分數(shù)的使用者(包括學(xué)生、教師、家長、招生招工機構(gòu))僅僅提供一個“總分”,而是向測驗的使用者提供描述性成績報告(descriptive scoring)。
為此,廣泛開展了認知診斷(cognitive diagnosis)方面的研究。
基于認知診斷的思路,獲得相同總分的人可能具有不同的認知結(jié)構(gòu)和學(xué)習(xí)路徑。
認知診斷研究將認知心理學(xué)和心理測量學(xué)結(jié)合,借助現(xiàn)代的統(tǒng)計方法和計算機技術(shù),對學(xué)生的認知結(jié)構(gòu)和認知過程進行個性化的診斷分析,向測驗的使用者提供更豐富的反饋信息,對進一步的學(xué)習(xí)和教學(xué)提出更具體、更有針對性的建議。
認知診斷過程可以發(fā)現(xiàn)每個學(xué)習(xí)者的知識掌握狀況,發(fā)現(xiàn)每個學(xué)習(xí)者的認知結(jié)構(gòu),發(fā)現(xiàn)每個學(xué)習(xí)者不同的學(xué)習(xí)路徑,并提出幫助和補救建議,如SAT就采用了描述性計分和成績報告。
只有借助現(xiàn)代的統(tǒng)計工具、高速計算機和網(wǎng)絡(luò)環(huán)境,才可能根據(jù)每個考生在考試中的反應(yīng)作出認知診斷。
今天,已經(jīng)發(fā)展出多種認知診斷的數(shù)學(xué)模型,包括規(guī)則空間模型(Rule Space Model)、統(tǒng)一模型(Unified Model)、融合模型(Fusion Model)、DINA模型(Deterministic Inputs,Noisy“And”Gate Model),等等。
描述性記分的關(guān)鍵步驟是對測驗所要測量的能力進行特征定義,定義這種能力所具有的屬性,詳細描述學(xué)習(xí)的進程,界定不同的認知模式和不同的問題解決路徑。
當今,計算機技術(shù)和互聯(lián)網(wǎng)正在改變著世界,未來互聯(lián)網(wǎng)將沖擊傳統(tǒng)的教育和心理測量領(lǐng)域。
可以展望,未來的招生評價將不再是基于一次性考試的評價,也不再是基于某一時間橫斷面的信息,借助于大數(shù)據(jù)和云資源,招生機構(gòu)可以收集到考生各方面的資料,從而獲得申請者全方位的、立體的信息,這些信息無疑將成為決策更可靠的依據(jù)。
從1916年約翰·杜威發(fā)表《民主主義的教育》以來,教育觀念的變革已經(jīng)持續(xù)了百余年。
在快速變化的新時代,教育的變革必須與社會的變革相適應(yīng),尤其是在移動互聯(lián)時代。
今天,面對鋪天蓋地奔涌而來的信息大潮,重要的已經(jīng)不再是“獲取”信息,而是對信息進行“過濾”和“篩選”。
由于傳統(tǒng)和習(xí)慣的力量,重視知識傳授而忽略能力發(fā)展是各國教育的痼疾。
與以往相比,發(fā)展能力在今天變得更加重要。
在美國高校招生的“新模式”中,彰顯了繼續(xù)淡化知識傳授和強化能力發(fā)展的努力。
可以展望,伴隨技術(shù)的發(fā)展,不僅知識的存儲、檢索和提取工作將被機器所取代,甚至一部分知識的分類和整理工作也會被機器所取代,人的注意力將更加集中于對知識的評價和運用,集中于運用知識解決實際問題。
Looney校長倡議采用“新模式”的初衷并非要用“新模式”取代SAT和ACT標準化考試,而是為了改進高中的學(xué)生評價系統(tǒng),為每個學(xué)生提供更有針對性、更個性化的反饋信息,提高學(xué)習(xí)的效率。
盡管SAT等標準化考試也開始采用描述性計分,但這些考試仍然主要是預(yù)測選拔性考試,而不是認知診斷性考試。
今天,認知診斷性考試在實踐中主要用于幫助教師了解學(xué)生,以便因材施教。
此類測驗?zāi)J讲贿m合也并沒有被全面引入大學(xué)招生考試。
從上述對美國招生“新模式”的分析可以看出,“新模式”主要是為了改進和完善學(xué)校的評價系統(tǒng),是改進教育種種努力的自然延續(xù)。
當然,這種模式也會對改進大學(xué)招生產(chǎn)生促進作用。
考慮到“新模式”需要較多的人力物力投入,考慮到“新模式”對教師和教育管理人員有更高的要求,我們估計,至少在未來的10年間,“新模式”將僅僅被應(yīng)用于少數(shù)私立學(xué)校,并且也主要用于一些尖子生的錄取,被廣泛應(yīng)用于公立學(xué)校的可能性不大,更不可能取代SAT和ACT等標準化考試。
但是,伴隨基于大數(shù)據(jù)的新型形成性評價系統(tǒng)的建設(shè),SAT和ACT等標準化考試在大學(xué)招生中的比重有可能越來越小。
盡管30年來對SAT等標準化考試的批評一波未平一波又起,盡管20多年前在美國就興起了表現(xiàn)型評估和真實性評估的熱潮,但標準化考試在大學(xué)招生中的作用并未削弱。
出現(xiàn)這種情況,緣于三個因素:其一,標準化考試是一種比較經(jīng)濟、便宜的評價方式,而表現(xiàn)型評估則花費高昂;其二,盡管就一個班級或一所學(xué)校的學(xué)生而言,表現(xiàn)型評估具有更高的效度,
但是在不同學(xué)校、不同地區(qū)之間卻缺乏可比性,也較難保證評估的公平性;其三,SAT等標準化考試一直在根據(jù)大學(xué)和高中的要求進行改進,努力滿足大學(xué)和高中的需求。
未來這三個因素會繼續(xù)存在,因此,美國的大學(xué)招生不大可能出現(xiàn)革命性的變化。
中國需要更堅定地推進考試評價制度改革
我國從1977年恢復(fù)高考以來,雖然已經(jīng)在考試科學(xué)化方面取得了顯著成績,但與社會發(fā)展的要求之間還存在一定差距。
中國的基礎(chǔ)教育于2001年啟動“新課程改革”,17年來,為了挽救“小范進”們,中小學(xué)教師付出了許多心血,承擔了種種壓力,在他們的努力下,我國基礎(chǔ)教育已經(jīng)發(fā)生了明顯變化,
中小學(xué)課堂已經(jīng)出現(xiàn)了可喜變化,“小組學(xué)習(xí)”正在取代教師的“獨角戲”和“一言堂”,“能力發(fā)展”正在取代“知識傳授”,思維訓(xùn)練正在取代“死記硬背”。
但是,積極從事“課改”的教師、校長和教育局局長們長期面臨著一個困惑:如何評價新的教學(xué)方法達到了更好的教學(xué)效果?教學(xué)改革的效果如何體現(xiàn)?
顯然,傳統(tǒng)的“以分數(shù)為緯、以學(xué)科為經(jīng)”的評價方式已經(jīng)不足以反映教學(xué)改革在發(fā)展學(xué)生核心勝任力和提高學(xué)生思維水平方面所取得的成效,不足以反映教學(xué)改革在提高學(xué)生核心素養(yǎng)方面的成效。
因此,迫切需要加速考試評價的科學(xué)化進程,美國高校招生“新模式”中淡化分數(shù)、淡化學(xué)科的嘗試,值得我們借鑒和參考。
好在2014年啟動的新一輪高考綜合改革已經(jīng)邁出了一步,未來的路還很長,任務(wù)還很艱巨,需要全社會轉(zhuǎn)變觀念,需要考試評價研究工作者提出符合中國國情的評價技術(shù)和方法,在吸收借鑒美國教育同行經(jīng)驗的基礎(chǔ)上,堅定不移地推進中國的考試評價制度改革。

? 2025. All Rights Reserved. 滬ICP備2023009024號-1