考試評價(jià)改革作為教育改革的“牛鼻子工程”,直接影響教學(xué)導(dǎo)向、學(xué)習(xí)方式和人才培養(yǎng)質(zhì)量。以新一代數(shù)智技術(shù)為杠桿,撬動(dòng)考試評價(jià)改革,賦能人才培養(yǎng),成為推進(jìn)教育數(shù)字化轉(zhuǎn)型、深化教育評價(jià)改革和促進(jìn)教育高質(zhì)量發(fā)展的“關(guān)鍵齒輪”。
數(shù)智時(shí)代考試評價(jià)改革可在評價(jià)理念、評價(jià)工具、評價(jià)功能等方面實(shí)現(xiàn)系統(tǒng)性范式轉(zhuǎn)型。
從“統(tǒng)一標(biāo)尺”向“多元融合”的評價(jià)理念轉(zhuǎn)型。技術(shù)快速迭代、產(chǎn)業(yè)形態(tài)重構(gòu)和社會(huì)運(yùn)行方式革新,要求人才具備技術(shù)素養(yǎng)和跨界復(fù)合能力、高階認(rèn)知和創(chuàng)新能力、動(dòng)態(tài)適應(yīng)能力和人文價(jià)值判斷力等。標(biāo)準(zhǔn)化考試難以評估這些高階能力,因此要構(gòu)建技術(shù)賦能、多元融合、動(dòng)態(tài)反饋的新型多元評價(jià)體系,以適應(yīng)未來社會(huì)對人才的要求。多元評價(jià)不是簡單增加考核形式,而是借助技術(shù)賦能的多元化工具,通過開展情境化表現(xiàn)評價(jià)、動(dòng)態(tài)過程性評價(jià)和社會(huì)化參與評價(jià)等,使教育實(shí)現(xiàn)促進(jìn)人的全面發(fā)展這一本質(zhì)目標(biāo)。
從“標(biāo)準(zhǔn)化量表”向“智能生態(tài)系統(tǒng)”的評價(jià)工具轉(zhuǎn)型??荚囋u價(jià)工具的數(shù)智化轉(zhuǎn)型是數(shù)智技術(shù)落地的核心載體,其演進(jìn)路徑呈現(xiàn)出從單一工具向復(fù)合生態(tài)、從靜態(tài)測量向動(dòng)態(tài)感知、從人工操作向智能協(xié)同的顯著特征。評價(jià)工具的轉(zhuǎn)向應(yīng)包含三個(gè)層次:第一個(gè)層次是傳統(tǒng)評價(jià)工具的數(shù)智化升級,如深化人工智能在智能組卷系統(tǒng)和電子閱卷系統(tǒng)中的應(yīng)用等。第二個(gè)層次是新型數(shù)智評價(jià)工具的突破,如研發(fā)自適應(yīng)測評系統(tǒng),構(gòu)建“千人千卷”的個(gè)性化測評模式;探索虛擬現(xiàn)實(shí)測評場景,通過沉浸式任務(wù)解決評估學(xué)生的創(chuàng)新思維和實(shí)踐能力等。第三個(gè)層次是形成數(shù)智評價(jià)生態(tài),借助數(shù)智技術(shù)推動(dòng)考試評價(jià)與課程教學(xué)、教師考核深度銜接,建立覆蓋“教、學(xué)、評”全場景的數(shù)據(jù)采集網(wǎng)絡(luò),形成可解釋、可追溯的智能評價(jià)算法體系,提升考試評價(jià)的科學(xué)性和系統(tǒng)性。
從“末端測量”向“過程賦能”的評價(jià)功能轉(zhuǎn)型。借助數(shù)智技術(shù),推進(jìn)多維素養(yǎng)建模、認(rèn)知深度挖掘與情境化測評的深度融合,推動(dòng)考試評價(jià)實(shí)現(xiàn)四大功能躍遷:一是突破傳統(tǒng)考試的“分?jǐn)?shù)桎梏”,構(gòu)建覆蓋價(jià)值觀、協(xié)作能力和批判性思維的立體化素養(yǎng)評估體系,借助自然語言處理、虛擬現(xiàn)實(shí)等技術(shù)生成動(dòng)態(tài)“能力雷達(dá)圖”,實(shí)現(xiàn)對學(xué)生綜合能力的立體評估。二是依托認(rèn)知診斷模型和學(xué)習(xí)行為追蹤,從“結(jié)果判定”轉(zhuǎn)向精準(zhǔn)歸因和過程干預(yù),定位學(xué)生思維盲區(qū)并推送個(gè)性化學(xué)習(xí)路徑,同時(shí)幫助教師實(shí)現(xiàn)精準(zhǔn)教學(xué)。三是通過跨學(xué)科情境任務(wù)和真實(shí)問題模擬,檢驗(yàn)學(xué)生在復(fù)雜場景中解決問題的能力,彌合考場與社會(huì)實(shí)踐間的鴻溝。四是基于大數(shù)據(jù)聚類分析和生涯關(guān)聯(lián)算法,從“統(tǒng)一標(biāo)尺”轉(zhuǎn)向差異化成長導(dǎo)航,為個(gè)體提供多元發(fā)展適配方案。
數(shù)智技術(shù)為考試評價(jià)改革注入了創(chuàng)新活力,但技術(shù)賦能的同時(shí)也帶來了不可預(yù)測性和不可逆風(fēng)險(xiǎn)。因此,數(shù)智時(shí)代考試評價(jià)改革應(yīng)辯證把握工具效能與教育規(guī)律、效率追求與教育公平、技術(shù)創(chuàng)新與制度供給三大關(guān)系的動(dòng)態(tài)平衡,堅(jiān)守教育本質(zhì)。
始終把握工具效能與教育規(guī)律的辯證統(tǒng)一。智能技術(shù)賦能考試評價(jià)的核心在于數(shù)據(jù)資源的深度挖掘和科學(xué)應(yīng)用,但不能將之窄化為精準(zhǔn)計(jì)算的工程問題,而應(yīng)始終服務(wù)于立德樹人根本任務(wù)。比如,利用算法模型解構(gòu)知識(shí)能力圖譜時(shí),需警惕“技術(shù)至上”對教育主體性的消解;智能系統(tǒng)替代教師進(jìn)行診斷和反饋,可能導(dǎo)致教師主體性削弱。因此,教育工作者應(yīng)具備技術(shù)敏感與人文定力的雙重自覺,構(gòu)建“技術(shù)向善”的價(jià)值錨點(diǎn),在技術(shù)研發(fā)時(shí)嵌入教育價(jià)值校準(zhǔn)機(jī)制,在制度設(shè)計(jì)時(shí)構(gòu)建風(fēng)險(xiǎn)預(yù)警響應(yīng)系統(tǒng),在文化認(rèn)知中培育技術(shù)批判性思維,讓技術(shù)真正成為“點(diǎn)亮人”而非“定義人”的力量,實(shí)現(xiàn)從技術(shù)賦能走向教育增值。
始終把握效率提升與公平保障的動(dòng)態(tài)平衡。教育公平是社會(huì)公平的重要基礎(chǔ),數(shù)智技術(shù)雖然可以顯著提升評價(jià)效率,但若缺乏系統(tǒng)性制度設(shè)計(jì),可能加劇資源分配失衡、算法偏見和數(shù)字鴻溝。要實(shí)現(xiàn)考試評價(jià)數(shù)智化改革的高效、公平,就要打好“技術(shù)+制度+文化”的組合拳。首先,在技術(shù)適配層,要以多模態(tài)終端支持系統(tǒng)開發(fā)跨平臺(tái)考試系統(tǒng),使之像“變形金剛”那樣能適配各種設(shè)備,確保城鄉(xiāng)不同配置設(shè)備均可獲得標(biāo)準(zhǔn)化的交互體驗(yàn);要建立深度學(xué)習(xí)驅(qū)動(dòng)的評卷糾偏機(jī)制,給智能評卷系統(tǒng)裝上“偏見過濾器”,防止算法因數(shù)據(jù)偏差產(chǎn)生不公平。其次,在制度保障層,實(shí)施“紙質(zhì)—數(shù)字”雙軌并行機(jī)制,不讓跟不上技術(shù)腳步的孩子掉隊(duì)。再次,在文化認(rèn)知層,實(shí)施數(shù)字素養(yǎng)培育工程,構(gòu)建多元主體共治機(jī)制,建立數(shù)據(jù)共享但不泄密的聯(lián)防機(jī)制。
始終把握技術(shù)創(chuàng)新與制度供給的動(dòng)態(tài)適配。數(shù)智化考試評價(jià)的健康發(fā)展,既需要保持技術(shù)創(chuàng)新的開拓性,又必須加強(qiáng)制度供給的前瞻性。例如,針對大規(guī)模教育數(shù)據(jù)采集與個(gè)人信息保護(hù)的制度沖突,需建立分級分類授權(quán)機(jī)制;針對評價(jià)模型可解釋性要求與技術(shù)復(fù)雜性的矛盾,應(yīng)構(gòu)建算法備案審查制度;針對落后于技術(shù)迭代速度的困境,需建立敏捷性制度響應(yīng)機(jī)制等。在政策層面,推進(jìn)“管辦評”分離改革,建立政府、學(xué)校、專業(yè)機(jī)構(gòu)與家長協(xié)同治理的多元評價(jià)格局。如成立教育數(shù)據(jù)治理委員會(huì),統(tǒng)籌政府、學(xué)校、專業(yè)機(jī)構(gòu)、家長四方主體,建立數(shù)據(jù)確權(quán)、算法審計(jì)、倫理審查的協(xié)同機(jī)制。在標(biāo)準(zhǔn)層面,實(shí)施標(biāo)準(zhǔn)體系先行引領(lǐng),教育部門應(yīng)加快制定教育數(shù)據(jù)安全標(biāo)準(zhǔn)、算法倫理規(guī)范等制度。在機(jī)制層面,建立動(dòng)態(tài)校準(zhǔn)機(jī)制,通過人機(jī)協(xié)同、多方驗(yàn)證確保評價(jià)的公平性和科學(xué)性,防范技術(shù)應(yīng)用可能帶來的“算法偏見”等問題。通過建立技術(shù)標(biāo)準(zhǔn)與制度規(guī)范的雙向映射機(jī)制,構(gòu)建風(fēng)險(xiǎn)可控的試錯(cuò)容錯(cuò)空間,確保技術(shù)賦能始終行駛在“教育規(guī)律”與“技術(shù)倫理”的雙軌之上,為改革提供持續(xù)動(dòng)能。
?。ㄗ髡呦蹈=ㄊ〗逃荚囋嚎蒲信c評價(jià)處副處長、副研究員。本文系2022年度福建省教育系統(tǒng)哲學(xué)社會(huì)科學(xué)研究項(xiàng)目[JDW22001]成果)
《中國教育報(bào)》2025年08月02日 第04版
工信部備案號:京ICP備05071141號
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120170024
中國教育報(bào)刊社主辦 中國教育新聞網(wǎng)版權(quán)所有,未經(jīng)書面授權(quán)禁止下載使用
Copyright@2000-2022 www.weilaiguolv0015.com All Rights Reserved.