教育評價事關教育發(fā)展方向,有什么樣的評價指揮棒,就有什么樣的辦學導向。2020年中共中央、國務院印發(fā)的《深化新時代教育評價改革總體方案》,明確提出要“健全綜合評價”。在教育數(shù)字化轉型的背景下,特別是教育信息化取得長足進步的今天,學生的綜合評價需要構建以核心素養(yǎng)為底座的學生全面發(fā)展理論模型與指標體系,依托常態(tài)化教與學信息化應用所采集的學生客觀行為、身心發(fā)展和結果數(shù)據(jù),并積極探索形成各指標與多模態(tài)數(shù)據(jù)的關聯(lián)映射關系,從而建立起理論指導技術應用、技術應用優(yōu)化理論模型的雙向驅動評價新范式。 雙向優(yōu)化的新范式 如何全面理解理論與技術雙向驅動下的學生評價新范式?首先,新范式的重中之重是,理論站得住,技術可操作,兩者相互促進,在迭代中形成不斷優(yōu)化的評價解決方案。新范式不僅在于理論層面的拓展與深化,而且涵蓋方法層面的創(chuàng)新。 一是理論上的完備性和綜合性。理論層面的完備性重在指導評價內容的全面性,即對學生面向新時代跨越學科特性的必備能力、關鍵品格和價值觀的全面覆蓋。綜合評價不是對已有德智體美勞各要素的分立性判斷,而是對學生能力發(fā)展的基礎性和必要性成分的綜合判定。學生問題解決能力、批判性思維、心理健康、親子關系、家國情懷等,都是綜合評價涉及內容。 二是技術上的可行性和先進性。新技術的使用,使采集和匯聚學生不同場景的客觀數(shù)據(jù)已成為可能,突破了以往綜合評價依賴主觀經(jīng)驗的局限。同時,利用多模態(tài)數(shù)據(jù)的智能處理與分析技術可以對不同來源、不同結構的海量數(shù)據(jù)進行處理和分析,構建特征數(shù)據(jù)與各指標的映射關系,從而深度挖掘學生綜合素養(yǎng)發(fā)展過程與特點,并為學生個體提供綜合性評價結果和未來發(fā)展建議。 三是理論與技術不斷迭代的發(fā)展性。新范式下,基于智能技術的持續(xù)動態(tài)采集能力,學生綜合評價可以對特定時間范圍內的學生能力變化進行持續(xù)刻畫,精準洞察學生個體在一定時間范圍內的發(fā)展變化,從而支持對學生的增值評價;并且,通過對相關評價信息進行關聯(lián)挖掘、分析,能夠實現(xiàn)針對學生發(fā)展規(guī)律的理解。更重要的是,大數(shù)據(jù)支持下的強化學習和主動學習,又幫助我們進一步挖掘出能夠表征理論指標的更多數(shù)據(jù)特征,從而支持理論模型的不斷迭代優(yōu)化。 新范式的構建 新范式堅持理論科學性與技術可行性的有機統(tǒng)一,總體來說,新范式的核心理念可以概括為“四個環(huán)節(jié)”“雙向驅動”與“循環(huán)迭代”。 四個環(huán)節(jié)主要包括模型構建、數(shù)據(jù)采集、數(shù)據(jù)智能分析以及評價應用。 第一,學生綜合評價模型構建。學生綜合評價模型的構建不再完全依靠教育學領域專家,而要聯(lián)結多領域專家共同構建一套以“中國學生發(fā)展核心素養(yǎng)”的文化基礎、自主發(fā)展、社會參與三個方面為基礎,適應時代發(fā)展、共識性與可解釋性較強、靈活性較高的學生綜合素質評價模型。 第二,多場域多模態(tài)的數(shù)據(jù)采集。新范式下,數(shù)據(jù)采集方式、數(shù)據(jù)來源、數(shù)據(jù)模態(tài)等方面有了根本性的改變。數(shù)據(jù)采集方式方面,突破傳統(tǒng)調查、填報為主的采集方式,轉向基于教育信息化基礎數(shù)據(jù)匯聚,走向伴隨式數(shù)據(jù)采集為主的趨勢。數(shù)據(jù)來源方面,不再局限于學校場景,而是延伸至對學生發(fā)展至關重要的家庭、社區(qū)、科技館等多種典型場域。數(shù)據(jù)模態(tài)方面,除了文本數(shù)據(jù)以外,還能夠采集包括音頻、視頻、圖像、生理信號等多模態(tài)數(shù)據(jù)。 第三,多模態(tài)數(shù)據(jù)智能分析。通過分析旨在將多模態(tài)數(shù)據(jù)指標與學生發(fā)展特征建立關聯(lián)映射關系。面對復雜的、非結構化的多模態(tài)數(shù)據(jù),首先要做的就是對其進行包括缺失值處理、無效數(shù)據(jù)剔除等工作;然后依據(jù)評價理論模型,通過特征變量提取等方法提取特征,構建綜合評價的各指標與不同模態(tài)學生表現(xiàn)性數(shù)據(jù)特征的映射關系。 第四,學生綜合評價應用?;谏鲜鋈?,將構建起學生綜合評價的數(shù)據(jù)表征能力。在此基礎上,我們就可以搭建起學生綜合評價的應用體系,通過常態(tài)化的應用,去驗證理論模型,優(yōu)化技術服務,從而實現(xiàn)綜合評價應用的常態(tài)化和科學化。 從以上四個環(huán)節(jié)來看,通過融合“理論”與“技術”優(yōu)勢,形成了從理論到技術的“自上而下”(理論指導技術應用)和從技術到理論的“自下而上”(技術應用優(yōu)化理論)的雙向驅動機制。就理論到技術的“自上而下”而言,實質是從權威的角度出發(fā)構建學生綜合評價理論模型,為多模態(tài)數(shù)據(jù)采集、多模態(tài)數(shù)據(jù)智能分析以及學生綜合評價應用提供基本理論指導與模型服務支持。就技術到理論的“自下而上”而言,實質是從數(shù)據(jù)出發(fā)構建基于數(shù)據(jù)的學生綜合評價模型,為學生綜合評價指標找到可測量、可計算的數(shù)據(jù)指標,提煉出相應的數(shù)學結構,計算出學生綜合評價結果,為結果應用提供參考,進而優(yōu)化、完善理論。 通過“模型構建—數(shù)據(jù)采集—數(shù)據(jù)智能分析—評價應用—模型構建”的閉環(huán)反饋、多輪迭代流程,新范式下的評價模型持續(xù)優(yōu)化,數(shù)據(jù)來源持續(xù)豐富,數(shù)據(jù)處理持續(xù)精準,最終使學生綜合評價能夠適應不同場景需要。但是,針對不同的情形,循環(huán)迭代過程中所要迭代的側重點也不一樣,大致可以分為三種情形:一是教育學、心理學等領域已有成熟理論模型和方法的評價內容,迭代優(yōu)化數(shù)據(jù)采集點;二是教育學、心理學等領域尚無成熟理論模型和方法的評價內容,迭代優(yōu)化評價指標以及指標權重;三是教育學、心理學等領域已有理論模型,但尚無測量方法的評價內容,迭代優(yōu)化評價模型與數(shù)據(jù)采集點。 新范式的實施路徑 理論與技術雙向驅動的學生綜合評價新范式從理論走向實踐,解決教育評價實踐中存在的問題,必然會遇到挑戰(zhàn)。在實踐中有效解決以下四個關鍵問題,將利于持續(xù)推進新范式的落地應用。 一是破解數(shù)據(jù)匯聚難題。我國教育信息化發(fā)展歷經(jīng)40多年,已經(jīng)建立起了完備的應用系統(tǒng)或平臺體系。然而,如何匯聚海量多源異構數(shù)據(jù)?首先,建立健全數(shù)據(jù)標準規(guī)范體系是從源頭上保障數(shù)據(jù)格式的規(guī)范與統(tǒng)一。其次,建立高一級別的數(shù)據(jù)采集與匯聚平臺,通過統(tǒng)一的數(shù)據(jù)接口對接各應用系統(tǒng)或平臺,實現(xiàn)各取所需。 二是保障數(shù)據(jù)安全和隱私。針對不同應用系統(tǒng)或平臺的海量數(shù)據(jù)能夠匯聚融合的情況下,組合數(shù)據(jù)加密、簽名、隱私處理等方法確保數(shù)據(jù)在傳輸、存儲以及應用過程中的安全性。針對不同應用系統(tǒng)或平臺的海量數(shù)據(jù)無法匯聚融合的情況下,采用聯(lián)邦學習技術保證學生個人的隱私不外泄,同時還能保證數(shù)據(jù)擁有方的利益。 三是加快建立綜合評價常模。從長遠來看,學生綜合評價的結果要服務于我國人才培養(yǎng)與教育評價改革。常模建立能為評價結果應用提供參考的基準線。一方面,對于可以確定因變量的指標或維度,引入數(shù)據(jù)科學方法進行分析;另一方面,對于數(shù)據(jù)科學方法無法進行合理權重分配的情況,以教育科學方法為主,結合數(shù)據(jù)科學方法確定權重,這均為常模構建提供了支持。 四是遵循定性與量化評價相結合。新范式下,學生發(fā)展的一切指標均可以通過智能技術采集客觀數(shù)據(jù)進行量化評價。然而,從評價的科學性與當前技術的可行性來看,這是一種理想狀態(tài)。因此,在實踐中考慮這一問題時,我們主張不走極端的數(shù)據(jù)決定論支持的絕對量化評價這一道路,純粹的量化評價對學生綜合評價并不完全適合,而是需要將定性評價與定量評價結合起來,共同針對學生某一發(fā)展指標進行科學、客觀、全面評價。