本文由《遠程教育雜志》授權(quán)發(fā)布
作者:牟智佳、俞顯
摘要
“學(xué)習(xí)分析與知識國際會議”是反映學(xué)習(xí)分析研究現(xiàn)狀與趨勢的一個重要風(fēng)向標(biāo)。通過以歷年會議論文為研究樣本來源,以元分析、知識圖譜、社會網(wǎng)絡(luò)分析為研究方法,從研究者國籍、學(xué)科背景、關(guān)鍵文獻、關(guān)鍵詞、研究主題和研究方法六個方面,對文獻進行內(nèi)容分析。研究結(jié)果顯示:(1)以美國、英國、加拿大、澳大利亞等為主導(dǎo)的國家引領(lǐng)學(xué)習(xí)分析的研究熱點,并形成了以教育學(xué)、計算機科學(xué)與工程、人工智能、心理學(xué)與認知科學(xué)為主導(dǎo)學(xué)科的學(xué)術(shù)群體合作研究態(tài)勢;(2)歷年研究關(guān)鍵詞分別呈現(xiàn)出社會網(wǎng)絡(luò)分析、教育文本分析和可視化、大規(guī)模開放在線課程、教育數(shù)據(jù)挖掘和計算機支持協(xié)作學(xué)習(xí)共同體的演變趨勢;(3)通過聚類分析,形成了以生成預(yù)測模型、數(shù)據(jù)集驅(qū)動的研究、語義對話與自動作文評分、知識建構(gòu)與能力轉(zhuǎn)化等為代表的研究主題;(4)以設(shè)計研究法、文本分析法、混合研究法、教育數(shù)據(jù)挖掘等為代表的研究方法,呈現(xiàn)為新型研究范式。最后,基于分析結(jié)果對學(xué)習(xí)分析研究熱點進行了討論。
關(guān)鍵詞:知識圖譜;學(xué)習(xí)分析;社會網(wǎng)絡(luò)分析;可視化;研究熱點
一、研究背景
在教育大數(shù)據(jù)、教育云服務(wù)和網(wǎng)絡(luò)學(xué)習(xí)空間日漸普及的背景下,學(xué)習(xí)分析的應(yīng)用價值得到日益凸顯,越來越多教育者和管理機構(gòu)通過學(xué)習(xí)分析了解學(xué)生的學(xué)習(xí)過程并為其提供更好的支持。自2008年《地平線報告》在中期趨勢中提出“數(shù)據(jù)集成”以來,學(xué)習(xí)分析經(jīng)歷了從可視化數(shù)據(jù)分析到量化自我的演變,并在近五年的報告中一直作為影響教育領(lǐng)域的關(guān)鍵趨勢之一然而,麥肯錫全球數(shù)據(jù)分析研究所(Mckinsey Global Institute)在2011年6月發(fā)布的《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個前沿》報告中指出,有策略地應(yīng)用分析來指導(dǎo)實踐這一思想并未在教育領(lǐng)域中得到應(yīng)用,教育領(lǐng)域的數(shù)據(jù)已初具規(guī)模,但分析卻相當(dāng)薄弱[2]。之后,美國教育部下設(shè)的教育技術(shù)辦公室在2012年發(fā)布的《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析來改善教與學(xué)》報告中,對教育數(shù)據(jù)挖掘和學(xué)習(xí)分析的研究基礎(chǔ)、應(yīng)用方向、實施挑戰(zhàn)等方面進行了深入分析,旨在促進這兩類組織的融合并推動其在教育領(lǐng)域的應(yīng)用[3]。
當(dāng)前,學(xué)習(xí)分析已經(jīng)引起國內(nèi)外研究者的廣泛重視,相關(guān)研究者成立學(xué)習(xí)分析研究協(xié)會。該協(xié)會下設(shè)的“學(xué)習(xí)分析與知識國際會議”(International Conferenceon Learning Analytics & Knowledge,LAK)旨在為從事學(xué)習(xí)分析的學(xué)術(shù)機構(gòu)、管理者、軟件開發(fā)者和企業(yè)提供一個交流平臺,其交流內(nèi)容逐漸成為反映學(xué)習(xí)分析研究風(fēng)向標(biāo)的一個重要觀測點。
二、研究方法與過程
(一)研究樣本與研究方法
本研究選取歷年“學(xué)習(xí)分析與知識國際會議”的論文作為研究樣本,該會議自2011年2月第一次由加拿大阿薩巴斯卡大學(xué)在阿爾伯塔省的班夫舉辦以來,已經(jīng)連續(xù)舉辦五屆。在此,我們對歷屆會議的信息進行了匯總,如表1所示。從中可以看出,學(xué)習(xí)分析議題由初期將學(xué)習(xí)分析中的技術(shù)內(nèi)容與社會和教育方向相整合走向深人的教育大數(shù)據(jù)學(xué)習(xí)分析,與創(chuàng)新,會議主題報告也側(cè)重于通過教育數(shù)據(jù)分析,獲取更豐富的教與學(xué)信息。在研究樣本的獲取上,由于該會議與國際計算機學(xué)會電子數(shù)據(jù)庫合作,因此,將通過在線數(shù)據(jù)庫來獲取歷年會議論文和文獻統(tǒng)計信息。在檢索過程和結(jié)果上,以會議名稱為檢索字段,在檢索結(jié)果上剔除每年的會議日程介紹、Workshop安排等非研究性論文,獲取到第一年論文27篇,第二年論文52篇,第三年論文45篇,第四年論文54篇,第五年論文84篇,總計262篇。
在研究方法上,本文分別采用元分析、知識圖譜、社會網(wǎng)絡(luò)分析對文獻內(nèi)容進行分析。其中元分析(Meta-analysis)是由Glass于1976年首次提出,它是一種將定性分析和定量分析相結(jié)合的文獻分析方法,其目的主要是借助統(tǒng)計方法,就同一主題的大量研究結(jié)果進行綜合分析與評價,探討研究中存在的規(guī)律[9]。通過元分析可以對文獻研究主題和研究方法進行分析,而知識圖譜是對歷年文獻中的關(guān)鍵詞演變及研究熱點進行分析,社會網(wǎng)絡(luò)則是對研究者合作關(guān)系信息進行分析。整個研究通過可視化的知識圖譜展現(xiàn)各項分析結(jié)果。
研究過程中用到的工具軟件有CiteSpacelll、Ucinet6.0、Histcite、Visio2010,其中Ucinet6.0用于描述社會網(wǎng)絡(luò)中個體之間的關(guān)系、角色地位和所屬派系等社會學(xué)信息[10];Histcite由SCI的創(chuàng)辦人加菲爾德設(shè)計開發(fā),能夠用圖示的方式展示某一領(lǐng)域重要文獻及其文獻之間的關(guān)系[11],本研究中將用其分析和提取關(guān)鍵文獻;CiteSpacelll是由美國學(xué)者陳超美領(lǐng)銜開發(fā)的可視化分析工具,通過分析可以找出該領(lǐng)域的知識基礎(chǔ)、核心作者、研究熱點以及研究趨勢[12]。
(二)研究過程
文章的研究過程主要包括以下六個方面:(1)匯總近五年“學(xué)習(xí)分析與知識國際會議”的論文,并按時間順序?qū)v年會議論文進行編碼;(2)提取文獻中的研究者姓名、國籍、學(xué)科、關(guān)鍵詞、題目等信息并進行編碼,對同義、單復(fù)數(shù)、簡寫關(guān)鍵詞進行合并處理,如“visualization”、“visualisation”統(tǒng)—為“visualisation”,SNA統(tǒng)一寫為“society network analysis”等;(3)對文獻中的研究方法進行內(nèi)容分析,其方法是兩名研究者分別閱讀文獻確定其方法記錄到表格中,并匯總研究方法名稱,最后對各類文獻方法進行編碼;研究主題分析通過知識圖譜軟件對“主題詞”進行聚類分析得到;(4)利用本地引用次數(shù)繪制關(guān)鍵文獻的引文編年圖,并分析其引證關(guān)系鏈;(5)通過知識圖譜和社會網(wǎng)絡(luò)對樣本數(shù)據(jù)進行分析并可視化輸出;(6)依據(jù)分析結(jié)果探討學(xué)習(xí)分析的研究熱點。
三、研究結(jié)果分析
(一)研究者國籍與學(xué)術(shù)群體分析
1.研究者國籍與研究機構(gòu)分析
通過研究者國籍分析可以掌握不同國家對某一研究領(lǐng)域的貢獻程度以及國家之間的合作關(guān)系。將數(shù)據(jù)導(dǎo)入CiteSpacelll,時間跨度設(shè)定為2011-2015年,單個時間分區(qū)設(shè)定為1年,“Node Types”選擇“Country”,“Top N per slice”閾值設(shè)定為50,其中前、中、后三個時間分區(qū)的閾值(C,CC,CV)分別設(shè)定為(3,4,15)、(3,2,15)、(2,2,15),閾值越大符合條件的作者越少,其余閾值由現(xiàn)行內(nèi)插值來決定,最后獲得包含50個節(jié)點和113條線的關(guān)系圖。需要說明的是,閾值設(shè)置根據(jù)圖譜聚類效果而定,若各聚類之間清晰顯示要素,聚類之間有少量關(guān)鍵的聯(lián)系,此類閾值設(shè)置符合分析要求[13]。
通過上述分析設(shè)定得出如圖1的分析結(jié)果,其中“圓圖”半徑代表著國家出現(xiàn)的次數(shù)和時間,時間由遠至近,從圓的中心向外拓展。可以看出,在學(xué)習(xí)分析研究領(lǐng)域中,第一梯隊是美國、英國、加拿大,其中,美國和加拿大均舉辦過兩屆“學(xué)習(xí)分析與知識國際會議”,英國則以英國開放大學(xué)(The Open University)為首的研究機構(gòu)積極參與到學(xué)習(xí)分析的理論、發(fā)展和應(yīng)用實踐研究中[14];而澳大利亞、德國、荷蘭等國緊隨其后;西班牙、比利時、希臘、法國則處于第三梯隊。從機構(gòu)分布來看,英國開放大學(xué)、美國密西根大學(xué)、加拿大阿薩巴斯卡大學(xué)、澳大利亞臥龍崗大學(xué)、荷蘭開放大學(xué)、西班牙卡洛斯三世大學(xué)、德國信息技術(shù)研究中心等機構(gòu)是學(xué)習(xí)分析領(lǐng)域的主要研究機構(gòu)。此外,美國斯坦福大學(xué)、澳大利亞悉尼大學(xué)、英屬哥倫比亞大學(xué)、德國弗勞恩霍夫信息技術(shù)應(yīng)用研究所在學(xué)習(xí)分析領(lǐng)域的研究也比較突出。
可見,學(xué)習(xí)分析技術(shù)的研究主陣地在歐美國家,圖譜顯示各國之間呈現(xiàn)合作研究的態(tài)勢,跨國合作研究是學(xué)習(xí)分析領(lǐng)域的一個明顯特征。
2.學(xué)術(shù)群體合作關(guān)系分析
科學(xué)文獻的作者是科學(xué)研究活動的主體,學(xué)科領(lǐng)域內(nèi)的優(yōu)秀研究人員往往能夠引領(lǐng)學(xué)科新的方向,對快速了解該學(xué)科基本研究概況大有裨益[15]。此外,對一學(xué)科研究團體的關(guān)系進行分析,可以掌握該學(xué)科研究團體的研究生態(tài)情況?!癗ode Types”選擇“Author”“Top N per slice”閾值設(shè)定為50,其它閾值依照原有設(shè)定不變,運行軟件后得到具有164個節(jié)點和223條連線的合作網(wǎng)絡(luò)關(guān)系圖,如圖2所示。
學(xué)術(shù)群體合作關(guān)系圖譜顯示,圖中有大量的關(guān)系網(wǎng)絡(luò),表明學(xué)習(xí)分析領(lǐng)域的研究者注重以團體的形式進行合作研究,基本形成了較為穩(wěn)定的研究團體;各研究團體之間也表現(xiàn)出較緊密的聯(lián)系,說明各研究團體之間的信息交流較通暢,資源共享程度較高。
其中,以舒姆(Simon Buckingham Shum)為代表的合作團體在學(xué)習(xí)分析領(lǐng)域占有主要位置,其形成的研究團體在整個學(xué)習(xí)分析領(lǐng)域有著廣泛的影響,是學(xué)習(xí)分析研究的主力軍。舒姆具有社會科學(xué)、心理學(xué)和計算機科學(xué)等學(xué)科背景,當(dāng)前致力于知識提取與表征、社會網(wǎng)絡(luò)分析、語義文本分析等方面的探索,其團隊最新研究是設(shè)計計算機支持的辯論可視化工具對學(xué)習(xí)者在線協(xié)作與知識分享建構(gòu)的能力進行評價[16]。此外,以加舍維奇(Dragan Gasevic)、道森(Shane Dawson)、帕爾多(Abelardo Pardo)和貝克(Ryan S.Baker)組成的研究團隊致力于如何利用復(fù)雜教育系統(tǒng)中的教育大數(shù)據(jù)進行教育評價,并在學(xué)習(xí)分析工具設(shè)計、學(xué)習(xí)策略分析和教育數(shù)據(jù)挖掘方面有較多探索[17]。以弗格森(Rebecca Ferguson)、德拉克斯勒(Hendrik Drachsler)和拉特(Maarten de Laat)組成的研究團隊也具有較高的影響力,該學(xué)術(shù)群體基于歐洲教育項目實踐開展學(xué)習(xí)分析應(yīng)用探索,研究內(nèi)容涉及學(xué)習(xí)分析理論、個性化推薦系統(tǒng)、教育文本分析等[18]。
(二)研究者學(xué)科背景分析
在新興研究領(lǐng)域,研究者的學(xué)科背景分析有助于了解該領(lǐng)域的基本研究內(nèi)容和專業(yè)研究屬性。本研究閱讀并提取了每篇文章研究者的學(xué)科背景信息,之后兩名分析者根據(jù)所提取的研究者背景信息對其所屬學(xué)科進行劃分,最后利用Ucinet6.0軟件構(gòu)建作者的學(xué)科背景鄰接矩陣,應(yīng)用軟件分析得到如圖3的分析結(jié)果,其中,塊狀節(jié)點表示學(xué)科,圓形節(jié)點表示學(xué)科下屬的研究方向。
可以看出,當(dāng)前學(xué)習(xí)分析領(lǐng)域研究者的學(xué)科背景除教育學(xué)、計算機科學(xué)、統(tǒng)計學(xué)等基礎(chǔ)學(xué)科之外,還涉及人工智能、心理學(xué)與認知科學(xué)、經(jīng)濟學(xué)、藝術(shù)設(shè)計、管理學(xué)、情報學(xué)等學(xué)科。各學(xué)科之間存在交叉聯(lián)系,特別是教育學(xué)、計算機科學(xué)與工程、人工智能、心理學(xué)與認知科學(xué)這四門學(xué)科合作密切,這說明研究者試圖通過跨學(xué)科合作來解決教與學(xué)實踐中的復(fù)雜問題。此外,探索教育數(shù)據(jù)背后的學(xué)習(xí)本質(zhì)、學(xué)習(xí)者是如何學(xué)習(xí)的這一基本問題也是學(xué)習(xí)分析需要探測和解釋的,而該問題的解決需要心理學(xué)與認知科學(xué)的相關(guān)理論提供支持。交叉學(xué)科研究是產(chǎn)生新學(xué)科的沃土和源泉,是獲得原創(chuàng)性科學(xué)成果的重要途徑,也是解決重大技術(shù)、社會問題的必然選擇[19]。學(xué)習(xí)分析作為一個新的研究領(lǐng)域,也正因為其多學(xué)科交叉的研究背景才有可能在未來給教育教學(xué)帶來飛躍式的變革。
(三)關(guān)鍵文獻的提取與分析
關(guān)鍵文獻集中體現(xiàn)了某個學(xué)科主題發(fā)展的基本信息和主要內(nèi)容,是針對特定科學(xué)主題開展研究的重要入口[20]。文獻被引頻次反映文獻被其他研究者關(guān)注的程度,也從一個側(cè)面反映了論文質(zhì)量和作者科研成果的吸收量,被引頻次越高說明此文獻在該研究領(lǐng)域中越重要,可被認為是核心文獻[21]。將數(shù)據(jù)導(dǎo)入Histcite,運行軟件并選擇Graph Maker命令,按LCS(Local Citation Score,本地引用頻次,即在當(dāng)前所搜集的文獻中被引用的次數(shù))最高的前40篇文獻繪制出關(guān)鍵文獻的引文編年圖,如圖4所示。其中,每一個圓圈中的數(shù)字代表一篇文獻的編號,圓圈的大小代表該篇文獻被引用頻次的多少,箭頭連線代表之間的互引關(guān)系。
從圖4中可以看到,2011年度有編號為46、51、50、49、53、52等6篇文獻被引用頻次較多;編號為102、99的文獻則為2012年度被引用頻次較多的文獻;2013年度有編號為131、141的2篇文獻被引用頻次較高。整個引文編年圖大致有三條引證關(guān)系鏈:引證關(guān)系鏈1主要對學(xué)習(xí)分析中的學(xué)習(xí)建模、個性化推薦系統(tǒng)的算法進行深入研究[22];引證關(guān)系鏈2涉及學(xué)習(xí)行為數(shù)據(jù)分析、學(xué)習(xí)分析可視化以及基于MOOCs的學(xué)習(xí)分析[23];引證關(guān)系鏈3集中探討了學(xué)習(xí)分析背景下的工具方法、學(xué)習(xí)設(shè)計、基本理論等關(guān)鍵內(nèi)容[24]。此外,孤立點33、46、206、252、239也有一定量的被引用頻次,但與其它高被引文獻無互相引證關(guān)系。上述10個文獻編碼對應(yīng)的原文信息如表2所示。
(四)關(guān)鍵詞演變與整體分析
1.對關(guān)鍵詞的整體分析
關(guān)鍵詞是表述文獻主題、內(nèi)容、思路以及研究方法的關(guān)鍵性詞匯,是信息計量研究的重要指標(biāo)[25]。關(guān)鍵詞可以反映本年度的研究熱點,并在一定程度上預(yù)測今后的發(fā)展趨勢[26]。在“Node Types”選擇“Keywords”,“Top N per slice”閾值設(shè)定為50,(C,CC,CCV)前、中、后的設(shè)置為(2,3,20)、(3,6,20)、(2,3,20),最后獲得包含188個節(jié)點和258條線的關(guān)鍵詞整體網(wǎng)絡(luò)分析圖,如圖5所示??梢钥闯鰀atamining、MOOCs、social network analysis、visualisation、discourse analytics、predictive analytics、online learning、collaborative learning(CSCL)、society learning analytics、assessment是排在前十的高頻關(guān)鍵詞,基于網(wǎng)絡(luò)學(xué)習(xí)活動行為數(shù)據(jù)進行分析、可視化表征和預(yù)測是學(xué)習(xí)分析研究的典型特征,這與2011年《地平線報告》對學(xué)習(xí)分析內(nèi)涵的描述較為一致[27]。
圖5中圓點大小和連線的厚度代表著節(jié)點中介中心度及其值的大小,中介中心度反映了一個關(guān)鍵詞在網(wǎng)絡(luò)中的核心橋梁地位。其中MOOCs、education data mining的中介中心度分別達到0.13和0.11,說明這兩者在整個學(xué)習(xí)分析領(lǐng)域具有核心橋梁的地位,連接著整個學(xué)習(xí)分析領(lǐng)域各部分的內(nèi)容。大規(guī)模開放在線課程作為教育大數(shù)據(jù)主要來源之一,其數(shù)據(jù)獲取方便、數(shù)據(jù)結(jié)構(gòu)多樣化、數(shù)據(jù)量大的特點已經(jīng)成為學(xué)習(xí)分析研究者的主要研究對象,而教育數(shù)據(jù)挖掘作為一個獨立學(xué)術(shù)群體開始與學(xué)習(xí)分析進行合作與交流,兩者都側(cè)重基于數(shù)據(jù)分析為教育系統(tǒng)的計劃、干預(yù)和決策提供支持[28]。
2.歷年文獻的關(guān)鍵詞演變分析
分析歷年文獻的關(guān)鍵詞演變情況可以幫助讀者了解在不同時期某一領(lǐng)域研究者所關(guān)注的重點以及整個研究的變化態(tài)勢。在“Node Types”選擇“Keywords”,“Top N perslice”閾值設(shè)定為50,“Layout”選擇“Timezone”。為了讓圖譜清晰展示分析結(jié)果,在Display Merged界面的“Article Labeling”面板中將“Threshold”設(shè)置為3,其它參數(shù)設(shè)置同上,最后獲得包含74個節(jié)點和120條線的關(guān)鍵詞歷年演變關(guān)系結(jié)果,如圖6所示。
從中可以發(fā)現(xiàn),2011年學(xué)習(xí)分析研究側(cè)重關(guān)注社會網(wǎng)絡(luò)分析、在線學(xué)習(xí)和計算機支持的協(xié)作學(xué)習(xí)。2012年會議關(guān)注點集中在學(xué)習(xí)分析可視化、預(yù)測分析和文本對話分析,此外,研究者開始關(guān)注教育評價和學(xué)生注意力方面的研究。2013年則集中聚焦在MOOCs和高等教育,受大規(guī)模開放在線課程全球范圍內(nèi)的影響,研究者開始探索高等教育環(huán)境下的網(wǎng)絡(luò)學(xué)習(xí)者群體行為特征和規(guī)律。2014年教育數(shù)據(jù)挖掘和教育數(shù)據(jù)聚類分析成為該年度會議論文的主要關(guān)鍵詞,2012年英國學(xué)者維克托.邁爾-舍恩伯格(Viktor Mayer-Schnberger)撰寫的《大數(shù)據(jù)時代》成為了大數(shù)據(jù)研究的先河之作,此后,軍事大數(shù)據(jù)、醫(yī)療大數(shù)據(jù)、旅游大數(shù)據(jù)、電商大數(shù)據(jù)受到了廣泛的關(guān)注并通過大數(shù)據(jù)挖掘分析分別取得了一些應(yīng)用實例,而在當(dāng)前倡導(dǎo)智慧教育的背景下則需要基于教育大數(shù)據(jù)的學(xué)習(xí)分析作為支撐,因此,教育數(shù)據(jù)挖掘也成為當(dāng)前學(xué)習(xí)分析關(guān)注的重點和熱點。2015年關(guān)注的重點包括協(xié)作學(xué)習(xí)共同體、對話文本分析、倫理道德研究等。隨著學(xué)習(xí)數(shù)據(jù)的搜集和積累,大數(shù)據(jù)環(huán)境下學(xué)習(xí)分析數(shù)據(jù)的安全性和個人隱私保護成為了新的研究議題[29]。
(五)研究主題聚類分析
對近五年會議論文研究主題進行分析,可以進一步了解該領(lǐng)域關(guān)注的焦點內(nèi)容和研究取向。在“Node Types”選擇“Term”,“Top N per slice”閾值設(shè)定為50,“Pruning”選擇“Minimum Spannning Tree”,為保證圖譜更為清晰,去除“l(fā)earning analysis”,其它參數(shù)設(shè)置同上。獲得包含74個節(jié)點和119條線的聚類圖譜,從聚類的情況上看,一共得到八個主題聚類,如圖7所示。
聚類#0 generating predictive model(生成預(yù)測模型),該類研究是對學(xué)習(xí)者已學(xué)習(xí)活動的行為數(shù)據(jù)進行分析并對其未來學(xué)習(xí)結(jié)果進行預(yù)測,對存在問題和學(xué)習(xí)障礙的學(xué)習(xí)者進行適當(dāng)?shù)母深A(yù)。
聚類#1 pedagogical model(教學(xué)模型)通過對學(xué)習(xí)者的學(xué)習(xí)行為數(shù)據(jù)進行分析,總結(jié)學(xué)習(xí)者在學(xué)習(xí)過程的關(guān)鍵點和規(guī)律,從而構(gòu)建支持有效教學(xué)設(shè)計的教學(xué)模型,而這些模型最終目的是更好地開展差異化教學(xué)以滿足學(xué)習(xí)者的個性化學(xué)習(xí)需求。
聚類#2 automatic essay scoring(自動作文評分)和聚類#3 exploratory dialogue(探索對話)則是對學(xué)習(xí)者在互動交流中產(chǎn)生的大量對話文本進行分析,通過自動化文本語義分析了解學(xué)習(xí)者知識掌握程度、學(xué)習(xí)動機、學(xué)習(xí)策略等個性特征信息,為調(diào)整教學(xué)策略和設(shè)計提供依據(jù)。
聚類#4 knowledge construction(知識建構(gòu))和聚類#5 transferable competencies(能力轉(zhuǎn)化)主要是判定學(xué)習(xí)者知識和能力的掌握程度,并依據(jù)分析的結(jié)果為學(xué)習(xí)者提供一定的學(xué)習(xí)策略和方法以幫助學(xué)習(xí)者提升掌握知識和應(yīng)用知識的能力。
聚類#6 dataset-drivenre search(數(shù)據(jù)集驅(qū)動的研究)是基于網(wǎng)絡(luò)學(xué)習(xí)平臺和系統(tǒng)搜集的數(shù)據(jù),采用相關(guān)挖掘技術(shù)和算法進行分析,發(fā)現(xiàn)學(xué)習(xí)中存在的問題和學(xué)習(xí)行為特征。
聚類#7 emotional research(情感研究)是對學(xué)習(xí)者注意力、情緒和態(tài)度等方面進行探索。學(xué)習(xí)者情感態(tài)度價值觀的研究一直是教育研究領(lǐng)域忽視的板塊,特別是在網(wǎng)絡(luò)環(huán)境下教與學(xué)活動、教師與學(xué)生時空相對分離,學(xué)生的焦慮感、孤獨感等情緒時有發(fā)生,因此,關(guān)注學(xué)習(xí)者情感和動機變化的成因并進行改善有助于提高其學(xué)習(xí)成效[30]。
(六)基于學(xué)科背景的研究方法分析
在研究方法編碼上,分別對學(xué)科背景和研究方法名稱進行數(shù)字和字母標(biāo)識,例如,文獻標(biāo)識LAK13-01,學(xué)科背景標(biāo)識12,研究方法標(biāo)識A,代表該文獻含有教育學(xué)和計算機科學(xué)與工程兩個學(xué)科,研究方法為文獻研究法。通過數(shù)據(jù)進行統(tǒng)計分析和可視化輸出,得出如圖8所示分析結(jié)果。
其中,圓圈中的數(shù)字代表對應(yīng)學(xué)科采用該研究方法的數(shù)量,如,文獻研究法對應(yīng)教育學(xué)的圓圈顯示為14,表明有14篇教育學(xué)背景的研究文獻采用文獻研究法作為其主要的研究方法;連線表示不同學(xué)科背景研究者采用同一研究方法的合著關(guān)系,連線上的數(shù)字代表其合著過程使用同一研究方法的數(shù)量,例如,文獻研究法對應(yīng)的教育學(xué)和計算機科學(xué)與工程兩門學(xué)科,其連線上的數(shù)字顯示為4,表明以教育學(xué)和計算機科學(xué)與工程為學(xué)科背景的合著文章中有4篇采用文獻研究法。
在研究方法種類方面,相對于傳統(tǒng)的調(diào)查研究、實驗研究等方法,學(xué)習(xí)分析側(cè)重開展文本分析、設(shè)計研究、聚類分析、眼動分析、連續(xù)模式提取、時間序列分析、移動點分析、人工智能等教育數(shù)據(jù)挖掘和機器學(xué)習(xí)分析方法,這與前面研究主題分析得出的數(shù)據(jù)集驅(qū)動的研究較為一致。
在研究方法數(shù)量方面,文獻研究法、基于設(shè)計的研究、文本分析法、混合研究法是較多應(yīng)用的研究方法。其中,文獻研究法主要用于介紹學(xué)習(xí)分析的理論框架、模型設(shè)計、技術(shù)方法等內(nèi)容,基于設(shè)計的研究側(cè)重學(xué)習(xí)分析工具的設(shè)計、可視化、應(yīng)用與改善,如,桑托斯(Jose Luis Santos)等研究者設(shè)計StepUp學(xué)習(xí)分析儀表盤以支持學(xué)習(xí)者自我反饋和意義建構(gòu)[31]。
文本分析側(cè)重分析虛擬學(xué)習(xí)社區(qū)和網(wǎng)絡(luò)答疑區(qū)中互動文本的提取、分析與社會網(wǎng)絡(luò)分析?;旌涎芯糠▌t是結(jié)合定性和定量兩種方式對學(xué)習(xí)數(shù)據(jù)的捕獲、個性化學(xué)習(xí)行為和心理特征等方面進行分析。
在學(xué)科合作方面,從學(xué)科合作曲線密集度可以看出設(shè)計研究、混合研究和人工智能等方法涉及教育學(xué)、計算機科學(xué)、人工智能、心理學(xué)與認知科學(xué)等多學(xué)科的交叉合作,說明跨學(xué)科開展工具設(shè)計、可視化和教育數(shù)據(jù)挖掘成為學(xué)習(xí)分析的一種常態(tài)。
四、學(xué)習(xí)分析研究熱點的討論
(一)學(xué)習(xí)分析的工具設(shè)計與可視化輸出
利用學(xué)習(xí)分析工具對網(wǎng)絡(luò)學(xué)習(xí)活動管理系統(tǒng)中的數(shù)據(jù)進行分析并可視化輸出是當(dāng)前學(xué)習(xí)分析研究的熱點之一。
通過對歷屆會議論文研究主題的分析可以看出,每年都會有研究者聚焦于學(xué)習(xí)分析工具的設(shè)計與應(yīng)用。從早期的用于分析學(xué)習(xí)者社會網(wǎng)絡(luò)關(guān)系的SNAPP(The Social Networks Adapting Pedagogical Practice)工具、對學(xué)習(xí)管理系統(tǒng)中學(xué)生行為數(shù)據(jù)進行評價和分析的AAT(The Academic Analytics Tool)工具到后面對學(xué)習(xí)過程和參與行為進行分析的eGraph工具,學(xué)習(xí)分析工具逐漸從分析學(xué)習(xí)者群體特征數(shù)據(jù)走向?qū)€人學(xué)習(xí)活動過程行為分析的演變[32][33][34]。
而在可視化分析方面,由早期的基本信息呈現(xiàn)走向?qū)W(xué)習(xí)者活動參與情況、個性化學(xué)習(xí)路徑、學(xué)習(xí)能力等深層信息進行分析輸出??梢钥闯?,未來學(xué)習(xí)分析工具設(shè)計與分析將逐漸走向個性化、智能化和可視化。
(二)基于學(xué)習(xí)過程的行為數(shù)據(jù)預(yù)測未來學(xué)習(xí)表現(xiàn)
近年來,研究者逐漸開始探索分析學(xué)習(xí)者在網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)中的學(xué)習(xí)活動行為與學(xué)習(xí)者未來考試表現(xiàn)之間的關(guān)系[35]。了解不同學(xué)習(xí)者的學(xué)習(xí)過程行為及其所產(chǎn)生的學(xué)習(xí)結(jié)果和表現(xiàn)不僅能夠幫助理解學(xué)習(xí)者做出選擇的歸因和動機,而且能夠幫助教師發(fā)現(xiàn)影響學(xué)習(xí)表現(xiàn)的內(nèi)外因素,為教學(xué)內(nèi)容的調(diào)整和干預(yù)提供依據(jù)。
這方面的研究主要集中在學(xué)習(xí)結(jié)果預(yù)測模型和機制分析、學(xué)習(xí)者已有知識經(jīng)驗如何影響其未來表現(xiàn)、預(yù)測工具設(shè)計與應(yīng)用、學(xué)習(xí)成敗預(yù)測分析等。例如,肯尼迪(Gregor Kennedy)等研究者基于大規(guī)模開放在線課程中學(xué)習(xí)者的先前知識、技能和活動預(yù)測學(xué)習(xí)表現(xiàn),發(fā)現(xiàn)學(xué)習(xí)者的先驗知識是其未來學(xué)習(xí)成功的重要預(yù)測指標(biāo)[36]。安德爾加森(Monika Ander-gassen)等研究者使用Web Usage Mining工具對學(xué)習(xí)者在考試準備過程中的行為數(shù)據(jù)與學(xué)習(xí)結(jié)果的相關(guān)性進行了分析,發(fā)現(xiàn)學(xué)習(xí)者的時間間隔、練習(xí)題和考試題的覆蓋范圍與成績成正相關(guān)[37]。因此,利用學(xué)習(xí)者已有行為數(shù)據(jù)進行預(yù)測分析并提供適切的教育干預(yù)是當(dāng)前學(xué)習(xí)分析的另一個研究熱點。
(三)虛擬學(xué)習(xí)社區(qū)中的交互文本與對話挖掘分析
虛擬學(xué)習(xí)社區(qū)中的互動答疑和討論交流是網(wǎng)絡(luò)環(huán)境下教師與學(xué)生以及學(xué)習(xí)者之間開展異步討論與協(xié)作學(xué)習(xí)的主陣地,通過對學(xué)習(xí)者互動交流產(chǎn)生的文本進行分析和挖掘,不僅可以了解其對討論內(nèi)容的看法,而且可以了解其知識建構(gòu)的過程。
然而,鑒于互動文本本身所具有的內(nèi)容長度較小和情境復(fù)雜的特性,很難對其進行有效的分析[38]。傳統(tǒng)的文本分析并不能夠全面地提取到學(xué)習(xí)者互動交流內(nèi)容中所包含的意義和情境信息,且在文本大數(shù)據(jù)集的背景下通過人工方式對文本內(nèi)容進行編碼分析會耗費大量的時間和精力。當(dāng)前,教育文本分析側(cè)重通過數(shù)據(jù)挖掘和機器學(xué)習(xí)等方式對文本內(nèi)容進行自動提取和分析。例如,希巴尼(Antonette Shibani)等研究者通過文本挖掘方式自動獲取學(xué)習(xí)者在互動交流中對團隊評價的內(nèi)容并進行分析[39]。在研究群體上,舒姆等研究者在2013年發(fā)起了教育文本分析的國際工作坊,以促進從事該主題研究的學(xué)者開展交流與合作[40]。
(四)學(xué)習(xí)者參與度、注意力與情感研究
在學(xué)習(xí)者廣泛注冊和學(xué)習(xí)大規(guī)模開放在線課程的現(xiàn)象下,參與度和通過率成為課程學(xué)習(xí)過程中日益凸顯的問題,較少學(xué)習(xí)者能夠堅持學(xué)完課程所有內(nèi)容并獲得課程認證[41]。
學(xué)習(xí)者參與度是影響學(xué)習(xí)成效的一個重要因素,如何提高其參與度、學(xué)習(xí)注意力并分析其情感成為研究者逐漸關(guān)注的問題。在參與度模式上,研究者麗塔(Kop Rita)及其同事對聯(lián)通主義理論指導(dǎo)下大規(guī)模開放在線課程的學(xué)習(xí)參與度進行分析,發(fā)現(xiàn)由于該類型課程鏈接了不同類型工具和資源,很難追蹤學(xué)習(xí)者所有的學(xué)習(xí)活動,但從已有學(xué)習(xí)行為上分析,可以看出學(xué)習(xí)者熱衷于該類型的課程學(xué)習(xí),且這種參與度能獲得較好的學(xué)習(xí)效果[42]。在注意力分析方面,通過采用視頻分析和移動點分析,可以了解學(xué)生在課堂環(huán)境下注意力的變化情況,并發(fā)現(xiàn)其注意力層級表現(xiàn)水平,進而為教學(xué)策略的改善提供依據(jù)[43]。
在情感分析方面,通過眼動和腦電波分析可以了解學(xué)習(xí)者的課程學(xué)習(xí)狀態(tài),以真實反映其在學(xué)習(xí)活動中的態(tài)度意向,并找到真正影響學(xué)習(xí)的內(nèi)在因素[44]。
(五)教育數(shù)據(jù)挖掘視角下的形成性評價
學(xué)習(xí)評價是課堂教學(xué)活動和網(wǎng)絡(luò)學(xué)習(xí)過程的一個重要環(huán)節(jié)之一,評價內(nèi)容、方式和結(jié)果在一定程度上影響后面的教學(xué)過程[45]?!督逃畔⒒臧l(fā)展規(guī)劃(2011-2020)》在“推進信息技術(shù)與教學(xué)融合”部分提出,要建設(shè)智能化教學(xué)環(huán)境,提供優(yōu)質(zhì)數(shù)字教育資源和軟件工具,鼓勵發(fā)展性評價[46]。而教育數(shù)據(jù)的積累和學(xué)習(xí)分析的出現(xiàn),為學(xué)習(xí)者的形成性評價提供了新的分析思路。通過教育數(shù)據(jù)挖掘的方式對學(xué)習(xí)者參與的學(xué)習(xí)活動進行行為分析并分數(shù)轉(zhuǎn)化,可以使形成性評價更加科學(xué)有效。
這方面比較有代表性的研究是理查茲(Griff Richards)等搜集了學(xué)習(xí)者在課程學(xué)習(xí)中的過程性數(shù)據(jù),并進行動態(tài)性的評價以分析學(xué)習(xí)活動的有效性和教學(xué)設(shè)計的適切性,最后,提出了數(shù)字化學(xué)習(xí)環(huán)境下開展形成性評價的指導(dǎo)原則[47]。
五、結(jié)語
學(xué)習(xí)分析作為新興的研究方向,近年來得到研究者的廣泛關(guān)注和深入探索。本研究通過對歷年“學(xué)習(xí)分析與知識國際會議”文獻的研究者信息、關(guān)鍵詞、研究主題和方法等進行定量分析以洞悉該研究領(lǐng)域的學(xué)術(shù)生態(tài)結(jié)構(gòu)和焦點內(nèi)容,為國內(nèi)研究者了解該領(lǐng)域的研究取向并開展國際合作研究提供鋪墊。從文獻分析結(jié)果中可以看出,學(xué)習(xí)分析在理論和實踐兩個層面已經(jīng)開展了多方面的研究探索,并進行了試驗研究,未來學(xué)習(xí)分析研究應(yīng)致力于如何利用學(xué)習(xí)分析工具、教育數(shù)據(jù)算法、人工智能和機器學(xué)習(xí)等技術(shù),來更好地改善數(shù)字化環(huán)境下的教與學(xué),解決教育實踐中的關(guān)鍵問題,從而真正地將教育研究成果轉(zhuǎn)化為教育生產(chǎn)力。
基金項目:本文系2014年全國教育科學(xué)“十二五”規(guī)劃教育部重點課題“基于教育大數(shù)據(jù)的學(xué)習(xí)分析工具設(shè)計與應(yīng)用研究”(課題編號:DCA140230)、2014年北京師范大學(xué)自主科研基金重點項目“電子書包中基于大數(shù)據(jù)的學(xué)生個性化信息挖掘與應(yīng)用研究”(課題編號+00305-310400080)和2015年國家留學(xué)基金委建設(shè)高水平大學(xué)公派研究生項目的研究成果。
作者簡介:牟智佳,北京師范大學(xué)教育技術(shù)學(xué)院在讀博士,研究方向:數(shù)字化學(xué)習(xí)技術(shù)與環(huán)境,系本文通訊作者;俞顯,寧波市教育考試院研究實習(xí)員,研究方向:教育考試數(shù)據(jù)挖掘與分析。