近年來,人工智慧(AI)技術逐漸融入各種不同的領域,關於它的便利性,相信多數人在生活中已或多或少有了親身的體悟。AI將過去許多需要大量人力投入的工作交給了機器來做,透過訓練好的模型,一步一步為人類完成許多艱難繁瑣的任務。
在教育領域中,也有一些學者試著研究該如何運用AI來幫助教師,使教學和學習這件事更加有效。如此一來,教師就可以將關注學生狀況的這項工作交給AI來分擔,讓自己更能專注在授課內容之上。對異地教師來說,即使人不在現場,也能藉由這樣的工具得知現場學生的學習狀況,當注意到學生缺乏專注時,也可以適時地調整教學方法,使教學過程更加有效率。
群體AI影像識別分析技術
但是,當現場教室空間範圍大、且有多名學生時,這樣的輔助工具該如何運作呢?以下,就要來介紹群體AI影像識別分析技術的應用實例。
群體AI影像識別分析技術主要結合了群體人像搜尋和肢體事件的AI分析技術,以即時追蹤學生上課的注意力。在課堂中,將以多角度攝影機偵測學生如頭部、肢體等活動行為,同時結合專注度偏差行為模型,於邊緣運算提供全面性的學習分析。
那麼,機器該如何識別不同的學生呢?
Person re-identification(ReID)模型是一種可根據不同身分的人們進行個別辨識的深度學習模型架構,它能夠對不同攝影機所擷取出來影像串流內的人物肢體行為進行身分辨識,並且彼此進行配對。
首先,模型會提取影像中的深度語意特徵,以便在後續流程中可以準確地找到人物的位置和識別他們的肢體行為。接著,利用提取的特徵來預測可能的人物位置,並將預測的位置與特徵圖中的區域特徵進行配對,成功配對的區域特徵即表示特定人物。這些特徵不僅可以用來修正座標,還可以作為人物的身分進行識別。
而要將這樣的模型實際應用於課堂進行學習專注度檢測,則需要先對學生的學習過程進行拍攝,並且有效地擷取教學過程中的姿態變化,將高品質的影像匯入至深度學習模型內,才能進行專注度的檢測。
在捕捉到影像後,模型將對輸入的場景影像進行深度語意特徵的提取,並對場景中可能存在的學生位置進行座標預測來定位學生,將預測出來的座標位置與特徵圖內的區域特徵進行配對,這樣一來,模型就能夠準確地定位學生的位置。成功地找到目標對象後,接下來就是專注度檢測模型的工作了。透過事前已訓練好的專注度檢測模型,將能透過學生的肢體動作識別每位學生當下的專注程度,並將狀態即時反饋給遠端教師,即時掌握另一端的學生學習情形。
圖1:ReID模型影像辨識架構圖
資料來源:本文作者自行繪製
FIND觀點
人工智慧與教育的結合,對教師而言將成為一項強而有力的輔助工具。尤其是對異地的教師來說。透過訓練好的深度學習模型,即可在異地教學中利用智慧輔助學習工具識別學生當下的專注程度,幫助教師更好理解學生學習歷程及優化教學方法。同時提供更加深入了解學生學習狀況的方式,除了能讓教師即時調整授課步調外,更能作為日後課程內容安排上的參考依據,讓這樣的AI智慧輔助學習工具成為教師的小助手,有望減輕教師在課堂管理方面的負擔。
封面圖片來源:本文作者自行拍攝
參考資料來源:
- Person re-identification based on deep learning — An overview https://www.sciencedirect.com/science/article/abs/pii/S1047320321002765