14 個科學驗證的認知測驗如何測量學習者的認知能力特徵。涵蓋執行功能、處理速度、工作記憶、空間認知、語文能力與後設認知六大構念。
UCG(Uedu Cognomics)認知組學測驗工具箱是 Uedu 平台 Educational Omics 框架中 Cognomics(認知組學)維度的核心實作。Cognomics 關注學習者的認知歷程,透過標準化的認知測驗直接測量個體在注意力、工作記憶、執行功能等基礎認知能力上的表現,作為理解學習行為與學習成效的基底變項。
UCG 的測驗選擇以 Miyake et al. (2000) 提出的執行功能三因素模型為理論骨幹。該模型透過潛在變項分析,將執行功能區分為三個可分離但相關的成分:
在此基礎上,UCG 擴展至處理速度、空間認知、語文能力與後設認知等構念,形成 6 大構念、14 個測驗的完整工具箱。
傳統認知測驗多在實驗室環境中以專用軟體(如 E-Prime、PsychoPy)執行。UCG 採用 web-based 實施方式,主要依據 Reimers & Stewart (2015) 的研究結論:
performance.now() 計時精度已達亞毫秒等級,足以支撐反應時間測量UCG 測驗在精確度與可及性之間取得平衡:採用 requestAnimationFrame 雙幀同步確保刺激呈現的精確性,同時維持跨裝置(桌機、平板、手機觸控)的可用性。
UCG 工具箱包含 6 大構念(constructs)、14 個測驗工具(instruments),涵蓋從基礎認知處理到高階後設認知的完整認知能力光譜。
| 構念 | 測驗名稱 | 核心範式 | 測量目標 |
|---|---|---|---|
| 執行功能 Executive Function | Stroop Task | 色字不一致干擾 | 抑制控制(Inhibition) |
| Flanker Task | 側翼干擾 | 抑制控制(Inhibition) | |
| Task Switching | 任務集切換 | 認知彈性(Shifting) | |
| 處理速度與注意力 Processing Speed & Attention | Simple RT | 簡單反應時間 | 基礎處理速度 |
| Choice RT | 選擇反應時間 | 決策速度 | |
| PVT | 精神運動警覺作業 | 持續性注意力 | |
| 工作記憶 Working Memory | N-back | N-back 作業 | 工作記憶更新(Updating) |
| Corsi Block | 空間序列記憶 | 視覺空間工作記憶容量 | |
| 空間認知 Spatial Cognition | Mental Rotation | 心理旋轉 | 空間推理能力 |
| Symmetry Span | 對稱跨度作業 | 空間工作記憶容量 | |
| UFOV | 有效視野 | 視覺注意力範圍 | |
| 語文能力 Verbal Ability | Grammatical Reasoning | 文法推理 | 語言邏輯推理 |
| Vocabulary | 詞彙量測驗 | 結晶智力(詞彙知識) | |
| 後設認知 Metacognition | Confidence Calibration | 信心校準 | 自我監控準確性 |
執行功能的三個子成分(Inhibition、Updating、Shifting)分別由不同測驗測量。Stroop 與 Flanker 同屬 Inhibition,但使用不同的干擾範式(語意 vs. 空間),可評估抑制控制的跨任務一致性。
所有認知測驗資料的蒐集均依據 IRB 202507EM058 核准之研究倫理計畫,學生在首次進入測驗工具箱時需完成電子簽署知情同意書。同意書明確說明資料用途、保存期限與退出權利。
UCG 完整保留每一個 trial 的原始資料,包含:
Trial-level 原始資料可供研究者進行客製化分析(如 ex-Gaussian RT 分布擬合、序列效應分析等),不受平台預設計分方法的限制。
每個測驗的 trial 序列由伺服器端預先生成並儲存,確保:
為確保反應時間測量的精確度,UCG 採用以下技術策略:
performance.now() 取代 Date.now(),精度達亞毫秒等級requestAnimationFrame 巢狀呼叫(double-rAF),確保 DOM 更新與螢幕渲染同步,計時起點對齊實際像素繪製為支援跨裝置施測,UCG 同時監聽多種輸入事件:
pointerdown 事件(統一觸控與滑鼠輸入),避免觸控裝置 300ms 延遲keydown 事件,支援桌機使用者以鍵盤快速反應各測驗依其實驗範式採用不同的核心指標。以下說明各 paradigm 的計分邏輯。
| 指標 | 計算方式 | 意義 |
|---|---|---|
| Interference Effect (RT) | mean_RT(incongruent) - mean_RT(congruent) | 干擾效果大小,愈小表示抑制能力愈佳 |
| Accuracy | 各 condition 正確率 | 反映正確性,可計算 speed-accuracy tradeoff |
| Congruency Effect (Accuracy) | acc(congruent) - acc(incongruent) | 準確率的干擾效果 |
| 指標 | 計算方式 | 意義 |
|---|---|---|
| d-prime (d') | Z(hit rate) - Z(false alarm rate) | 訊號偵測敏感度,愈高表示辨別力愈強 |
| Hit Rate | 正確偵測 target 的比例 | 對 target 的敏感度 |
| False Alarm Rate | 誤判 non-target 為 target 的比例 | 反應偏向(response bias) |
當 hit rate = 1.0 或 false alarm rate = 0.0 時,Z 分數為無限大。UCG 採用 1/(2N) 修正法:hit rate 修正為 1 - 1/(2N),false alarm rate 修正為 1/(2N),其中 N 為該 condition 的 trial 數。
| 指標 | 計算方式 | 意義 |
|---|---|---|
| Simple RT | 單純反應的中位數 RT | 基礎神經傳導與運動反應速度 |
| Choice RT | 選擇反應的中位數 RT | 決策處理速度 |
| Choice - Simple Cost | median_RT(choice) - median_RT(simple) | 決策額外成本,反映中央處理速度 |
| 指標 | 計算方式 | 意義 |
|---|---|---|
| Switch Cost (RT) | mean_RT(switch trials) - mean_RT(repeat trials) | 任務轉換的時間成本 |
| Switch Cost (Accuracy) | acc(repeat) - acc(switch) | 轉換造成的準確率下降 |
| 指標 | 計算方式 | 意義 |
|---|---|---|
| Max Span | 成功回憶的最大序列長度 | 工作記憶容量上限 |
| Span Product | max_span × proportion_correct_at_max_span | 綜合考量容量與穩定性 |
| 指標 | 計算方式 | 意義 |
|---|---|---|
| RT by Angular Disparity | 各旋轉角度的平均正確 RT | 心理旋轉的線性函數斜率 |
| Rotation Rate | RT 對角度的回歸斜率 (ms/degree) | 心理旋轉速度,愈小表示空間推理愈快 |
| Accuracy | 各角度的正確率 | 判斷正確性 |
| 指標 | 計算方式 | 意義 |
|---|---|---|
| Median RT | 所有有效 trial 的中位數 RT | 整體警覺反應速度 |
| Lapses | RT > 500ms 的 trial 數 | 注意力失誤次數,反映持續性注意力的穩定性 |
| 1/RT (Reciprocal RT) | 各 trial 的 1000/RT 平均值 | 速度指標,對慢反應更敏感 |
| 指標 | 計算方式 | 意義 |
|---|---|---|
| Accuracy | 正確判斷的比例 | 語言邏輯推理能力 |
| RT | 正確 trial 的中位數 RT | 推理處理速度 |
| 指標 | 計算方式 | 意義 |
|---|---|---|
| Calibration Error | mean(|confidence - accuracy|) 各信心區間 | 信心判斷與實際表現的偏差,愈小愈佳 |
| Overconfidence Index | mean(confidence - accuracy) | 正值表示過度自信,負值表示信心不足 |
| 指標 | 計算方式 | 意義 |
|---|---|---|
| Total Correct | 正確回答題數 | 詞彙知識量(結晶智力指標) |
| 指標 | 計算方式 | 意義 |
|---|---|---|
| Accuracy by Display Duration | 各呈現時間條件下的正確率 | 視覺注意力處理速度的閾值 |
| 指標 | 計算方式 | 意義 |
|---|---|---|
| Max Targets Tracked | 能成功追蹤的最大目標數 | 視覺注意力的同時追蹤容量 |
為確保認知測驗資料的有效性,UCG 在 trial 層級與 session 層級分別實施品質控制規則。
| 規則 | 閾值 | 處理方式 | 理據 |
|---|---|---|---|
| 預期反應 | RT < 150ms | 標記為 anticipation,排除於分析 | 低於人類最短反應時間,屬於預期性按鍵 |
| 極端值 | RT > 2000ms | 標記為 outlier,視分析需求決定保留或排除 | 可能反映注意力分散或暫時離開 |
| 規則 | 閾值 | 處理方式 |
|---|---|---|
| 有效 trial 比例 | ≥ 80% 的 trial 需為有效(非 anticipation、非 timeout) | 低於閾值則整個 session 標記為 invalid |
| 條件正確率 | 任一 condition 正確率 < 70% | 該 condition 的資料標記為 flagged,需人工檢查 |
若同一學生在 24 小時內重複施測同一認知測驗,系統會顯示練習效應(practice effects)警告,提醒研究者在分析時將此納入考量。認知測驗的 test-retest reliability 可能因短間隔重測而被高估。
Hedge, Powell & Sumner (2018) 指出,干擾效果(如 Stroop effect、Flanker effect)的效果量大且穩定,但其個別差異的信度(split-half reliability)卻可能偏低,此即所謂的「信度悖論(Reliability Paradox)」。原因在於:實驗效果的穩健性正是因為幾乎所有人都會產生相似的干擾效果,使得個體間的變異相對較小。
因此,研究者在使用 UCG 干擾效果指標進行個別差異分析時,應:
學習者的認知能力透過 Uedu 平台的 UCG 認知組學測驗工具箱(Uedu Cognomics)收集,該工具箱包含 14 個 web-based 認知測驗,涵蓋 6 大構念:(1) 執行功能(Stroop Task、Flanker Task、Task Switching),(2) 處理速度與注意力(Simple RT、Choice RT、PVT),(3) 工作記憶(N-back、Corsi Block),(4) 空間認知(Mental Rotation、Symmetry Span、UFOV),(5) 語文能力(Grammatical Reasoning、Vocabulary),(6) 後設認知(Confidence Calibration)。測驗架構以 Miyake et al. (2000) 的執行功能三因素模型為基礎,並擴展至其他認知構念。所有測驗以 JavaScript 實作,使用 performance.now() 精確計時與雙 requestAnimationFrame 渲染同步。Trial-level 原始資料完整保留,含刺激參數、反應時間與準確率。資料品質控制包含 RT < 150ms 預期反應排除、RT > 2000ms 極端值標記、session 有效性驗證(≥ 80% 有效 trial),以及 24 小時重測間隔警告。本研究經 IRB 202507EM058 核准。詳細方法論說明見 https://uedu.tw/doc/ucg。
若論文僅使用部分測驗,可在方法論描述中列出具體使用的測驗,並引用對應的原始文獻。例如:
抑制控制以 Stroop Task 測量(Stroop, 1935; MacLeod, 1991),核心指標為不一致與一致條件的反應時間差(interference effect)。工作記憶更新以 2-back Task 測量(Kane et al., 2007),核心指標為 d-prime。兩測驗均透過 Uedu UCG 工具箱以 web-based 方式施測(詳見 https://uedu.tw/doc/ucg)。