Home
探索 Uedu
學生控制台
註冊會員/登入
研究知情同意中心
問卷中心
教師控制台
課程設定
支援與訊息
Uptime 數據

UeduGPTs

--

Jupyters

3

UG26 CISOSE26
陽明交大 AQI 47 29°C PM2.5 9

AI 回覆桌面通知

AI 助教回覆完成時顯示桌面通知

聊天訊息通知

同學在討論區發送訊息時通知

聲音通知

每當有新通知時播放提示音

方法章

寫一章別人攻不破的方法:從「可複製」到「會辯護」的方法章正當性

入門篇教你把方法章寫到別人複製得出來;進階篇要你在每個決策旁補上理由、用檢定力分析推導樣本數、把方法章寫成對效度威脅的預先回應,並誠實揭露偏離與創新。

入門篇教你「寫清楚」,進階篇要你「說服」:方法章不只是操作手冊

入門篇把方法章定位成一份「別人複製得出來的操作手冊」——把模糊量詞換成具體數字、遵守時態語態慣例、別把結果偷渡進來。那是地基,不可動搖。但當你開始投稿有審查門檻的 venue,你會發現一個殘酷的事實:一份完全可複製的方法章,仍然可能被拒。

為什麼?因為審稿人讀方法章時,腦中跑的不是一個問題,而是兩個。第一個是入門篇處理的:「我照著做得出來嗎?」(可複製性)。第二個更尖銳,也更難對付:「你為什麼這樣做?換成別的做法會不會更好、甚至推翻你的結論?」(方法的正當性,methodological justification)。

換句話說,進階的方法章不只「描述」你做了什麼,還要「辯護」你為什麼這樣做、以及你怎麼預先堵住每一個可能的攻擊。一句寫得清清楚楚卻沒有任何理由的操作,在資深審稿人眼裡等於一個沒上鎖的破口。這篇文章談的,就是入門篇沒空細講的那一層:如何把方法章從一份「食譜」升級成一份「防禦工事兼說服文件」。

方法章進階概念示意圖

每一個方法選擇,都欠讀者一個理由

新手寫方法章只交代 what:用了什麼量表、跑了什麼統計。進階作者在每一個關鍵決策旁邊,都補上一句 why——而且這個 why 往往只需要半句話,卻能決定審稿人是信任你還是懷疑你。

來看一組對照。學生選了某個量表:

不佳:

"We measured cognitive load using the NASA-TLX."

這句話「可複製」——別人知道你用了 NASA-TLX。但審稿人會問:為什麼是 NASA-TLX 而不是 Paas 的單題量表?為什麼測整體負荷而不分內在/外在負荷?

改良:

"We measured cognitive load using the NASA-TLX, chosen over single-item scales because it captures multiple load dimensions (mental, temporal, effort) that were theoretically relevant to our multimedia condition."

那個 "chosen over... because..." 結構,是進階方法章的核心句型。它做了兩件事:承認存在其他選項(顯示你知道這個領域的工具版圖),並給出選擇的理由(顯示你的選擇不是隨機的)。

同樣的邏輯適用於每一個決策。看看排除標準(exclusion criteria)——這是最容易被質疑「你是不是挑資料」的地方:

不佳:

"We removed outliers and analyzed the remaining data."

「removed outliers」是研究誠信的紅旗。哪種離群值?用什麼準則?是分析前就定好的,還是看了資料才剔除的?

改良:

"Following a pre-specified rule, we excluded trials with response times below 200 ms (anticipatory responses) or above 3 SD from each participant's mean (lapses of attention), removing 2.1% of trials."

改良版交代了準則的依據(200 ms 是生理上不可能的真實反應,3 SD 是慣例)、準則的時機(pre-specified,事前定好)、以及代價(只刪了 2.1%,不是動了大刀)。每一個元素都在回應「你是不是 p-hacking」這個無聲的指控。

原則很簡單:凡是你做了一個「本來可以不這樣做」的決定,就在旁邊放一句理由。 樣本怎麼算的、共變項為什麼選這幾個、為什麼用這個顯著水準、為什麼分這幾組——這些半句話的理由,累積起來就是審稿人對你「方法學成熟度」的整體判斷。

樣本數不是「我找得到多少」,而是「我需要多少」

入門篇教你精確報告樣本數(「139 students」而非「some students」)。進階一層的問題是:這個數字是怎麼來的? 在 2026 年的審查環境裡,一句「我們招募了 60 位參與者」如果後面沒接著「為什麼是 60」,幾乎一定會收到審稿人的質疑。

最弱的寫法是讓樣本數看起來像「湊到的」:

不佳:

"A total of 60 participants took part in the study."

讀者心裡的問題:60 夠嗎?如果你沒測出效果,是真的沒效果,還是樣本太小、檢定力(statistical power)不足看不出來?這個不確定性會反過來侵蝕你所有的結論。

改良(事前檢定力分析):

"An a priori power analysis (GPower 3.1) indicated that 52 participants would be required to detect a medium effect (d = 0.5) at α = .05 with 80% power for an independent-samples t-test. We recruited 60 to allow for attrition."*

改良版把樣本數從「找得到的數字」變成「推導出來的數字」。它交代了工具(GPower)、假設的效果量(d = 0.5,且這個假設本身最好有文獻或先導研究支撐)、目標檢定力(80%,慣例下限)、以及多招的緩衝*(allow for attrition)。

但這裡有個進階陷阱要避開:不要做「事後檢定力分析」(post hoc / observed power)來替不顯著的結果開脫。 用你實際觀察到的效果量回頭算檢定力,在統計上是循環論證,幾乎所有方法學者都反對。如果你關心「我這個不顯著結果到底有沒有意義」,正確工具是報告效果量的信賴區間,或做敏感度分析(sensitivity analysis)說明「以我的樣本數,我有能力偵測到多大的效果」:

改良(敏感度分析的寫法):

"A sensitivity analysis showed that our final sample (N = 58) provided 80% power to detect effects of d ≥ 0.74; smaller effects may have gone undetected, a limitation we acknowledge."

這句話誠實地畫出你研究的「偵測下限」,主動承認你看不見小效果——這種坦白反而讓審稿人信任你。

把方法章寫成「對效度威脅的預先回應」

資深審稿人讀方法章時,其實是在主動找漏洞。他腦中有一份清單,叫做「對效度的威脅」(threats to validity)。你的方法章寫得好不好,很大程度上取決於你有沒有在他開口之前,就把這些洞補上。

學界通常把效度分四類,每一類對應一組你該在方法章預先回應的問題:

  • 內部效度(internal validity):你怎麼確定是「介入」造成了效果,而不是別的東西?→ 你需要交代隨機分派、對照組、控制了哪些干擾變項。
  • 外部效度(external validity):你的結論能推廣到誰?→ 你需要誠實描述樣本的侷限與情境。
  • 建構效度(construct validity):你的測量工具真的測到了你說的那個概念嗎?→ 你需要報告信效度證據。
  • 統計結論效度(statistical conclusion validity):你的統計推論站得住嗎?→ 你需要交代檢定力、假設檢驗、多重比較的處理。

最常被攻擊的破口,是沒有處理明顯的替代解釋(alternative explanation)。設想一個教育介入研究:

不佳:

"The experimental group used the AI tutor, and the control group used the textbook. We then compared their test scores."

這段話技術上可複製,但一個老練的審稿人立刻看到漏洞:兩組老師是同一位嗎?上課時數一樣嗎?AI 組會不會只是因為「拿到新玩具比較興奮」(新奇效應,novelty effect)才表現好?這些沒被排除的替代解釋,會讓你「AI 有效」的結論變得搖搖欲墜。

改良:

"To isolate the effect of the AI tutor, both groups were taught by the same instructor, spent identical total instructional time (150 minutes), and covered the same content. The control group used an interactive textbook app rather than a static textbook, to control for the novelty of using a digital tool. Group assignment was at the class level to avoid within-class contamination."

改良版在審稿人開口之前,就一一堵住了破口:控制了教師時數內容、用「互動式電子課本」控制了新奇效應、用「班級層級分派」避免了組間污染(contamination,即兩組學生互相交流)。每一個被控制的變項,都是一個被預先拆除的炸彈。

寫作技巧上,這種「預先回應」常用 "To control for X..." / "To rule out the possibility that..." / "To ensure that..." 這類目的句型,把你的設計決策和它要對抗的威脅明確綁在一起。讀者一眼就看出:你不是隨便這樣設計的,你是有意識地在防守。

預先註冊與「偏離計畫」的誠實書寫

入門篇的深入探討提到了預先註冊(pre-registration)能對抗 HARKing 與 p-hacking。進階篇要處理的是一個更實務、也更難寫的問題:當你的實際執行偏離了預先註冊的計畫,方法章該怎麼寫?

這幾乎一定會發生——招募不到預期人數、某個量表中途發現有問題、分析時才意識到原計畫的統計方法不適用。新手的直覺是隱瞞偏離、假裝一切照計畫走。但這正是審稿人(尤其在註冊報告 registered report 流程裡)最在意的誠信問題。

不佳(假裝照計畫走):

"As pre-registered, we analyzed the data using a mixed-effects model."

如果你其實偏離了——比方原本註冊的是 ANOVA,後來改用混合模型——卻寫得像「完全照計畫」,一旦被發現對照註冊文件,你的可信度會瞬間崩盤。

改良(誠實揭露偏離):

"We pre-registered an ANOVA, but during analysis we found that the assumption of independence was violated due to the nested structure of students within classes. We therefore deviated from the pre-registered plan and used a linear mixed-effects model with class as a random effect. The original ANOVA results are reported in the Supplementary Materials for transparency."

這段話之所以高明,在於它把一個「偏離」轉化成一個「展現方法學判斷力」的時刻:它說明了為什麼偏離(獨立性假設被違反)、怎麼偏離(改用混合模型)、並且保留了原計畫的結果供對照(放進補充材料)。審稿人看到的不是「這人沒照計畫」,而是「這人遇到問題時做了正確且透明的決定」。

關鍵詞彙是 "deviated from the pre-registered plan""we report both for transparency"。誠實揭露偏離,永遠比被抓到隱瞞偏離好上一百倍。

新方法、新工具:當你的方法本身就是貢獻

當你開發了一個新的演算法、新的量表、新的 AI 系統,方法章的角色會改變——它不再只是「交代你怎麼測量」,而是你研究貢獻的本體。這時方法章要同時做到兩件看似矛盾的事:足夠詳細到能複製,又足夠清楚到能讓人理解你的創新點在哪。

最常見的失敗,是把新方法埋在一堆實作細節裡,讀者看完知道「每一行在做什麼」,卻不知道「整體在做什麼、為什麼重要」。

不佳(只有細節、沒有架構):

"The system takes the input, embeds it using a transformer, retrieves the top-5 documents, concatenates them, and feeds them to the generator with temperature 0.7."

這是一串操作,但讀者抓不到設計的意圖新意

改良(先給架構,再給細節):

"Our system extends standard retrieval-augmented generation (RAG) with a relevance-reranking step (the key novelty), which addresses the common failure mode of retrieving topically related but pedagogically unhelpful passages. Concretely, candidate passages are first retrieved via dense embeddings (top-20), then reranked by a lightweight classifier trained on instructor-labeled relevance judgments, with only the top-5 passed to the GPT-4o generator (temperature = 0.7). Full hyperparameters and the reranker training procedure are detailed in Appendix B."

改良版的結構是「架構 → 新意 → 它解決什麼問題 → 具體步驟 → 細節去哪找」。讀者先理解你站在什麼基礎上(standard RAG)、你加了什麼(reranking step)、為什麼加(解決「相關但沒教學價值」的檢索失敗)、然後才進入參數細節。這就是把「方法即貢獻」寫清楚的順序。

對於 AI/計算方法,2026 年的審查還期待你交代一組額外的可複製性要素:模型版本與快照日期(GPT-4o 在不同時間點行為會漂移)、隨機種子(random seed)、運算環境、以及程式碼與資料的可得性聲明(code/data availability statement)。一句 "Code and prompts are available at [repository]" 在今天幾乎是計算研究的標配。沒有它,你的「新方法」就只是一段無法被驗證的宣稱。

看一個例子:把一段「沒有理由」的方法改寫成「會辯護」的版本

假設一位研究生寫下這樣一段(技術上可複製,但毫無正當性辯護):

"We recruited 40 students and split them into two groups. The experimental group used our app for two weeks. We used a questionnaire to measure engagement and ran a t-test to compare the groups."

逐句診斷它欠了讀者什麼理由:「40 students」——怎麼算出來的?夠不夠?「split them into two groups」——隨機嗎?「used a questionnaire」——哪個?信效度如何?為什麼測 engagement 而非 learning?「ran a t-test」——資料符合 t 檢定的假設嗎?

改寫後:

"An a priori power analysis indicated that 36 students would suffice to detect a medium-to-large effect (d = 0.7) at 80% power; we recruited 40 to allow for attrition. Students were randomly assigned to condition using a computer-generated sequence, stratified by prior GPA to ensure baseline equivalence. Engagement was measured with the 14-item User Engagement Scale (UES-SF; O'Brien et al., 2018), selected for its validated multidimensional structure and reported reliability (α > .85). Because the engagement scores were approximately normally distributed (Shapiro–Wilk p > .10) and variances were homogeneous (Levene's p > .20), a between-groups independent-samples t-test was appropriate; Cohen's d is reported as the effect size."

注意改寫後的每一個決策都帶著一句辯護:樣本數有推導、分派有方法(且分層確保基線一致)、量表有引用且說明為何選它、連選用 t 檢定都先驗證了它的前提假設(常態性、變異數同質性)。從一段「我做了什麼」,變成一段「我為什麼這樣做、而且我知道你會問」。這就是研究生與資深研究者方法章的真正分水嶺。

重點回顧

  • 可複製是地基,正當性是上層建築。 進階方法章不只交代 what,更要在每個關鍵決策旁補一句 why"chosen over X because...")。沒有理由的操作,在審稿人眼裡是沒上鎖的破口。
  • 樣本數要「推導」不要「湊」。 用事前檢定力分析說明你需要多少人;絕不用事後檢定力(post hoc power)替不顯著開脫,改用敏感度分析誠實畫出偵測下限。
  • 把方法章寫成對效度威脅的預先回應。"To control for..." / "To rule out..." 句型,在審稿人開口前就堵住替代解釋(新奇效應、組間污染、教師差異等)。
  • 誠實揭露對預先註冊計畫的偏離。 說明為什麼偏離、怎麼偏離、並保留原計畫結果供對照——這展現的是判斷力,不是失誤。
  • 方法即貢獻時,先給架構與新意,再給細節。 並附上模型版本、隨機種子、程式碼/資料可得性聲明。

深入探討(研究所視角)

到了博士與發表前沿的層級,方法章會從一份「研究報告的段落」升級為一個牽涉研究典範、社群規範與知識基礎建設的戰場。

第一,方法章是典範(paradigm)的宣示,不是中立的描述。 你選擇隨機對照試驗(RCT)、選擇紮根理論、選擇設計本位研究(design-based research),背後都預設了一套關於「什麼算是有效知識」的立場。資深審稿人會從你的方法選擇讀出你的認識論(epistemology)。因此在方法論有爭議的領域,成熟的方法章會用一小段明確交代自己的典範立場與其侷限——例如承認 RCT 在真實課堂的生態效度限制,或承認質性詮釋的研究者主觀性。把這層說清楚,等於先發制人地回應「你為什麼不用另一種典範」的質疑。對 Uedu 這類整合多模態學習資料的研究尤其關鍵:當你同時握有生理訊號(量化)與對話軌跡(可質可量)時,方法章必須交代你如何在混合方法(mixed methods)中整合兩種典範,而不是把它們生硬並置。

第二,「方法的方法」——方法學作為一種研究貢獻。 在頂尖 venue,一篇論文的貢獻可以純粹是方法學的:提出一個新的測量工具、一種新的因果推論設計、一套新的分析流程。這時整篇論文的「方法章」會反客為主,變成最核心、最需要嚴謹辯護的部分,往往還會附上模擬研究(simulation study)來證明你的方法在已知真值(ground truth)下能正確還原參數。如果你未來想做這類工作,要意識到:方法不只是達成研究目的的手段,它本身就能是被研究、被檢驗、被改良的對象。

第三,因果推論的方法學軍備競賽。 教育與社會科學近十年最大的方法學變革,是對「相關不等於因果」的嚴肅對待。當你無法做隨機分派(多數真實教育情境如此),準實驗設計需要更精巧的因果識別策略:傾向分數配對(propensity score matching)、差異中之差異(difference-in-differences)、迴歸不連續(regression discontinuity)、工具變數(instrumental variables)。這些方法的方法章寫法有嚴格的社群規範——你必須交代識別假設(identifying assumptions,例如平行趨勢假設)以及你如何檢驗這些假設站不站得住。寫不清楚識別策略,在經濟學取向的教育研究期刊幾乎必被拒。

第四,開放科學基礎建設正在重新定義「方法章」的邊界。 預先註冊、註冊報告(registered reports,方法在收資料前就先送審通過)、開放材料(open materials)、容器化的運算環境(如 Docker),正把方法章從一段靜態文字,擴展成一個可被獨立執行、獨立驗證的物件鏈。註冊報告尤其顛覆:它把方法章的審查提前到結果出現之前,等於用制度保證了「方法的正當性不被結果的好看與否污染」。對你個人的意義是:學會把方法寫得足以通過「結果還沒出來就被審查」的考驗,是這個世代研究者誠信與嚴謹的最高標準。

第五,方法透明與研究倫理的交織。 在 Uedu 這類平台上做研究,方法章還承擔一個無法迴避的倫理責任:當你的「材料」是學習者的生理數據、對話軌跡、學習歷程時,方法的透明度直接等於倫理的問責性。方法章必須交代知情同意的具體機制(不是一句「取得同意」帶過)、去識別化的技術程序、資料保存與可撤回的安排、以及 IRB 核准的確切範圍。這正是 Educational Omics 框架中 Ethicomics 維度落在寫作層面的要求——一個技術細節完美、卻對「如何合乎倫理地取得這些敏感資料」語焉不詳的方法章,在當代審查環境裡不會被接受。方法的「可重現」與「可問責」,在多模態教育研究裡已經是同一件事的兩面。

AI 共讀助教正在陪你讀:寫一章別人攻不破的方法:從「可複製」到「會辯護」的方法章正當性
嗨!我是這篇文章的共讀助教,只根據〈寫一章別人攻不破的方法:從「可複製」到「會辯護」的方法章正當性〉的內容回答。可以問我「解釋某段」「舉個例子」「出題考我」,或反白文中段落後點下方「解釋選取段落」。