當你的資料搭上跨國航班:去識別化、追蹤技術與生成式 AI 的法律新戰場
深入跨境資料傳輸(Schrems II 與台灣個資法第 21 條)、追蹤技術與去識別化的法律邊界,以及深偽與生成式 AI 對平台責任的全新挑戰。
當你的資料搭上跨國航班:去識別化、追蹤技術與生成式 AI 的法律新戰場
你在台灣的手機點開一個購物 App,輸入信用卡買了一雙鞋。這筆交易資料下一秒可能存進新加坡的雲端機房,由愛爾蘭的子公司負責帳務,再被美國總部的演算法拿去訓練「猜你還想買什麼」的推薦模型。整個過程不到一秒鐘,跨越了四個法域(jurisdiction)。
如果你讀過入門篇,已經知道個資的核心是「識別性」、知道誹謗與公然侮辱的差別、知道平台有「避風港(safe harbor)」。但那些討論大多停在「一國之內、靜態的一筆資料」。真實世界的網路法遠比這複雜:資料會流動、會被技術手段重新拼湊、會被生成式 AI 重新混合。這篇進階文章帶你進入三個更硬的戰場——跨境資料傳輸(cross-border data transfer)、追蹤技術與去識別化的法律邊界、以及生成式 AI 帶來的內容治理新難題。以下仍屬通識性概念說明,並非針對任何個案的法律意見。

資料跨境傳輸:法律疆界 vs. 無國界的網路
入門篇提過 GDPR 有「域外效力」,但沒細談一個關鍵問題:台灣的企業要把個資送出國,到底需要什麼條件?
台灣個資法第 21 條:被忽略的「跨境禁令」開關
《個人資料保護法》第 21 條規定,非公務機關進行個資的「國際傳輸(international transmission)」,中央目的事業主管機關在四種情形下「得限制」之:(1)涉及國家重大利益;(2)國際條約或協定有特別規定;(3)接受國對個資保護未有完善法規,致有損當事人權益之虞;(4)以迂迴方法向第三國(地區)傳輸而規避本法。
注意這裡的法律邏輯:台灣採「原則允許、例外限制」。也就是說,個資跨境傳輸原則上是自由的,主管機關必須「主動發布限制命令」才會被禁止。這和 GDPR 的設計恰好相反——歐盟採「原則禁止、例外允許」,資料要離開歐盟,必須先滿足特定法律基礎才行。
這個差異看似抽象,實務影響卻很大。台灣曾在 2021 年由國家通訊傳播委員會(NCC)依第 21 條第 3 款,限制將個資傳輸至中國大陸(針對特定產業),就是少數實際動用這個「開關」的例子。
GDPR 的三道閘門:適足性、SCCs、BCRs
要理解全球資料治理,你必須認識歐盟設下的三道跨境閘門,因為它們已成為各國談判資料貿易的事實標準:
- 適足性決定(adequacy decision):歐盟執委會認定某國的個資保護水準「與歐盟實質相當」,資料就能自由流向該國,等於拿到「免簽證」。日本、英國、韓國都拿到了;台灣尚未取得,這正是台灣產業出口歐盟資料的痛點之一。
- 標準契約條款(Standard Contractual Clauses, SCCs):沒有適足性時,資料輸出方與輸入方簽訂歐盟核可的制式契約,把 GDPR 的義務「用合約綁住」對方。這是中小企業最常用的工具。
- 拘束性企業規則(Binding Corporate Rules, BCRs):跨國集團內部訂定一套經主管機關核准的資料保護政策,讓集團內各國子公司間的資料流動合法化。
「Schrems 案」:當合約遇上國家監控
這裡有一個堪稱二十一世紀資料法經典的故事。奧地利法律人 Max Schrems 主張,他的 Facebook 資料被傳到美國後,可能遭美國情報機關(依《外國情報監控法》FISA 702 條)大規模監控,歐盟對他的保護形同虛設。
歐洲法院(CJEU)兩度站在他這邊:2015 年「Schrems I」推翻了美歐之間的「安全港(Safe Harbor)」協議,2020 年「Schrems II」更進一步推翻了後續的「隱私盾(Privacy Shield)」,並指出:即使簽了 SCCs,如果資料輸入國的法律允許政府無差別監控、且當事人無有效救濟途徑,那麼這紙合約也無法真正保護資料——企業必須額外採取「補充措施(supplementary measures)」,例如加密、假名化。
Schrems II 的深層啟示是:資料保護不只是私人之間的合約問題,它最終會撞上國家主權與國家安全。一個國家的監控法律,會讓另一個國家的人民失去保護。這就是入門篇提到的「資料主權」在實務上最尖銳的展現。
追蹤技術的法律邊界:Cookie、指紋與「去識別化」的真假
入門篇說「Email、IP 也可能是個資」,但網路追蹤的技術手段遠不只這些,而法律對它們的規範正是當代爭議最多的地帶。
從 Cookie 同意到「黑暗模式」
你一定看過網站跳出的「本站使用 Cookie,點擊接受」橫幅。這個橫幅的法律來源是歐盟《ePrivacy 指令》,要求在裝置上「存取或儲存資訊」前須取得同意。但實務上出現大量「黑暗模式(dark patterns)」:把「全部接受」做成醒目大按鈕,「拒絕」藏在三層選單裡,或把預設選項全部勾選。
歐盟資料保護機關已明確表態:這種誘導式設計取得的同意「無效」,因為 GDPR 要求同意必須是「自由給予、具體、知情且明確(freely given, specific, informed and unambiguous)」。台灣個資法雖未對 Cookie 做專條規範,但「同意」的有效性同樣以「充分告知」為前提,誘導式設計在法理上同樣站不住腳。
裝置指紋:當你刪掉 Cookie 也躲不掉
更進階的追蹤是「裝置指紋(device fingerprinting)」。廣告商蒐集你的瀏覽器版本、螢幕解析度、安裝字型、時區、語言設定等數十個參數,組合起來幾乎能唯一識別一台裝置——即使你刪光 Cookie、開無痕模式也沒用。
這裡的法律難點在於:裝置指紋蒐集的是一堆「看似不相關的技術參數」,廣告商常主張「我們沒蒐集姓名,這不是個資」。但依入門篇講的「間接識別」概念,只要這組指紋能穩定地對應到「同一個你」並被用來投放個人化廣告,它在功能上就是個人資料——識別性看的是「能不能對應到特定人」,而非「有沒有寫出名字」。
「去識別化」的真相:匿名 vs. 假名
很多企業聲稱「我們的資料已經去識別化(de-identification),所以不受個資法拘束」。但法律上必須嚴格區分兩個概念:
- 匿名化(anonymization):資料被處理到「再也無法、且不可逆地」連結回特定個人。真正匿名化的資料才脫離個資法。
- 假名化(pseudonymization):把姓名換成代碼(如 user_8842),但只要保留一張「對照表」或還能透過其他資料勾稽還原,它仍然是個資,仍受法律拘束。GDPR 明文把假名化資料列為個資。
研究上反覆證明,許多號稱「匿名」的資料集其實只是假名化,透過與其他公開資料勾稽就能「再識別(re-identification)」。著名案例如僅憑「郵遞區號+生日+性別」三個欄位,就能在美國重新識別出大多數人。這提醒我們:「去識別化」是一個程度問題,不是一個非黑即白的開關。
動手試試
請你自己檢驗一個常見迷思。某 App 宣稱:「我們只蒐集您的『裝置 ID、概略位置(城市層級)、瀏覽紀錄』,這些都不是個人資料,所以不需要您同意。」
試著用本文與入門篇的概念逐項反駁:
- 裝置 ID ——它能穩定對應到「同一支手機=同一個你」嗎?若能據此累積長期行為輪廓,是否落入「間接識別」?
- 概略位置 ——城市層級看似模糊,但若結合「每天晚上 11 點到早上 7 點都在某住宅區、白天在某辦公大樓」,能否反推出住家與工作地點,進而鎖定個人?
- 瀏覽紀錄 ——這串紀錄本身或許不含姓名,但它是不是「特徵」資料?能否與裝置 ID 勾稽成可識別的輪廓?
你會發現,三項「單獨看都不是個資」的資料,組合起來足以辨識特定人——這正是「馬賽克理論(mosaic theory)」:個別無害的碎片,拼起來就是高解析度的個人畫像。因此該 App 的主張在法律上難以成立。(此為概念推演示範,非個案結論。)
生成式 AI 時代的內容治理:深偽、訓練資料與責任歸屬
入門篇談平台責任時,假設的是「使用者上傳一篇人寫的貼文」。但生成式 AI(generative AI)打破了這個前提——內容可以由機器大量生成、足以亂真,這對既有法律框架構成全新挑戰。
深偽(Deepfake)與人格權
利用 AI 換臉、合成聲音製作的「深偽(deepfake)」影像,可以讓任何人「說出他從沒說過的話」「做出他從沒做過的事」。這同時侵害多種權利:
- 肖像權與姓名權(《民法》第 18 條人格權):未經同意使用他人臉孔與聲音。
- 名譽權:若深偽內容貶損當事人。
- 若涉及合成不實性影像,台灣已於 2023 年修正《刑法》,增訂第 28 章之一「妨害性隱私及不實性影像罪」(第 319 條之 1 至之 6),明文處罰未經同意以電腦合成、編輯製作他人不實性影像並散布的行為。這是台灣法律針對 AI 生成內容做出的具體回應。
訓練資料的著作權爭議
生成式 AI 必須「讀」海量文字、圖像來學習,這些訓練資料(training data)很多受著作權保護。核心爭議是:未經授權把受著作權保護的作品餵給 AI 訓練,算不算侵權?
這牽涉著作權法上的「合理使用(fair use / 合理使用原則)」。台灣《著作權法》第 65 條的合理使用四要素——利用之目的與性質、著作之性質、利用的質量比例、對市場的影響——是否涵蓋「機器學習」這種前所未見的利用方式,目前全球都還在訴訟與立法的拉鋸中(如美國多起作家、藝術家對 AI 公司的集體訴訟)。這是一個尚無定論的前沿問題,任何斬釘截鐵的答案都該存疑。
AI 生成內容,避風港還適用嗎?
回到平台責任。傳統避風港的前提是「平台只是被動中介,內容是使用者產生的」。但當平台自己內建的 AI 生成了違法內容(例如 AI 聊天機器人捏造了對某人的誹謗陳述,即所謂「幻覺(hallucination)」),平台還能主張自己只是「中介者」嗎?
這裡出現一個關鍵的法律分水嶺:避風港保護的是「傳遞他人言論的管道」,而非「自己發表言論的主體」。當 AI 是平台提供的服務、由平台的模型直接「生成」內容時,平台更接近「內容生產者(content creator)」而非「中介者」,避風港的適用空間大幅縮小。這也是為何各國開始討論,是否需要為生成式 AI 服務量身打造一套有別於傳統 ISP 責任的新規則。
重點回顧
-
跨境傳輸有方向性差異:台灣個資法第 21 條採「原則允許、例外限制」,主管機關需主動發布限制;歐盟 GDPR 相反,採「原則禁止、例外允許」,需透過適足性、SCCs 或 BCRs 三道閘門。
-
Schrems II 揭示資料保護的天花板:私人合約(SCCs)擋不住國家監控;資料保護最終會撞上接收國的國安與監控法律,這是「資料主權」最尖銳之處。
-
追蹤技術突破了 Cookie:裝置指紋即使刪光 Cookie 也能識別;判斷是否為個資看「能否對應特定人」而非「有沒有寫出名字」。
-
「去識別化」是程度而非開關:真正不可逆的「匿名化」才脫離個資法;保留對照表的「假名化」仍是個資,且資料常可被「再識別」。
-
生成式 AI 改寫責任框架:深偽已有《刑法》不實性影像罪回應;訓練資料的合理使用尚無定論;當平台 AI「自己生成」違法內容時,避風港的適用空間大幅縮小。
深入探討(研究所視角)
對想往研究走的學習者,本文三個戰場都各自連著值得深掘的理論前沿。
第一,「同意」機制在資料經濟下的結構性失靈,與替代典範。 入門篇提過「告知後同意(notice and consent)」可能失靈,進階層次要追問的是:替代方案是什麼? 學界提出幾條路線值得追蹤——其一是「去同意化的實質管制」,亦即不再把責任壓在使用者「點同意」上,而是直接從法律層面禁止某些資料利用(如歐盟《AI 法》對特定高風險用途的禁令、對「操縱性」設計的禁止)。其二是把焦點從「蒐集端同意」移到「利用端問責(accountability)」,要求企業就資料利用的後果負舉證與評估責任(如資料保護影響評估 DPIA)。其三是制度創新如「資料信託(data trust)」「資料中介(data intermediary)」,由獨立第三方代表資料主體集體議價。研究者可比較這幾種典範在「保護效力」與「創新成本」之間的權衡。
第二,平台內容治理的「正當程序」化與審查的可問責性。 入門篇談過私人平台不受憲法言論自由直接拘束(缺乏 state action)的漏洞。進階研究的核心問題是:既然無法直接套用憲法,能否退而要求「程序正當」? 歐盟 DSA 的回應是課予大型平台一系列程序義務:刪文須附理由、提供內部申訴與外部爭議解決、定期透明度報告、演算法風險評估與外部稽核。這形成一種「程序性的言論保護」——不直接規定「什麼能說」,而是規定「平台想刪你的話,必須走完哪些程序」。研究者可探討:這種「程序正當化」是否真能制衡平台權力?外部稽核員如何取得演算法的「黑箱」資料?商業機密與透明度要求如何權衡?這正是「平台憲政主義(platform constitutionalism)」的實證檢驗場。
第三,生成式 AI 的「責任鏈」斷裂問題。 傳統侵權法假設「行為人—損害」之間有清楚因果。但 AI 生成內容的責任鏈被切成好幾段:訓練資料提供者、模型開發者、部署平台、下達指令的使用者——當 AI 生成了一段誹謗、一張深偽、一段侵權程式碼,該由誰負責?這牽涉到「演算法問責(algorithmic accountability)」與「有意義的人類控制(meaningful human control)」等概念。值得對照的是歐盟《AI 法》的「風險分級」進路(禁止/高風險/有限風險/最小風險)與台灣研擬中的 AI 基本法之間的取向差異。
建議的進階路徑:先讀通台灣個資法第 21 條與《著作權法》第 65 條合理使用,建立本土條文基礎;接著精讀歐盟 GDPR 第五章(跨境傳輸)、DSA 與《AI 法》的條文架構,理解「風險分級」的監管哲學;再回頭研讀 Schrems II 判決全文,體會「私法合約如何被公法監控擊穿」;最後延伸到 Julie Cohen《Between Truth and Power》對「資訊資本主義」的批判,以及 Frank Pasquale《The Black Box Society》對演算法不透明的分析。網路與資訊法最迷人之處,在於它永遠跑在技術後面追趕——而正是這份「追趕」,逼著我們不斷重新定義:在一個資料即權力、AI 即生產力的時代,自由、隱私與正義各自還剩下多少分量。