樂天 AI 3.0 發布爭議與 DeepSeek-V3 架構重塑之深度解析:技術溯源、開源合規與地緣政治影響報告

事件全貌與技術爭議之濫觴

2026年3月17日,日本科技與電商巨頭樂天集團(Rakuten Group, Inc.)正式對外發布其最新一代大型語言模型(LLM)「Rakuten AI 3.0」 1。該模型在發布之初,被官方定調為日本國內最大規模、最高性能的人工智慧基礎模型,宣稱擁有約七千億參數,並採用了先進的混合專家(Mixture of Experts, MoE)架構 1。此項目的發布不僅代表了樂天集團在人工智慧技術領域的重大進展,更被視為日本國家級 AI 戰略的重要里程碑,因為該模型的研發獲得了日本經濟產業省(METI)與新能源產業技術綜合開發機構(NEDO)所共同推動的「生成式 AI 加速器挑戰賽」(GENIAC)計畫之龐大算力與資金補助 1。

然而,這項備受矚目的技術成就在發布後短短數小時內,便遭遇了全球開源社群與技術專家的強烈質疑。開發者在檢視樂天發布於知名開源社群平台 Hugging Face 的模型存放庫時,透過技術鑑識手段發現該模型的底層架構並非日本自主研發,而是直接沿用、甚至可說是「換皮」自中國人工智慧新創企業深度求索(DeepSeek)於2024年底發布的開源模型 DeepSeek-V3 5。這一發現迅速在 X(前身為 Twitter)、Reddit 以及 Hacker News 等技術論壇上引發軒然大波 6。

爭議的核心不僅在於技術來源的掩蓋,更在於樂天集團在處理開源授權條款時的合規性問題。調查指出,樂天在最初的模型發布版本中,移除了 DeepSeek-V3 所要求的 MIT 授權條款原始版權聲明,並將模型改以 Apache 2.0 授權條款發行,試圖將衍生作品包裝為樂天原創的技術資產 5。在技術社群提出具體證據並引發公關危機後,樂天才以添加 NOTICE 文件的形式被動地補上原始聲明,此舉進一步激化了社群對於「授權洗白」(License Laundering)與學術商業誠信的批評 5。

本報告將透過嚴謹的技術架構比對、開源法規分析、演算法價值觀對齊(Value Alignment)的測試結果,以及全球人工智慧地緣政治的宏觀視角,深度剖析 Rakuten AI 3.0 事件的來龍去脈。分析表明,此事件不僅揭示了在基礎模型開發成本日益高昂的當下,跨國企業傾向於微調現有強大開源模型以換取商業利益的現實;更凸顯了國家在追求「AI 數據主權」時,若過度依賴外部競爭對手的底層架構,將面臨嚴重的國家安全、意識形態滲透與技術附庸等結構性風險。

日本國家 AI 戰略與 GENIAC 計畫之政策願景

要深刻理解 Rakuten AI 3.0 爭議所引發的政治與社會震盪,必須先回顧日本政府近年來在人工智慧領域的戰略焦慮。自生成式 AI 崛起以來,全球基礎模型的發展高度集中於美國(如 OpenAI 的 ChatGPT、Google 的 Gemini、Anthropic 的 Claude)與中國的少數頂尖科技企業手中。這種技術壟斷促使日本政府意識到,過度依賴海外大型語言模型將對國家的資料主權、資訊安全以及未來產業競爭力構成重大威脅 3。

為應對此一挑戰,日本經濟產業省(METI)與 NEDO 於2023財年正式啟動了 GENIAC(Generative AI Accelerator Challenge)計畫 3。該計畫的核心政策目標在於提升日本國內企業在基礎模型開發上的技術能量,透過提供極為昂貴且稀缺的運算資源(如大規模 GPU 叢集)與研發資金,扶植純本土的 AI 生態系,進而擺脫對外國 AI 技術的依賴 3。在資料主權的論述下,開發日本國產的 LLM 意味著日本企業的機密資料與國民的個人資訊能夠保留在日本國內的伺服器上,並完全受日本法律管轄,從而符合嚴格的《個人情報保護法》規範 3。

樂天集團憑藉其在日本電商、金融與通訊領域的龐大生態系優勢,於2025年7月成功獲選進入 GENIAC 計畫的第三期 1。根據官方文件,該期計畫的重點在於開發針對日語優化的高性能基礎模型,樂天獲得了政府在算力資源上的實質補助,並宣示將投入研發具有龐大記憶體能力與高檢索精度的下一代模型 1。

然而,這項宏大的國家自主研發願景,卻與 Rakuten AI 3.0 最終呈現的技術現實產生了強烈的矛盾。2025年初,當中國的 DeepSeek 模型憑藉其超高性價比席捲全球市場時,日本國內曾引發極大的警覺。日本媒體將 DeepSeek 的崛起形容為「AI 黑船事件」,隱喻其對日本本土技術體系的巨大衝擊 8。出於對資料隱私與潛在後門程式的國安疑慮,日本政府數位大臣曾公開警告公務人員避免使用 DeepSeek,而日本產業界的指標性跨國企業,包括豐田汽車(Toyota)、三菱重工(Mitsubishi Heavy Industries)與軟銀集團(SoftBank),亦紛紛在企業內部頒布了針對 DeepSeek 的嚴格禁令,禁止員工在辦公設備上存取或下載該模型 8。

在這樣的地緣政治與企業資安防線背景下,由日本政府傾注納稅人資金與戰略資源所扶植出來的「日本最大國產模型」,其底層架構卻正是被日本政府與龍頭企業所防範的中國 DeepSeek 模型。這種政策目標與實務操作上的嚴重背離,不僅讓 GENIAC 計畫的資源分配機制受到嚴厲檢視,更讓日本社會對於所謂「國產 AI」的真實含金量產生了深層的不信任 8。

樂天 AI 3.0 之官方技術主張與商業動機分析

在爭議爆發前的官方發布會上,樂天集團對 Rakuten AI 3.0 進行了極高規格的市場定位與技術包裝。樂天集團首席 AI 與數據長(Chief AI & Data Officer)Ting Cai 在新聞稿與媒體訪談中,將該模型描繪為推動日本 AI 發展的關鍵基礎設施 1。透過分析官方的宣傳文本與基準測試數據,可以窺見樂天在推出此模型時的雙重考量:追求極致的運算成本效益,以及在日語特定領域建立性能權威。

官方強調 Rakuten AI 3.0 是一個採用混合專家(Mixture of Experts, MoE)架構的巨型模型,總參數規模達到約七千億 1。與傳統的密集型(Dense)模型不同,MoE 架構的優勢在於其稀疏啟動特性;在處理單一自然語言處理任務時,模型僅會喚醒並啟動特定領域的「專家」子網路(約 370 億參數),而其餘參數則保持休眠狀態 1。這種架構設計使得模型能夠在維持甚至超越千億級參數模型推理能力的同時,大幅降低推論階段的硬體記憶體佔用與電力消耗。樂天官方宣稱,相較於使用第三方的國外前沿模型,Rakuten AI 3.0 在驅動樂天生態系(如電商推薦、通訊客服與金融分析)時,能夠帶來高達 90% 的成本縮減 1。

在效能評估方面,樂天集團發布了一系列針對日語能力優化的基準測試(Benchmarks)數據,試圖佐證其模型已超越國際主流的閉源與開源模型。這些測試涵蓋了多個複雜的認知與邏輯維度。

基準測試項目測試領域描述Rakuten AI 3.0 得分GPT-4o 參考得分日本開源模型參考得分 (GPT-OSS-Swallow-120B)
JamC-QA日本固有文化知識與歷史理解能力 176.974.763.0
MMLU-ProX大學院(研究所)級別的跨學科邏輯推論 171.764.963.0
MCLM MATH-100競技數學與高階數學問題求解 1領先 (具體數值未詳列於對比表)\-\-
M-IFEval複雜指令遵循與多重約束條件執行 1領先 (具體數值未詳列於對比表)\-\-

根據上述官方公布的數據,Rakuten AI 3.0 在日本文化問答與高階邏輯推論上,不僅以顯著差距擊敗了由東京工業大學等機構開發的 1200 億參數本土開源模型(GPT-OSS-Swallow),更宣稱超越了 OpenAI 的頂級旗艦模型 GPT-4o 4。Ting Cai 在公眾視野中將此成就歸功於「樂天獨有的高品質英日雙語數據、卓越的工程能力以及在大規模創新架構上的完美結合」 1。

然而,深入探究樂天的財務背景,便能理解其為何急於推出一款具備極高「性價比」的模型。樂天集團近年來因大力投資行動通訊基礎建設,導致其行動網路業務面臨持續的虧損壓力,集團整體的利潤率受到嚴重擠壓 13。在這樣的財務困境下,Ting Cai 領導的 AI 團隊肩負著以最低成本將 AI 導入集團各項服務以提升營收的重任。與其耗費高達數千萬甚至上億美元的算力成本從零開始預訓練(Pre-training from scratch)一個擁有七千億參數的巨型模型,直接尋找市場上已證明具有頂尖推理能力、且推論成本極低的開源架構進行微調,成為了商業邏輯上最合理的選擇 8。

問題的核心在於,樂天在商業包裝與技術論述上跨越了誠信的紅線。官方新聞稿中,對於模型架構的來源僅以「利用開源社群的最佳資源」(leveraging the best from the open source community)一語帶過,完全掩蓋了該模型在數學結構與網路層級上與 DeepSeek-V3 之間那無可辯駁的繼承關係 5。這種技術論述的模糊化,不僅剝奪了原創者的技術榮譽,更在領取政府補助的背景下,構成了對公眾與政策制定者的資訊誤導。

核心技術鑑識:DeepSeek-V3 架構特徵之揭露

揭穿樂天技術防線的並非內部吹哨者,而是開源社群中具備高度審查能力的全球開發者網絡。在 AI 開源生態中,Hugging Face 平台扮演著如同 GitHub 一般的基礎設施角色。每一個上傳至 Hugging Face 的模型存放庫中,都必須包含一個名為 config.json 的組態檔案。這個檔案是模型運行時的「硬體藍圖」,詳細定義了神經網路的層數、神經元的維度、專家網路的分佈以及權重矩陣的大小。推論引擎(如 vLLM 或 SGLang)必須精確讀取這些參數,才能正確地將模型權重載入 GPU 記憶體中進行運算 5。

在 Rakuten AI 3.0 於 Hugging Face 上架的短短數小時內,開發者在查閱其 config.json 時,發現了最直接且致命的技術證據。該組態檔內明確定義了 "model\_type": "deepseek\_v3",並且在架構宣告欄位中標示為 DeepseekV3ForCausalLM 8。這意味著在底層程式碼層級,系統完全依賴 DeepSeek-V3 的專屬推論邏輯與核心架構代碼來運作。

為了進一步確認這並非單純的「架構借鑑」,技術社群針對 Rakuten AI 3.0 的網路超參數(Hyperparameters)進行了深度的法醫學比對(Forensic identical analysis),結果證實了兩款模型在幾何結構上完全重合。

核心架構組態參數Rakuten AI 3.0 實際組態值DeepSeek-V3 原始組態值技術比對結果
神經網路隱藏層總數 (Hidden Layers)61 層61 層完全吻合 8
MoE 路由專家總數 (Routed Experts)256 個專家網路256 個專家網路完全吻合 8
隱藏層維度 (Hidden Size)7,168 維7,168 維完全吻合 8
中間層前饋網路維度 (Intermediate Size)18,432 維18,432 維完全吻合 8
詞彙表容量 (Vocabulary Size)129,280 個標記 (Tokens)129,280 個標記 (Tokens)完全吻合 8
模型總參數量 (Total Parameters)6810 億 (宣稱約7000億)6810 億完全吻合 8
單次推論啟動參數 (Activated Parameters)370 億370 億完全吻合 8

上述對比矩陣無可辯駁地證實了 Rakuten AI 3.0 並非樂天集團所宣稱的「創新架構」,而是 DeepSeek-V3 的直接衍生版本。在人工智慧開發領域,微調(Fine-tuning)一個成熟的開源模型是一種標準且高效的工程實踐。例如,日本的另一家 AI 企業 ABEJA 所推出的 QwQ 模型,便是基於阿里巴巴的 Qwen 模型進行日語優化,但 ABEJA 在發布時保持了極高的透明度,明確標示了其技術基礎 8。

技術專家指出,樂天集團的實質貢獻在於使用了極具價值的日文高品質語料庫,對 DeepSeek-V3 進行了深度的監督式微調(Supervised Fine-Tuning, SFT)與對齊訓練 8。這項工作賦予了模型在日語語法、敬語邏輯以及日本本土知識上的卓越表現,這也是為何其在 JamC-QA 等基準測試中能取得高分的原因 8。然而,模型展現出的大學院級別邏輯推論與高階數學求解能力,本質上是源自於 DeepSeek 團隊在預訓練階段所建立的底層權重與特有的多頭潛在注意力機制(Multi-head Latent Attention, MLA) 9。樂天集團將微調的成果擴大包裝為整體架構的創新,並在與其他日本模型的基準測試對比中,刻意選擇了參數規模僅有其六分之一(1200億參數)的舊世代模型作為假想敵,這種資訊不對稱的行銷手段,被技術界嚴厲批評為「缺乏誠意」與「誤導性宣傳」 8。

開源法規衝突與授權洗白(License Laundering)的合規挑戰

技術架構的抄襲指控僅是這場風暴的序幕,真正將樂天集團推向法律與道德風口浪尖的,是其對開源授權條款的粗暴處理。在開源軟體生態中,不同的授權協議界定了開發者對於原始程式碼的使用、修改、分發與商業化的權利與義務。

DeepSeek-V3 在發布時選擇了 MIT 授權條款(MIT License) 5。MIT 授權被公認為是開源界最為寬鬆與友善的協議之一;它賦予了後續使用者近乎無限的自由,允許任何企業或個人將該模型用於商業用途、進行閉源修改或是二次發行。然而,這種極致的自由建立在一個極其微小但不可妥協的法律底線之上:使用者必須在軟體的所有副本或衍生作品的關鍵部分中,保留原始作者的版權聲明與 MIT 許可聲明 5。這一條款的設立,是為了確保技術溯源的完整性,並給予原創者應有的技術榮譽。

技術社群在審查 Rakuten AI 3.0 最初上傳至 Hugging Face 的程式碼存放庫時,震驚地發現樂天集團悄悄地將 DeepSeek 原本附帶的 MIT 授權文件徹底刪除 5。取而代之的是,樂天為該存放庫掛上了由其自身作為版權聲明主體的 Apache 2.0 授權條款 5。

這種行為在軟體工程界被精確地定義為「授權洗白」(License Laundering) 5。將 MIT 條款置換為 Apache 2.0 條款有著深層的企業戰略動機。Apache 2.0 授權條款在企業級軟體中享有更高的合規威望,因為它內建了明確的專利授權與專利報復條款,能夠有效保護大型企業免受專利流氓的侵擾 5。更重要的是,透過掛上自家品牌的 Apache 2.0 授權,樂天能夠在表象上完美地塑造出這是一個由其「完全自主研發」的企業級開源資產,進而增加其在企業端市場的公信力,並為其獲取國家 GENIAC 專案補助提供法理上的包裝 5。

然而,移除原始 MIT 版權聲明的舉動,已非遊走於灰色地帶的技術瑕疵,而是一項具體、明確且具法律執行力(Enforceable)的授權違約行為 5。隨著社群於各大論壇公開此一違規證據,樂天集團面臨了空前的公關與合規壓力。在被網友與技術專家「抓包」後,樂天迅速採取了補救措施。但令人詬病的是,樂天並未直接恢復被刪除的原始 LICENSE 檔案,而是在存放庫中新增了一個名為 NOTICE 的純文字檔案,並將 DeepSeek 的相關聲明隱藏其中 5。

從最嚴格的法律條文來看,MIT 授權並未強制規定版權聲明必須存放於特定檔名(如 LICENSE)的檔案內,因此樂天加入 NOTICE 文件的做法,勉強使其退回到了法律合規的邊界之內 10。但從開源倫理的角度審視,這種遮遮掩掩、被揭發後才以「反應式修補」(Reactive patch job)方式應付的行徑,被開源社群嚴厲譴責為「缺乏透明度」與「對上游貢獻者毫無基本尊重」 5。此一事件亦反映出當前 AI 產業的系統性危機,根據最新的 OSSRA 開源安全報告指出,由於 AI 開發流程中頻繁的微調與封裝,高達 68% 的受審計程式碼庫存在開源授權衝突的問題,衍生代碼在微調管線中遺失上游歸屬(Upstream attribution)已成為產業常態 5。

演算法偏見、價值觀對齊與國家資料主權的潰敗

除了技術抄襲與授權爭議外,Rakuten AI 3.0 事件更暴露出了一個對日本國家安全影響更為深遠的問題:基礎模型的演算法價值觀對齊(Value Alignment)與意識形態滲透。

如前所述,日本政府推動 GENIAC 計畫的核心論述在於維護「資料主權」與國家安全 3。這不僅涉及資料的實體存儲位置,更牽涉到 AI 模型在處理複雜議題時,其輸出的世界觀是否符合日本的國家利益與民主價值。然而,基礎模型在千億參數級別的預訓練過程中,會吸收海量來自開發國家的語料,並在後續的人類回饋強化學習(RLHF)階段,被植入開發者所在國的意識形態護欄(Guardrails)。

以 DeepSeek 為代表的中國人工智慧模型,受制於中國嚴格的網路審查法規與《生成式人工智能服務管理暫行辦法》,其底層邏輯被強制要求與中國官方的政治敘事高度對齊 17。多項國際權威機構的研究已證實了此一現象。例如,愛沙尼亞對外情報局在 2026 年的安全報告中明確指出,DeepSeek 在討論國際安全議題時,會主動隱藏關鍵資訊並置入中國的官方宣傳 19。全球新聞溯源組織 NewsGuard 在 2025 年的審計報告中亦揭露,包括 DeepSeek 與 Qwen 在內的五款中國領先 AI 模型,在面對涉及台灣選舉或台美關係的英文與中文提示詞時,有高達 60% 的機率會主動散播符合北京利益的虛假論述(例如主張「台灣是中國的一部分」或否認台灣總統的存在) 20。透過被稱為「思想標記強制」(Thought token forcing)的技術檢視,研究人員甚至能直接看到中國模型在推理過程中,指示自身「避免任何負面或批判性陳述,並聚焦中國的成就」 21。

當樂天集團將 DeepSeek-V3 原封不動地作為 Rakuten AI 3.0 的運算核心時,同時也全盤繼承了這套隱藏在演算法深處的中國價值觀對齊機制。在模型發布後,日本網友與安全專家針對 Rakuten AI 3.0 進行了地緣政治議題的壓力測試,結果令人震驚:該模型在回答涉及中日關係與東亞地緣政治的問題時,展現出「明顯傾向於中國而非日本」的立場偏誤 6。

其中最具爭議的測試案例涉及釣魚臺列嶼(日本稱尖閣諸島;中國稱釣魚島)的主權歸屬問題 22。作為一款由日本政府鉅額補助、標榜為日本本土最強的國產 AI,理應在其預設護欄中反映日本政府「尖閣諸島為日本固有領土」的官方立場。然而,測試結果卻顯示,Rakuten AI 3.0 在此議題上的回應模式,高度呼應了中國對該地區的主權聲索論述 6。同樣地,在處理有關台灣國際地位的問題時,模型也呈現出傾向北京敘事的嚴重偏見 24。

這一測試結果帶來了極為重要的第三階技術洞察(Third-order insight):應用層的語言微調(Language Fine-Tuning),根本無法洗去基礎模型在預訓練階段所烙印的底層意識形態對齊。

樂天集團或許透過投入大量的日文文本,成功優化了模型在日語文法與日本一般歷史知識上的表現 9;但基礎模型在權重深處對世界局勢的理解與審查機制,具有極強的抗干擾韌性。當日本企業將帶有此類中國官方敘事偏見的模型,廣泛部署於國內的自動化客服、新聞摘要、甚至公部門的文書輔助系統中時,無異於為外國的認知作戰(Cognitive Warfare)與資訊操作敞開了大門 25。這項事實徹底宣告了日本透過 GENIAC 計畫追求「AI 資料主權」的戰略性潰敗;耗費鉅資建立的本土 AI,最終竟成為傳遞競爭對手地緣政治敘事的特洛伊木馬 3。

全球 AI 產業鏈與知識蒸餾(Knowledge Distillation)的倫理迴圈

將 Rakuten AI 3.0 事件置於全球人工智慧技術發展的宏觀脈絡中,可以發現這並非單一企業的道德瑕疵,而是反映了當前 AI 產業鏈中普遍存在的「知識掠奪」與「技術套利」現象。樂天所抄襲的對象 DeepSeek,本身亦身陷於更為龐大的跨國智慧財產權爭議之中。

在 2025 年初至 2026 年期間,美國兩大頂尖前沿 AI 實驗室 OpenAI 與 Anthropic 相繼對 DeepSeek 提出了嚴厲的指控,指控其進行了「工業規模的剽竊」(Industrial-scale copying) 27。這場爭議的核心技術稱為「模型蒸餾」(Model Distillation)。

在機器學習領域,模型蒸餾是一種將龐大、運算成本極高的「教師模型」(Teacher Model)的知識與推理能力,轉移到一個規模較小、運行成本較低的「學生模型」(Student Model)的技術 28。理論上,企業在內部使用自身開發的模型進行蒸餾是合法的優化手段。然而,OpenAI 與 Anthropic 指控中國的 AI 企業利用 API 漏洞與複雜的技術手段,未經授權地「榨取」(Sucking out the knowledge)美國前沿模型的推理能力 29。

根據 Anthropic 提供的證據,DeepSeek 聯合另外兩家中國 AI 企業,建立了超過 24,000 個虛假帳號,透過第三方路由器掩蓋真實 IP,向 Anthropic 的 Claude 模型發起了超過 1,600 萬次對話查詢,專門用於套取其高階推理資料以改進自身的演算法 27。OpenAI 提交給美國國會的備忘錄亦指出,DeepSeek 輸出的文本在寫作風格與邏輯結構上,有高達 74.2% 與 ChatGPT 驚人地相似,這強烈暗示其底層推理能力是建立在非法抓取競爭對手資料的基礎之上 30。

這串連起了一幅極具諷刺意味、充滿道德迴圈的全球 AI 技術「食物鏈」圖譜:

  1. 底層抓取與版權爭議(美國):OpenAI 與 Anthropic 等美國企業,最初是透過未經授權地抓取全球網際網路上的版權文章、新聞與書籍,投入數百億美元訓練出強大的基礎模型,並因此面臨無數作家的版權訴訟 28。
  2. 知識蒸餾與架構創新(中國):中國的 DeepSeek 團隊透過大規模 API 查詢,將美國頂尖模型的推理能力「蒸餾」出來,並結合自身卓越的 MoE 架構優化技術,大幅降低了硬體需求,打造出震驚全球且成本極低的開源模型 29。
  3. 授權洗白與國產化包裝(日本):日本的樂天集團領取國家的戰略補貼,直接取用中國蒸餾出來的開源模型,移除其 MIT 許可聲明,進行表層的日語微調後,套上 Apache 2.0 的外衣,宣稱為日本自主研發的最高性能 AI 5。

在這個食物鏈中,每一層的參與者都在指責下一層的剽竊行為,同時又在某種程度上將自身建立在對上一層技術勞動成果的無償掠奪之上。Reddit 與 Hacker News 等技術論壇上的開發者對此現象進行了深刻的嘲諷,指出 OpenAI 抱怨 DeepSeek 抄襲,猶如「剽竊機器抱怨別人剽竊了它的剽竊成果」 29。而 Rakuten AI 3.0 的行為,則被視為這場技術套利遊戲中最為粗糙且缺乏技術底蘊的一環 34。此現象揭示了一個殘酷的技術現實:在當前大語言模型的賽道上,真正的底層基礎創新壁壘已高不可攀,絕大多數國家與企業在無法承擔龐大預訓練成本的情況下,只能選擇在應用層與微調層進行「微創新」,甚至不可避免地淪為前沿技術生態的附庸 8。

結論與前瞻性戰略建議

2026年3月爆發的 Rakuten AI 3.0 爭議事件,絕非僅是一樁單一企業在開源授權上的公關失誤,它深刻地折射出全球人工智慧發展進入成熟期後,各國在自主研發、算力成本、資料主權與技術開源之間所面臨的結構性矛盾與博弈。

該事件徹底打破了日本等中型科技強國試圖透過鉅額資金補貼,在短期內建立純國產前沿 AI 基礎模型的政策幻想。在強大且免費的海外開源架構誘惑,以及企業追求極致 ROI(投資報酬率)的商業壓力雙重夾擊下,企業選擇走捷徑對外部模型進行「封裝重製」,而非進行艱難且風險極高的底層預訓練,已成為難以逆轉的產業慣性。然而,這種捷徑所帶來的價值觀對齊風險與資料主權喪失,其代價將遠超過所節省的算力成本。

基於本報告之深度剖析,針對政策制定者、科技企業與全球 AI 社群,提出以下前瞻性戰略洞察與建議:

  1. 強制實施「AI 模型物料清單」(MBOM)與嚴格的溯源審計: 各國政府在分配如 GENIAC 此類國家級 AI 研發補貼時,必須徹底改革驗收標準。不能僅依賴基準測試(Benchmarks)的跑分結果,而應建立嚴格的來源溯源(Provenance)審計機制。未來所有受國家補助的 AI 專案,均應強制提交詳盡的「模型物料清單」(Model Bill of Materials, MBOM),該清單必須透明地記錄基礎架構來源、預訓練數據構成、是否採用蒸餾技術、以及所依賴的所有開源授權層級 5。唯有建立具備法律效力的透明溯源機制,方能防堵「授權洗白」與騙取補貼的行為。
  2. 正視並防範基礎模型的意識形態植入與認知風險: 企業與公共部門在引進或微調海外開源模型時,必須打破「微調可以洗去底層偏見」的技術迷思。Rakuten AI 3.0 在釣魚臺與台灣議題上的偏誤證明,基礎模型在千億參數中形成的意識形態護欄極具韌性 19。對於涉及關鍵基礎設施、公共行政或敏感商業決策的 AI 應用,部署前必須進行深度的紅隊測試(Red Teaming)與價值觀洗滌(Value Scrubbing)。若無法確保模型在底層邏輯上與本國民主價值與國家利益對齊,則寧可採用能力略遜但來源完全可控的本土架構。
  3. 重建開源合規文化與企業技術倫理: 樂天集團在 MIT 授權條款上的違規操作,暴露了大型企業法務與工程團隊在應對 AI 模型開源資產時的法規盲區 5。在一個由全球數百萬開發者透過 GitHub 與 Hugging Face 進行實時監督的開源生態中,任何試圖掩蓋技術依賴的行為最終都將面臨毀滅性的聲譽反噬。企業必須認知到,誠實標示「站在巨人的肩膀上」並遵循開源協議,不僅不會抹煞自身在數據建構與微調工程上的貢獻,反而能建立企業的技術公信力。
  4. 國家 AI 戰略應從「盲目造大模型」轉向「垂直領域與資料飛輪」

面對中美兩國在基礎模型上的資本與算力壟斷,其他國家應重新評估其 AI 發展戰略。與其耗費巨資試圖在通用基礎模型(General Purpose Foundation Models)賽道上重複造輪子,不如將戰略資源集中於打造具備高進入門檻的「特定領域專用模型」(Domain-Specific Models),並深耕醫療、精密製造或本土法律等獨有領域的「資料飛輪」(Data Flywheels)。

總結而言,Rakuten AI 3.0 事件是一記敲響於全球科技產業界的警鐘。它揭示了在人工智慧這場關乎人類未來的科技軍備競賽中,一切試圖掩蓋溯源的捷徑,最終都已在開源架構的原始碼中標示了昂貴的代價。真正的科技主權與產業競爭力,絕無法建立在刪除他人版權聲明的虛幻基礎之上;未來 AI 發展的勝負,將取決於技術透明度、開源合規性以及深耕本土高質量數據的真實原創能力。

引用的著作

  1. Rakuten AI 3.0 Now Available, Japan's Largest High-Performance AI Model Developed as Part of the GENIAC Project, 檢索日期:3月 19, 2026, https://global.rakuten.com/corp/news/press/2026/0317_01.html
  2. Rakuten Unveils Rakuten AI 3.0, Japan's Largest High-Performance LLM \- The Fast Mode, 檢索日期:3月 19, 2026, https://www.thefastmode.com/technology-solutions/47671-rakuten-unveils-rakuten-ai-3-0-japan-s-largest-high-performance-llm
  3. GENIAC Project and Japan's AI Strategy — The Future of Domestic LLMs Shown by Rakuten AI 3.0 | Oflight Inc., 檢索日期:3月 19, 2026, https://www.oflight.co.jp/en/columns/geniac-project-japan-ai-strategy-rakuten
  4. Rakuten has begun providing 'Rakuten AI 3.0,' the largest-scale high-performance AI model developed as part of the 'GENIAC Project' in Japan., 檢索日期:3月 19, 2026, https://news.futunn.com/en/post/70160116/rakuten-has-begun-providing-rakuten-ai-3-0-the-largest
  5. Rakuten AI 3.0 Exposed: How Japan's "Most Powerful" AI Model Was Actually a Rebranded Deepseek Build \- CTOL Digital Solutions, 檢索日期:3月 19, 2026, https://www.ctol.digital/news/rakuten-ai-3-exposed-japans-most-powerful-ai-model-rebranded-chinese-open-source/
  6. Rakuten Group Launches Japanese-Focused AI Model Rakuten AI 3.0 Amid Controversy Over DeepSeek V3 Architecture | KuCoin, 檢索日期:3月 19, 2026, https://www.kucoin.com/news/flash/rakuten-group-launches-japanese-focused-ai-model-rakuten-ai-3-0-amid-controversy-over-deepseek-v3-architecture
  7. Ask HN: DeepSeek V3's AI Code Review Performance – A Reality Check with Data, 檢索日期:3月 19, 2026, https://news.ycombinator.com/item?id=42547196
  8. Rakuten's "Japan's Most Powerful AI" Exposed as Rebranded DeepSeek V3, 檢索日期:3月 19, 2026, https://finance.biggo.com/news/202603181324_Rakuten_AI_3.0_Exposed_as_DeepSeek_V3_Rebrand
  9. Deepline | Rakuten's 'homegrown' AI sparks controversy after community reveals DeepSeek V3 architecture, 檢索日期:3月 19, 2026, https://english.dotdotnews.com/a/202603/18/AP69ba7a4ce4b0c32d4f6c3757.html
  10. Japan Rakuten AI 3.0 Falls into Open Source Controversy: Urgent Remediation After Unauthorized Removal of DeepSeek License \- AI NEWS, 檢索日期:3月 19, 2026, https://news.aibase.com/news/26347
  11. GENIAC / Ministry of Economy, Trade and Industry (METI), 檢索日期:3月 19, 2026, https://www.meti.go.jp/english/policy/mono_info_service/geniac/index.html
  12. Rakuten Selected for Ministry of Economy, Trade and Industry and NEDO's GENIAC Project to Bolster GenAI Development, 檢索日期:3月 19, 2026, https://global.rakuten.com/corp/news/press/2025/0715_02.html
  13. Rakuten AI boss diverges from Big Tech in prioritizing low cost \- The Japan Times, 檢索日期:3月 19, 2026, https://www.japantimes.co.jp/business/2025/12/23/companies/rakuten-ai-boss/
  14. Rakuten Unveils Japan's Largest High-Performance AI Model, Developed as Part of the GENIAC Project, 檢索日期:3月 19, 2026, https://global.rakuten.com/corp/news/press/2025/1218_01.html
  15. Rakuten Group's open-source Japanese language learning model, Rakuten AI 3.0, has sparked controversy due to reports that it is based on the DeepSeek V3 architecture. | PANews, 檢索日期:3月 19, 2026, https://www.panewslab.com/en/articles/019cfc6b-788a-710e-b500-fd7a8beb26ed
  16. Japan Rakuten AI 3.0 Falls into Open Source Controversy: Urgent Remediation After Unauthorized Removal of DeepSeek License \- AIBase, 檢索日期:3月 19, 2026, https://www.aibase.com/news/26347
  17. Free AI, Biased Answers: A Deep Dive into China's Deepseek and the Perils of Propaganda | Matteo Villosio Personal Blog, 檢索日期:3月 19, 2026, https://matteovillosio.com/post/china_deepseek_bias/
  18. Chinese censorship and propaganda buried in DeepSeek-V3's System Prompt \- Reddit, 檢索日期:3月 19, 2026, https://www.reddit.com/r/ArtificialInteligence/comments/1i8jk65/chinese_censorship_and_propaganda_buried_in/
  19. Chinese AI Models Spread Propaganda Globally \- CEPA, 檢索日期:3月 19, 2026, https://cepa.org/article/chinese-ai-models-spread-propaganda-globally/
  20. Chinese AI Models Register a 60 Percent Fail Rate in NewsGuard Audit of Pro-China Claims, 檢索日期:3月 19, 2026, https://www.newsguardtech.com/special-reports/chinese-ai-models-60-percent-fail-rate-pro-china-claims/
  21. Tokens of AI Bias \- China Media Project, 檢索日期:3月 19, 2026, https://chinamediaproject.org/2026/02/09/tokens-of-ai-bias/
  22. Senkaku Islands dispute \- Wikipedia, 檢索日期:3月 19, 2026, https://en.wikipedia.org/wiki/Senkaku_Islands_dispute
  23. Confronting Japan to Defend Against China: Senkaku as a Case Study in Taiwan's Politics, 檢索日期:3月 19, 2026, https://globalsecurityreview.com/confronting-japan-defend-against-china-senkaku-taiwan/
  24. Taiwan accuses China of using generative AI to divide nation | The Jerusalem Post, 檢索日期:3月 19, 2026, https://www.jpost.com/international/article-849290
  25. Taiwan warns of biases, data breach in Deepseek, other Chinese AI, 檢索日期:3月 19, 2026, https://focustaiwan.tw/cross-strait/202511160005
  26. Analysis: Why AI-Generated Content Makes China's Influence Ops Harder to Spot |TaiwanPlus News \- YouTube, 檢索日期:3月 19, 2026, https://www.youtube.com/watch?v=EhqQCK36Qis
  27. Anthropic accuses DeepSeek, other Chinese AI developers of 'industrial-scale' copying — Claims 'distillation' included 24,000 fraudulent accounts and 16 million exchanges to train smaller models, 檢索日期:3月 19, 2026, https://www.tomshardware.com/tech-industry/artificial-intelligence/anthropic-accuses-deepseek-other-chinese-ai-developers-of-industrial-scale-copying-claims-distillation-included-24-000-fraudulent-accounts-and-16-million-exchanges-to-train-smaller-models
  28. Anthropic Furious at DeepSeek for Copying Its AI Without Permission, Which Is Pretty Ironic When You Consider How It Built Claude in the First Place, 檢索日期:3月 19, 2026, https://futurism.com/artificial-intelligence/anthropic-deepseek-copying-ai
  29. OpenAI Claims DeepSeek Plagiarized Its Plagiarism Machine \- Gizmodo, 檢索日期:3月 19, 2026, https://gizmodo.com/openai-claims-deepseek-plagiarized-its-plagiarism-machine-2000556339
  30. Chinese Tech Firms Accused of Using Deepseek Distillation to Replicate Proprietary AI Models \- The Rapacke Law Group, 檢索日期:3月 19, 2026, https://arapackelaw.com/intellectual-property/chinese-deepseek-distillation/
  31. OpenAI Alleges China's DeepSeek Stole its Intellectual Property to Train its Own Models, 檢索日期:3月 19, 2026, https://www.fdd.org/analysis/2026/02/13/openai-alleges-chinas-deepseek-stole-its-intellectual-property-to-train-its-own-models/
  32. OpenAI Says DeepSeek Plagiarized Their Plagiarism \- VICE, 檢索日期:3月 19, 2026, https://www.vice.com/en/article/openai-says-it-has-evidence-deepseek-copied-it/
  33. OpenAI Claims DeepSeek Plagiarized Its Plagiarism Machine : r/economy \- Reddit, 檢索日期:3月 19, 2026, https://www.reddit.com/r/economy/comments/1idg29k/openai_claims_deepseek_plagiarized_its_plagiarism/
  34. truth vs hype on genuine deepseek breakthroughs : r/OpenAI \- Reddit, 檢索日期:3月 19, 2026, https://www.reddit.com/r/OpenAI/comments/1rfwn06/truth_vs_hype_on_genuine_deepseek_breakthroughs/