DeepSeek震撼輝達、臺積電 科技專家妙喻「AI料理戰爭開始」
▲中國AI新創公司DeepSeek(深度求索)推出新AI模型DeepSeek R1。(圖/路透)
文/林坤正
想像有一座全球頂級的料理學院,OpenAI 是這裡最頂尖的主廚,他花了多年時間,研發出了一道 「GPT-4 天價料理」。這道料理的特色是:
• 用最昂貴的食材(NVIDIA H100 高端 GPU)• 由最厲害的廚師(頂級 AI 研究員)製作• 調理過程極爲繁瑣(耗費 10 億美元訓練成本)• 只有豪華餐廳(大企業)能負擔得起
這使得 OpenAI 的餐廳成爲 AI 世界的米其林三星級存在,只有少數公司能使用這道頂級 AI 料理。
但某天,DeepSeek 這位來自中國的年輕廚師走進這家學院,他品嚐了 OpenAI 的料理後,開始思考:
「這道菜確實很棒,但真的需要這麼貴嗎?如果我能用更簡單的方法做出相似的味道,甚至讓更多人都吃得起呢?」
這是 AI 產業的關鍵問題,也是美中科技競爭的縮影。DeepSeek 不只是要做出這道菜,它還希望繞過美國對 AI 晶片的封鎖,並用開源策略反擊 OpenAI 和 NVIDIA。
於是,DeepSeek 開始用三種方法破解這道 AI 名菜——這不只是技術創新,更是一場 美中 AI 競爭的新回合。
第一步:智慧模仿(學霸筆記版學習)DeepSeek 並沒有偷走 OpenAI 的秘方,而是在細細品味料理的味道(分析 GPT-4 的輸入與輸出模式)、研究它的組成(拆解 AI 模型的架構)、 分析主廚的烹飪習慣(模仿 GPT-4 的推理邏輯)後寫下一本「學霸筆記」,拆解這道菜的核心風味、思考有沒有更簡單的方式達成同樣效果?如果不用名貴的食材,而是用價格較低的替代品,能否達到 90% 的相似度?
這就像 DeepSeek 透過蒸餾技術(Distillation)學習 GPT-4 的行爲模式,而不是直接複製 GPT-4 本身。
第二步:組合式創新(食材 + 烹飪技術優化)DeepSeek 發現 OpenAI 的料理過於昂貴和繁瑣,於是決定進行組合式創新:• 「我們不一定要用頂級牛排(高階 GPU),改用平價牛排(低端 GPU)也能做出好料理!」• 「如果讓廚房團隊分工合作(MoE),可以加快烹飪時間、降低成本!」• 「如果調味精度降低一點(FP8 混合精度計算),成本能再降一半!」• 「如果設計成三階段烹飪法(多階段訓練),味道可以更靈活適應客戶需求!」
這些技術的組合,使 DeepSeek 的 AI 訓練成本降至 600 萬美元,而非 OpenAI 的 10 億美元。
這其實與中國的電動車產業發展類似:• 美國 Tesla 領先,但中國 BYD (編注:比亞迪)透過技術優化與低成本戰略反攻全球市場。
第三步:開源策略(讓人人都能做這道菜)DeepSeek 這位聰明的年輕廚師,煮出了「平價版 GPT-4 料理」後,做了一個讓所有人驚掉下巴的決定——他開源了這道菜的食譜!這意味着每個廚師、每間餐廳都可以免費使用這份食譜,不再需要支付高昂的費用來請 OpenAI 名廚來做菜。
原本只能在高端餐廳享受的 AI 料理,現在變成了街頭巷尾的平價美食,打破了 OpenAI 在 AI 市場的壟斷。
這就像 DeepSeek 透過開源 AI 模型,讓企業和開發者可以免費使用 AI 技術,而不必向 OpenAI 支付昂貴的 API 費用。
這與 Google Android 與 Apple iOS 競爭的歷史相似,開源模式可以擴大影響力,但也會削弱商業控制權。
DeepSeek 的戰略成功,影響了哪些人?
當 DeepSeek 這道「智慧 AI 料理」成功推出後,它不僅影響了 OpenAI,還影響了整個 AI 產業鏈。
1. 對 OpenAI 而言:它的高端餐廳模式受到挑戰2. 對 NVIDIA 而言:高端食材需求下降3. 對臺積電而言:廚具市場發生變化
如果大家不再需要昂貴的烹飪設備(高端 AI 晶片),那麼臺積電可能會失去一部分高端市場的需求。
但另一方面,DeepSeek 的新技術(FP8 計算)可能會帶動新的 AI 晶片設計需求,讓臺積電找到新的成長機會。
結論:DeepSeek 不能單純視爲「抄襲」,而是「產業破局者」DeepSeek 這位年輕廚師,透過智慧模仿、組合創新、開源策略,打破了 OpenAI 與 NVIDIA 在 AI 領域的壟斷,這不只是技術創新,而是一場「美中科技冷戰」的新回合。
這場 「AI 料理戰爭」纔剛剛開始,未來 AI 市場的競爭將更加激烈,也將決定「開源 vs. 商業壟斷」這場技術競賽的最終贏家。
本文獲孔雀魚普惠科技創辦人林坤正授權《ETtoday新聞雲》節錄刊載,不得轉載