2026年3月的GTC大會上,黃仁勳宣布推出「Groq 3 LPU」推論晶片,這款整合至Vera Rubin平台的新產品,將由三星代工製造。消息一出來,PTT科技板就炸了鍋,一堆人在那邊喊「台積電要被拋棄了」、「NVIDIA變心了」。

少年仔,冷靜一下。這根本不是什麼失寵不失寵的問題,這是典型的產能分配與供應鏈多元化操作。你以為黃老闆是因為不爽台積電才找三星?錯了,是因為台積電的產線已經塞到2027年,再塞下去整個系統都要崩潰了。

LPU是什麼?為什麼適合推論任務?

先講結論:Groq 3 LPU專為推論任務設計,採用SRAM架構提供高頻寬優勢。

秘密藏在記憶體設計裡。傳統GPU依賴高頻寬記憶體(HBM),雖然容量大,但延遲相對較高、成本不菲。而LPU直接在晶片內建500MB的SRAM,記憶體頻寬達到150 TB/s——這個數字遠高於單顆HBM4的2.8 TB/s以上規格,在頻寬層面具有明顯優勢。

什麼概念?就像把常用資料庫搬進處理器旁邊,存取速度大幅提升。這種設計特別適合大型語言模型(LLM)在推論時對頻寬的高度需求。

黃仁勳在大會上說:「推論的轉折點已經到來。」他提到的「代理型AI(Agentic AI)」需要AI系統自主思考、頻繁交互,Token生成速度需求從每秒100個提升到更高水平——這種場景下,專用推論晶片的優勢更加明顯。用我們做半導體的話來說,這就是針對特定工作負載做的最佳化設計,良率穩定、效能到位,這才是真本事。

為什麼選三星?台積電產能到底塞成什麼樣子?

這才是重點。很多人以為NVIDIA是因為對台積電不滿才找三星,這根本是外行人的想法。

事實是:台積電並未失去NVIDIA訂單,而是現有產能已排滿至2027年。

你知道NVIDIA的Blackwell GPU、CoWoS先進封裝需求有多誇張嗎?台積電產線已經滿載到一個不行,黃仁勳多次訪台爭取產能已經變成業界笑話了。問題是,Groq 3 LPU因為採用SRAM設計,不需要複雜的HBM封裝與CoWoS技術,結構相對簡單——這就給了三星接單的機會。

根據業界分析,若要在2026年下半年順利出貨,將LPU交給三星代工是合理的商業決策。台積電仍然是NVIDIA主要合作夥伴,負責Rubin GPU等核心產品製造,這次三星接單更像是產能分流,而非供應鏈轉移。

講白一點,這就是一場大型的產能Debug。當你的主要產線已經跑到極限,系統隨時可能崩潰,你會怎麼做?當然是找備援方案,把相對簡單的產品分流出去,讓主產線專注在更複雜、良率要求更高的產品上。這不是背叛,這是風險管理。

網友怎麼看?理性分析與迷信並存

社群反應呈現多元觀點。

支持者認為這是成本與效能的最佳化策略:「用SRAM架構設計推論晶片,針對性強,這是技術演進的必然。」更有人分析NVIDIA正在建立「訓練用GPU + 推論用LPU」的完整生態系,進一步強化在AI基礎設施市場的地位。

質疑者則對三星製造品質抱持觀望態度:「三星代工?希望良率能穩定。」也有人關注下半年出貨時程是否會如期達成。

老實說,這些擔心不是沒道理。三星的良率一直是個謎,投片出來會不會亮、良率能不能穩定在可接受範圍,這都是未知數。不過話說回來,LPU的結構相對簡單,不需要CoWoS那種魔王級的封裝技術,三星應該還扛得住。當然,記得在機房多放幾包綠色乖乖,這種事情還是要敬畏一下天意的。

值得注意的是,NVIDIA在GTC 2026宣布整合Groq技術時明確表示,這是技術合作的延伸應用,而非獨占性收購。Groq 3 LPU將作為Vera Rubin平台的第七個元件,與GPU協同運作,而非取代關係。

推論晶片市場,正在重新洗牌

根據GTC 2026公告,Groq 3 LPU將整合進NVIDIA的Vera Rubin平台,專責處理推論任務,而GPU則繼續負擔訓練與其他運算需求。換句話說,LPU不是來取代GPU的,而是來分工推論任務、優化整體效能的。

這場代工決策背後,更深層的訊號是:全球AI算力需求已成長到單一晶圓廠難以完全承載的規模。NVIDIA透過架構創新與供應鏈多元化,降低對單一製造夥伴的絕對依賴。

台積電失寵了嗎?答案是否定的。但NVIDIA已經展現出更靈活的供應鏈管理策略,在確保產能的同時,也為未來成長預留空間。

用我們半導體業的話來說,這就是一場成功的「降壓」操作。當系統壓力過大時,懂得適時分散負載、重新配置資源,這才是高手的表現。不要動不動就喊什麼失寵、背叛,這世界沒有那麼多戲劇性,有的只是務實的商業決策和對供應鏈穩定性的追求。

AI推論市場的競爭,才正式進入新階段。而我們這些做半導體的,只要確保投片出來會亮、良率穩定,其他的就交給市場去決定吧。對了,記得買綠色乖乖。