訪問一次中國,馬斯克再次成為了世界首富。

馬斯克訪華期間,特斯拉股價2天累計上漲10.76%,市值上漲341.09億美元。正是訪華的兩天,讓馬斯克身價超過了法國奢侈品巨頭酩悅·軒尼詩-路易·威登集團(LVMH)董事長兼CEO貝爾納·阿爾諾。彭博社億萬富豪指數顯示,馬斯克其時身家約為1923億美元,阿爾諾身家約為1866億美元,再次成為世界首富。

當然,同樣是大佬,待遇卻不同。中國媒體人甚至精確計算了馬斯克此次訪華在中國具體待的時間——44個小時,但摩根大通CEO戴蒙訪華與馬斯克也就是前後腳,關注度就沒有那麼高。

但首富和大佬們還是紛紛開啟了訪華行程,彭博社6月1日報導,繼特斯拉CEO馬斯克和摩根大通CEO戴蒙之後,前任世界首富、LVMH董事長貝爾納·阿爾諾計劃6月訪問中國。看來,被馬斯克超過之後,前首富也要來「沾沾歐氣」。

不過,在媒體關注度和話題度上能與馬斯克齊平的企業大佬,哪怕蘋果的CEO庫克都做不到——唯一能堪比馬斯克的,或許就是黃仁勛了。

知情人士表示,英偉達CEO黃仁勛將於6月6日到訪上海,與騰訊、字節跳動、理想汽車、比亞迪和小米等中國企業的高管會面。報導稱,黃仁勛此行為私人行程,如計劃成行,也是他多年來首次參觀訪問中國大陸。

不過也有新消息稱,黃仁勛已經從台北返回美國。6月6日已經到了,看來,這次傳得沸沸揚揚的黃仁勛訪華,終究還是一次誤會。但無論黃仁勛是否來大陸,是否晚點來大陸,對英偉達來說,中國都是一個不能割捨的市場,黃仁勛對中國市場的看重也不會減少。

黃仁勛已經多年未來大陸

黃仁勛上一次作為主角來大陸,還是2005年6月(2013年黃仁勛曾應雷軍約來大陸,不過是以嘉賓身份出席小米發布會),其時黃仁勛在北京發布了英偉達新一代圖形晶片GeForce 7800。

而那一次來華的背景,則是失去微軟大客戶的英偉達,試圖在中國大陸這個快速崛起的市場中,尋找新的機會。

2005年的英偉達,剛剛從此前的兩年困境中恢復:2005 財年總收入 20.1 億美元,淨利潤 1.004 億美元,分別比上一年增長了 10.4% 和 34.9%。但多年的顯卡混戰,戰勝者英偉達彼時也只是慘勝,還沒有獲得足夠的超額利潤作為回報。印度樂威壯印度樂威壯20mg印度樂威壯正品印度樂威壯哪裡買樂威壯

由於微軟 2002 年下半年宣布其Xbox2 遊戲機中不再使用英偉達的晶片,這直接導致英偉達2003 年出現負增長。2003年困境之後,黃仁勛決定在中國大陸成立公司,短短一年時間,就分別在北京、上海、深圳成立了獨立的公司。其中,北京公司負責銷售和客戶支持,深圳公司負責研發和系統集成,上海公司負責晶片設計。

彼時,作為需求方的大陸市場,在先進晶片上還沒有人會想到,會發生「卡脖子」這種事。

十八年過去了,本次傳聞黃仁勛訪華(傳言時間可能會變)的背景,與上次相比,有不同;也有相同之處。

英偉達已經如日中天,是市值萬億美元的晶片巨頭。中國大陸市場需求依然旺盛,英偉達財報數據顯示,中國大陸在 2023 財年營收達到58億美元,占總收入的 21%,而在2003財年中國大陸營收只有 2.4 億美元,占總收入的比例僅為 13%。

儘管地緣政治變化了,但英偉達重視大陸市場的決心還沒有變。

在美國拜登政府2022年公布禁令,禁止英偉達向包括騰訊和字節跳動在內的中國客戶銷售NVIDIA A100、H100兩款計算加速卡之後,英偉達迅速調整了產品布局,為中國市場開發了「新的符合限制的晶片」。

首先是專供中國市場的A800,在已有A100的基礎上將NVLink高速互連總線的帶寬從600GB/s降低到400GB/s,其他完全不變。A800的大規模擴展互連將受到限制,但是單卡性能沒有損失。

更強大的H100採用Hopper架構,GH100 GPU核心,台積電4nm製造工藝與CoWoS 2.5D封裝技術,集成800億個電晶體,核心面積814平方毫米。在大算力時代,僅靠一塊晶片是不夠的,NVLink互連下的暴力疊加,真的能大力出奇蹟。如果沒有足夠的NVLink互連帶寬,加速卡就無法實現「暴力美學」。當然,大模型不是只是單純的暴力美學,背後還有大量的軟體工程系統問題需要考量。

美國不願意中國購買到英偉達的最先進晶片,但英偉達也不願意失去中國市場。2023年3月的GTC 2023春季圖形大會上,NVIDIA又確認為中國市場開發了特供版H800,基於已有的H100調整而來,符合美政府的規定。H800的具體變化英偉達未透露,但外媒稱H800晶片間互連帶寬只有H100的一半,如果用於AI訓練會消耗更長的時間。

看似只是少了一半,但類似大模型這種應用,需要上千甚至上萬塊晶片互連以提供訓練算力,最終耗費的時間是指數級增加,而這是哪怕購買2倍特供版晶片都無法解決的。美國當局也試圖通過這種制裁,來延緩中國在AI應用上的進步速度。

死了張屠夫,就吃帶毛豬?

儘管晶片產業獨立自主,已經是堅定的方向。但英偉達H100、A100等先進計算卡,大陸短期內甚至10年內,依然難以製造出類似算力級別的晶片。

在對未來保持樂觀與信心的同時,我們依然要解決,沒了美國這個「張屠夫」,我們的先進晶片需求,確實會吃上「帶毛豬」的窘境。我們自己的「屠夫」,在手藝上確實還落後於張屠夫。沒有人願意唱衰自己,但在長期樂觀的同時,短期的需求如何解決?

不過,在我們擔心高端晶片缺乏的同時,太平洋對面的精英也同樣擔心中國在禁令之下更要獨立自主的決心。

據《華爾街日報》報導,美國對華半導體出口管制正促使多家中國龍頭科技公司加快研究步伐,尋求利用國產自研等現有晶片資源開發尖端 AI,擺脫對個別外國先進位程晶片的依賴。報導稱,許多中國公司正在研究,把三四種不太先進的晶片結合在一起,來模擬英偉達最先進處理器的性能。這些晶片絕大部分都是自研為主,組合晶片是單一晶片的數倍算力,對 ASIC 設計需求同步倍增。

而目前,國產GPU、CPU的研發推進速度也在加快。特別是GPU,相比CPU具有更強大的並行計算能力,在人工智慧和高性能計算等領域有明顯優勢。大算力時代,GPU成為了主角。

據黃仁勛在2023年台北電腦展上的演講,訓練一個LLM大語言模型,將需要960個CPU組成的伺服器集群,這將耗費大約1000萬美元(約合人民幣7070萬元),並消耗11千兆瓦時的電力。相比之下,同樣以1000萬美元的成本去組建GPU伺服器集群,將以僅3.2千兆瓦時的電力消耗,訓練44個LLM大模型。相比CPU伺服器,GPU伺服器能夠以4%的成本和1.2%的電力消耗來訓練一個LLM,這將帶來巨大的成本節省。

GPU強大計算能力和高效率使之成為各行各業的創新引擎,也是算力產業鏈的基石,驅動圖形處理、計算機視覺、AI、科學研究等領域的突破性進展。

5月31日,國內GPU晶片公司摩爾線程(Moore Threads)就發布超過10款新產品與技術更新,包括全新遊戲顯卡MTT S70桌面GPU、面向遊戲愛好者的DirectX 11社區版驅動、雲桌面產品MT vGPU 2.1和MCCX VDI雲桌面一體機以及GPU物理引擎AlphaCore等。