標籤: 中國晶片

  • 香港寬頻企業方案夥算豐信息 引入中國 GPU 沐曦晶片運算服務

    香港寬頻企業方案夥算豐信息 引入中國 GPU 沐曦晶片運算服務

    香港寬頻企業方案(HKBNES)與中國公司算豐信息達成合作,成為後者香港首間運算能力服務經銷商,提供中國製 GPU 沐曦所支援的人工智能(AI)相關運算資源,以及其他雲端服務。算豐信息在香港和中國上海開設人工智能數據中心,目標用沐曦建 1,000PFLOP 運算效能。

    算豐信息的香港人工智能數據中心取名「豐收二號」,而在中國上海的為「豐收一號」。兩地均採用沐曦的豐收系列 GPU 晶片,為企業客戶提供自行調配運算能力的平台,應付不同使用環境,如訓練和營運大型語言模型(Large Language Model,LLM)的運算。

    香港寬頻集團總裁及營運總裁葉成輝博士指出:「今次與算豐信息合作,引入 AI 運算資源到香港,為企業提供運算速度與靈活性。這有助滿足本地市場的高性能算力需求,更能開啟跨行業的創新,開拓更多機會。」

    香港算豐信息總裁顧萌表示:「今次與香港寬頻企業方案的合作,將縮短企業獲取 AI 運算資源的距離。期待這次合作引領更多企業加速數碼化及智能化轉型。」

    最新影片

  • 商湯 AI 運算力望增至 30EFLOPS 美國限制晶片出口或改用中國產品頂上

    商湯 AI 運算力望增至 30EFLOPS 美國限制晶片出口或改用中國產品頂上

    美國多次收緊人工智能( AI )晶片向中國出口的條件,令中國的人工智能運算能力受到一定限制。即使如此,商湯仍然預期公司整體運算能力繼續增加,兩年後從目前約 12EFLOPS 增至 30EFLOPS。商湯科技董事長和行政總裁徐立稱,之後會加碼採購中國產晶片。

    近年,商湯不斷增加其 AI 系統的運算能力,由 2022 年底的 5EFLOPS 加至 2023 年底的 12EFLOPS,營運 45,000 張 GPU。徐立的目標是在兩年後將運算能力增加超過一倍的 30EFLOPS。商湯旗下的運算平台目前集中在中國上海臨港的人工智能運算中心(AIDC),效能有 8.4EFLOPS,近年亦在深圳、廣州、重慶、福建等城市擴展。

    根據 TOP500 最新公布 2024 年 6 月超級電腦排名榜,排首位 Frontier 的運算效能為 1.206EFLOPS。換言之,商湯所擁有的運算能力較最快的超級電腦多近 10 倍。

    徐立稱,目前的 GPU 以 NVIDIA 的 A800、H800 為主,惟美國限制晶片出口肯定會對業務發展有衝擊。但有多個方法代替,其中之一是改用中國生產的晶片。

    商湯現時擁有 12EFLOPS 運算能力,僅約五分之一採用中國 AI 晶片。不過,徐立表明會擴大使用比例,兩年後目標增至 30EFLOPS 時會有一半晶片由中國產品支援,如華為的昇騰、寒武紀等。中國晶片性價比高,相比 NVIDIA 每張 GPU 只有約七成運算能力,但價格則是一半,成本有競爭優勢。不過最後還是要視乎中國廠商的供貨進度。

    未來兩年新增的運算能力將擴充至中國其他地區,不再集中在上海,如深圳前海和福州。其中前海深港人工智能運算中心在今年初啟用,支援包括香港在內的客戶。徐立直言,香港營運成本高,難以建立具成本效益的數據中心,但香港的 AI 市場前景好,關鍵是改變行業與 AI 的生產關係。商湯將在今月底發表支援廣東話的《商量》大型語言模型。

    另一方法是開發更具效益的 AI 模型,減低消耗運算能力。徐立表示,大型語言模型愈來愈大,推理成本也漸高。而相對較小的模型只選用合適的數據集,例如有關係的數據,亦能具備更有效的推理能力。同時,將 AI 運算推向終端和邊緣設備,在日日新 5.0 推出終端與雲端協同方案,在兩者之間判斷合適的運算環境,估計超過八成運算都能在終端上處理,顯著降低推理成本。又推出企業級大型語言模型一體機的邊緣設備,以在地部署方式減少使用雲端運算資源。

    最新影片

  • 阿里雲、騰訊或不買 NVIDIA 特供 AI 晶片 寧改用土炮國貨

    阿里雲、騰訊或不買 NVIDIA 特供 AI 晶片 寧改用土炮國貨

    NVIDIA 在主導全球 AI 晶片的地位,還特別為中國市場推出專用的 AI GPU 產品。不過據《華爾街日報》報道,中國大型公共雲公司阿里雲和騰訊測試過 NVIDIA 中國特供的 AI 晶片 H20 樣本後,均對這款降級產品不感興趣。這些公司或改買華為的昇騰,或自行研發 AI 晶片。

    《華爾街日報》報道,阿里雲和騰訊去年 11 月開始測試 NIVIDA 為中國特供的最高效能晶片 H20,但試用後未如理想,表明會較原定訂購的數量大幅減少。

    H20 晶片支援數據在 GPU 之間直接傳送,惟運算 AI 工作需要更多 H20 才能達到一般 NIVIDA 正常晶片的運算能力,變相增加成本。報道還指,NVIDIA 的降級版晶片效能跟中國土產的優勢差距正在縮小,令互聯網企業可能轉向訂購華為的昇騰晶片。科大訊飛創辦人劉慶峰去年 8 月在公開場合稱,華為的 GPU 能力已經跟 NVIDIA 的 A100 一樣。而《路透社》去年 11 月已報道,百度是其中一間向華為小規模買入昇騰晶片的公司。另外,中國公司也在自行研發 AI 晶片技術,如阿里巴巴旗下的平頭哥開發 NPU 晶片「含光」。

    不過,NVIDIA 的 AI 晶片生態系統廣泛,其他 AI 晶片也供不應求,中國公司在 12 個月內仍以採購 NVIDIA 的產品為先。

    美國去年 10 月加辣向中國出售 AI 晶片限制,不再只限個別型號,改為用運算效能為界限,連 NVIDIA RTX 4090 也在限制之內,而基於 A100 和 H100 為中國市場特設降級頻寬的 A800 和 H800 亦不能出口。

    NVIDIA 有 20% 收入來自中國,產品佔當地 AI 晶片市場九成。即使面臨美國商務部連番限制,甚至遭商務部部長點名警告,亦盡力迎合條件去做中國公司的生意。

    最新影片

  • 英特爾發表中國特供版 Gaudi 2 避開商務部 AI 晶片限制

    英特爾發表中國特供版 Gaudi 2 避開商務部 AI 晶片限制

    美國商務部要求晶片公司向中國出口高階 AI 晶片時,需要額外申請批准文件。廠商紛紛推出只在中國銷售的降級產品,既避開限制,也可應付當地的人工智能運算需求。繼 NVIDIA 的 A800 、 H800 之後,英特爾發表限制版的 Gaudi 2 晶片 Gaudi 2 HL-225B ,跟 NVIDIA 競爭中國市場。

    英特爾在中國發表當地特供的 Gaudi 2 HL-225B ,跟原裝版本同樣採用 600W OCP 核心,分別在於限制連接記憶體的頻寬減至 21x100Gbps RDMA ,而原裝版本 HL-225H 的上限為 24x100Gbps RDMA ,前者變相限制擴展能力,削減 AI 運算效能。

    英特爾稱, Gaudi 2 比 NVIDIA 的 A100 效能更強,是用於訓練大型語言模型唯一可代替 NVIDIA GPU 的產品。不過,推出已超過一年的 Gaudi 2 仍未獲市場廣泛採用。

    中國特供版 Gaudi 2 的合作夥伴有百度智慧雲、浪潮、美團、新華三、超聚變、華勤技術等公司。其中,新華三的 UniServer R5500 G6 系列可選配 Gaudi 2 或 NVIDIA H800 。然而,已採用 NVIDIA GPU 的企業無法直接轉用 Gaudi 系列晶片,成為英特爾開拓 AI 訓練基建市場的一大挑戰。

    近期亦有消息指出,美國商務部擬將進一步加強限制中國購買外國的 AI 晶片,即使 NVIDIA 的中國特供版 A800 和 H800 也需要取得批准方可付運。若新限制一旦實施,英特爾 Gaudi 2 HL-225B 可能也在措施之內。

    最新影片