Don't Miss

跑贏輝達？｜美企AI新方案號稱快輝達20倍

By 信報財經新聞 on August 29, 2024

原文刊於信報財經新聞「EJ Tech 創科鬥室」

美企Cerebras Systems周二（27日）推出號稱是全球最快的AI解決方案Cerebras Inference。模型輸出速度方面，Llama 3.1-8B為每秒1800個Tokens，而Llama 3.1-70B為每秒450個Tokens，據稱比輝達（Nvidia）繪圖處理器（GPU）為基礎的超大規模雲端快20倍，以「高速推理」挑戰後者的市場領導地位。

運行Llama 3.1-70B模型時，Cerebras Inference比輝達GPU超大規模雲端快20倍。（Cerebras Systems網上圖片）

Cerebras成本耗電量較H100低

Cerebras Inference由美國4個數據中心支持運算，當中採用第三代晶圓級引擎WSE-3，成本及耗電量只是輝達H100的兩成。新方案透過應用程式介面（API），向任何已登入用戶免費開放；針對開發人員的版本，以Llama 3.1-8B模型為例，每百萬Tokens收費10美仙（約0.78港元）；規模較大的Llama-3.1 70B模型，每百萬Tokens收費60美仙（約4.68港元）。

Cerebras Inference 由美國4個數據中心提供支持。（Cerebras Systems網上圖片）

Cerebras Inference由第三代晶圓級引擎WSE-3提供動力。（LinkedIn影片擷圖）

外媒The Information報道，美企OpenAI準備推出一款具備先進功能的新AI產品，模型在內部被稱為「士多啤梨」或Q*（發音為Q-Star），以應付目前AI模型無法解決的問題及任務。話說OpenAI行政總裁阿爾特曼（Sam Altman）本月初在社媒X張貼一張「士多啤梨」盆栽相片，惹來網民揣測箇中玄機。

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

Cerebras Inference Cerebras Systems GPU Llama Nvidia OpenAI

Tweet

Pin It

Related Posts

家務機械人｜美國科企Physical Intelligence籌31億

家務機械人｜美國科企Physical Intelligence籌31億

PS5 Pro｜拆機片流出支援8K畫質新電池方便替換

PS5 Pro｜拆機片流出支援8K畫質新電池方便替換

AI新定義｜開放原碼促進會制定開源AI標準

AI新定義｜開放原碼促進會制定開源AI標準

OpenAI｜擬夥博通自行設計AI晶片

OpenAI｜擬夥博通自行設計AI晶片

Latest News

馬斯克發功｜SpaceX據報要求台灣供應商生產線移至海外
美國首富馬斯克(Elon Musk)旗下太空探索公司SpaceX，據報要求台灣供應商將生產線轉移至越南、泰國等國家，主要是基於地緣政治考慮。

Posted November 6, 2024

0

數據與AI的成功密碼：思維、技能與工具的融合（李沛陞）
無論是企業決策、醫療診斷還是個性化推薦，數據與AI的應用無處不在。然而，要在這個領域取得成功，僅僅依賴技術是不夠的。成功的關鍵在於思維(Mindset)、技能(skillset)與工具(toolset)的完美融合。

Posted November 6, 2024

0

WhatsApp新功能2024大盤點｜自訂名單、強化私隱提升通訊體驗
隨著數碼通訊的迅速發展，WhatsApp 作為全球最受歡迎的即時通訊平台之一，不斷致力於提升用戶體驗。臨近年尾，就讓我們來一個功能大盤點吧！

Posted November 6, 2024

0

轉數快｜轉數快怎麼用？轉數快登記、支付、扣帳教學
轉數快全稱快速支付系統（Faster Payment System），是香港金融管理局於2018年9月推出的一個電子支付平台，旨在提升跨機構之間的即時轉賬便利性。

Posted November 6, 2024

0

國際數據便捷流通惠民利商（車品覺）
近日看到數字政策辦公室的報告提到：「數據對推動創新及引領高質量經濟發展中發揮戰略性作用。香港特別行政區政府充分把握數據作為推動經濟增長及數字經濟和社會的新引擎。國家『十四五』規劃明確支持香港建設國際創新科技中心。

Posted November 6, 2024

0

科技趣聞｜動物進食發酵水果也會醉
科學家一直認為，野生動物在食用發酵水果後，攝取過多乙醇（Ethanol）而醉酒屬於罕見的意外事件。英國埃克塞特大學的行為生態學家質疑，不少進食含糖水果，以至吸食花蜜的動物，都會進食一定份量的乙醇，這種物質並非人類專享。

Posted November 6, 2024

0

諦聲科技｜港鐵旗下入股諦聲拓AI聲學監測技術
人工智能（AI）驅動的聲學監測是能加強設備維護的新技術，可改善維護人員的工作部署，減少停機風險及提升設備維護質量。

Posted November 6, 2024

0

EJ Tech Video

POPULAR POSTS

善用大數據和人工智能提升安老服務效率

 智能科技守護長者家居與煮食安全

 Mac mini｜搭載M4晶片激細登場 5乘5吋效能更強售4599元起

 科大AI快速測乳癌涵蓋30多種疾病

 HKUST E-25th｜科大孵化初創 25年成果晒冷逾百企設攤位玩「大富翁」體驗創業

 PS5 Pro｜拆機片流出支援8K畫質新電池方便替換

 OpenAI｜擬夥博通自行設計AI晶片

 實現未來科學｜Atlas人形機械人全自主執貨

 CityU｜城大獸醫採用推廣兼顧人力成本

 大埔5G禁區解封促進數碼化（方保僑）

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe