人人夜人人夜夜国产,69AV视频在线播,日本熟妇精品在线,国产欧美日韩一区,久久精品人人爱网站,超碰 精品 AV,大香蕉伊在线欧美,久久久久久久日韩免费,国产亚洲综合在线视频

from common-pcom:html:key:hk_segment_includes_overall_segment_header_shtml
美通社: 全球領(lǐng)先的新聞稿發(fā)佈, 傳播和監(jiān)測服務(wù)提供者
首頁 > 新聞稿中心 > 行業(yè)新聞稿
en_US zh_TW

Skymizer Taiwan Inc. 發(fā)表突破性架構(gòu) 單卡實現(xiàn)超大型 LLM 推論

2026-04-23 19:00

提供業(yè)界領(lǐng)先的效能功耗比,單張 PCIe 介面卡即可執(zhí)行 700B 參數(shù)模型——無需 GPU 叢集,亦無須密集散熱

新竹2026年4月23日 /美通社/ -- 於 COMPUTEX 2026 展前,AI 推論解決方案先驅(qū) Skymizer Taiwan Inc.( 臺灣發(fā)展軟體科技股份有限公司)今日預(yù)先揭露其在地端 AI 部署的重大突破——HTX301 推論晶片,內(nèi)建於 COMPUTEX 2025 首次發(fā)表的軟硬體協(xié)同設(shè)計平臺 HyperThought?。HTX301 為 HyperThought IP 的首款參考晶片,該 IP 為 AI 推論定義了長期的架構(gòu)願景。此首版矽晶片在大幅簡化超大型模型推論所需基礎(chǔ)設(shè)施的同時,亦帶來卓越的效能功耗比。

打破 GPU 對超大型模型推論的壟斷

一直以來,在地端部署超大型模型皆需仰賴龐大的 GPU 叢集、NVLink/NVSwitch 等高速互連技術(shù),以及密集的散熱系統(tǒng)——導(dǎo)致成本高昂且維運複雜。

Skymizer 於業(yè)界首次將此願景化為可能。

僅需一張 PCIe 介面卡——搭載 六顆 HTX301 晶片與 384 GB 記憶體——企業(yè)即可於本地執(zhí)行 700B 參數(shù)模型推論,每卡功耗僅約 240W。

HyperThought 針對 不同尺寸與形式的彈性擴展 而設(shè)計——可封裝為 SoC 或介面卡,邊緣到迷你資料中心 皆可部署。單卡可由 1 顆晶片擴展至 6 顆晶片,記憶體容量介於 32 GB 至 384 GB,支援 4B 至 700B 參數(shù) 的模型——讓企業(yè)依實際工作負載需求,精準規(guī)劃部署規(guī)模,避免過度配置。

「推論已成為 AI 的主要工作負載,基礎(chǔ)設(shè)施也必須反映此一現(xiàn)實?!?/i>

「仰賴超大規(guī)模 GPU 叢集執(zhí)行超大型 LLM 的時代已經(jīng)結(jié)束。HyperThought 讓 AI 從僅屬於雲(yún)端巨擘的複雜工程,轉(zhuǎn)變?yōu)槊恳患移髽I(yè)皆可擁有的單卡級簡潔方案。」

—— William Wei,Skymizer 行銷長

消除企業(yè) AI 的隱藏稅負

其結(jié)果是:企業(yè)在享有資料隱私、低延遲與完整營運掌控權(quán)的同時,亦可擺脫 GPU 叢集所帶來的基礎(chǔ)設(shè)施負擔(dān)。

地端推論亦消除了「按 token 計費」所帶來的支出焦慮——此焦慮已成為企業(yè)導(dǎo)入 AI 的無形稅負。雲(yún)端推論迫使團隊必須精打細算每筆查詢,並限縮 Agent 的使用。HyperThought 則徹底解除此限制:一旦部署完成,企業(yè)便可在固定的基礎(chǔ)設(shè)施成本下,執(zhí)行無上限的推論。

HyperThought 為企業(yè)既有的 GPU 基礎(chǔ)設(shè)施提供互補,而非取代。透過將解碼(decode)密集的推論工作自 GPU 卸載,企業(yè)可提升整體叢集的利用率與電力效率。

驅(qū)動企業(yè)跨領(lǐng)域的 Agentic AI 工作流程

HyperThought 與 HTX301 專為 agentic AI 工作負載而設(shè)計,此類工作負載正快速成為企業(yè)自動化的核心基石。搭配 OpenClaw 等 agent harness 框架,HTX301 能提供這些系統(tǒng)所需的推論吞吐量,並同時具備完整的資料自主權(quán)與可預(yù)期的延遲表現(xiàn)。

此一架構(gòu)可驅(qū)動跨產(chǎn)業(yè)與跨領(lǐng)域的 agentic 工作流程與自動化,包括:

金融服務(wù)(法遵、詐欺偵測、投資組合推理);醫(yī)療與生命科學(xué)(臨床決策輔助、藥物交互作用分析);製造業(yè)(預(yù)測性維護、品質(zhì)檢測);法律與專業(yè)服務(wù)(合約審閱、機密知識檢索);政府與國防(主權(quán) AI、機密分析);零售(客服自動化、庫存推理);軟體工程(私有 code copilot、自主 CI/CD);以及 半導(dǎo)體與 IC 設(shè)計(地端 RTL copilot、驗證 agent、針對自有 IP 的設(shè)計知識檢索)。

焦點應(yīng)用:地端 AI Coding。AI 輔助編碼已成為現(xiàn)代軟體團隊的基本配備,且在「原始碼即公司命脈」的領(lǐng)域中,需求增長最為快速。IC 設(shè)計公司無法將自有 RTL 上傳至雲(yún)端編碼助手,否則將面臨價值數(shù)十億美元矽智財外洩的風(fēng)險;軟體公司在面對機密程式碼與客戶資料時,亦有相同的考量。HTX301 能提供足以支撐完全地端執(zhí)行私有 code copilot、RTL 生成器與驗證 agent 的吞吐量——既消除雲(yún)端外洩風(fēng)險,又完整保留 AI 輔助工程所帶來的生產(chǎn)力效益。

除了 agentic 工作負載之外,單顆 HTX301 晶片亦支援裝置端推論——涵蓋語音轉(zhuǎn)寫、翻譯、視覺理解與多模態(tài) AI——適用於邊緣伺服器、AI 工作站、智慧 NAS 系統(tǒng)及各類智能端點。

由 LISA? 與 HyperThought? 驅(qū)動

HyperThought 由 LISA?(Language Instruction Set Architecture,語言指令集架構(gòu)) 所驅(qū)動,此為 Skymizer 自主研發(fā)、專為 Transformer 推論最佳化的語言中心指令集架構(gòu)。LISA 在效能、功耗效率與擴展性方面,全面支援自邊緣裝置至企業(yè)叢集的各類部署。

地端部署的 HTX301 介面卡,與 HyperThought 裝置端 LPU 共用相同的 LISA 架構(gòu)基礎(chǔ)——一套 ISA、一套部署流程,自邊緣至資料中心,一以貫之。

Prefill/Decode 分離:HyperThought P/D 策略

LLM 推論包含兩個本質(zhì)上截然不同的階段:prefill(處理輸入提示,屬 compute-bound)與 decode(逐一生成 token,屬 memory-bandwidth-bound)。以 GPU 為核心的基礎(chǔ)設(shè)施強迫兩者共用同一塊矽晶片,在任一時刻總會造成運算資源或頻寬資源的閒置。HyperThought 自架構(gòu)設(shè)計之初,即將此兩階段加以分離。

硬體堆疊——Decode 優(yōu)先的專屬矽晶片。HTX301 為 decode 階段量身打造——此階段是主導(dǎo)真實世界推論延遲、對記憶體頻寬極度敏感的 token 生成過程。既有 GPU 處理 compute 密集的 prefill;HTX301 介面卡則負責(zé) decode。每一塊矽晶片皆對應(yīng)其最適合的階段。

軟體堆疊——統(tǒng)一的 P/D 調(diào)度。Skymizer 的統(tǒng)一軟體堆疊——涵蓋 KV-cache 管理員、具階段感知能力的排程器,以及動態(tài)配置引擎——可協(xié)同調(diào)度 prefill 與 decode 資源池,於節(jié)點之間傳遞 KV-cache 狀態(tài),並隨工作負載變動即時重新平衡 P:D 比例。

「專為 decode 打造的硬體,搭配能協(xié)調(diào)每一份推論工作負載的智慧軟體堆疊——這才是在規(guī)模化場景下分離 P/D 的真正做法?!?/i>

—— Luba Tang, Skymizer 技術(shù)長

定義 AI 部署的下一個世代

隨著模型規(guī)模自數(shù)十億參數(shù)邁向兆級參數(shù),業(yè)界對暴力式 GPU 擴展的依賴正面臨瓶頸。Skymizer 的存在,正是為了超越此一瓶頸——結(jié)合深厚的編譯器專業(yè)與針對 decode 最佳化的矽晶片,定義 AI 基礎(chǔ)設(shè)施的下一個世代。

有關(guān) HyperThought 延伸平臺的完整藍圖,將於 Skymizer 在 COMPUTEX 2026 的記者會中公布。

申請 HTX301 早期存取權(quán): skymizer.ai/press

關(guān)於 Skymizer Taiwan Inc.

Skymizer (臺灣發(fā)展軟體科技股份有限公司)成立於 2013 年,是一家專注於 AI 推論的公司。其旗艦平臺 HyperThought 結(jié)合編譯器驅(qū)動的軟體堆疊與針對 Transformer 最佳化的硬體,可於裝置端、邊緣端與地端部署環(huán)境中,提供高效能的推論服務(wù)。

消息來源: Skymizer Taiwan Inc.
from common-pcom:html:key:hk_segment_includes_releases_right_column_video_module_shtml
精選視頻
數(shù)據(jù)顯示視頻、圖片等元素讓新聞稿點擊量提升77%
 

電腦硬件 最近新聞稿

電腦軟件 最近新聞稿

電腦/電子 最近新聞稿

電腦配件 最近新聞稿

新產(chǎn)品/新服務(wù) 最近新聞稿

人工智能 最近新聞稿

from common-pcom:html:key:hk_segment_includes_overall_segment_footer_shtml
進階搜尋
搜尋
  
  1. 產(chǎn)品與服務(wù)
  2. 新聞稿中心
  3. 知識庫
  4. 博客
  5. 多媒體新聞稿
  6. 聯(lián)繫我們
  7. 繁體中文知識庫正在建設(shè)中,請您選擇簡體中文或英文版查看。

  1. 關(guān)於美通社
  2. 聯(lián)繫我們
  3. Legal
  4. Privacy Policy
  5. 加入我們
  6. 網(wǎng)站地圖
  7. RSS訂閱

Copyright © 2025 美通社版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載.
Cision 旗下公司.

新竹县| 秦皇岛市| 平湖市| 芦山县| 台北县| 哈尔滨市| 枣强县| 新河县| 申扎县| 临武县| 鄂托克旗| 大关县| 东宁县| 富顺县| 运城市| 东莞市| 资源县| 凯里市| 澄江县| 南开区| 大宁县| 泰和县| 阿尔山市| 太仓市| 迁安市| 萨嘎县| 崇仁县| 西青区| 宜宾县| 定襄县| 宁蒗| 永春县| 马公市| 象山县| 墨脱县| 时尚| 南投市| 城口县| 巩义市| 台安县| 本溪市|