Skymizer Taiwan Inc. 發(fā)表突破性架構(gòu) 單卡實現(xiàn)超大型 LLM 推論

2026-04-23 19:00

提供業(yè)界領(lǐng)先的效能功耗比，單張 PCIe 介面卡即可執(zhí)行 700B 參數(shù)模型——無需 GPU 叢集,亦無須密集散熱

新竹2026年4月23日 /美通社/ -- 於 COMPUTEX 2026 展前，AI 推論解決方案先驅(qū) Skymizer Taiwan Inc.( 臺灣發(fā)展軟體科技股份有限公司)今日預(yù)先揭露其在地端 AI 部署的重大突破——HTX301 推論晶片，內(nèi)建於 COMPUTEX 2025 首次發(fā)表的軟硬體協(xié)同設(shè)計平臺 HyperThought?。HTX301 為 HyperThought IP 的首款參考晶片，該 IP 為 AI 推論定義了長期的架構(gòu)願景。此首版矽晶片在大幅簡化超大型模型推論所需基礎(chǔ)設(shè)施的同時，亦帶來卓越的效能功耗比。

打破 GPU 對超大型模型推論的壟斷

一直以來，在地端部署超大型模型皆需仰賴龐大的 GPU 叢集、NVLink/NVSwitch 等高速互連技術(shù)，以及密集的散熱系統(tǒng)——導(dǎo)致成本高昂且維運複雜。

Skymizer 於業(yè)界首次將此願景化為可能。

僅需一張 PCIe 介面卡——搭載六顆 HTX301 晶片與 384 GB 記憶體——企業(yè)即可於本地執(zhí)行 700B 參數(shù)模型推論，每卡功耗僅約 240W。

HyperThought 針對 不同尺寸與形式的彈性擴展 而設(shè)計——可封裝為 SoC 或介面卡，自 邊緣到迷你資料中心 皆可部署。單卡可由 1 顆晶片擴展至 6 顆晶片，記憶體容量介於 32 GB 至 384 GB，支援 4B 至 700B 參數(shù) 的模型——讓企業(yè)依實際工作負載需求，精準規(guī)劃部署規(guī)模，避免過度配置。

「推論已成為 AI 的主要工作負載,基礎(chǔ)設(shè)施也必須反映此一現(xiàn)實?！?/i>

「仰賴超大規(guī)模 GPU 叢集執(zhí)行超大型 LLM 的時代已經(jīng)結(jié)束。HyperThought 讓 AI 從僅屬於雲(yún)端巨擘的複雜工程，轉(zhuǎn)變?yōu)槊恳患移髽I(yè)皆可擁有的單卡級簡潔方案。」

—— William Wei,Skymizer 行銷長

消除企業(yè) AI 的隱藏稅負

其結(jié)果是：企業(yè)在享有資料隱私、低延遲與完整營運掌控權(quán)的同時，亦可擺脫 GPU 叢集所帶來的基礎(chǔ)設(shè)施負擔(dān)。

地端推論亦消除了「按 token 計費」所帶來的支出焦慮——此焦慮已成為企業(yè)導(dǎo)入 AI 的無形稅負。雲(yún)端推論迫使團隊必須精打細算每筆查詢，並限縮 Agent 的使用。HyperThought 則徹底解除此限制：一旦部署完成，企業(yè)便可在固定的基礎(chǔ)設(shè)施成本下，執(zhí)行無上限的推論。

HyperThought 為企業(yè)既有的 GPU 基礎(chǔ)設(shè)施提供互補，而非取代。透過將解碼(decode)密集的推論工作自 GPU 卸載，企業(yè)可提升整體叢集的利用率與電力效率。

驅(qū)動企業(yè)跨領(lǐng)域的 Agentic AI 工作流程

HyperThought 與 HTX301 專為 agentic AI 工作負載而設(shè)計，此類工作負載正快速成為企業(yè)自動化的核心基石。搭配 OpenClaw 等 agent harness 框架，HTX301 能提供這些系統(tǒng)所需的推論吞吐量，並同時具備完整的資料自主權(quán)與可預(yù)期的延遲表現(xiàn)。

此一架構(gòu)可驅(qū)動跨產(chǎn)業(yè)與跨領(lǐng)域的 agentic 工作流程與自動化，包括:

金融服務(wù)(法遵、詐欺偵測、投資組合推理)；醫(yī)療與生命科學(xué)(臨床決策輔助、藥物交互作用分析)；製造業(yè)(預(yù)測性維護、品質(zhì)檢測)；法律與專業(yè)服務(wù)(合約審閱、機密知識檢索)；政府與國防(主權(quán) AI、機密分析)；零售(客服自動化、庫存推理)；軟體工程(私有 code copilot、自主 CI/CD)；以及 半導(dǎo)體與 IC 設(shè)計(地端 RTL copilot、驗證 agent、針對自有 IP 的設(shè)計知識檢索)。

焦點應(yīng)用：地端 AI Coding。AI 輔助編碼已成為現(xiàn)代軟體團隊的基本配備，且在「原始碼即公司命脈」的領(lǐng)域中，需求增長最為快速。IC 設(shè)計公司無法將自有 RTL 上傳至雲(yún)端編碼助手，否則將面臨價值數(shù)十億美元矽智財外洩的風(fēng)險；軟體公司在面對機密程式碼與客戶資料時，亦有相同的考量。HTX301 能提供足以支撐完全地端執(zhí)行私有 code copilot、RTL 生成器與驗證 agent 的吞吐量——既消除雲(yún)端外洩風(fēng)險，又完整保留 AI 輔助工程所帶來的生產(chǎn)力效益。

除了 agentic 工作負載之外，單顆 HTX301 晶片亦支援裝置端推論——涵蓋語音轉(zhuǎn)寫、翻譯、視覺理解與多模態(tài) AI——適用於邊緣伺服器、AI 工作站、智慧 NAS 系統(tǒng)及各類智能端點。

由 LISA? 與 HyperThought? 驅(qū)動

HyperThought 由 LISA?(Language Instruction Set Architecture，語言指令集架構(gòu)) 所驅(qū)動，此為 Skymizer 自主研發(fā)、專為 Transformer 推論最佳化的語言中心指令集架構(gòu)。LISA 在效能、功耗效率與擴展性方面,全面支援自邊緣裝置至企業(yè)叢集的各類部署。

地端部署的 HTX301 介面卡，與 HyperThought 裝置端 LPU 共用相同的 LISA 架構(gòu)基礎(chǔ)——一套 ISA、一套部署流程，自邊緣至資料中心，一以貫之。

Prefill/Decode 分離:HyperThought P/D 策略

LLM 推論包含兩個本質(zhì)上截然不同的階段：prefill(處理輸入提示，屬 compute-bound)與 decode(逐一生成 token，屬 memory-bandwidth-bound)。以 GPU 為核心的基礎(chǔ)設(shè)施強迫兩者共用同一塊矽晶片，在任一時刻總會造成運算資源或頻寬資源的閒置。HyperThought 自架構(gòu)設(shè)計之初，即將此兩階段加以分離。

硬體堆疊——Decode 優(yōu)先的專屬矽晶片。HTX301 為 decode 階段量身打造——此階段是主導(dǎo)真實世界推論延遲、對記憶體頻寬極度敏感的 token 生成過程。既有 GPU 處理 compute 密集的 prefill；HTX301 介面卡則負責(zé) decode。每一塊矽晶片皆對應(yīng)其最適合的階段。

軟體堆疊——統(tǒng)一的 P/D 調(diào)度。Skymizer 的統(tǒng)一軟體堆疊——涵蓋 KV-cache 管理員、具階段感知能力的排程器，以及動態(tài)配置引擎——可協(xié)同調(diào)度 prefill 與 decode 資源池，於節(jié)點之間傳遞 KV-cache 狀態(tài)，並隨工作負載變動即時重新平衡 P:D 比例。

「專為 decode 打造的硬體，搭配能協(xié)調(diào)每一份推論工作負載的智慧軟體堆疊——這才是在規(guī)模化場景下分離 P/D 的真正做法?！?/i>

—— Luba Tang, Skymizer 技術(shù)長

定義 AI 部署的下一個世代

隨著模型規(guī)模自數(shù)十億參數(shù)邁向兆級參數(shù),業(yè)界對暴力式 GPU 擴展的依賴正面臨瓶頸。Skymizer 的存在，正是為了超越此一瓶頸——結(jié)合深厚的編譯器專業(yè)與針對 decode 最佳化的矽晶片，定義 AI 基礎(chǔ)設(shè)施的下一個世代。

有關(guān) HyperThought 延伸平臺的完整藍圖，將於 Skymizer 在 COMPUTEX 2026 的記者會中公布。

申請 HTX301 早期存取權(quán): skymizer.ai/press

關(guān)於 Skymizer Taiwan Inc.

Skymizer （臺灣發(fā)展軟體科技股份有限公司）成立於 2013 年，是一家專注於 AI 推論的公司。其旗艦平臺 HyperThought 結(jié)合編譯器驅(qū)動的軟體堆疊與針對 Transformer 最佳化的硬體，可於裝置端、邊緣端與地端部署環(huán)境中，提供高效能的推論服務(wù)。

消息來源: Skymizer Taiwan Inc.

from common-pcom:html:key:hk_segment_includes_releases_right_column_video_module_shtml

精選視頻

數(shù)據(jù)顯示視頻、圖片等元素讓新聞稿點擊量提升77%

相關(guān)關(guān)鍵詞:

電腦硬件

電腦軟件

電腦/電子

電腦配件

新產(chǎn)品/新服務(wù)

人工智能

最近新聞稿

Skymizer Taiwan Inc. 發(fā)表突破性架構(gòu) 單卡實現(xiàn)超大型 LLM 推論 2026-04-23

前往企業(yè)新聞室

電腦硬件最近新聞稿

Skymizer Taiwan Inc. 發(fā)表突破性架構(gòu) 單卡實現(xiàn)超大型 LLM 推論 2026-04-23

數(shù)位無限設(shè)立韓國子公司前進 AI EXPO KOREA 揭示未來AI基礎(chǔ)設(shè)施 2026-04-23

技嘉與 NVIDIA 合作推出 GeForce RTX? 50 系列與《PRAGMATA?》遊戲套裝提升沉浸遊戲體驗 2026-04-22

螢石加入聯(lián)合國全球契約組織，開啟企業(yè)可持續(xù)發(fā)展的新徵程，進一步擴大對關(guān)鍵環(huán)境議題的貢獻 2026-04-22

Delska 在里加正式啟用波羅的海地區(qū)其中一座最先進、最可持續(xù)發(fā)展的數(shù)據(jù)中心 2026-04-17

查看更多

電腦軟件最近新聞稿

Skymizer Taiwan Inc. 發(fā)表突破性架構(gòu) 單卡實現(xiàn)超大型 LLM 推論 2026-04-23

微軟AI巡展香港站啟幕萬興科技攜PDFelement等企業(yè)級AI辦公解決方案亮相 2026-04-23

HCLTech 2026 財政年度年收入增長 3.9%，主因源於對先進人工智能的需求上升 2026-04-23

Cognizant 與 OpenAI 合作，利用 Codex 重塑企業(yè)軟件工程 2026-04-23

Zendure征拓在歐洲推出SolarFlow Mix系列----三款家庭儲能系統(tǒng)，統(tǒng)一平臺，電費最高可省91% 2026-04-22

查看更多

電腦/電子最近新聞稿

Skymizer Taiwan Inc. 發(fā)表突破性架構(gòu) 單卡實現(xiàn)超大型 LLM 推論 2026-04-23

寶尊發(fā)佈2025年致股東的一封信 2026-04-23

追覓星空計劃攜手UCB伯克利，深化AI汽車創(chuàng)新合作 2026-04-23

微軟AI巡展香港站啟幕萬興科技攜PDFelement等企業(yè)級AI辦公解決方案亮相 2026-04-23

MetaOptics 就其超透鏡與模組成功獲得世界級客戶設(shè)計／評估訂單，取得階段性重要里程碑 2026-04-23

查看更多

電腦配件最近新聞稿

Skymizer Taiwan Inc. 發(fā)表突破性架構(gòu) 單卡實現(xiàn)超大型 LLM 推論 2026-04-23

技嘉與 NVIDIA 合作推出 GeForce RTX? 50 系列與《PRAGMATA?》遊戲套裝提升沉浸遊戲體驗 2026-04-22

螢石加入聯(lián)合國全球契約組織，開啟企業(yè)可持續(xù)發(fā)展的新徵程，進一步擴大對關(guān)鍵環(huán)境議題的貢獻 2026-04-22

IBM 宣布與 Arm 達成策略合作共同打造企業(yè)運算未來 2026-04-15

技嘉 Z890 Plus 系列主機板正式上市，CQDIMM 技術(shù)引領(lǐng) Z890 AORUS ELITE DUO X 釋放完整效能 2026-03-26

查看更多

新產(chǎn)品/新服務(wù) 最近新聞稿

Skymizer Taiwan Inc. 發(fā)表突破性架構(gòu) 單卡實現(xiàn)超大型 LLM 推論 2026-04-23

Now TV盡攬第44屆香港電影金像獎得獎電影 | 最佳男女主角得獎作品即時有得睇（附上架時間表） 2026-04-23

Tech. For Family：一步歸家，一鍵啟程！CHERY VPD全球首秀圓滿落幕，中國智慧點亮萬家歸途 2026-04-23

微軟AI巡展香港站啟幕萬興科技攜PDFelement等企業(yè)級AI辦公解決方案亮相 2026-04-23

數(shù)位無限設(shè)立韓國子公司前進 AI EXPO KOREA 揭示未來AI基礎(chǔ)設(shè)施 2026-04-23

查看更多

人工智能最近新聞稿

Skymizer Taiwan Inc. 發(fā)表突破性架構(gòu) 單卡實現(xiàn)超大型 LLM 推論 2026-04-23

寶尊發(fā)佈2025年致股東的一封信 2026-04-23

Tech. For Family：一步歸家，一鍵啟程！CHERY VPD全球首秀圓滿落幕，中國智慧點亮萬家歸途 2026-04-23

追覓星空計劃攜手UCB伯克利，深化AI汽車創(chuàng)新合作 2026-04-23

微軟AI巡展香港站啟幕萬興科技攜PDFelement等企業(yè)級AI辦公解決方案亮相 2026-04-23

查看更多

人人夜人人夜夜国产,69AV视频在线播,日本熟妇精品在线,国产欧美日韩一区,久久精品人人爱网站,超碰 精品 AV,大香蕉伊在线欧美,久久久久久久日韩免费,国产亚洲综合在线视频

Skymizer Taiwan Inc. 發(fā)表突破性架構(gòu) 單卡實現(xiàn)超大型 LLM 推論

精選視頻

相關(guān)關(guān)鍵詞:

最近新聞稿

電腦硬件 最近新聞稿

電腦軟件 最近新聞稿

電腦/電子 最近新聞稿

電腦配件 最近新聞稿

新產(chǎn)品/新服務(wù) 最近新聞稿

人工智能 最近新聞稿

人人夜人人夜夜国产,69AV视频在线播,日本熟妇精品在线,国产欧美日韩一区,久久精品人人爱网站,超碰精品 AV,大香蕉伊在线欧美,久久久久久久日韩免费,国产亚洲综合在线视频

電腦硬件最近新聞稿

電腦軟件最近新聞稿

電腦/電子最近新聞稿

電腦配件最近新聞稿

人工智能最近新聞稿