在线一区中文,欧美+国产+人人,中国不卡毛片,五月婷婷成人免费视频,人妻传媒国产久草碰,婷婷av玖玖,嫩草久久久久,97MV免费视频,亚州久久情色

每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

華為,正式發(fā)布!計劃于9月開源

2025-08-12 17:42:16

每經編輯|張錦河    

8月12日,華為正式發(fā)布AI推理創(chuàng)新技術UCM(推理記憶數據管理器)。據了解,作為一款以KV Cache為中心的推理加速套件,UCM融合了多類型緩存加速算法工具,分級管理推理過程中產生的KV Cache記憶數據,可擴大推理上下文窗口,實現高吞吐、低時延的推理體驗,降低每Token推理成本。該技術已率先在中國銀聯“客戶之聲”“營銷策劃”“辦公助手”三大業(yè)務場景中,開展智慧金融AI推理加速應用試點,并已取得成果。

華為計劃于2025年9月正式開源UCM,屆時將在魔擎社區(qū)首發(fā),后續(xù)逐步貢獻給業(yè)界主流推理引擎社區(qū),并共享給業(yè)內所有Share Everything(共享架構)存儲廠商和生態(tài)伙伴。

圖片來源:每日經濟新聞 資料圖

據悉,UCM可根據記憶熱度在HBM、DRAM、SSD等存儲介質中實現按需流動,同時融合多種稀疏注意力算法實現存算深度協同,使長序列場景下TPS(每秒處理token數)提升2至22倍,從而降低每個Token的推理成本。

Token是AI模型中的基本數據單位。在訓練過程中,AI大模型會學習標記Token之間的關系,從而執(zhí)行推理并生成準確、相關的輸出。

數據顯示,國外主流AI大模型的單用戶輸出速度已進入200 Tokens/s區(qū)間(時延5ms),而我國主流AI大模型的單用戶輸出速度普遍小于60 Tokens/s(時延50至100ms)。

每日經濟新聞綜合自公開信


如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0

冷水江市| 石嘴山市| 尉犁县| 龙江县| 咸宁市| 万荣县| 通城县| 双柏县| 新竹县| 承德县| 晋州市| 抚松县| 罗城| 广安市| 青川县| 东海县| 土默特右旗| 怀来县| 阿坝县| 政和县| 内乡县| 天水市| 南充市| 镇原县| 韶关市| 滨州市| 竹山县| 盐源县| 喜德县| 林周县| 南雄市| 长春市| 姚安县| 永丰县| 贵定县| 太白县| 济源市| 太康县| 营山县| 宜黄县| 昂仁县|