1月16日消息,今日,智譜宣布,其聯合華為開源的新一代圖像生成模型GLM-Image,在開源不到24小時內,登上全球知名AI開源社區Hugging Face(抱抱臉)榜單全球第一。
智譜表示,這是首次完全依托國產芯片訓練的國產模型在國際舞臺上取得榜首位置,標志國產AI模型的端到端自主研發能力在國際競爭中取得突破。
據了解,GLM-Image基于昇騰Atlas 800T A2設備和昇思MindSpore AI框架完成從數據到訓練的全流程,是首個在國產芯片上完成全程訓練的SOTA多模態模型。

在模型架構上,GLM-Image不同于開源常用的LDM方案,創新性地采用自回歸+擴散解碼器的混合架構,兼顧全局指令理解與局部細節刻畫。
性能方面,GLM-Image在CVTG-2K(復雜視覺文本生成)和LongText-Bench(長文本渲染)榜單獲得開源第一,能夠讀懂指令,寫對文字,尤其擅長漢字生成任務,可廣泛應用于海報、PPT、科普圖等知識密集型場景。
在商業化應用方面,GLM-Image API調用模式下,單張圖片生成成本僅為0.1元,大幅降低了企業和開發者使用先進圖像生成技術的門檻。