DeepSparse:利用稀疏性加速神經網絡推理
站長之家10月26日 消息:DeepSparse是一種突破性的CPU推理運行時,采用了復雜的稀疏性技術,從而實現了神經網絡推理的加速。稀疏性是指神經網絡中存在許多連接權重為零的情況。
DeepSparse充分利用了這些零權重的連接,以跳過不必要的計算,從而有效地提高了推理速度。作為一個開源項目,DeepSparse的代碼庫可以在GitHub上找到。
項目地址:https://github.com/neuralmagic/deepsparse
目前,DeepSparse已經成功集成到了TensorFlow中,并成為了TensorFlow不可或缺的一個組件。
最新的DeepSparse LLM支持以稀疏內核進行加速,實現從非結構化稀疏權重中的速度提升和內存節省,同時支持8位權重和激活量化以及高效使用緩存的注意力鍵和值,從而減少內存移動。不僅如此,DeepSparse還支持多種計算機視覺和自然語言處理模型,包括BERT、ViT、ResNet、YOLOv5/8等等。
核心功能:
稀疏性加速: DeepSparse使用稀疏性來加速神經網絡推理,從而提高性能。
LLM支持: 支持性能卓越的LLM推理,包括稀疏內核、8位權重和激活量化,以及緩存注意力鍵和值的高效使用。
模型優化: 與SparseML合作,DeepSparse可以進行模型修剪和量化,以優化神經網絡模型。
多種模型支持: 支持多種計算機視覺和自然語言處理模型,適用于各種任務。
多層次API: 提供引擎、管道和服務器等多層次的API,以滿足不同應用場景的需求。
相關推薦
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。