• 《工程索引》(EI)刊源期刊
    • 中文核心期刊
    • 中國科技論文統計源期刊
    • 中國科學引文數據庫來源期刊

    留言板

    尊敬的讀者、作者、審稿人, 關于本刊的投稿、審稿、編輯和出版的任何問題, 您可以本頁添加留言。我們將盡快給您答復。謝謝您的支持!

    姓名
    郵箱
    手機號碼
    標題
    留言內容
    驗證碼

    信息專輯+深度神經網絡模型量化方法綜述

    楊春 張睿堯 林金輝 黃瀧 遆書童 董志偉 陳松路 劉艷 殷緒成(通訊作者)

    楊春, 張睿堯, 林金輝, 黃瀧, 遆書童, 董志偉, 陳松路, 劉艷, 殷緒成(通訊作者). 信息專輯+深度神經網絡模型量化方法綜述[J]. 工程科學學報. doi: 10.13374/j.issn2095-9389.2022.12.27.004
    引用本文: 楊春, 張睿堯, 林金輝, 黃瀧, 遆書童, 董志偉, 陳松路, 劉艷, 殷緒成(通訊作者). 信息專輯+深度神經網絡模型量化方法綜述[J]. 工程科學學報. doi: 10.13374/j.issn2095-9389.2022.12.27.004
    A Survey of Quantization Methods for Deep Neural Networks[J]. Chinese Journal of Engineering. doi: 10.13374/j.issn2095-9389.2022.12.27.004
    Citation: A Survey of Quantization Methods for Deep Neural Networks[J]. Chinese Journal of Engineering. doi: 10.13374/j.issn2095-9389.2022.12.27.004

    信息專輯+深度神經網絡模型量化方法綜述

    doi: 10.13374/j.issn2095-9389.2022.12.27.004
    詳細信息
    • 中圖分類號: TP183

    A Survey of Quantization Methods for Deep Neural Networks

    • 摘要: 近年來,利用大規模預訓練深度神經網絡模型來提高具體任務下的泛化能力和性能,逐漸成為基于深度學習的人工智能技術與應用發展的一大趨勢。雖然這些深度神經網絡模型表現優異,但是復雜的模型結構、龐大的模型參數量以及驚人的運算量使得它們難以被部署在邊緣及端側硬件平臺上。為了解決這個問題,模型壓縮與加速技術應運而生。在多種模型壓縮與加速方案中,模型量化是其中主要技術,是大規模商業化應用推廣的核心問題。模型量化技術可以通過減少網絡參數的位寬和中間過程特征圖的位寬來達到壓縮加速深度神經網絡的目的,從而使量化后的網絡能夠部署在資源有限的邊緣設備上。本文較全面地調研了不同角度下模型量化相關技術,深入地總結歸納了不同方法的優缺點,并探究了量化技術目前仍然存在的問題以及未來可能的發展方向。

       

    • 加載中
    計量
    • 文章訪問數:  136
    • HTML全文瀏覽量:  6
    • PDF下載量:  31
    • 被引次數: 0
    出版歷程
    • 網絡出版日期:  2023-03-24

    目錄

      /

      返回文章
      返回
      中文字幕在线观看