OHQ: On-chip Hardware-aware Quantization | allainews.com

Feb. 7, 2024, 5:44 a.m. | Wei Huang Haotong Qin Yangdong Liu Jingzhuo Liang Yulun Zhang Ying Li Xianglong Liu

cs.LG updates on arXiv.org arxiv.org

Quantization emerges as one of the most promising approaches for deploying advanced deep models on resource-constrained hardware. Mixed-precision quantization leverages multiple bit-width architectures to unleash the accuracy and efficiency potential of quantized models. However, existing mixed-precision quantization suffers exhaustive search space that causes immense computational overhead. The quantization process thus relies on separate high-performance devices rather than locally, which also leads to a significant gap between the considered hardware metrics and the real deployment.In this paper, we propose an On-chip …

accuracy advanced architectures chip computational cs.ai cs.ar cs.lg devices efficiency hardware mixed mixed-precision multiple performance precision process quantization search space

More from arxiv.org / cs.LG updates on arXiv.org

LangProp: A code optimization framework using Large Language Models applied to driving 53 minutes ago | arxiv.org

arxiv code cs.ai cs.lg +10

MRI Scan Synthesis Methods based on Clustering and Pix2Pix 53 minutes ago | arxiv.org

abstract arxiv automated brain +16

Continual Diffusion with STAMINA: STack-And-Mask INcremental Adapters 53 minutes ago | arxiv.org

abstract arxiv concept concepts +21

Improving Interpretation Faithfulness for Vision Transformers 53 minutes ago | arxiv.org

abstract adversarial adversarial attacks architectures +21

Training robust and generalizable quantum models 53 minutes ago | arxiv.org

abstract adversarial arxiv context +15

Causal Discovery Under Local Privacy 53 minutes ago | arxiv.org

abstract application arxiv causal +19

From Neural Activations to Concepts: A Survey on Explaining Concepts in Neural Networks 53 minutes ago | arxiv.org

abstract act arxiv concepts +13

It's About Time: Temporal References in Emergent Communication 53 minutes ago | arxiv.org

abstract agents arxiv autonomous +21

Learning Risk-Aware Quadrupedal Locomotion using Distributional Reinforcement Learning 53 minutes ago | arxiv.org

arxiv cs.lg cs.ro reinforcement +3

Founding AI Engineer, Agents

@ Occam AI | New York

View on ai-jobs.net

AI Engineer Intern, Agents

@ Occam AI | US

View on ai-jobs.net

AI Research Scientist

@ Vara | Berlin, Germany and Remote

View on ai-jobs.net

Data Architect

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Data ETL Engineer

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Consultant Senior Power BI & Azure - CDI - H/F

@ Talan | Lyon, France

View on ai-jobs.net