Safe LoRA: the Silver Lining of Reducing Safety Risks when Fine-tuning Large Language Models | allainews.com

May 28, 2024, 4:43 a.m. | Chia-Yi Hsu, Yu-Lin Tsai, Chih-Hsun Lin, Pin-Yu Chen, Chia-Mu Yu, Chun-Ying Huang

cs.LG updates on arXiv.org arxiv.org

arXiv:2405.16833v1 Announce Type: new
Abstract: While large language models (LLMs) such as Llama-2 or GPT-4 have shown impressive zero-shot performance, fine-tuning is still necessary to enhance their performance for customized datasets, domain-specific tasks, or other private needs. However, fine-tuning all parameters of LLMs requires significant hardware resources, which can be impractical for typical users. Therefore, parameter-efficient fine-tuning such as LoRA have emerged, allowing users to fine-tune LLMs without the need for considerable computing resources, with little performance degradation compared to …

abstract arxiv cs.lg datasets domain fine-tuning gpt gpt-4 hardware however language language models large language large language models llama llms lora parameters performance risks safe safety safety risks specific tasks tasks type while zero-shot

More from arxiv.org / cs.LG updates on arXiv.org

Bayesian identification of nonseparable Hamiltonians with multiplicative noise using deep learning and reduced-order modeling 3 hours ago | arxiv.org

abstract arxiv bayesian cs.lg +17

MMGPL: Multimodal Medical Data Analysis with Graph Prompt Learning 3 hours ago | arxiv.org

abstract analysis arxiv cs.cv +16

Self-Supervised Detection of Perfect and Partial Input-Dependent Symmetries 3 hours ago | arxiv.org

arxiv cs.cv cs.lg detection +3

MixerFlow: MLP-Mixer meets Normalising Flows 3 hours ago | arxiv.org

abstract architectures arxiv context +15

Machine Learning-Enabled Software and System Architecture Frameworks 3 hours ago | arxiv.org

abstract architecture arxiv concerns +22

Efficient Interaction-Aware Interval Analysis of Neural Network Feedback Loops 3 hours ago | arxiv.org

abstract analysis arxiv cs.lg +19

Kernelised Normalising Flows 3 hours ago | arxiv.org

abstract architecture arxiv capabilities +14

GSplit: Scaling Graph Neural Network Training on Large Graphs via Split-Parallelism 3 hours ago | arxiv.org

abstract arxiv class cs.dc +25

Reinforcement Learning in Credit Scoring and Underwriting 3 hours ago | arxiv.org

abstract action adapt arxiv +17

AI Focused Biochemistry Postdoctoral Fellow

@ Lawrence Berkeley National Lab | Berkeley, CA

View on ai-jobs.net

Senior Data Engineer

@ Displate | Warsaw

View on ai-jobs.net

Solutions Architect

@ PwC | Bucharest - 1A Poligrafiei Boulevard

View on ai-jobs.net

Research Fellow (Social and Cognition Factors, CLIC)

@ Nanyang Technological University | NTU Main Campus, Singapore

View on ai-jobs.net

Research Aide - Research Aide I - Department of Psychology

@ Cornell University | Ithaca (Main Campus)

View on ai-jobs.net

Technical Architect - SMB/Desk

@ Salesforce | Ireland - Dublin

View on ai-jobs.net