Learn Beyond The Answer: Training Language Models with Reflection for Mathematical Reasoning | allainews.com

June 19, 2024, 4:41 a.m. | Zhihan Zhang, Zhenwen Liang, Wenhao Yu, Dian Yu, Mengzhao Jia, Dong Yu, Meng Jiang

cs.CL updates on arXiv.org arxiv.org

arXiv:2406.12050v1 Announce Type: new
Abstract: Supervised fine-tuning enhances the problem-solving abilities of language models across various mathematical reasoning tasks. To maximize such benefits, existing research focuses on broadening the training set with various data augmentation techniques, which is effective for standard single-round question-answering settings. Our work introduces a novel technique aimed at cultivating a deeper understanding of the training problems at hand, enhancing performance not only in standard settings but also in more complex scenarios that require reflective thinking. Specifically, …

abstract arxiv augmentation benefits beyond cs.cl data fine-tuning language language models learn mathematical reasoning problem problem-solving question reasoning research set standard supervised fine-tuning tasks training tuning type work

More from arxiv.org / cs.CL updates on arXiv.org

MuTox: Universal MUltilingual Audio-based TOXicity Dataset and Zero-shot Detector 14 hours ago | arxiv.org

abstract arxiv audio cs.cl +22

Can Large Language Model Summarizers Adapt to Diverse Scientific Communication Goals? 14 hours ago | arxiv.org

abstract adapt arxiv communication +23

ReFT: Reasoning with Reinforced Fine-Tuning 14 hours ago | arxiv.org

abstract annotations arxiv capability +22

Deductive Closure Training of Language Models for Coherence, Accuracy, and Updatability 14 hours ago | arxiv.org

abstract accuracy arxiv cs.cl +13

Exploring Defeasibility in Causal Reasoning 14 hours ago | arxiv.org

abstract arxiv causal causal reasoning +7

Can Large Language Models Follow Concept Annotation Guidelines? A Case Study on Scientific and Financial … 14 hours ago | arxiv.org

abstract annotation arxiv capacity +26

Theory of Mind for Multi-Agent Collaboration via Large Language Models 14 hours ago | arxiv.org

abstract agent agents arxiv +28

Enhancing Text-based Knowledge Graph Completion with Zero-Shot Large Language Models: A Focus on Semantic Enhancement 14 hours ago | arxiv.org

arxiv cs.ai cs.cl focus +12

A Large Language Model Approach to Educational Survey Feedback Analysis 14 hours ago | arxiv.org

abstract analysis arxiv capabilities +27

AI Focused Biochemistry Postdoctoral Fellow

@ Lawrence Berkeley National Lab | Berkeley, CA

View on ai-jobs.net

Senior Quality Specialist - JAVA

@ SAP | Bengaluru, IN, 560066

View on ai-jobs.net

Aktuar Financial Lines (m/w/d)

@ Zurich Insurance | Köln, DE

View on ai-jobs.net

Senior Network Engineer

@ ManTech | 054H - 124TchnlgyPrkWy,SBurlington,VT

View on ai-jobs.net

Pricing Analyst

@ EDF | Exeter, GB

View on ai-jobs.net

Specialist IS Engineer

@ Amgen | US - California - Thousand Oaks - Field/Remote

View on ai-jobs.net