Ring-A-Bell! How Reliable are Concept Removal Methods for Diffusion Models?. (arXiv:2310.10012v2 [cs.LG] UPDATED) | allainews.com

Jan. 31, 2024, 4:46 p.m. | Yu-Lin Tsai, Chia-Yi Hsu, Chulin Xie, Chih-Hsun Lin, Jia-You Chen, Bo Li, Pin-Yu Chen, Chia-Mu Yu, Chun-Ying Huang

cs.LG updates on arXiv.org arxiv.org

Diffusion models for text-to-image (T2I) synthesis, such as Stable Diffusion
(SD), have recently demonstrated exceptional capabilities for generating
high-quality content. However, this progress has raised several concerns of
potential misuse, particularly in creating copyrighted, prohibited, and
restricted content, or NSFW (not safe for work) images. While efforts have been
made to mitigate such problems, either by implementing a safety filter at the
evaluation stage or by fine-tuning models to eliminate undesirable concepts or
styles, the effectiveness of these safety measures …

arxiv capabilities concept concerns cs.lg diffusion diffusion models image images misuse nsfw progress quality ring stable diffusion synthesis text text-to-image work

More from arxiv.org / cs.LG updates on arXiv.org

Consistent3D: Towards Consistent High-Fidelity Text-to-3D Generation with Deterministic Sampling Prior 8 hours ago | arxiv.org

arxiv consistent cs.cv cs.lg +6

Machine-learned models for magnetic materials 8 hours ago | arxiv.org

abstract arxiv autoencoder cond-mat.mtrl-sci +17

Revisiting RIP guarantees for sketching operators on mixture models 8 hours ago | arxiv.org

abstract alternative analysis arxiv +9

Non-Intrusive Speech Intelligibility Prediction for Hearing Aids using Whisper and Metadata 8 hours ago | arxiv.org

abstract accuracy arxiv assessment +16

Getting More for Less: Using Weak Labels and AV-Mixup for Robust Audio-Visual Speaker Verification 8 hours ago | arxiv.org

abstract arxiv audio cs.cv +18

Neural-network quantum state study of the long-range antiferromagnetic Ising chain 8 hours ago | arxiv.org

abstract arxiv boltzmann cond-mat.quant-gas +12

Prediction Risk and Estimation Risk of the Ridgeless Least Squares Estimator under General Assumptions on … 8 hours ago | arxiv.org

abstract arxiv assumptions cs.lg +22

Vortex Feature Positioning: Bridging Tabular IIoT Data and Image-Based Deep Learning 8 hours ago | arxiv.org

abstract arxiv cs.cv cs.lg +19

Provably Efficient Exploration in Quantum Reinforcement Learning with Logarithmic Worst-Case Regret 8 hours ago | arxiv.org

abstract algorithms arxiv attention +20

Senior Machine Learning Engineer

@ GPTZero | Toronto, Canada

View on ai-jobs.net

Head of Statistical Programming – US

@ Sobi | Waltham, MA, United States

View on ai-jobs.net

Data Lead Engineer

@ Capco | Brazil - Sao Paulo

View on ai-jobs.net

Intern Assistant Researcher - mmWave Imaging

@ Huawei Technologies Canada Co., Ltd. | Ottawa, Ontario, Canada

View on ai-jobs.net

Hardware Test Engineer, Amazon Robotics Hardware Test

@ Amazon.com | North Reading, Massachusetts, USA

View on ai-jobs.net

Mechanical Design Engineer (Aircraft Interiors)

@ Segula Technologies | Mexico City, Mexico

View on ai-jobs.net