all AI news for `captioning` | allainews.com

Inserting Faces inside Captions: Image Captioning with Attention Guided Merging 3 days, 1 hour ago | arxiv.org

abstract accessibility arxiv attention +15

The Pyramid of Captions 1 week, 1 day ago | arxiv.org

abstract arxiv building captioning +15

Visual Fact Checker: Enabling High-Fidelity Detailed Caption Generation 1 week, 2 days ago | arxiv.org

3d objects abstract arxiv captioning +15

RSCaMa: Remote Sensing Image Change Captioning with State Space Model 1 week, 3 days ago | arxiv.org

arxiv captioning change cs.cv +6

Compressed Image Captioning using CNN-based Encoder-Decoder Framework 1 week, 3 days ago | arxiv.org

abstract accuracy application applications +24

Learning text-to-video retrieval from image captioning 1 week, 4 days ago | arxiv.org

abstract access arxiv captioning +19

PLLaVA : Parameter-free LLaVA Extension from Images to Videos for Video Dense Captioning 1 week, 4 days ago | arxiv.org

arxiv captioning cs.cv extension +6

FLoRA: Enhancing Vision-Language Models with Parameter-Efficient Federated Learning 2 weeks, 2 days ago | arxiv.org

abstract applications artificial artificial intelligence +25

Uncensored auto-captioning libraries that work well for NSFW image datasets 2 weeks, 2 days ago | www.reddit.com

auto captioning captions computervision +16

Movie101v2: Improved Movie Narration Benchmark 2 weeks, 3 days ago | arxiv.org

abstract advance arxiv benchmark +18

The Solution for the CVPR2024 NICE Image Captioning Challenge 2 weeks, 4 days ago | arxiv.org

abstract annotations arxiv captioning +15

Rethinking 3D Dense Caption and Visual Grounding in A Unified Framework through Prompt-based Localization 3 weeks, 1 day ago | arxiv.org

abstract applications arxiv captioning +14

LaDiC: Are Diffusion Models Really Inferior to Autoregressive Counterparts for Image-to-Text Generation? 3 weeks, 2 days ago | arxiv.org

abstract arxiv auto autoregressive +20

TrafficVLM: A Controllable Visual Language Model for Traffic Video Captioning 3 weeks, 3 days ago | arxiv.org

arxiv captioning cs.ai cs.cl +9

Enhancing Traffic Safety with Parallel Dense Video Captioning for End-to-End Event Analysis 3 weeks, 4 days ago | arxiv.org

analysis arxiv captioning cs.cv +6

Microsoft and CMU Researchers Propose a Machine Learning Method to Train an AAC (Automated Audio … 3 weeks, 6 days ago | www.marktechpost.com

ai paper summary ai shorts applications artificial intelligence +23

View Selection for 3D Captioning via Diffusion Ranking 4 weeks ago | arxiv.org

3d object abstract annotation applications +19

Do You Remember? Dense Video Captioning with Cross-Modal Memory Retrieval 4 weeks ago | arxiv.org

abstract arxiv attention captioning +13

Meta AI Presents MA-LMM: Memory-Augmented Large Multimodal Model for Long-Term Video Understanding 4 weeks ago | www.marktechpost.com

ai paper summary applications artificial intelligence capabilities +32

Revolutionizing Video Understanding: Real-Time Captioning for Any Length with Google’s Streaming Model 4 weeks, 1 day ago | syncedreview.com

advancement ai artificial intelligence captioning +21

Dense Video Object Captioning from Disjoint Supervision 1 month ago | arxiv.org

arxiv captioning cs.cv object +3

EVCap: Retrieval-Augmented Image Captioning with External Visual-Name Memory for Open-World Comprehension 1 month ago | arxiv.org

abstract arxiv capability captioning +22

Embedded Heterogeneous Attention Transformer for Cross-lingual Image Captioning 1 month ago | arxiv.org

abstract analysis arxiv attention +15

CapsFusion: Rethinking Image-Text Data at Scale 1 month ago | arxiv.org

abstract arxiv benchmark captioning +23

Google AI Unveils New Benchmarks in Video Analysis with Streaming Dense Captioning Model 1 month ago | www.marktechpost.com

ai shorts analysis artificial intelligence benchmarks +19

OW-VISCap: Open-World Video Instance Segmentation and Captioning 1 month ago | arxiv.org

abstract arxiv captioning cs.ai +15

DIBS: Enhancing Dense Video Captioning with Unlabeled Videos via Pseudo Boundary Enrichment and Online Refinement 1 month ago | arxiv.org

abstract arxiv capabilities captioning +16

ALOHa: A New Measure for Hallucination in Captioning Models 1 month ago | arxiv.org

aloha arxiv captioning cs.ai +5

MusiLingo: Bridging Music and Text with Pre-trained Language Models for Music Captioning and Query Response 1 month, 1 week ago | arxiv.org

abstract applications arxiv captioning +21

LangNav: Language as a Perceptual Representation for Navigation 1 month, 1 week ago | arxiv.org

abstract agent arxiv captioning +21

Streaming Dense Video Captioning 1 month, 1 week ago | arxiv.org

arxiv captioning cs.cv streaming +2

Learning by Correction: Efficient Tuning Task for Zero-Shot Generative Vision-Language Reasoning 1 month, 1 week ago | arxiv.org

abstract annotation arxiv captioning +26

HallE-Control: Controlling Object Hallucination in Large Multimodal Models 1 month, 1 week ago | arxiv.org

abstract arxiv captioning control +15

Change-Agent: Towards Interactive Comprehensive Change Interpretation and Analysis from Change Detection and Change Captioning 1 month, 1 week ago | arxiv.org

agent analysis and analysis arxiv +7

LocCa: Visual Pretraining with Location-aware Captioners 1 month, 1 week ago | arxiv.org

abstract arxiv captioning cs.cv +10

TOD3Cap: Towards 3D Dense Captioning in Outdoor Scenes 1 month, 1 week ago | arxiv.org

arxiv captioning cs.cv type

Towards Multimodal Video Paragraph Captioning Models Robust to Missing Modality 1 month, 1 week ago | arxiv.org

abstract arxiv availability captioning +12

Text Data-Centric Image Captioning with Interactive Prompts 1 month, 1 week ago | arxiv.org

abstract arxiv captioning clip +21

CLAMP: Contrastive LAnguage Model Prompt-tuning 1 month, 1 week ago | arxiv.org

abstract arxiv captioning chat +25

Semi-Supervised Image Captioning Considering Wasserstein Graph Matching 1 month, 1 week ago | arxiv.org

abstract arxiv captioning captions +23

Compared Effect Of Image Captioning For SDXL Fine-tuning / DreamBooth Training for a Single Person, … 1 month, 1 week ago | dev.to

ai beginners captioning check +16

The Solution for the ICCV 2023 1st Scientific Figure Captioning Challenge 1 month, 1 week ago | arxiv.org

abstract arxiv captioning captions +20

Image Captioning in news report scenario 1 month, 2 weeks ago | arxiv.org

abstract and natural language processing applications arxiv +29

Cognitive resilience: Unraveling the proficiency of image-captioning models to interpret masked visual content 1 month, 2 weeks ago | arxiv.org

abstract arxiv capability captioning +15

Visually-Aware Context Modeling for News Image Captioning 1 month, 2 weeks ago | arxiv.org

arxiv captioning context cs.cv +3

Improved Baselines for Data-efficient Perceptual Augmentation of LLMs 1 month, 2 weeks ago | arxiv.org

abstract applications arxiv augmentation +20

Towards More Unified In-context Visual Understanding 1 month, 3 weeks ago | arxiv.org

abstract advancement arxiv captioning +25

TARN-VIST: Topic Aware Reinforcement Network for Visual Storytelling 1 month, 3 weeks ago | arxiv.org

abstract arxiv captioning cs.cv +14

FlexCap: Generating Rich, Localized, and Flexible Captions in Images 1 month, 3 weeks ago | arxiv.org

abstract arxiv captioning captions +14

Synth2: Boosting Visual-Language Models with Synthetic Captions and Image Embeddings by Researchers from Google DeepMind 1 month, 3 weeks ago | www.marktechpost.com

ai shorts applications artificial intelligence availability +31

Apple researchers achieve breakthroughs in multimodal AI as company ramps up investments 1 month, 3 weeks ago | venturebeat.com

ai apple apple ai apple ai research +39

PathM3: A Multimodal Multi-Task Multiple Instance Learning Framework for Whole Slide Image Classification and Captioning 1 month, 3 weeks ago | arxiv.org

abstract arxiv captioning captions +17

Are Vision Language Models Texture or Shape Biased and Can We Steer Them? 1 month, 3 weeks ago | arxiv.org

abstract applications array arxiv +22

This AI Paper from Apple Delves Into the Intricacies of Machine Learning: Assessing Vision-Language Models … 1 month, 3 weeks ago | www.marktechpost.com

ai paper ai paper summary ai shorts apple +26

How to Understand Named Entities: Using Common Sense for News Captioning 1 month, 4 weeks ago | arxiv.org

abstract article arxiv captioning +13

Sieve: Multimodal Dataset Pruning Using Image Captioning Models 1 month, 4 weeks ago | arxiv.org

abstract arxiv captioning cs.cv +17

Transformer based Multitask Learning for Image Captioning and Object Detection 1 month, 4 weeks ago | arxiv.org

abstract arxiv autonomous captioning +17

Rule-driven News Captioning 1 month, 4 weeks ago | arxiv.org

abstract article arxiv captioning +14

Sora as an AGI World Model? A Complete Survey on Text-to-Video Generation 1 month, 4 weeks ago | arxiv.org

abstract agi arxiv captioning +21

Let's Go Shopping (LGS) -- Web-Scale Image-Text Dataset for Visual Concept Understanding 2 months ago | arxiv.org

abstract applications arxiv captioning +24

Nothing found.

Items published with this topic over the last 90 days.

Latest

Inserting Faces inside Captions: Image Captioning with Attention Guided Merging 3 days, 1 hour ago | arxiv.org

abstract accessibility arxiv attention +15

The Pyramid of Captions 1 week, 1 day ago | arxiv.org

abstract arxiv building captioning +15

Visual Fact Checker: Enabling High-Fidelity Detailed Caption Generation 1 week, 2 days ago | arxiv.org

3d objects abstract arxiv captioning +15

RSCaMa: Remote Sensing Image Change Captioning with State Space Model 1 week, 3 days ago | arxiv.org

arxiv captioning change cs.cv +6

Compressed Image Captioning using CNN-based Encoder-Decoder Framework 1 week, 3 days ago | arxiv.org

abstract accuracy application applications +24

Learning text-to-video retrieval from image captioning 1 week, 4 days ago | arxiv.org

abstract access arxiv captioning +19

PLLaVA : Parameter-free LLaVA Extension from Images to Videos for Video Dense Captioning 1 week, 4 days ago | arxiv.org

arxiv captioning cs.cv extension +6

FLoRA: Enhancing Vision-Language Models with Parameter-Efficient Federated Learning 2 weeks, 2 days ago | arxiv.org

abstract applications artificial artificial intelligence +25

Uncensored auto-captioning libraries that work well for NSFW image datasets 2 weeks, 2 days ago | www.reddit.com

auto captioning captions computervision +16

Movie101v2: Improved Movie Narration Benchmark 2 weeks, 3 days ago | arxiv.org

abstract advance arxiv benchmark +18

The Solution for the CVPR2024 NICE Image Captioning Challenge 2 weeks, 4 days ago | arxiv.org

abstract annotations arxiv captioning +15

Rethinking 3D Dense Caption and Visual Grounding in A Unified Framework through Prompt-based Localization 3 weeks, 1 day ago | arxiv.org

abstract applications arxiv captioning +14

LaDiC: Are Diffusion Models Really Inferior to Autoregressive Counterparts for Image-to-Text Generation? 3 weeks, 2 days ago | arxiv.org

abstract arxiv auto autoregressive +20

TrafficVLM: A Controllable Visual Language Model for Traffic Video Captioning 3 weeks, 3 days ago | arxiv.org

arxiv captioning cs.ai cs.cl +9

Enhancing Traffic Safety with Parallel Dense Video Captioning for End-to-End Event Analysis 3 weeks, 4 days ago | arxiv.org

analysis arxiv captioning cs.cv +6

Microsoft and CMU Researchers Propose a Machine Learning Method to Train an AAC (Automated Audio … 3 weeks, 6 days ago | www.marktechpost.com

ai paper summary ai shorts applications artificial intelligence +23

View Selection for 3D Captioning via Diffusion Ranking 4 weeks ago | arxiv.org

3d object abstract annotation applications +19

Do You Remember? Dense Video Captioning with Cross-Modal Memory Retrieval 4 weeks ago | arxiv.org

abstract arxiv attention captioning +13

Meta AI Presents MA-LMM: Memory-Augmented Large Multimodal Model for Long-Term Video Understanding 4 weeks ago | www.marktechpost.com

ai paper summary applications artificial intelligence capabilities +32

Revolutionizing Video Understanding: Real-Time Captioning for Any Length with Google’s Streaming Model 4 weeks, 1 day ago | syncedreview.com

advancement ai artificial intelligence captioning +21

Dense Video Object Captioning from Disjoint Supervision 1 month ago | arxiv.org

arxiv captioning cs.cv object +3

EVCap: Retrieval-Augmented Image Captioning with External Visual-Name Memory for Open-World Comprehension 1 month ago | arxiv.org

abstract arxiv capability captioning +22

Embedded Heterogeneous Attention Transformer for Cross-lingual Image Captioning 1 month ago | arxiv.org

abstract analysis arxiv attention +15

CapsFusion: Rethinking Image-Text Data at Scale 1 month ago | arxiv.org

abstract arxiv benchmark captioning +23

Google AI Unveils New Benchmarks in Video Analysis with Streaming Dense Captioning Model 1 month ago | www.marktechpost.com

ai shorts analysis artificial intelligence benchmarks +19

OW-VISCap: Open-World Video Instance Segmentation and Captioning 1 month ago | arxiv.org

abstract arxiv captioning cs.ai +15

DIBS: Enhancing Dense Video Captioning with Unlabeled Videos via Pseudo Boundary Enrichment and Online Refinement 1 month ago | arxiv.org

abstract arxiv capabilities captioning +16

ALOHa: A New Measure for Hallucination in Captioning Models 1 month ago | arxiv.org

aloha arxiv captioning cs.ai +5

MusiLingo: Bridging Music and Text with Pre-trained Language Models for Music Captioning and Query Response 1 month, 1 week ago | arxiv.org

abstract applications arxiv captioning +21

LangNav: Language as a Perceptual Representation for Navigation 1 month, 1 week ago | arxiv.org

abstract agent arxiv captioning +21

Streaming Dense Video Captioning 1 month, 1 week ago | arxiv.org

arxiv captioning cs.cv streaming +2

Learning by Correction: Efficient Tuning Task for Zero-Shot Generative Vision-Language Reasoning 1 month, 1 week ago | arxiv.org

abstract annotation arxiv captioning +26

HallE-Control: Controlling Object Hallucination in Large Multimodal Models 1 month, 1 week ago | arxiv.org

abstract arxiv captioning control +15

Change-Agent: Towards Interactive Comprehensive Change Interpretation and Analysis from Change Detection and Change Captioning 1 month, 1 week ago | arxiv.org

agent analysis and analysis arxiv +7

LocCa: Visual Pretraining with Location-aware Captioners 1 month, 1 week ago | arxiv.org

abstract arxiv captioning cs.cv +10

TOD3Cap: Towards 3D Dense Captioning in Outdoor Scenes 1 month, 1 week ago | arxiv.org

arxiv captioning cs.cv type

Towards Multimodal Video Paragraph Captioning Models Robust to Missing Modality 1 month, 1 week ago | arxiv.org

abstract arxiv availability captioning +12

Text Data-Centric Image Captioning with Interactive Prompts 1 month, 1 week ago | arxiv.org

abstract arxiv captioning clip +21

CLAMP: Contrastive LAnguage Model Prompt-tuning 1 month, 1 week ago | arxiv.org

abstract arxiv captioning chat +25

Semi-Supervised Image Captioning Considering Wasserstein Graph Matching 1 month, 1 week ago | arxiv.org

abstract arxiv captioning captions +23

Compared Effect Of Image Captioning For SDXL Fine-tuning / DreamBooth Training for a Single Person, … 1 month, 1 week ago | dev.to

ai beginners captioning check +16

The Solution for the ICCV 2023 1st Scientific Figure Captioning Challenge 1 month, 1 week ago | arxiv.org

abstract arxiv captioning captions +20

Image Captioning in news report scenario 1 month, 2 weeks ago | arxiv.org

abstract and natural language processing applications arxiv +29

Cognitive resilience: Unraveling the proficiency of image-captioning models to interpret masked visual content 1 month, 2 weeks ago | arxiv.org

abstract arxiv capability captioning +15

Visually-Aware Context Modeling for News Image Captioning 1 month, 2 weeks ago | arxiv.org

arxiv captioning context cs.cv +3

Improved Baselines for Data-efficient Perceptual Augmentation of LLMs 1 month, 2 weeks ago | arxiv.org

abstract applications arxiv augmentation +20

Towards More Unified In-context Visual Understanding 1 month, 3 weeks ago | arxiv.org

abstract advancement arxiv captioning +25

TARN-VIST: Topic Aware Reinforcement Network for Visual Storytelling 1 month, 3 weeks ago | arxiv.org

abstract arxiv captioning cs.cv +14

FlexCap: Generating Rich, Localized, and Flexible Captions in Images 1 month, 3 weeks ago | arxiv.org

abstract arxiv captioning captions +14

Synth2: Boosting Visual-Language Models with Synthetic Captions and Image Embeddings by Researchers from Google DeepMind 1 month, 3 weeks ago | www.marktechpost.com

ai shorts applications artificial intelligence availability +31

Apple researchers achieve breakthroughs in multimodal AI as company ramps up investments 1 month, 3 weeks ago | venturebeat.com

ai apple apple ai apple ai research +39

PathM3: A Multimodal Multi-Task Multiple Instance Learning Framework for Whole Slide Image Classification and Captioning 1 month, 3 weeks ago | arxiv.org

abstract arxiv captioning captions +17

Are Vision Language Models Texture or Shape Biased and Can We Steer Them? 1 month, 3 weeks ago | arxiv.org

abstract applications array arxiv +22

This AI Paper from Apple Delves Into the Intricacies of Machine Learning: Assessing Vision-Language Models … 1 month, 3 weeks ago | www.marktechpost.com

ai paper ai paper summary ai shorts apple +26

How to Understand Named Entities: Using Common Sense for News Captioning 1 month, 4 weeks ago | arxiv.org

abstract article arxiv captioning +13

Sieve: Multimodal Dataset Pruning Using Image Captioning Models 1 month, 4 weeks ago | arxiv.org

abstract arxiv captioning cs.cv +17

Transformer based Multitask Learning for Image Captioning and Object Detection 1 month, 4 weeks ago | arxiv.org

abstract arxiv autonomous captioning +17

Rule-driven News Captioning 1 month, 4 weeks ago | arxiv.org

abstract article arxiv captioning +14

Sora as an AGI World Model? A Complete Survey on Text-to-Video Generation 1 month, 4 weeks ago | arxiv.org

abstract agi arxiv captioning +21

Let's Go Shopping (LGS) -- Web-Scale Image-Text Dataset for Visual Concept Understanding 2 months ago | arxiv.org

abstract applications arxiv captioning +24

Topic trend (last 90 days)

Top (last 7 days)

Nothing found.

Artificial Intelligence – Bioinformatic Expert

@ University of Texas Medical Branch | Galveston, TX

View on ai-jobs.net

Lead Developer (AI)

@ Cere Network | San Francisco, US

View on ai-jobs.net

Research Engineer

@ Allora Labs | Remote

View on ai-jobs.net

Ecosystem Manager

@ Allora Labs | Remote

View on ai-jobs.net

Founding AI Engineer, Agents

@ Occam AI | New York

View on ai-jobs.net

AI Engineer Intern, Agents

@ Occam AI | US

View on ai-jobs.net