End-to-end Dense Video Captioning as Sequence Generation. (arXiv:2204.08121v2 [cs.CV] UPDATED) | allainews.com

Sept. 19, 2022, 1:14 a.m. | Wanrong Zhu, Bo Pang, Ashish V. Thapliyal, William Yang Wang, Radu Soricut

cs.CV updates on arXiv.org arxiv.org

Dense video captioning aims to identify the events of interest in an input
video, and generate descriptive captions for each event. Previous approaches
usually follow a two-stage generative process, which first proposes a segment
for each event, then renders a caption for each identified segment. Recent
advances in large-scale sequence generation pretraining have seen great success
in unifying task formulation for a great variety of tasks, but so far, more
complex tasks such as dense video captioning are not able …

arxiv captioning video

More from arxiv.org / cs.CV updates on arXiv.org

Image Restoration by Denoising Diffusion Models with Iteratively Preconditioned Guidance 8 hours ago | arxiv.org

abstract algorithms arxiv become +17

ParamISP: Learned Forward and Inverse ISPs using Camera Parameters 8 hours ago | arxiv.org

abstract arxiv cs.cv data +11

LLM-driven Multimodal Target Volume Contouring in Radiation Oncology 8 hours ago | arxiv.org

abstract advancement arxiv clinical +20

Dynamic Clue Bottlenecks: Towards Interpretable-by-Design Visual Question Answering 8 hours ago | arxiv.org

abstract advances arxiv bottlenecks +24

Multi-scale Attention Network for Single Image Super-Resolution 8 hours ago | arxiv.org

abstract arxiv attention cs.cv +10

Post-processing of coronary and myocardial spatial data 8 hours ago | arxiv.org

abstract arxiv computational context +17

RSBuilding: Towards General Remote Sensing Image Building Extraction and Change Detection with Foundation Model 8 hours ago | arxiv.org

abstract analysis arxiv building +24

Inconsistency Masks: Removing the Uncertainty from Input-Pseudo-Label Pairs 8 hours ago | arxiv.org

arxiv cs.cv masks type +1

Objects With Lighting: A Real-World Dataset for Evaluating Reconstruction and Rendering for Object Relighting 8 hours ago | arxiv.org

arxiv cs.cv cs.gr dataset +6

Data Scientist (m/f/x/d)

@ Symanto Research GmbH & Co. KG | Spain, Germany

View on ai-jobs.net

Sr. Data Science Consultant

@ Blue Yonder | Bengaluru

View on ai-jobs.net

Artificial Intelligence Developer

@ HP | PSR01 - Bengaluru, Pritech Park- SEZ (PSR01)

View on ai-jobs.net

Senior Software Engineer - Cloud Data Extraction

@ Celonis | Munich, Germany

View on ai-jobs.net

Finance Master Data Management

@ Airbus | Lisbon (Airbus Portugal)

View on ai-jobs.net

Imaging Support Associate

@ Lexington Medical Center | West Columbia, SC, US, 29169

View on ai-jobs.net