SpikeMba: Multi-Modal Spiking Saliency Mamba for Temporal Video Grounding | allainews.com

April 2, 2024, 7:48 p.m. | Wenrui Li, Xiaopeng Hong, Xiaopeng Fan

cs.CV updates on arXiv.org arxiv.org

arXiv:2404.01174v1 Announce Type: new
Abstract: Temporal video grounding (TVG) is a critical task in video content understanding. Despite significant advancements, existing methods often limit in capturing the fine-grained relationships between multimodal inputs and the high computational costs with processing long video sequences. To address these limitations, we introduce a novel SpikeMba: multi-modal spiking saliency mamba for temporal video grounding. In our work, we integrate the Spiking Neural Networks (SNNs) and state space models (SSMs) to capture the fine-grained relationships of …

abstract arxiv computational costs cs.cv cs.mm fine-grained inputs limitations mamba modal multi-modal multimodal novel processing relationships temporal type understanding video

More from arxiv.org / cs.CV updates on arXiv.org

DisBeaNet: A Deep Neural Network to augment Unmanned Surface Vessels for maritime situational awareness 17 hours ago | arxiv.org

abstract arxiv augment automated +18

Contextual Embedding Learning to Enhance 2D Networks for Volumetric Image Segmentation 17 hours ago | arxiv.org

arxiv cs.cv eess.iv embedding +5

KI-PMF: Knowledge Integrated Plausible Motion Forecasting 17 hours ago | arxiv.org

abstract actors arxiv autonomous +18

Adaptive Landmark Color for AUV Docking in Visually Dynamic Environments 17 hours ago | arxiv.org

abstract arxiv autonomous batteries +15

OccupancyDETR: Using DETR for Mixed Dense-sparse 3D Occupancy Prediction 17 hours ago | arxiv.org

abstract arxiv autonomous autonomous vehicles +21

Multimodal Chain-of-Thought Reasoning in Language Models 17 hours ago | arxiv.org

arxiv cs.ai cs.cl cs.cv +7

Robust Self-Tuning Data Association for Geo-Referencing Using Lane Markings 17 hours ago | arxiv.org

abstract advantages aerial arxiv +16

Surrogate-based cross-correlation for particle image velocimetry 17 hours ago | arxiv.org

arxiv correlation cs.cv eess.iv +5

Advancing Human Action Recognition with Foundation Models trained on Unlabeled Public Videos 17 hours ago | arxiv.org

abstract action action recognition advance +20

Software Engineer for AI Training Data (School Specific)

@ G2i Inc | Remote

View on ai-jobs.net

Software Engineer for AI Training Data (Python)

@ G2i Inc | Remote

View on ai-jobs.net

Software Engineer for AI Training Data (Tier 2)

@ G2i Inc | Remote

View on ai-jobs.net

Data Engineer

@ Lemon.io | Remote: Europe, LATAM, Canada, UK, Asia, Oceania

View on ai-jobs.net

Artificial Intelligence – Bioinformatic Expert

@ University of Texas Medical Branch | Galveston, TX

View on ai-jobs.net

.NET Software Engineer (AI Focus)

@ Boskalis | Papendrecht, Netherlands

View on ai-jobs.net