[D] 1D CNN on Waveforms and Spectrograms vs. 2D CNN Performance | allainews.com

June 16, 2024, 3:18 a.m. | /u/ivanstepanovftw

Machine Learning www.reddit.com

It's counter-intuitive that most successful audio frameworks are using 2-dimensional convolutional neural networks (CNN), so I have tried to experiment while trying to train on [BirdCLEF-2024 on Kaggle](https://www.kaggle.com/competitions/birdclef-2024) using simple frameworks, and I have questions regarding learning:

1. When learning waveform input, why 1D CNN does not converge and even diverge immediately on validation split?
2. When training on spectrogram magnitude (stft -> abs -> log1p), why 1D CNN performs worse than 2D CNN?
3. While it seems that spectrogram …

animals cnn converge humans information input machinelearning raw spectrogram split training validation while

More from www.reddit.com / Machine Learning

[R] M3-AUDIODEC: Multi-channel multi-speaker multi-spatial audio codec 7 hours ago | www.reddit.com

audio codec machinelearning spatial +1

[P] C-GAN based MNIST model evaluator/validator 11 hours ago | www.reddit.com

building gan gans generative +5

[R] [CVPR 2024] AV-RIR: Audio-Visual Room Impulse Response Estimation 12 hours ago | www.reddit.com

audio cvpr machinelearning room +1

[Research] Exploiting the Layered Intrinsic Dimensionality for Practical Adversarial Training 13 hours ago | www.reddit.com

adversarial adversarial training aes algorithm +16

[D] Patenting in ML 15 hours ago | www.reddit.com

academia algorithms application applications +10

[R] Weight Rescaling: Applying Initialization Strategies During Training 20 hours ago | www.reddit.com

machinelearning strategies training

[P] llama.ttf: A font which is also an LLM 1 day ago | www.reddit.com

llama llm machinelearning

[D] Thought Space in LLMs? 1 day, 3 hours ago | www.reddit.com

concepts create generate image +12

Cuda advanced learning materials, [D] 1 day, 6 hours ago | www.reddit.com

advanced books course cuda +9

Senior Data Engineer

@ Displate | Warsaw

View on ai-jobs.net

Content Designer

@ Glean | Palo Alto, CA

View on ai-jobs.net

IT&D Data Solution Architect

@ Reckitt | Hyderabad, Telangana, IN, N/A

View on ai-jobs.net

Python Developer

@ Riskinsight Consulting | Hyderabad, Telangana, India

View on ai-jobs.net

Technical Lead (Java/Node.js)

@ LivePerson | Hyderabad, Telangana, India (Remote)

View on ai-jobs.net

Backend Engineer - Senior and Mid-Level - Sydney Hybrid or AU remote

@ Displayr | Sydney, New South Wales, Australia

View on ai-jobs.net