语音/音频处理学术速递
今日论文合集:cs.SD语音7篇,eess.AS音频处理10篇。cs.SD语音【1】 A Preliminary Investigation on Flexible Singing Voice Synthesis Through Decomposed Framework with Inferrable Feat...
浅谈大模型的多模态和语音流式技术
ChatGPT 引爆LLM的同时scaling law席卷了整个机器学习行业,openai 、meta、google等公司在语音方向也分别推出了whisper、mms、audioPaLM多个语音大模型,在模型和数据规模上再次发挥scaling...
大模型集体失智!9.11和9.9哪个大,几乎全翻车了
没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??强如GPT-4o,都坚定地认为9.11更大。来源丨量子位谷歌Gemini Advanced付费版,同样的口径。新王Claude 3.5 Sonnet...