9月13日消息,小米自研声音识别算法在音频标记(Audio Tagging)任务中取得重要进展。以公开数据集AudioSet-2M的音频数据作为训练集的音频标记模型,首次突破50 mAP的分数,此项突破标志着小米声音识别算法已在国际上性能排名第一。
据了解,Google将AudioSet数据集分为三个子集,前两个子集用于训练,被合并称为“AudioSet-2M”。正是在这个合并后的训练集中,小米的声音识别算法模型首次在业界突破了50 mAP,刷新了音频标记技术指标,成为截至目前性能最好的模型。
此外,小米还发布了一个Mini版模型,适合资源受限的场景。该模型的参数量被压缩到了原模型的约九分之一,远小于其他机构的模型,但性能却优于其他所有机构。
合法状态下纵欲过度的方法 这咪咪已经很大的囧图
《仙剑4 重制版》新实机预热:虚幻5开发 登PC和主机
网红甲亢哥被做进游戏!本人笑得合不拢嘴
放假玩游戏的人太多了!Steam遭遇平安夜大崩溃
顺眼多了?剧版《美末》艾莉演员被AI换脸
五年后才发现!《最后生还者2》被删机制曝光