9月13日消息,小米自研声音识别算法在音频标记(Audio Tagging)任务中取得重要进展。以公开数据集AudioSet-2M的音频数据作为训练集的音频标记模型,首次突破50 mAP的分数,此项突破标志着小米声音识别算法已在国际上性能排名第一。
据了解,Google将AudioSet数据集分为三个子集,前两个子集用于训练,被合并称为“AudioSet-2M”。正是在这个合并后的训练集中,小米的声音识别算法模型首次在业界突破了50 mAP,刷新了音频标记技术指标,成为截至目前性能最好的模型。
此外,小米还发布了一个Mini版模型,适合资源受限的场景。该模型的参数量被压缩到了原模型的约九分之一,远小于其他机构的模型,但性能却优于其他所有机构。
交换本子和换妻有啥区别?胸罩不要买肉色的囧图
外媒锐评007开场实机太拉:无聊至极!还以为COD呢
游族网络投毒案画上句号!被告人许垚已被执行死刑
时长翻倍!曝《GTA6》主线通关50小时起步 五章巨制
预售暴雷?曝《007》新作数据不佳 疯狂整活宣发
中国人再次夺冠!小孩曾卓君又双叒叕赢了