近日,小米自研声音识别算法取得最新进展,算法模型领先其他机构,性能国际排名第一。小米是在 Google 发布的 AudioSet 音频标记任务中获得的这一突破。它是音频标记任务影响力最大的数据集,被认为是声音领域的 Ima ...
近日,小米自研声音识别算法取得最新进展,算法模型领先其他机构,性能国际排名第一。小米是在 Google 发布的 AudioSet 音频标记任务中获得的这一突破。它是音频标记任务影响力最大的数据集,被认为是声音领域的 ImageNet (注:计算机视觉领域最著名的数据集,由著名学者李飞飞等主持发布),权威性颇高。 Google 将 AudioSet 数据集分为三个子集,前两个子集用于训练,被合并称为 “AudioSet-2M”。正是在这个合并后的训练集中,小米的声音识别算法模型首次在业界突破了50 mAP,刷新了音频标记技术指标,成为截至目前性能最好的模型。此外,小米还发布了一个 Mini 版模型,适合资源受限的场景。该模型的参数量被压缩到了原模型的约九分之一,远小于其他机构的模型,但性能却优于其他所有机构。 这项技术的突破意味着小米的声音识别算法能力再次精进,小米的众多智能硬件设备应用此项技术后,可以更敏锐地捕捉和识别环境声音,大幅提升硬件的智能化程度,从而为用户创造更加便捷的智能生活体验。 不仅如此,小米声音识别算法下的音频标记技术能力,还为业界的前沿研究提供了巨大的技术价值,有力推动了相关研发进程。 (小米自研声音识别算法性能国际排名第一) 小米算法应用场景广泛,AI赋能惠及普通大众 小米此次精进后的声音识别算法,具有极高的应用价值。它能够广泛应用于小米的智能设备中,大幅提升用户的智能生活体验。具体来说,音频标记算法能够识别广泛的环境声音,比如婴儿的啼哭声、动物叫声、汽车引擎声、爆炸声、烟雾警报、门铃声、水流声等,并让环境中的声音以文字等模态表达,让声音被“看”见。这可以让硬件设备更加智能,为用户带去更高效和更准确的声音识别体验。 以搭载在小米手机中的“小米闻声”功能来说,它可以监测 14 种重要的环境音,包括火警、婴儿啼哭、烧水壶声等,并以手机通知栏进行文字推送。这让听力障碍用户得以“看见”生活中的声音,与普通人一样享受智能生活的便捷。小米手环也可以同步显示和接收这样的声音信息。 |
2023-08-28
2023-08-24
2023-09-13
2023-09-21
2023-08-24
回答
回答
回答
回答
回答
评论