本
文
摘
要
日常生活中,有没有一个旋律,存在你深深的脑海里,但你却怎么也记不起歌名?现在,除了继续绞尽脑汁拼命回忆,你还可以通过“哼唱”旋律的方式找到它,即使是方言歌曲也没什么问题。
日前,南方日报、南方产业智库联合广州市社科院、广州市人工智能产业发展促进会等专业机构启动“粤港澳大湾区AI产业深调研”。4月30日,南方日报记者实地走访酷狗,深入了解酷狗AI“黑科技”,揭秘数字音乐的“最强大脑”。
目前,依托音频指纹技术,用户可通过音乐软件中“听歌识曲”或“哼唱识曲”这两种“智能识曲”功能找回“被遗忘”的歌曲。“目前,正常办公环境下,‘听歌识曲’准确率高达99%以上。哼唱识曲的效果和用户哼唱的水平有关,哼唱不错的情况下,识别率也能达到90%以上。”据酷狗音乐智能技术负责人介绍,当下音乐软件中的“智能识曲”功能已基本成熟,未来AI+音乐还能帮助音乐公司提高曲库管理效率,降低用户的创作成本和门槛,“让人人都有机会成为周杰伦、方文山。”
“听歌识曲”4秒解锁音频密码
伴随着互联网、大数据、云计算等领域的飞速发展,近年来人工智能在数字音乐应用方面开始了频繁的探索,许多优质功能也被逐一开发了出来。在这之中,“听歌识曲”及“哼唱识曲”就是AI+音乐所打造出来的最具代表的功能之一。
“目前,音频指纹技术已经较为成熟,普通办公环境下,听歌识曲识别率可达99%。”据酷狗音乐智能技术负责人介绍,用户打开酷狗音乐App的“识曲”功能,让手机尽量靠近正在播放的音源,后台就会迅速将该歌曲中的音频特征跟曲库中的歌曲进行匹配,目前技术下,“听歌识曲”平均识别时长仅需4秒左右。
在“哼唱识曲”方面,哼唱识别的模糊匹配会受到用户哼唱水平的影响。在用户哼唱不错的情况下,识别率可达90%以上。用户连续哼唱时间越长且哼唱音准越高,系统识别准确度越高,即使是方言歌曲也能被快速识别。据了解,酷狗音乐会借助“识曲”技术对所收录的歌曲中包含的音频信息进行压缩处理,提取出其中最关键、最具区分度的信息点。如此一来,每当用户使用“识曲”功能时,酷狗音乐后台即可凭最少的信息量完成音频匹配。“每首歌的音频信息都有独特的‘指纹’密码,我们要做的就是快速筛选这些音频‘指纹’信息及歌词信息,并完成匹配和识别。”
然而,音频指纹技术也有一个天然的“敌人”,那就是噪音。由于用户开启“哼唱识曲”或“听歌识曲”功能的环境多种多样,因此在设备识曲时很难避免噪声对识别准确率带来的消极影响。目前,酷狗音乐自行开发的“智能去噪”技术已能对部分现实环境中的噪音进行平滑处理,“净化”效率和效果也在不断优化。对此,酷狗音乐正计划开发AI智能环境识别等功能,未来根据用户环境的不同,可为用户在识曲时提供不同的去噪方案,“比如在汽车站识曲,后台技术可支持智能去除车流的噪音;在浴室识曲,能够智能去除回声等。”
酷狗“AI智能推歌”很“懂你”
除“智能识曲”外,“AI智能推歌”也是AI+音乐的核心应用之一。“一首歌里往往包括情感、曲风、声学特征三类信息,把这个信息汇总成信息库,我们就能“读懂”用户的喜好,并为他们智能推荐歌单。据介绍,基于音频特征分析技术以及音频特征推荐模型,酷狗音乐可通过用户收藏的歌曲和平时的听歌喜好为用户智能推荐“每日歌单”。
记者在使用时发现,酷狗音乐的“每日歌曲推荐”功能每天会为用户推荐30首歌曲,并根据他们的喜好差异智能筛选出古风、欢快、摇滚等不同曲风的歌曲,“用户使用这一功能的频率越高、时长越长,推荐也会越准确。”
然而,由于AI+音乐仍处于发展的初级阶段,各个音乐平台研发的智能推荐技术“百花齐放”,行业内对于音频信息的分类方法等仍然缺乏一套统一的标准。“但不可否认的是,推荐算法是AI+音乐重要的应用方向之一,今后随着行业的进步,规范也会逐步建立起来。”
未来“AI+音乐”让人人都是周杰伦、方文山?
尽管目前AI+音乐正处于快速发展的阶段,但AI目前在音乐产业的应用仍然需要基于统计和深度学习技术,“AI+音乐现阶段仍然离不开模仿和统计模型”。这位负责人告诉记者,当下AI缺乏“常识性”思维,在音乐创作能力和逻辑思考能力方面与人类仍有一定距离。未来,随着技术的发展、成熟,AI不仅应具备“识曲”、“推荐”等基础能力,还应当承担起“智能创作”的任务,充分降低用户的音乐生产门槛及成本,实现“人人都能做原创”,真正激活音乐创作的活力。
“‘AI智能作曲’是用户可以期待的功能。未来用户随机输入一段旋律或歌词,人工智能就可以根据词曲风格智能补足整首作品,或给用户提供修改建议,帮助他们学习音乐创作技巧。”他表示,今后在AI的帮助下,音乐产业极有可能迎来全新的乐曲风格和创作方式,许多因音乐学习、制作门槛过高而打消创作念头的用户也将获得新的机遇。“AI+音乐是一种趋势,尽管还处于发展初期,但今后它的发展潜力确实不可小觑。”
来源:中国青年网