本
文
摘
要
【编者按】
建设粤港澳大湾区,提升科技创新水平可谓是重中之重。作为全球科创领域的“当红炸子鸡”——人工智能(AI)产业在粤港澳大湾区的发展也备受重视。为此,近日,南方日报、南方产业智库就联合广州市社科院、广州市人工智能产业发展促进会等专业机构启动了“粤港澳大湾区AI产业深调研”。
根据计划,调研团队将深入一线、实地走访过百家粤港澳大湾区的人工智能相关企业,从出行、零售、金融、教育、医疗、互联网等诸多应用场景切入,对粤港澳大湾区AI产业的机遇与挑战进行深度探访。
调研的第二站,我们来看看生活中无处不在的互联网如何借助AI变得更智慧吧!
有没有一个旋律,存在在你深深的脑海里,但你却怎么也记不起歌名?现在,除了继续绞尽脑汁拼命回忆,你还有70%的几率可以通过“哼唱”旋律的方式找到它,即使是方言歌曲也没什么问题。
目前,依托于音频指纹技术,部分用户可以通过音乐软件中的“智能识曲”功能找回“被遗忘”的歌曲,“在普通办公环境中,只要对着手机哼唱4秒左右就能找到歌曲,正确识别率最高99.4%。”酷狗音乐智能技术负责人告诉记者,当下音乐软件中的“智能识曲”功能已基本成熟,未来AI+音乐还能帮助音乐公司提高曲库管理效率,降低用户的创作成本和门槛,“让人人都有机会成为周杰伦、方文山。”
音频也有“指纹”密码,识曲最快只需0.8秒
伴随着互联网、大数据、云计算等领域的飞速发展,近年来人工智能在数字音乐应用方面开始了频繁的探索,许多优质功能也被逐一开发了出来。在这之中,“听歌识曲”及“哼唱识曲”就是AI+音乐所打造出来的最具代表的功能之一。
“目前,音频指纹技术已经较为成熟,听歌识曲在实际使用时准确率约有85%。”据酷狗音乐智能技术负责人谭建文介绍,用户打开APP的“识曲”功能,让手机尽量靠近正在播放的音源,后台就会迅速将该歌曲中的音频特征跟曲库中的歌曲进行匹配,平均识别时长约6.9秒,无噪音或其他干扰的情况下最快0.8秒就能完成识别。
而在“哼唱识曲”方面,正常办公室环境下用户只要“哼”约4秒就能完成识别并导出结果。然而,为保证结果足够准确,酷狗音乐App建议用户哼唱12秒以上,“并且整体音准最好有70%左右。”该负责人表示,哼唱时后台处理器会迅速将所唱曲调与3500万首曲库中的歌曲做匹配,识别准确度最高可达99.4%,即使是方言歌曲也不在话下。
据了解,酷狗音乐会借助拾取技术对所收录的歌曲中包含的音频信息进行压缩处理,提取出其中最关键、最具区分度的信息点。如此一来,每当用户使用“识曲”功能时,App能够凭最少的信息量完成音频匹配。“每首歌的音频信息都有独特的‘指纹’密码,我们要做的就是快速筛选这些音频‘指纹’信息及歌词信息,并完成匹配和识别。”
然而,音频指纹技术也有一个天然的“敌人”,那就是噪音。由于用户开启“哼唱识曲”或“听歌识曲”功能的环境多种多样,因此在设备识曲时很难避免噪声对识别准确率带来的消极影响。目前,酷狗音乐自行开发的“智能去噪”技术已能对部分现实环境中的噪音做平滑处理,但“净化”效率和效果仍待提升。对此,酷狗音乐正计划开发AI智能环境识别等功能,未来根据环境的不同,为用户在识曲时提供不同的去噪方案:“比如在汽车站识曲,就能智能去除车流的噪音;在浴室识曲,能够智能去除回声等。”
根据喜好推荐歌单,音乐软件也有“最强大脑”
除“智能识曲”外,“AI智能推歌”也是AI+音乐的核心应用之一。据介绍,基于音频特征分析技术以及音频特征推荐模型,酷狗音乐可通过用户收藏的歌曲和平时的听歌喜好为用户智能推荐“每日歌单”:“一首歌里往往包括情感、曲风、声学特征三类信息,把这个信息汇总成信息库,我们就能找到用户的喜好,并为他们智能推荐歌单。”
记者在使用时发现,酷狗音乐的“每日歌曲推荐”功能每天会为用户推荐30首歌曲,并根据他们的喜好差异智能筛选出古风、欢快、摇滚、悬疑等不同曲风的歌曲,“用户使用这个功能的频率越高、时长越长,推荐也会越准确。”
然而,由于AI+音乐仍处于发展的初级阶段,各个音乐平台研发的智能推荐技术“百花齐放”,行业内对于音频信息的分类方法等仍然缺乏一套统一的标准。“但不可否认的是,推荐算法是AI+音乐重要的应用方向之一,今后随着行业的进步,规范也会逐步建立起来。”
未来“AI+音乐”让人人都是周杰伦、方文山?
尽管目前AI+音乐正处于快速发展的阶段,但AI目前在音乐产业的应用仍然要基于统计和深度学习技术,“逃不开模仿和统计模型”。谭建文表示,当下AI缺乏“常识性”思维,在音乐创作能力和逻辑思考能力方面与人类仍有一定距离。未来,随着技术的发展、成熟,AI不仅要高效完成“识曲”和“精准推荐”,还应当具备“智能创作”的能力,辅助用户以更低的门槛及成本完成音乐创作,真正实现“人人都能做原创”。
“‘AI智能作曲’是用户可以期待的功能。未来用户随机输入一段旋律或歌词,人工智能就可以根据词曲风格智能补足整首作品,或给用户提供修改建议,帮助他们学习创作技巧。”该负责人表示,今后在AI的加持下,音乐平台将不仅仅具备“最佳听力”,能够快速识别音频信息并给予用户反馈,还有可能搭载上“最强大脑”,创作出全新的音乐风格和形式;许多因音乐学习、制作门槛过高而打消创作念头的用户也将获得新的机遇。“AI+音乐是一种趋势,尽管还处于发展初期,但今后它的发展潜力确实不可小觑。”
【出品】南方产业智库
【策划】陈韩晖 卢轶
【统筹】程鹏 李劼 郜小平
【新媒体运营】刘静
【采写/视频】许隽
【作者】 许隽
【来源】 南方报业传媒集团南方+客户端 南方号~深度~南方产业智库