日期:2023-08-03 05:56:37 来源:科创板日报
财联社8月3日讯(编辑 牛占林)美东时间周三,Meta发布了一款开源人工智能(AI)工具AudioCraft(直译为音频技艺),该工具可以帮助用户根据文本提示创作音乐和音频。
(来源:Meta官网)Meta表示,这款人工智能工具将AudioGen、EnCodec和MusicGen三种模型或技术融为一炉,可用文本内容生成高质量、逼真的音频和音乐。
(资料图片仅供参考)
Meta在官网介绍称,MusicGen接受过Meta拥有的和特别授权的音乐训练,可以从文本提示生成音乐,而AudioGen接受过公共音效训练,可从文本提示生成音频,比如模拟狗叫或脚步声;再加上EnCodec编解码器的改进版本,用户可以更高效率地生成更高质量的音乐。
在6月初,Meta推出了名为MusicGen的开源人工智能模型,这是一种深度学习语言模型,可以根据文本提示生成音乐。
Meta的EnCodec是一个基于深度学习的音频编解码器,由人工智能驱动,可以在音频质量没有损失的前提下,将音频压缩到比MP3格式还要小10倍的程度。
AudioGen则是一个来自Meta和耶路撒冷希伯来大学的研究团队的人工智能模型,可以通过输入文本来生成音频,亦可以扩展现有音频。AudioGen可以区分不同的声音对象,并在声学上将它们分开。
Meta还演示了MusicGen和AudioGen工作的流程图,并表示将让这些模型开源,让研究人员和从业人员可以用自己的数据集训练适合自己的模型,并帮助推进人工智能生成音频和音乐领域的发展。
与其他音乐模型相比,AudioCraft系列模型能够生成长期一致的高质量音乐和音频,还简化了音频生成模型的整体设计,使得该工具简单易用。
Meta相信它的模型可以引领新一波歌曲潮流,就像合成器改变音乐一样。“我们认为MusicGen可以变成一种新型的乐器,就像最初出现的合成器一样。”
当然,Meta也承认创作复杂而又优秀的音乐还是比较困难的,因此它选择将AudioCraft开源,以使用于训练它的数据多样化。
今年早些时候,谷歌也发布了名为MusicLM的音乐生成模型,并于5月向上月向所有用户开放。除此之外,目前较为常见的音乐模型还有Riffusion、Mousai和Noise2Music等。
标签:
文字可生成音乐!Meta发布的AI工具AudioCraft有何不同之处?
一年内到期的长期借款需要列示在资产负债表中"短期借款"项目下 一年内到期的长期借款
中交地产将全部赎回“20中交债”7亿元公司债
大连东北地区‘三交’历史博物馆文物征集要求有什么?
泪目!新生儿被抱出产房外婆一句话破防:我女儿怎么样? 具体是啥状况呢
8月2日:中国发出警告!不许美国提供援助,美:不信中国敢动手
“盗”此为止!琼中公安侦破系列盗窃案
郑州人才公寓申请之后可以更换吗?
拟上市公司早知道|安泰科、交大光芒等3家公司启动A股IPO辅导
成都大运会翻开世界青年交流合作新篇章
点名表扬!张家界25个小区成市级住宅示范小区
唆使、诱导保险代理人违背诚信义务等 华泰人寿济宁中支被罚10.5万元
内蒙古自治区开鲁县发布雷电黄色预警
彩涂钢卷商品报价动态(2023-08-02)
ST易购(002024)8月2日主力资金净买入1535.09万元
深圳10家企业上榜,比亚迪进步最大!2023《财富》世界500强揭晓
石材六面防护规范要求(石材六面防护是指什么)
集美新增一家高标准老年人养护中心 与社区深度融合
“三变女神”现身课堂,变光头强享受凉风,变贞子姐姐竟原地封神
深耕金融科技,法本信息获评“2023年度优秀软件产品”
河北涿州防汛形势严峻 ,多支救援队伍驰援
Apple发布iOS17 watchOS10和macOSSonomaPublicBeta2以及修订后的开发者Beta版
突发!A股将有重要变化?
夏季淹溺事故高发 这些知识关键时刻能救命
葱油鸡蛋饼(葱油饼)
8月2日房地产服务板块涨幅达2%
FF一夜大涨近8%!法拉第未来重磅官宣:启动第二阶段共创交付!贾跃亭:FF九年发展史上的重要里程碑
日本埃普西隆S火箭发动机试验爆炸或因外壳过热
南极海冰面积创近45年新低 消失面积约等同阿根廷国土
日方渲染所谓“中国威胁”蛊惑不了世人(钟声)