开发人员现在正在将人工智能用于文本转音乐应用程序

随着大型语言模型 (LLM) 和 GPT 等生成式 AI 工具的流行，开发人员已经找到了以不同方式塑造文本的用例，适用于从编写电子邮件到总结文章的用例。现在，他们希望帮助您只需输入一些单词即可生成音乐片段。

PlayListAI （之前为 LinupSupply）的开发者Brett Bauman本周在 App Store 上推出了一款名为Songburst的新应用。该应用程序没有陡峭的学习曲线。您只需输入“学习时听的平静钢琴音乐”或“播客介绍的时髦节拍”等提示，即可让应用程序生成音乐剪辑。

如果您想不出提示，该应用程序有不同类别的提示，包括视频、低保真、播客、游戏、冥想和示例。

Bauman 告诉 TechCrunch，他使用 Vercel 构建了应用程序的后端，并通过Leap生成音乐。目前，生成时间有 30 秒的限制，并且某些输出的质量可能不太好。鲍曼表示，随着时间的推移，他将寻求增加生成的音乐剪辑的长度并提高质量。

鲍曼表示，他之所以开发这款应用程序，是因为几乎没有简单且移动的本地文本到音乐解决方案不存在用于收取订阅费的垃圾邮件策略。

然而，他并不是唯一一个尝试制作一款简洁的文本转音乐应用程序的人。Akhil Tolani开发了音乐协作应用程序Rapchat等应用程序，并推出了CassetteAI，该产品可在网络和 App Store 上使用。

在输入层面，CassetteAI 的工作原理与其他应用程序类似。你输入音乐提示，它就会生成一首曲目。但是，它可以生成长达三分钟的样本。该应用程序制造商表示，这是因为该应用程序在基于 seq2seq 分层架构的自定义模型上工作，并且在专门的数据集上进行训练以生成无版权的音乐。

该工具还为用户提供了一个界面，用于创建生成的曲目的不同版本，并对它们进行编辑和混合以制作新曲目。这些工具非常基础，所以暂时不要指望用它来创建多层母带轨道。

用于混合曲目的磁带 AI 接口

托拉尼表示，该工具是在等待名单上运行的，但他现在正在向更多人开放。他告诉 TechCrunch，他还预计 Cassette AI pro这将使用户能够无限地生成歌曲，并获得更高质量的 AI 模型以改进歌曲生成。

开发人员提到，Cassette AI 比 Mubert 和 Beatbot 等其他音乐生成器更好，因为它生成的音乐质量更好，周转时间更快。他补充说，通过 Cassette AI，他希望尊重音乐行业的道德界限。

“我们希望人们将人工智能视为音乐创作的工具，而不是创作者的替代品:计算器并没有取代数学家，它们只是让计算变得更容易。我们希望让每个人都能在任何情况下进行音乐制作，”他说。

这些工具主要针对创作者，他们可以在视频或播客中使用无版权的音乐。开发人员还希望音乐家注意到他们的工具并将其融入到他们的样本或歌曲制作过程中。

除了独立开发商之外，大型科技公司也在尝试解决文本到音乐的生成问题。谷歌在 5 月份的Google I/O 开发者大会上公开了其MusicLM 工具。6 月，Meta 开源了自己的人工智能音乐生成器 MusicGen。

虽然模型在生成曲目的质量方面正在改进，但人们对它们用于创作音乐的训练数据存在担忧。为了避免法律麻烦，OpenAI 已将其 Jukebox 模型部分开源，并禁止用户为商业用例创作音乐。还有一些人工智能前沿的音乐家，比如 Grimes，她在四月份邀请粉丝用她的声音创作歌曲，并与她分享版税。