Shanghai财经网,✅Shanghai经济网,Shanghai财经频道,上海商业新闻网,上海本地新闻媒体✅

您好,欢迎访问Shanghai上海财经新闻网,我们将竭诚为您服务!

微软人工智能 VALL-E 只需 3 秒即可模仿任何人的声音

2023-02-20 12:27来源:未知 频道:财经头条 阅读:
《上海财经网》上海财经第一门户网站!
 追踪网络热点,关注财经动态,传播大沪文化,倡导网络新时代!
http://news.shanghaima.com/上海财经网欢迎您! 

上海财经网【上海财经号】:

微软展示了可以模仿任何人类声音的人工智能。它被称为VALL-E,就像之前的DALL-E算法一样。如果您知道,后者会根据文本创建图像。

VALL-E 可以在短短三秒钟内通过聆听真人的声音来模仿音色和说话方式。虽然听起来有点像机器人的声音,但效果还是很不错的。

微软称其为“神经编解码器语言模型”。VALL-E 是在 EnCodec(一种使用机器学习技术的音频编解码器)的基础上构建的,该编解码器由Meta一年前于 2022 年开发。

其他文本转语音方法考虑了波形。但是 VALL-E 从文本和音频中生成单独的音频编解码器。实际上,它分析了一个人的声音。然后,它通过 EnCodec 将该信息分解为单独的部分(称为“令牌”)。最后,它使用训练数据来匹配它“知道”的内容,即如果它说出三秒样本之外的其他短语,该声音的发音会如何。

VALL-E 是使用特殊图书馆教授的。后者包含来自 7,000 多人的 60,000 小时英语演讲。开发人员建议该方法可用于高质量的文本到语音应用程序。例如,您可以使用它来编辑允许更改人类单词的语音记录。因此,您可以创建音频内容(例如有声读物的画外音)等。

当然,这样的技术也会带来一定的危险。迟早,“独眼”用户会将其变成勒索工具。比如说,他们可以使用人工智能来证明名人说过一些他们没有说过的话。视频格式的 deepfakes已经有这样的案例。


本文地址: http://caijing.shanghaima.com/caijing/9046.html
严正声明:本文仅代表作者个人观点,与上海财经网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,上海财经号系信息发布平台,上海财经网仅提供信息存储空间服务。如有侵权请出示权属凭证联系管理员(3455677927@qq.com)删除!
|上海财经网|上海财经新闻网|上海财经网电子版官网|上海财经网电子版阅读|上海财经大学网站|上海财经媒体|上海财政局网站|上海报业集团|上海财经网专栏|上海财经网东方财经|投诉上海财经网|上海财经网有哪些内容|上海财经网在哪里看|上海财经网地址|上海财经网新版上线|上海财经网新浪博客|上海财经网新闻频道|上海财经杂志|上海财经网APP|上海财经网记者新闻采访|

上一篇:GALAXY S23 ULTRA 似乎是 IPHONE 15 的明显赢家

下一篇:三星 GALAXY Z FOLD 5 将拥有额外功能

相关推荐


关注我们

    Shanghai财经网,✅Shanghai经济网,Shanghai财经频道,上海商业新闻网,上海本地新闻媒体✅
返回顶部