欢迎访问 化工调查网!

当前所在:网站首页> 化工发展

“语音引擎”可从15秒样本复制原声

时间:2024-04-04 来源:河北省科学技术厅  作者:佚名

  

  科技日报北京4月1日电(记者张梦然)据著名科技网站TheVerge报道,OpenAI公司3月29日最新推出了一项名为“语音引擎”(VoiceEngine)的人工智能工具,其仅凭一段15秒的声音样本,便能够精准模仿出该人的声音。

  OpenAI称,该引擎自2022年底以来一直在开发中,实际已在ChatGPT应用程序的“大声朗读”功能中应用,该功能顾名思义会向用户朗读相关内容。

  用户只需利用15秒的样本来训练声音,就可让它以一种“情感和现实”的方式读出喜欢的任何文本。OpenAI表示,它可用于教育目的,将播客翻译成新语言。OpenAI发布的剪辑听起来令人印象深刻,尽管它们有轻微生硬的机器人痕迹。

  “语音引擎”展示了一些已经开始应用的例子。如生成更自然、更富有情感的声音;将视频内容翻译成多种语言,以拓宽其全球受众范围。这项技术的一大特色是,在翻译过程中能够保留演讲者原有的口音特征,为翻译增添了更多真实感和个性化色彩。

  “语音引擎”还可为语言障碍者提供支持,例如开发针对语言障碍者的治疗应用,为有特殊学习需求的人提供教育辅助,使用户能选择最能体现其个性的声音,并且对那些使用多种语言的用户,保持在各种语言中声音的一致性。“语音引擎”使用一位年轻患者之前为学校项目录制的视频音频,成功恢复了她因血管性脑瘤而失去的流畅语言能力。

  OpenAI目前并未立即向市场全面推广,而是选择与少数早期测试者谨慎地合作,共同探索“语音引擎”的应用可能和潜在风险。

  “语音引擎”目前仅处于有限测试阶段,主要原因是担心被滥用。OpenAI指出,“语音引擎”可能导致语音身份验证措施出现问题,以及让大众在误以为自己与熟人通话的情况下涉入骗局。

  OpenAI表示希望进行更多研究,以确保此类工具无法在未经同意的情况下用于传播错误信息和复制声音。


原文链接:https://kjt.hebei.gov.cn/www/kxpj22/kjqy89/301886/index.html
[免责声明] 本文来源于网络转载,仅供学习交流使用,不构成商业目的。版权归原作者所有,如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间处理。

本网概况| 联系我们| 会员服务| 免责声明| 环保项目简介| 网站地图| 本网招聘| 投稿服务|

全国政务信息一体化应用平台

本站部分信息由相应民事主体自行提供,该信息内容的真实性、准确性和合法性应由该民事主体负责。化工调查网 对此不承担任何保证责任。
本网部分转载文章、图片等无法联系到权利人,请相关权利人与本网站联系。

北京政讯通资讯中心主办 | 政讯通-全国政务信息一体化办公室 主管

化工调查网 huagongdc.org.cn 版权所有。

京ICP备16042780号-88

联系电话:010-69940054 010-80447989 监督电话:18511526897,违法和不良信息举报电话:010-57028685

第一办公区:北京市西城区砖塔胡同56号西配楼;第二办公区:北京市东城区建国门内大街26号新闻大厦5层

邮箱:huanbaofzxczx@163.com  客服QQ:2834255374 通联QQ:3404733191

北京政讯通资讯中心