一知智能申请一种基于自回归模型的语音编辑和合成专利,解决真人音频和合成音频拼接突兀的问题

一知智能申请一种基于自回归模型的语音编辑和合成专利,解决真人音频和合成音频拼接突兀的问题金融界 2025 年 4 月 7 日消息 国家知识产权局信息显示 杭州一知智能科技有限公司申请一项名为 一种基于自回归模型的语音编辑和合成方法及系统 的专利 公开号 CN A 申请日期为 2024 年 12 月

大家好,欢迎来到IT知识分享网。

金融界2025年4月7日消息,国家知识产权局信息显示,杭州一知智能科技有限公司申请一项名为“一种基于自回归模型的语音编辑和合成方法及系统”的专利,公开号CN A,申请日期为2024年12月。

专利摘要显示,本发明提出了一种基于自回归模型的语音编辑和合成方法及系统,用于拼接真人音频和合成音频,属于人工智能技术领域。将真人音频信号离散化成音频token和文本token,训练自回归模型;使用自回归模型生成的隐藏层状态训练声码器,使得声码器能够根据隐藏层状态还原音频;从待编辑的真人音频中提取音色特征,并转换为音频token和文本token,将真人音频的文本token之后拼接待合成音频的文本token;将音色特征、文本token、音频token拼接起来输入自回归模型,预测隐藏层状态;根据真人音频和合成音频的先后顺序预处理音频的隐藏层状态,还原音频。本发明解决了真人音频和合成音频拼接突兀的问题。

天眼查资料显示,杭州一知智能科技有限公司,成立于2017年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本2783.6767万人民币,实缴资本2783.6767万人民币。通过天眼查大数据分析,杭州一知智能科技有限公司共对外投资了4家企业,参与招投标项目28次,财产线索方面有商标信息47条,专利信息66条。

本文源自金融界

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/175691.html

(0)
上一篇 2025-04-08 11:00
下一篇 2025-04-08 11:10

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信