音视频一键生成 讯飞智作让内容生产高效率智能化 全球滚动


(相关资料图)

4月21日,由中央网信办网络传播局、中央网信办网络管理技术局、江苏省委网信办、人民网共同发起的“2023中国网络媒体论坛‘八点见’项目发布会”成功举办,“讯飞智作--AIGC内容创作平台”在发布会上亮相,这一平台是科大讯飞在AIGC领域的一项创新实践成果。

讯飞智作,用AI赋能音视频创作。其基于科大讯飞的语音合成、人脸建模、唇形预测、图形处理等多项人工智能技术,为用户提供音视频生产平台。提供的服务包括AI配音、AI虚拟主播视频制作等内容创作,可以解决用户制作时找主播难、成本高、生产效率低等痛点问题,让内容创作更加灵活、高效、便捷。

早在2021年,科大讯飞就发布了AI虚拟人交互平台,其具有多模感知、多维表达、自主定义、情感贯穿四大特性。郜静文还介绍了讯飞智作运用“自主定义”和“情感贯穿”两项特性的最新进展。

在“自主定义”方面,虚拟发言人“智造”过程更轻便、自动化。目前讯飞智作已支持从声音到形象的自动化构建能力,可生成差异化的虚拟资产

在“情感贯穿”方面,多情感功能上线。讯飞智作现有音库包含了大气浑厚、年轻时尚、可爱甜美、成熟知性、稳重磁性等多种风格,覆盖新闻播报、专题宣传、有声阅读、情感文章、广告促销、教育培训等场景,语言支持普通话、方言和英语,合成效果可自主调节,其语音效果媲美真人。

关于公司在AIGC领域的整体布局,科大讯飞AI研究院常务副院长高建清曾在今年3月29日的中国AIGC产业峰会上进行了分享。他表示,“底座+能力+应用”是科大讯飞AIGC整体布局的三层架构:以文本预训练、多模态预训练、多元异构基础资源构建、异构集群构建及大模型训练套件为技术底座,形成音频创作、视觉创作、文本创作三大AIGC能力,进而衍生出在教育、医疗、人机交互等领域的丰富应用。

未来,讯飞智作将致力于用AI更好地拓展内容创作方式,持续让AIGC助力各行各业的内容生产。

推荐DIY文章
大v是什么意思:指在网络平台获得个人认证 拥有众多粉丝的微博用户
环球快看:大地之灵出装dota 大地之灵中期可以获得相位鞋,原力棍吗
火影忍者里的阿飞是谁?是宇智波带土吗?他为什么会变成阿飞?-世界关注
假想敌是什么意思 指为了达到某个目的或目标而假想出来的对手_天天视讯
全球热文:白族的节日风俗有哪些 白族每年最隆重的节日又是什么
最新资讯:做好口腔门诊管理掌握这六个步骤:首先是团队建设和培训
精彩新闻

超前放送