详情

超写实三维数字人的语音驱动系统

申报人:张明霞 申报日期:2023-04-07

基本情况

2023年“校企专项”大学生创新实践计划
超写实三维数字人的语音驱动系统
校企专项
工学
计算机类
创新类
学生创新中心
张明霞
指导教师
登录状态下查看
指导教师在扩散模型相关研究方向发表多篇顶尖论文,并主持多项科研课题。
本项目已经拥有一套基于神经渲染的语音驱动数字人模型。该模型采用深度学习算法,将语音信号转换为数字人的口型,实现数字人的语音交互能力。同时,该模型采用神经渲染技术,对数字人进行高度逼真的渲染,使得数字人形象更加真实可信。此外,本项目还拥有一定的软硬件设备支持,包括有高性能图形处理器的计算机等设备。本项目还获得了相应场地支持,包括实验室和研究场所,以确保项目的顺利开展和实验的准确可靠。

立项背景: 人类在不断探索技术进步的同时,对于数字人技术也越来越关注。数字人技术作为一种数字化的人类形象技术,已经在游戏、动画、虚拟现实等领域得到了广泛的应用。在传统数字人技术中,数字人的驱动方式通常采用骨骼绑定或者画师手动绘制等方式,而这些方式存在一定的局限性且需要较多人力投入。因此,本项目旨在研究一种更为高效、实用的数字人驱动方式,采用神经渲染技术实现语音驱动数字人。

研究意义: 本项目旨在构建一个超写实三维数字人的语音驱动系统,该系统的研究意义在于:(1)提高数字人技术的真实程度和交互性,拓展数字人技术的应用场景;(2)推动语音技术和计算机视觉技术的深度融合,促进人工智能技术的发展;(3)在实际应用中,可以为人机交互、语音识别、智能客服等领域提供更为便捷的解决方案。

预期成果: 本项目的预期成果为开发一套数字人建模、语音识别、语音合成、三维渲染的融合方法,实现数字人形象的真实感强、交互性好。

选题成员

1

指导教师

序号 教师姓名 电子邮箱 所属学院
1 晏轶超 登录状态下查看 电子信息与电气工程学院 第一指导教师
2 张明霞 登录状态下查看 学生创新中心 指导教师

选题附件

结束