近日,来自 CVPR 2023 的一组研究人员发布了他们的最新研究成果——SadTalker。这是一种学习逼真的三维运动系数,为风格化音频驱动的单张图像说话人动画提供支持的技术。
SadTalker 可以将单张静态图像转换为逼真的说话动画,同时保留原始图像的风格。该技术通过学习逼真的三维运动系数,将音频信号转换为逼真的面部动画,从而实现了更加逼真的说话人动画。
该研究团队表示,SadTalker 的性能在多种场景下均表现出色,包括噪声环境和语音情感变化等,具有广泛的应用前景,例如电影制作、游戏开发、虚拟主播等领域。
如果您对该技术感兴趣,可以访问 SadTalker 官方网站(sadtalker.github.io)了解更多详情。