SadTalker：学习逼真的三维运动系数，为风格化音频驱动的单张图像说话人动画提供支持

SadTalker：学习逼真的三维运动系数，为风格化音频驱动的单张图像说话人动画提供支持计算机视觉人工智能动画

近日，来自 CVPR 2023 的一组研究人员发布了他们的最新研究成果——SadTalker。这是一种学习逼真的三维运动系数，为风格化音频驱动的单张图像说话人动画提供支持的技术。

SadTalker 可以将单张静态图像转换为逼真的说话动画，同时保留原始图像的风格。该技术通过学习逼真的三维运动系数，将音频信号转换为逼真的面部动画，从而实现了更加逼真的说话人动画。

该研究团队表示，SadTalker 的性能在多种场景下均表现出色，包括噪声环境和语音情感变化等，具有广泛的应用前景，例如电影制作、游戏开发、虚拟主播等领域。

如果您对该技术感兴趣，可以访问 SadTalker 官方网站（sadtalker.github.io）了解更多详情。

链接：https://sadtalker.github.io/