据悉,商汤科技于2024年7月推出了可控人物视频生成大模型——Vimi。该模型基于商汤先进的大模型技术,能够通过单张照片生成与目标动作一致的人物视频,实现精准的表情和肢体控制。Vimi支持多种驱动方式,包括视频、动画、声音和文字,凭借多年积累的面部跟踪技术和对细节的精确控制能力,生成高一致性、光影和谐的视频内容。