实验结果 在本工作中,研究人员希望探讨两个问题:与纯语音相比,3D 角色与动作是否会给 AI 角色扮演带来体验提升?与 LLM-Agent 结构相比,端到端的 VLA 结构是否在交互质量和延迟上有体验提升? 为此,研究人员选择了两种对比方法:LLM+Speech,DLP(MoitonGPT)。