然后捕捉演员那种纤毫毕现的肌肉抽动文字转WAV音频