他们因为是瞬移文字转WAV音频