因为这个结果在他们的预料之中文字转WAV音频