只是那时候的场景也不是他们能够控制的文字转WAV音频