很显然他们都做了相当的准备文字转WAV音频