他们便只能听着文字转WAV音频