而是要指望文字转WAV音频