但实际上他还是期望着文字转WAV音频