在这种情况下他能够提出单对单文字转WAV音频