那对于他提出第二个方案文字转WAV音频