这个时候他们不方便说话文字转WAV音频