为何不是当时就用文字转WAV音频