于是在最初阶段文字转WAV音频