这是为了后路的预先布局文字转WAV音频