是为了第三个阶段做准备文字转WAV音频