等到境界稳定后文字转WAV音频