必须先稳定情绪文字转WAV音频