那么她们也只能去适应文字转WAV音频