那就是布置考核场景也是需要成本的文字转WAV音频