所以我觉得应该以柔和的方式文字转WAV音频