我们只需要占下三分之一的南域文字转WAV音频