但是从说话当中就能够明显的感觉出来文字转WAV音频