但也有些时候因为说话随口而出文字转WAV音频