一开始的时候大家是排斥文字转WAV音频