所以说话的时候声音有些沉文字转WAV音频