然后又再次下沉文字转WAV音频