按照他原本的猜测文字转WAV音频