虽然他们的猜测已经很接近现实文字转WAV音频