而最接近结果的便是他的答案文字转WAV音频