也提出了自己认为最理性的答案文字转WAV音频