因为他已经想到了一种可能文字转WAV音频