他甚至猜想文字转WAV音频