他们已经隐约理解了人类造出来的文字转WAV音频