他们自然也能猜出文字转WAV音频