而他自己则是猜测着文字转WAV音频