他认出了三个文字转WAV音频