而且通过他的话语文字转WAV音频