所以他并不去指手画脚文字转WAV音频