很显然是他是集合所学文字转WAV音频