他们会具体分析这些人文字转WAV音频