他大体上能分析到那些人文字转WAV音频