也就只够两三个人并排进入的文字转WAV音频