也就是说在这三米的范围之内文字转WAV音频