毕竟不是近距离监控文字转WAV音频