已经完全控制了现场文字转WAV音频