这样的话双方都应该能够接受文字转WAV音频