更多的是强调尊重对方文字转WAV音频