只能是期望另外两个人的表现文字转WAV音频