取决于对方是如何待他文字转WAV音频