而是一方控制另一方文字转WAV音频