这也就意味着他们需要的补给更多文字转WAV音频