其次就是每一次传送都需要极大的消耗文字转WAV音频