单从双方现在所展露出的气势判断文字转WAV音频