因为他们同样可以知道结果文字转WAV音频