这些信息中主要有两个部分组成文字转WAV音频