而且这四个地方的排序应该是挨着的文字转WAV音频