筹划的都是两两一组文字转WAV音频