就是把他们加起来文字转WAV音频