然后是一连串细碎文字转WAV音频