整个故事的架构也相对较小……总之文字转WAV音频