自己只能按照她设想的去回答文字转WAV音频