主要还是要表明一个姿态文字转WAV音频