更多的时间都是在用肢体动作来完成表演文字转WAV音频