主要原因是为了让六道口气保持一种死板淡漠的状态文字转WAV音频