还要考虑到不同心法被解析插件化之后文字转WAV音频