也只能遵循大环境下的规则文字转WAV音频