所有的行动全部遵循文字转WAV音频