他都应该会按照最真实的情况文字转WAV音频