当然对于车展这一类的模特需要文字转WAV音频