如果他一种保持着一种透视深度的话文字转WAV音频