现在的局面是他处于被动文字转WAV音频