这个过程当中可能会出现误解文字转WAV音频