他担心的就是被动影响文字转WAV音频