显然也是在寻找进入第二层的入口文字转WAV音频