明显他们是打算直接正面冲击文字转WAV音频