我可以大致地感应到他们的死活文字转WAV音频