他应该是根据一些痕迹文字转WAV音频