能够清楚的捕捉到每一枚空间碎片的所在文字转WAV音频