也似乎是在观察文字转WAV音频