他是听进去了一些的文字转WAV音频