他仅仅听懂了一小部分文字转WAV音频