这两道声音几乎是同时喊出的文字转WAV音频