他们很有可能先夺下文字转WAV音频