显然之前所有的猜测都错了文字转WAV音频