显然是想让它做出一个正确的选择文字转WAV音频