他们明明可以有其他目标文字转WAV音频