他们做的都是主观题文字转WAV音频