或者是更窄一点的声音去唱文字转WAV音频