所以当他们中有人说要唱歌时文字转WAV音频