要么就简单把他们当成文字转WAV音频