其余的信息大抵都要变成细枝末节文字转WAV音频