它们不需要化作人形文字转WAV音频