功能应该是将物体分解文字转WAV音频