随着目标物体的移动文字转WAV音频