所以能够感应出他的位置来文字转WAV音频