从两个相对来说的视线死角文字转WAV音频