在已经明确侦破方向的前提下文字转WAV音频