我们需要非常详细的信息情报文字转WAV音频