我认为两位先生说得是理文字转WAV音频