随后又由质问变成了自言自语文字转WAV音频