在大致摸清其水准后文字转WAV音频