毕竟还是需要分辨出来这个差异的文字转WAV音频