从人数比例的概率上来说后者肯定胜出文字转WAV音频