从这两部作品的数据对比就可以看得出来文字转WAV音频