而后者却是靠着真正的技术文字转WAV音频