果然是只有经过比较文字转WAV音频