也就是背诵了两三遍文字转WAV音频