因为他发现要比起调侃和脸皮文字转WAV音频