我们打算开发一些识别类的系统,请教一下大神们。VLM(视觉语言模型)相比于传统OCR的最大优势是?