SemanticScuttle - klotz.me » klotz: vision language models+vlm

klotz: vision language models* + vlm*

Using Vision Language Models to Process Millions of Documents

This article discusses how to apply vision language models (VLMs) to document understanding, covering application areas like agentic use cases, question answering, classification, and information extraction, as well as limitations like cost and processing long documents.

2025-09-27 Tags: vision language models, vlm, document understanding, question answering, classification, information extraction by klotz
Scaling ColPali to billions of PDFs with Vespa

This blog post explores scaling ColPali for efficient document retrieval across large collections of PDFs using Vespa's phased retrieval and ranking pipeline, including the use of a hamming-based MaxSim similarity function.

2024-09-23 Tags: colpali, document retrieval, vespa, maxsim, hamming distance, vlm, binary quantization, pdf, vision language models, llm by klotz

First / Previous / Next / Last / Page 1 of 0