Recherche & développement

Notre vision

Faire Progresser l'IA Générative par l'Innovation

L'équipe de R&D de LightOn joue un rôle essentiel dans l'avancement du domaine de l'IA générative grâce à une innovation et un développement continus. Leur expertise couvre la création et le perfectionnement de grands modèles de langage (LLM) qui constituent la base de la plateforme Paradigm, une solution d'IA complète conçue pour une utilisation en entreprise. Cette plateforme simplifie l'intégration de l'IA générative dans les flux de travail des entreprises, offrant des options sur site et dans le cloud pour garantir flexibilité et évolutivité en fonction des besoins de chaque entreprise.

Publications récentes

Lire l'article

La révolution de la recherche (d’information) multi-vecteurs chez LightOn : de la recherche à la mise en production

Découvrez comment la late-interaction stack de LightOn — ModernBERT, PyLate et FastPlaid transforme la recherche sémantique et le retrieval en IA, en passant de la théorie académique aux systèmes de production.

August 25, 2025

CTA Title

Lorem Ipsum

Read post

Lire l'article

FastPlaid : Amener la recherche multi-vecteurs à l’échelle de la production

FastPlaid est le moteur open source en Rust de LightOn pour la recherche à interaction tardive. La version 1.10.0 introduit des index actualisables de manière incrémentale — 6,5× plus rapides que Stanford PLAID, permettant à vos pipelines RAG, de recommandation ou de recherche d’évoluer en temps réel, sans interruption.

August 14, 2025

CTA Title

Lorem Ipsum

Read post

Lire l'article

Introducing Ettin Suite: the SoTA open recipe to outperform existing Generative & Retrieval Models

Introducing Ettin, the first ever SOTA suite of paired encoder & decoder models, developed by Johns Hopkins University in collaboration with LightOn.

July 16, 2025

CTA Title

Lorem Ipsum

Read post

Lire l'article

PyLate-rs: a lightweight tool to compute embeddings lightning-fast

PyLate-rs is a high-performance inference engine for PyLate models, meticulously crafted in Rust for optimal speed and efficiency.

July 8, 2025

CTA Title

Lorem Ipsum

Read post

Lire l'article

LightOn met à niveau la recherche dans le RAG agentique avec son nouveau modèle de pointe : Reason-ModernColBERT

Après la récente sortie de GTE-ModernColBERT, un modèle dédié à la recherche d’information redéfinissant les standards de l’industrie par sa gestion des documents longs, LightOn annonce une nouvelle avancée dans la recherche d’information pilotée par l'IA : Reason-ModernColBERT, un modèle open-source multi-vecteurs spécialement conçu pour les applications de recherche approfondie (Deep Research).

May 22, 2025

CTA Title

Lorem Ipsum

Read post

Lire l'article

LightOn redéfinit les standards de la recherche d’information complexe (RAG) avec GTE-ModernColBERT

Levier d’innovation clé pour les entreprises, les IA génératives sont confrontées à la complexité et la spécificité des données internes aux organisations. Aujourd’hui LightOn annonce la sortie de GTE-ModernColBERT, un modèle dédié à la recherche d’information redéfinissant les standards de l’industrie par sa gestion des documents longs et sa capacité de généralisation sur données complexes inconnues. Ce nouveau modèle surclasse ceux des acteurs de l’écosystème (Alibaba, Cohere, Snowflake, BAAI, JinaAI) sur le benchmark de référence LongEmbed.

April 30, 2025

CTA Title

Lorem Ipsum

Read post

Lire l'article

Finally, a Replacement for BERT

This blog post introduces ModernBERT, a family of state-of-the-art encoder-only models representing improvements over older generation encoders across the board.

December 19, 2024

CTA Title

Lorem Ipsum

Read post

Lire l'article

MonoQwen-Vision, the first visual document reranker

We introduce MonoQwen2-VL-v0.1, the first visual document reranker to enhance the quality of the retrieved visual documents and take these pipelines to the next level. Reranking a small number of candidates with MonoQwen2-VL-v0.1 achieve top results on the ViDoRe leaderboard.

November 7, 2024

CTA Title

Lorem Ipsum

Read post

Lire l'article

PyLate: Flexible Training and Retrieval for ColBERT Models

We release PyLate, a new user-friendly library for training and experimenting with ColBERT models, a family of models that exhibit strong retrieval capabilities on out-of-domain data.

August 29, 2024

CTA Title

Lorem Ipsum

Read post

Explorez les publications de LightOn CTA Section

publications