2026-03-08 / Vincent Guyader / astuces, base de données, développement

DuckDB + dbplyr : quand votre pipeline donne des résultats différents à chaque exécution

TL;DR ? L’essentiel en une phrase : DuckDB parallélise l’exécution des requêtes et ne garantit jamais l’ordre des lignes sans ORDER BY explicite. Si une étape de votre pipeline dépend de l’ordre, row_number(), cumsum(), lag(), distinct(.keep_all = TRUE), jointures par inégalité, vous produisez silencieusement des résultats non reproductibles. Cet article présente les quatre patterns qui font mal et comment les ...