AI Engineering

Teil 5 · Zuverlässiges JSON aus einem lokalen LLM bekommen featured image

Teil 5 · Zuverlässiges JSON aus einem lokalen LLM bekommen

format="json" bringt dich 90% ans Ziel. Die anderen 10% sind nachgestellte Kommas, unerwartete Strukturen und Einträge, die fast, aber nicht ganz dem Schema entsprechen. Hier ist …

avatar
Ndimofor Aretas
Teil 4 · Crash-Resumable Ingestion: DBOS, SHA-256 und wie man ein kill -9 überlebt featured image

Teil 4 · Crash-Resumable Ingestion: DBOS, SHA-256 und wie man ein kill -9 überlebt

Ein 200-seitiges PDF jedes Mal neu einzubetten, wenn du einen Absatz anpasst, ist eine Strafe, die niemand zahlen will. Hier erfährst du, wie CogniVault DBOS-Workflows und …

avatar
Ndimofor Aretas
Teil 3 · Zwei-Phasen-Streaming: Zeigen, wie das Modell denkt, bevor es handelt featured image

Teil 3 · Zwei-Phasen-Streaming: Zeigen, wie das Modell denkt, bevor es handelt

Die meisten Agenten-UIs verbergen die Gedankengänge des Modells, bis alles fertig ist. CogniVault streamt zuerst die Chain-of-Thought von Gemma 4 und führt dann die Strands …

avatar
Ndimofor Aretas
Teil 2 · Hybrid Retrieval in der Praxis: FAISS + BM25, verschmolzen mit RRF featured image

Teil 2 · Hybrid Retrieval in der Praxis: FAISS + BM25, verschmolzen mit RRF

Dichte Vektoren sind schlau, aber vergesslich. Die Stichwortsuche ist dumm, aber loyal. Hier erfährst du, wie ich FAISS, BM25 und Reciprocal Rank Fusion in CogniVault kombiniert …

avatar
Ndimofor Aretas
Teil 1 · Warum ich ein Local-First RAG gebaut habe featured image

Teil 1 · Warum ich ein Local-First RAG gebaut habe

Cloud-KI-Assistenten sind mächtig — aber für Trainer, Researcher und alle, die mit sensiblem Material hantieren, sind sie auch eine undichte Abstraktion. Hier erfährst du, warum …

avatar
Ndimofor Aretas