<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Ollama |</title><link>https://aretascodes.dev/de/tags/ollama/</link><atom:link href="https://aretascodes.dev/de/tags/ollama/index.xml" rel="self" type="application/rss+xml"/><description>Ollama</description><generator>HugoBlox Kit (https://hugoblox.com)</generator><language>de-DE</language><lastBuildDate>Wed, 03 Jun 2026 00:00:00 +0000</lastBuildDate><image><url>https://aretascodes.dev/media/icon_hu_2ab4f4763b27c75b.png</url><title>Ollama</title><link>https://aretascodes.dev/de/tags/ollama/</link></image><item><title>Teil 3 · CogniVault Architektur: Warum wir Ollama nicht in Docker packen</title><link>https://aretascodes.dev/de/blog/cognivault-deployment-architecture/</link><pubDate>Wed, 03 Jun 2026 00:00:00 +0000</pubDate><guid>https://aretascodes.dev/de/blog/cognivault-deployment-architecture/</guid><description>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6"&gt;
&lt;p&gt;Alle Abkürzungen werden im Anhang am Ende der Seite ausführlich erklärt.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;Die goldene Regel für modernes Software-Deployment heißt Containerisierung. Pack alles in Docker, um die Abhängigkeiten zu isolieren, und es läuft auf jeder Maschine absolut identisch.&lt;/p&gt;
&lt;p&gt;Als ich CogniVault anfangs entworfen habe, war der erste Impuls, den FastAPI-Server, die PostgreSQL-Datenbank und die Ollama LLM-Engine in ein einziges, sicheres Docker-Netzwerk zu stecken.&lt;/p&gt;
&lt;p&gt;Aber das haben wir nicht getan. Wir haben Ollama nativ auf dem Host-System laufen lassen. Schauen wir uns mal an, warum.&lt;/p&gt;
&lt;h2 id="das-gpu-passthrough-problem"&gt;Das GPU-Passthrough-Problem&lt;/h2&gt;
&lt;p&gt;Stell dir deine GPU wie die Küche in einem Restaurant vor. Die Köche (deine KI-Modelle) müssen &lt;em&gt;in der Küche&lt;/em&gt; sein — am Herd stehen, die Hände an den Geräten. Stell dir nun vor, du sagst den Köchen, sie müssten aus einem verschlossenen Konferenzraum am Ende des Flurs kochen und Anweisungen durch eine Durchreiche rufen. Technisch gesehen kommt vielleicht immer noch Essen heraus. Aber es wird nicht schnell gehen.&lt;/p&gt;
&lt;p&gt;Dieser verschlossene Raum ist ein Container. Large Language Models wie Gemma 4 brauchen direkten, ungehinderten Zugriff auf die GPU deiner Hardware (wie Apple Silicons Unified Memory oder eine dedizierte Nvidia-Karte), um Text schnell genug für ein Echtzeit-Chat-Interface zu generieren. Und die Situation ist je nach Plattform unterschiedlich:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Auf macOS&lt;/strong&gt; lässt Docker Container in einer ressourcenschonenden virtuellen Maschine laufen — und es gibt aktuell &lt;strong&gt;überhaupt kein GPU (Metal) Passthrough&lt;/strong&gt;. Ein Ollama-Container auf einem Mac läuft also nur über die CPU. Für eine Chat-App ist das an sich schon ein K.o.-Kriterium.&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Unter Linux&lt;/strong&gt; gibt es Nvidia GPU-Passthrough und es funktioniert auch, aber es erfordert zusätzliche Toolkit-Konfiguration, die die &amp;ldquo;es funktioniert einfach&amp;rdquo;-Philosophie der lokalen Entwicklung zunichte macht.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Wenn man Ollama nativ laufen lässt, umgeht man diese ganze Kategorie von Problemen.&lt;/p&gt;
&lt;h2 id="die-brückenlösung"&gt;Die Brückenlösung&lt;/h2&gt;
&lt;p&gt;CogniVault verwendet ein geteiltes Deployment-Modell, das die Anwendungslogik von der rechenintensiven KI-Verarbeitung trennt.&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;Die sicheren Räume (Docker):&lt;/strong&gt; PostgreSQL — wo das DBOS-Workflow-Ledger aus
liegt — befindet sich in einem &lt;strong&gt;Docker Bridge Network&lt;/strong&gt; (einem privaten virtuellen Netzwerk). Isoliert, sauber, reproduzierbar.&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Das Hauptgebäude (Nativer Host):&lt;/strong&gt; Ollama läuft direkt auf deinem Mac-, Windows- oder Linux-Betriebssystem und hat so direkten Zugriff auf deine GPU.&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;CogniVault wird tatsächlich mit &lt;strong&gt;zwei Ausführungsmodi&lt;/strong&gt; ausgeliefert, und es lohnt sich, hier genau zu sein:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Der Standardmodus (&lt;code&gt;scripts/start.sh&lt;/code&gt;):&lt;/strong&gt; Nur PostgreSQL läuft in Docker. Das FastAPI-Backend läuft ebenfalls nativ (&lt;code&gt;python -m backend.main&lt;/code&gt;), direkt neben Ollama. Das ist der einfachste Loop für die lokale Entwicklung.&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Der vollcontainerisierte Modus (&lt;code&gt;docker-compose.yaml&lt;/code&gt;):&lt;/strong&gt; Die FastAPI-App gesellt sich zu Postgres ins Compose-Netzwerk. In diesem Modus erreicht der App-Container die native Ollama-Engine über eine spezielle Docker-Routing-Adresse: &lt;code&gt;host.docker.internal:11434&lt;/code&gt;.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;So oder so bleibt die Regel die gleiche: &lt;strong&gt;Das Modell kommt niemals in die Box.&lt;/strong&gt;&lt;/p&gt;
&lt;div class="mermaid"&gt;graph TD
Client[📱 Browser / Nutzer] --&gt;|HTTP: 8000| App
subgraph HostMachine ["Host-OS: Nativer GPU-Zugriff"]
Ollama[🧠 Ollama Engine]
Models[(gemma4:e4b)]
Ollama &lt;--&gt; Models
subgraph DockerNetzwerk ["Docker Compose Netzwerk"]
App[🖥️ FastAPI App Container]
Postgres[(🐘 PostgreSQL)]
App &lt;--&gt;|Interner Port 5432| Postgres
end
App &lt;--&gt;|host.docker.internal:11434| Ollama
end
&lt;/div&gt;
&lt;h3 id="was-ist-mit-der-vektor-datenbank"&gt;Was ist mit der Vektor-Datenbank?&lt;/h3&gt;
&lt;p&gt;Dir fällt vielleicht auf, dass FAISS hier kein Container ist. Im Gegensatz zu massiven SQL-Datenbanken ist FAISS extrem leichtgewichtig. In CogniVault läuft FAISS direkt im Speicher des FastAPI-Python-Prozesses und speichert seine Daten in einem lokalen Ordner. Es braucht keinen eigenen Container.&lt;/p&gt;
&lt;p&gt;Indem wir die schwere LLM-Arbeit direkt auf der Hardware (Bare-Metal) erledigen und die Buchhaltung in Containern belassen, erreichen wir genau die Balance, an der die lokale KI-Entwicklung so oft scheitert: null Abhängigkeitskonflikte kombiniert mit maximaler KI-Performance.&lt;/p&gt;
&lt;hr&gt;
&lt;h3 id="erlebe-es-in-aktion"&gt;Erlebe es in Aktion&lt;/h3&gt;
&lt;p&gt;Das schließt unsere CogniVault-Architekturserie ab! Wenn du diesen zu 100% lokalen, datenschutzfreundlichen Lernbegleiter auf deiner eigenen Hardware ausführen möchtest:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Hol dir den Code:&lt;/strong&gt;
&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Schau dir das Walkthrough an:&lt;/strong&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;hr&gt;
&lt;h2 id="anhang-abkürzungen-in-diesem-beitrag"&gt;Anhang: Abkürzungen in diesem Beitrag&lt;/h2&gt;
&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Abbreviation&lt;/th&gt;
&lt;th&gt;Full form&lt;/th&gt;
&lt;th&gt;Meaning&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;GPU&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Graphics Processing Unit&lt;/td&gt;
&lt;td&gt;Die Hardware, die lokale Modell-Inferenz schnell macht; Container haben Probleme, darauf zuzugreifen&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;LLM&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Large Language Model&lt;/td&gt;
&lt;td&gt;Ein auf riesigen Textmengen trainiertes neuronales Netzwerk, das Sprache lesen und erzeugen kann&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;AI&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Artificial Intelligence&lt;/td&gt;
&lt;td&gt;Software, die Aufgaben ausführt, für die normalerweise menschliche Intelligenz erforderlich ist&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;API&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Application Programming Interface&lt;/td&gt;
&lt;td&gt;Die URLs, die das Frontend aufruft, um mit dem Backend zu kommunizieren&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;HTTP&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;HyperText Transfer Protocol&lt;/td&gt;
&lt;td&gt;Das Protokoll, mit dem Browser und APIs Anfragen und Antworten austauschen&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;OS&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Operating System&lt;/td&gt;
&lt;td&gt;macOS, Windows oder Linux — wo Ollama nativ läuft&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;DBOS&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Database-Oriented Operating System&lt;/td&gt;
&lt;td&gt;Die Durable-Workflow-Bibliothek, deren Ledger im Postgres-Container liegt (siehe Teil 2)&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;SQL&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Structured Query Language&lt;/td&gt;
&lt;td&gt;Die Sprache relationaler Datenbanken wie PostgreSQL&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;FAISS&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Facebook AI Similarity Search&lt;/td&gt;
&lt;td&gt;Der In-Process-Vektorindex — absichtlich &lt;em&gt;kein&lt;/em&gt; separater Container&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;VM&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Virtual Machine&lt;/td&gt;
&lt;td&gt;Die versteckte Schicht, die Docker auf macOS nutzt — und der Grund, warum Mac-Container die GPU nicht erreichen können&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;</description></item><item><title>Teil 1 · Warum ich ein Local-First RAG gebaut habe</title><link>https://aretascodes.dev/de/blog/why-local-first-rag/</link><pubDate>Mon, 20 Apr 2026 00:00:00 +0000</pubDate><guid>https://aretascodes.dev/de/blog/why-local-first-rag/</guid><description>
&lt;blockquote class="border-l-4 border-neutral-300 dark:border-neutral-600 pl-4 italic text-neutral-600 dark:text-neutral-400 my-6"&gt;
&lt;p&gt;Alle Abkürzungen werden vollständig im Anhang am Ende der Seite erklärt.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;Ich habe die letzten paar Jahre vor virtuellen Klassen voller Quereinsteiger in Deutschland verbracht und ihnen die Grundlagen des Programmierens, der Webentwicklung und Einführungskurse in KI nähergebracht. Ein Großteil der Informationen, mit denen wir zu tun haben, kann man problemlos in Cloud-basierte KI-Tools kopieren. Einiges davon aber definitiv nicht.&lt;/p&gt;
&lt;p&gt;Prüfungsmaterialien, die der Geheimhaltung unterliegen. Das Portfolio eines Trainees mit persönlichen Details. Andere private Dokumente, die niemals das Modell von jemand anderem trainieren sollten.&lt;/p&gt;
&lt;p&gt;Also habe ich
gebaut — ein komplett lokales KI-Lern- und Produktivitäts-Tool. Keine Cloud. Keine Telemetrie. Kein &amp;ldquo;Wir könnten diese Daten verwenden, um unseren Service zu verbessern&amp;rdquo;. Einfach nur Gemma 4, das auf Ollama auf meinem Laptop läuft und mit meinen Dateien spricht.&lt;/p&gt;
&lt;h2 id="die-undichte-abstraktion"&gt;Die undichte Abstraktion&lt;/h2&gt;
&lt;p&gt;Der Pitch für Cloud-KIs ist großartig: ein riesiges Modell, sofort verfügbar, abgerechnet nach Token. Das Kleingedruckte ist der Teil, an dem es unbequem wird:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Wo genau liegen die Daten physisch während der Inferenz?&lt;/li&gt;
&lt;li&gt;Welcher Gerichtsbarkeit unterliegt diese Hardware heute Nachmittag?&lt;/li&gt;
&lt;li&gt;Endet der &lt;em&gt;Audit Trail&lt;/em&gt; an der API-Grenze, oder kannst du wirklich nachverfolgen, was mit deinen Bytes passiert ist?&lt;/li&gt;
&lt;li&gt;Wenn du das Häkchen bei &amp;ldquo;Nicht mit meinen Daten trainieren&amp;rdquo; setzt, vertraust du dann auf ein technisches Kontrollsystem, einen Vertrag oder beides?&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Für die meisten Consumer-Use-Cases kann man diese Fragen getrost wegwinken. Für &lt;strong&gt;Bildung, Gesundheitswesen, Finanzen, Recht, öffentliche Verwaltung&lt;/strong&gt; ist die Antwort &amp;ldquo;Vertrau uns&amp;rdquo; einfach keine Antwort.&lt;/p&gt;
&lt;h2 id="was-local-first-hier-tatsächlich-bedeutet"&gt;Was &amp;ldquo;Local-First&amp;rdquo; hier tatsächlich bedeutet&lt;/h2&gt;
&lt;p&gt;Viele Produkte nennen sich &amp;ldquo;privat&amp;rdquo;. Ich wollte drei handfeste Eigenschaften:&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;Das Modell lebt auf deiner Maschine.&lt;/strong&gt; Gemma 4 (&lt;code&gt;gemma4:e4b&lt;/code&gt;) und &lt;code&gt;embeddinggemma&lt;/code&gt; werden via Ollama gezogen. Die Inferenz ist ein lokaler HTTP-Aufruf auf localhost.&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Deine Dokumente verlassen deinen Rechner niemals.&lt;/strong&gt; Vektoren, Chunks, Chat-Historie, Lernsessions, Achievements — alles bleibt auf der Festplatte deines Computers.&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Du kannst es &lt;em&gt;überprüfen&lt;/em&gt;.&lt;/strong&gt; Gemma CogniVault bringt ein &lt;strong&gt;Privacy Audit Panel&lt;/strong&gt; mit, das live einen &amp;ldquo;Null externe Verbindungen&amp;rdquo;-Indikator neben der Dokumentenanzahl und dem Ollama-Host anzeigt. Das ist kein Versprechen — das ist ein Statuslämpchen.&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;Wenn ein zukünftiger Build von Gemma CogniVault jemals einen ausgehenden Anruf nach Hause machen würde, würde dieses Panel als erstes Alarm schlagen.&lt;/p&gt;
&lt;h2 id="was-du-dafür-bekommst"&gt;Was du dafür bekommst&lt;/h2&gt;
&lt;p&gt;Auf lokal zu wechseln klingt nach einem Kompromiss — verliert man nicht die Magie der gigantischen Frontier-Modelle? In der Praxis hast du mit &lt;strong&gt;Gemma 4&lt;/strong&gt; mehr als genug:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Thinking-Modus&lt;/strong&gt; — Die Chain-of-Thought von Gemma 4 streamt in ein ausklappbares Panel, bevor die Antwort kommt. Dem Modell beim Nachdenken über deine Dokumente zuzusehen, ist ein wirklich nützliches Lehrmittel.&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Tool-Nutzung&lt;/strong&gt; — Über das
entscheidet das Modell, wann es die Knowledge Base durchsuchen, ein Dokument zusammenfassen, zwei Dateien vergleichen oder die Uhrzeit checken soll.&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Vision&lt;/strong&gt; — Hänge Bilder und PDFs direkt in den Chat an.&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Generierung, die wirklich strukturiert ist&lt;/strong&gt; — Quizzes, Multi-Lektionen-Workshops, Karteikarten-Decks und interaktive Mindmaps, die mit &lt;code&gt;format=&amp;quot;json&amp;quot;&lt;/code&gt; generiert werden, sodass der Output zuverlässig geparst werden kann.&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Cognivault versucht nicht, ein riesiges Ökosystem zu sein. Es ist ein Single-Purpose-Tool, das eine Sache richtig gut macht: deine eigenen Dokumente mit einem fähigen lokalen Modell in einer privaten Umgebung nutzen. Ich muss zugeben, dass es stark von
inspiriert wurde, was ich unglaublich nützlich, aber für meine Zwecke einfach nicht privat genug fand.&lt;/p&gt;
&lt;h2 id="der-aufbau-der-app"&gt;Der Aufbau der App&lt;/h2&gt;
&lt;p&gt;CogniVault ist in vier Bereiche unterteilt, die abbilden, wie ich tatsächlich mit Informationen auf Cloud-basierten KI-Tools arbeite:&lt;/p&gt;
&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Bereich&lt;/th&gt;
&lt;th&gt;Wofür es da ist&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;Chat&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Frag alles über deine Dokumente. Zitierte Antworten, Scope-Filter, Spracheingabe.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;Knowledge Base&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Hochladen, kategorisieren, verwalten. SHA-256 erkennt Bearbeitungen beim erneuten Upload.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;Study Hub&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Quiz · Workshop · Flashcards · Mindmaps — vier Wege, tiefer in die Quelle einzusteigen.&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;Dashboard&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Gesamte Lernzeit, Streak, 25 Badges, GitHub-Style 90-Tage-Heatmap.&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;Alles ist über eine Sidebar erreichbar, die sich merkt, wo du aufgehört hast, auf einem Tech-Stack, der in deinen &lt;code&gt;~/Documents&lt;/code&gt;-Ordner passt.&lt;/p&gt;
&lt;h2 id="was-als-nächstes-kommt"&gt;Was als Nächstes kommt&lt;/h2&gt;
&lt;p&gt;Das hier ist der Start einer kurzen Serie. In den nächsten Posts werde ich genauer auf die Teile eingehen, auf die ich am stolzesten bin — und ein paar, die ich beim nächsten Mal anders bauen würde:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Hybrides Retrieval&lt;/strong&gt; — Warum FAISS &lt;em&gt;und&lt;/em&gt; BM25, zusammengeführt mit Reciprocal Rank Fusion&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Zwei-Phasen-Streaming&lt;/strong&gt; mit Gemma 4 und Strands Agents&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Crash-resistente Ingestion&lt;/strong&gt; mit DBOS, Hash-bewusster Re-Ingest, OCR-Fallback&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Zuverlässiges JSON&lt;/strong&gt; aus einem lokalen LLM bekommen (und was man tut, wenn es fehlschlägt)&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Der Mindmap-Renderer&lt;/strong&gt; — Was ich beim handgeschriebenen SVG gelernt habe und warum v2 React Flow nutzt&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Lernen gamifizieren&lt;/strong&gt; — 25 Badges, Idle-Gap-Sessions, 90-Tage-Heatmap&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Eine lokale KI-App testen&lt;/strong&gt; mit über 350 Tests und komplett ohne Infrastruktur&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Wenn du schon mal reinschauen willst, der Code ist Open Source auf
, und es gibt einen
.&lt;/p&gt;
&lt;p&gt;Deine Daten. Deine Hardware. Deine KI. Dein Vault.&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="anhang-abkürzungen-in-diesem-post"&gt;Anhang: Abkürzungen in diesem Post&lt;/h2&gt;
&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;Abkürzung&lt;/th&gt;
&lt;th&gt;Volle Form&lt;/th&gt;
&lt;th&gt;Bedeutung&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;RAG&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Retrieval-Augmented Generation&lt;/td&gt;
&lt;td&gt;Relevante Passagen aus deinen Dokumenten abrufen; das Modell antwortet basierend darauf statt aus dem Trainingsgedächtnis&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;AI&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Artificial Intelligence&lt;/td&gt;
&lt;td&gt;Software, die Aufgaben ausführt, für die normalerweise menschliche Intelligenz erforderlich ist&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;LLM&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Large Language Model&lt;/td&gt;
&lt;td&gt;Ein neuronales Netz, das mit riesigen Mengen an Text trainiert wurde und Sprache lesen sowie generieren kann&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;HTTP&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;HyperText Transfer Protocol&lt;/td&gt;
&lt;td&gt;Das Protokoll, das Browser und APIs nutzen, um Requests und Responses auszutauschen&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;API&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Application Programming Interface&lt;/td&gt;
&lt;td&gt;Die Grenze, an der du Software von jemand anderem aufrufst — und an der Cloud-Audit-Trails enden&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;IHK&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Industrie- und Handelskammer&lt;/td&gt;
&lt;td&gt;Die Institution, die in Deutschland unter anderem die Ausbildereignungsprüfung durchführt&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;AEVO&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Ausbildereignungsverordnung&lt;/td&gt;
&lt;td&gt;Das Prüfungsmaterial in Deutschland, das den Anstoß für dieses Projekt gab&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;FAISS&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Facebook AI Similarity Search&lt;/td&gt;
&lt;td&gt;Metas Vektorsuch-Bibliothek (Thema im nächsten Post)&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;BM25&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Best Match 25&lt;/td&gt;
&lt;td&gt;Eine klassische Keyword-Ranking-Formel (ebenfalls im nächsten Post)&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;SDK&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Software Development Kit&lt;/td&gt;
&lt;td&gt;Eine Sammlung von Bausteinen — hier Strands, das die Agenten-Loop bereitstellt&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;JSON&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;JavaScript Object Notation&lt;/td&gt;
&lt;td&gt;Das universelle Textformat für strukturierte Daten&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;PDF&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Portable Document Format&lt;/td&gt;
&lt;td&gt;Eines der über acht Dateiformate, die CogniVault verarbeitet&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;SHA-256&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Secure Hash Algorithm, 256-bit&lt;/td&gt;
&lt;td&gt;Ein inhaltlicher Fingerabdruck, um bearbeitete Dateien beim erneuten Upload zu erkennen&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;OCR&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Optical Character Recognition&lt;/td&gt;
&lt;td&gt;Bilder von Text (Scans) in maschinenlesbaren Text verwandeln&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;DBOS&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Database-Oriented Operating System&lt;/td&gt;
&lt;td&gt;Die Bibliothek für durable Workflows, die hinter der crash-resistenten Ingestion steckt&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;&lt;strong&gt;SVG&lt;/strong&gt;&lt;/td&gt;
&lt;td&gt;Scalable Vector Graphics&lt;/td&gt;
&lt;td&gt;Das im Browser eingebaute Format fürs Vektorzeichnen&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;</description></item></channel></rss>