KI-Agenten·RAG·Workflow-Automatisierung

Produktionsreife KI-Agenten für den Mittelstand.

Wir bauen produktionsreife Agenten-Systeme auf Basis eigener RAG-Architektur. DSGVO-konform, On-Premise-fähig und integriert in Ihre bestehenden Systeme. Für Mittelständler, die KI ernst nehmen.

01 · Das Problem

Unternehmenswissen liegt überall. Nur nicht dort, wo es gebraucht wird.

Dokumente in dutzenden Systemen: SharePoint, E-Mail, Fileserver, CRM, Wikis. Mitarbeitende verbringen Stunden am Tag mit Suchen und Nachfragen.

ChatGPT kennt Ihr Unternehmen nicht und darf oft nicht sehen, was intern liegt. Dazu scheitern Low-Code-Tools bei Enterprise-Anforderungen.

Die meisten RAG-Prototypen scheitern beim Sprung in Produktion:
an Chunking-Strategie, Retrieval-Qualität, Betriebsmodell. Genau hier setzen wir an.

03 · Unsere Architektur

Keine Blackbox. Kein Vendor Lock-in.

Wir setzen auf bewährte Open-Source-Technologien und offene Standards.

Next.js

Frontend Apps

React Native

Mobile Apps

Node.js

Backend Services

PostgreSQL + pgvector

Vector Database

Qdrant

Semantic Search

Kubernetes

Container Orchestration

Keycloak

Identity & Access Management

MS Graph API

Microsoft 365 Integration

rag-config.ts
1// RAG Pipeline Configuration
2export const ragConfig = {
3 "ai": {
4 "apiKey": "*****",
5 "llmModel": "mistral-medium-2508",
6 "provider": "mistral",
7 "textEmbeddingModel": "mistral-embed"
8 },
9 "rag": {
10 "chunking": {
11 "page": {
12 "boundaryMode": "PDF_META"
13 },
14 "semantic": {
15 "threshold": 0.72,
16 "windowTokens": 100
17 },
18 "strategy": "FIXED_TOKEN",
19 "proposition": {
20 "enabled": false,
21 "llmModel": "mistral-medium-2508",
22 "maxTokens": 4000,
23 "maxCostUsd": 0.25,
24 "costPer1kTokensUsd": 0.002
25 },
26 "docStructure": {
27 "headingLevels": [1, 2, 3],
28 "maxSectionTokens": 2000
29 },
30 "overlapTokens": 50,
31 "maxChunkTokens": 800,
32 "minChunkTokens": 200,
33 "targetChunkTokens": 512,
34 "overridesByDocType": {
35 "pdf": {
36 "strategy": "PAGE"
37 },
38 "markdown": {
39 "strategy": "DOC_STRUCTURE"
40 }
41 }
42 },
43 "provider": "pg-vector",
44 "retrieval": {
45 "strategyFilter": "CONFIGURED",
46 "maxContextTokens": 2200,
47 "adaptiveContextBudget": {
48 "enabled": true,
49 "maxChunksCap": 20,
50 "targetContextTokens": 2000
51 }
52 }
53 },
54 "objectStorage": {
55 "ssl": "false",
56 "url": "*****",
57 "port": "9000",
58 "provider": "s3",
59 "accessKey": "*****",
60 "secretKey": "*****",
61 "bucketName": "quikk-knowledge-engine"
62 }
63};

Beispiel einer RAG-Pipeline-Konfiguration

Bereit, Wissen in Aktion zu verwandeln?

Kontaktieren Sie uns für ein kostenloses 30-Minuten-Erstgespräch. Wir schauen uns Ihren Use Case an, bewerten die Machbarkeit und geben eine ehrliche Einschätzung.