{"id":9695,"date":"2024-12-19T10:44:35","date_gmt":"2024-12-19T08:44:35","guid":{"rendered":"https:\/\/staging.artiquare.com\/praktische-schritte-zur-verbesserung-von-rag-pipelines\/"},"modified":"2024-12-19T11:35:48","modified_gmt":"2024-12-19T09:35:48","slug":"praktische-schritte-zur-verbesserung-von-rag-pipelines","status":"publish","type":"post","link":"https:\/\/www.artiquare.com\/de\/praktische-schritte-zur-verbesserung-von-rag-pipelines\/","title":{"rendered":"Praktische Schritte zur \u00dcberwindung der RAG-Beschr\u00e4nkungen"},"content":{"rendered":"<p><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-padding-right:20px;--awb-padding-left:20px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:1372.8px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:1.92%;--awb-margin-bottom-large:20px;--awb-spacing-left-large:1.92%;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:1.92%;--awb-spacing-left-medium:1.92%;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:1.92%;--awb-spacing-left-small:1.92%;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-1\" style=\"--awb-content-alignment:left;\"><p data-pm-slice=\"1 1 &#091;&#093;\">Retrieval-Augmented Generation (RAG) ist zu einem unverzichtbaren Werkzeug f\u00fcr Unternehmen geworden, die das Potenzial von unstrukturiertem Wissen erschlie\u00dfen wollen. Durch die Kombination von Retrieval mit generativer KI erm\u00f6glichen RAG-Systeme Unternehmen die Beantwortung komplexer Anfragen, die Zusammenfassung umfangreicher Daten und die Bereitstellung kontextrelevanter Erkenntnisse. Trotz ihrer vielversprechenden M\u00f6glichkeiten sind die RAG-Pipelines jedoch oft unzureichend, da sie in den Phasen der Abfrage, der Erweiterung und der Generierung an ihre Grenzen sto\u00dfen.  <\/p>\n<p>In diesem Beitrag stellen wir dir praktische Schritte vor, mit denen du g\u00e4ngige RAG-Herausforderungen meistern und robuste Pipelines aufbauen kannst, die die Grenzen von RAG \u00fcberwinden. Diese grundlegenden Techniken &#8211; die Diversifizierung des Retrievals, die Kombination von semantischer und Stichwortsuche und das Reranking &#8211; sollen dir helfen, die Leistung deines RAG-Systems zu optimieren. Diese RAG-Optimierungstechniken bieten schnelle, kosteneffiziente und wirkungsvolle L\u00f6sungen, die auch mit kleineren Modellen zug\u00e4nglich sind. Wenn du tiefer in die technischen Details eintauchen willst, schau dir das begleitende <a href=\"https:\/\/youtu.be\/T5YPpQVuuGE?feature=shared&amp;t=1943\" target=\"_blank\" rel=\"noopener\">Workshop-Video<\/a> und das <a href=\"https:\/\/github.com\/artiquare\/mastering_rag_workshop\" target=\"_blank\" rel=\"noopener\">GitHub-Repository<\/a> an.<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-2 fusion-flex-container has-pattern-background has-mask-background nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:5%;--awb-margin-bottom:5%;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:1372.8px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-1 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:20px;--awb-spacing-right-large:1.92%;--awb-margin-bottom-large:20px;--awb-spacing-left-large:1.92%;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:1.92%;--awb-spacing-left-medium:1.92%;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:1.92%;--awb-spacing-left-small:1.92%;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-1 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-top:15px;--awb-margin-bottom:25px;--awb-margin-top-small:12px;--awb-margin-right-small:0px;--awb-margin-bottom-small:24px;--awb-margin-left-small:0px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:54;line-height:1.14;\"><p data-pm-slice=\"1 1 &#091;&#093;\">Herausforderungen in RAG-Pipelines<\/p><\/h2><\/div><div class=\"fusion-text fusion-text-2 fusion-text-no-margin\" style=\"--awb-content-alignment:left;--awb-margin-top:15px;--awb-margin-bottom:15px;\"><p data-pm-slice=\"1 1 &#091;&#093;\">RAG-Pipelines sind nur so stark wie ihre schw\u00e4chste Phase. Obwohl ihre innovative Architektur Abruf und Erzeugung kombiniert, sto\u00dfen naive Implementierungen oft auf gro\u00dfe Herausforderungen: <\/p>\n<ul data-spread=\"false\">\n<li><strong>Probleme bei der Datenbeschaffung<\/strong>: Irrelevante, redundante oder unvollst\u00e4ndige Daten, die mit einfachen Methoden abgerufen werden.<\/li>\n<li><strong>Erweiterungsl\u00fccken<\/strong>: Schlechte kontextuelle Anpassung, die Rohdaten und differenzierte Abfragen nicht miteinander verbindet.<\/li>\n<li><strong>Unzul\u00e4nglichkeiten bei der Erzeugung<\/strong>: Irref\u00fchrende, unvollst\u00e4ndige oder kontextbezogene Ergebnisse, die durch fehlerhafte Eingaben verursacht werden.<\/li>\n<\/ul>\n<p>Die Folgen dieser Einschr\u00e4nkungen ziehen sich durch die gesamte Unternehmenslandschaft und f\u00fchren zu langsameren Entscheidungen, geringerer Kundenzufriedenheit und verpassten Compliance-Anforderungen. Die Bew\u00e4ltigung dieser Herausforderungen beginnt mit der Verfeinerung der Abruf- und Erweiterungsphasen, den grundlegenden Schichten eines jeden RAG-Systems.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-1 hover-type-none\" style=\"border-radius:8px;\"><img decoding=\"async\" width=\"768\" height=\"430\" alt=\"retrieval augemneted generation rag\" title=\"retrieval-augemneted-generation\" src=\"https:\/\/www.artiquare.com\/wp-content\/uploads\/2023\/10\/retrieval-augemneted-generation.webp\" data-orig-src=\"https:\/\/www.artiquare.com\/wp-content\/uploads\/2023\/10\/retrieval-augemneted-generation.webp\" class=\"lazyload img-responsive wp-image-7060\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27768%27%20height%3D%27430%27%20viewBox%3D%270%200%20768%20430%27%3E%3Crect%20width%3D%27768%27%20height%3D%27430%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artiquare.com\/wp-content\/uploads\/2023\/10\/retrieval-augemneted-generation-200x112.webp 200w, https:\/\/www.artiquare.com\/wp-content\/uploads\/2023\/10\/retrieval-augemneted-generation-400x224.webp 400w, https:\/\/www.artiquare.com\/wp-content\/uploads\/2023\/10\/retrieval-augemneted-generation-600x336.webp 600w, https:\/\/www.artiquare.com\/wp-content\/uploads\/2023\/10\/retrieval-augemneted-generation.webp 768w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 768px\" \/><\/span><\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-3 fusion-flex-container has-pattern-background has-mask-background nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:5%;--awb-margin-bottom:5%;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:1372.8px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-2 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:20px;--awb-spacing-right-large:1.92%;--awb-margin-bottom-large:20px;--awb-spacing-left-large:1.92%;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:1.92%;--awb-spacing-left-medium:1.92%;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:1.92%;--awb-spacing-left-small:1.92%;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-2 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-top:15px;--awb-margin-bottom:25px;--awb-margin-top-small:12px;--awb-margin-right-small:0px;--awb-margin-bottom-small:24px;--awb-margin-left-small:0px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:54;line-height:1.14;\"><p data-pm-slice=\"1 1 &#091;&#093;\">Praktische Schritte zur \u00dcberwindung der RAG-Beschr\u00e4nkungen<\/p><\/h2><\/div><div class=\"fusion-text fusion-text-3 fusion-text-no-margin\" style=\"--awb-content-alignment:left;--awb-margin-top:15px;--awb-margin-bottom:15px;\"><h4 data-pm-slice=\"1 1 &#091;&#093;\"><strong>Schritt 1: Diversifizierung der Abfrageergebnisse mit MMR<\/strong><\/h4>\n<p>Maximal Marginal Relevance (MMR) ist eine Technik, die ein Gleichgewicht zwischen Relevanz und Vielfalt in den abgerufenen Dokumenten herstellt. Indem sie eine \u00fcberm\u00e4\u00dfige \u00c4hnlichkeit zwischen den Ergebnissen vermeidet, stellt MMR sicher, dass deine Pipeline ein breiteres Spektrum an n\u00fctzlichen Informationen erfasst. <\/p>\n<ul data-spread=\"false\">\n<li><strong>Wie es funktioniert<\/strong>: MMR ordnet Dokumente nicht nur nach ihrer Relevanz f\u00fcr die Suchanfrage ein, sondern auch nach ihrer Neuheit im Vergleich zu bereits ausgew\u00e4hlten Dokumenten.<\/li>\n<li><strong>Praktische Auswirkungen<\/strong>: Reduziert die Redundanz in den abgerufenen Dokumenten und verbessert so die Gesamtqualit\u00e4t des abgerufenen Kontexts.<\/li>\n<\/ul>\n<h4><strong>Schritt 2: Kombiniere semantische und stichwortbasierte Suche mit Hybrid Retrieval<\/strong><\/h4>\n<p>Hybrid Retrieval kombiniert zwei leistungsstarke Methoden: BM25 f\u00fcr schlagwortbasierte Relevanz und Embeddings f\u00fcr semantische \u00c4hnlichkeit. Diese Kombination stellt sicher, dass deine Pipeline Dokumente findet, die sowohl topisch relevant als auch kontextuell reichhaltig sind. <\/p>\n<ul data-spread=\"false\">\n<li><strong>So funktioniert es<\/strong>: BM25 bewertet Dokumente auf der Grundlage von exakten Term\u00fcbereinstimmungen, w\u00e4hrend Einbettungen tiefere Beziehungen durch Vektor\u00e4hnlichkeit erfassen.<\/li>\n<li><strong>Praktische Auswirkungen<\/strong>: Erh\u00f6ht die Treffergenauigkeit durch die Erfassung von dom\u00e4nenspezifischer Terminologie und breiterer kontextueller Relevanz.<\/li>\n<\/ul>\n<h4><strong>Schritt 3: Priorisiere Top-Ergebnisse mit Reranking<\/strong><\/h4>\n<p>Beim Reranking werden fortschrittliche maschinelle Lernmodelle, wie z.B. Cross-Encoder, eingesetzt, um die abgerufenen Dokumente auf der Grundlage ihrer kontextuellen Relevanz neu zu ordnen. Dieser Schritt konzentriert sich darauf, die wichtigsten Dokumente an die Spitze zu bringen. <\/p>\n<ul data-spread=\"false\">\n<li><strong>So funktioniert es<\/strong>: Ein Cross-Encoder bewertet die Beziehung zwischen der Anfrage und jedem Dokument und vergibt eine Relevanzbewertung.<\/li>\n<li><strong>Praktische Auswirkungen<\/strong>: Stellt sicher, dass die besten Ergebnisse die wertvollsten f\u00fcr die Beantwortung komplexer Abfragen sind, reduziert das Rauschen und verbessert die Genauigkeit.<\/li>\n<\/ul>\n<p>Durch die Integration dieser drei Schritte k\u00f6nnen RAG-Pipelines die Herausforderungen beim Retrieval direkt angehen und die Grundlage f\u00fcr eine bessere Augmentation und Generierung legen.<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-4 fusion-flex-container has-pattern-background has-mask-background nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:5%;--awb-margin-bottom:5%;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:1372.8px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-3 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:20px;--awb-spacing-right-large:1.92%;--awb-margin-bottom-large:20px;--awb-spacing-left-large:1.92%;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:1.92%;--awb-spacing-left-medium:1.92%;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:1.92%;--awb-spacing-left-small:1.92%;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-3 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-top:15px;--awb-margin-bottom:25px;--awb-margin-top-small:12px;--awb-margin-right-small:0px;--awb-margin-bottom-small:24px;--awb-margin-left-small:0px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:54;line-height:1.14;\">Warum diese Schritte wichtig sind<\/h2><\/div><div class=\"fusion-text fusion-text-4 fusion-text-no-margin\" style=\"--awb-content-alignment:left;--awb-margin-top:15px;--awb-margin-bottom:15px;\"><p data-pm-slice=\"1 1 &#091;&#093;\">Diese praktischen Verfeinerungen sind einfach, aber sehr effektiv. Im Gegensatz zu fortschrittlichen Generierungstechniken, die erhebliche Rechenressourcen erfordern, ist die Verbesserung des Abrufs kosteneffizient und skalierbar. Unternehmen, die kleinere Modelle verwenden, k\u00f6nnen mit diesen Schritten pr\u00e4zise und zuverl\u00e4ssige Ergebnisse liefern, ohne die bestehende Infrastruktur zu \u00fcberholen.  <\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-5 fusion-flex-container has-pattern-background has-mask-background nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:5%;--awb-margin-bottom:5%;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:1372.8px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-4 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:20px;--awb-spacing-right-large:1.92%;--awb-margin-bottom-large:20px;--awb-spacing-left-large:1.92%;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:1.92%;--awb-spacing-left-medium:1.92%;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:1.92%;--awb-spacing-left-small:1.92%;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-4 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-top:15px;--awb-margin-bottom:25px;--awb-margin-top-small:12px;--awb-margin-right-small:0px;--awb-margin-bottom-small:24px;--awb-margin-left-small:0px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:54;line-height:1.14;\">Fallstudie: Workshop-Rekapitulation<\/h2><\/div><div class=\"fusion-text fusion-text-5 fusion-text-no-margin\" style=\"--awb-content-alignment:left;--awb-margin-top:15px;--awb-margin-bottom:15px;\"><p>Auf unserem letzten Workshop haben wir gezeigt, wie diese grundlegenden Techniken die Leistung von RAG verbessern. Anhand eines 7-Milliarden-Parameter-Modells haben wir eine RAG-Pipeline optimiert, um reale Transformatorenspezifikationen zu verarbeiten. Durch die Verbesserung der Suchvielfalt, die Kombination hybrider Methoden und das Reranking der Ergebnisse lieferte die Pipeline pr\u00e4zise und kontextgenaue Antworten &#8211; trotz der Beschr\u00e4nkungen des kleineren Modells. Das folgende Diagramm gibt einen \u00dcberblick \u00fcber die Pipeline-Architektur, die wir w\u00e4hrend des Workshops verwendet haben:<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h5_typography-font-family);--awb-caption-title-font-weight:var(--h5_typography-font-weight);--awb-caption-title-font-style:var(--h5_typography-font-style);--awb-caption-title-size:var(--h5_typography-font-size);--awb-caption-title-transform:var(--h5_typography-text-transform);--awb-caption-title-line-height:var(--h5_typography-line-height);--awb-caption-title-letter-spacing:var(--h5_typography-letter-spacing);\"><span class=\" fusion-imageframe imageframe-none imageframe-2 hover-type-none\" style=\"border-radius:8px;\"><img decoding=\"async\" width=\"632\" height=\"484\" alt=\"QA Chain zeigt, wie man die RAG-Beschr\u00e4nkungen \u00fcberwindet\" title=\"qa_chain_flowchart\" src=\"https:\/\/www.artiquare.com\/wp-content\/uploads\/2024\/12\/qa_chain_flowchart.webp\" data-orig-src=\"https:\/\/www.artiquare.com\/wp-content\/uploads\/2024\/12\/qa_chain_flowchart.webp\" class=\"lazyload img-responsive wp-image-9677\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27632%27%20height%3D%27484%27%20viewBox%3D%270%200%20632%20484%27%3E%3Crect%20width%3D%27632%27%20height%3D%27484%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artiquare.com\/wp-content\/uploads\/2024\/12\/qa_chain_flowchart-200x153.webp 200w, https:\/\/www.artiquare.com\/wp-content\/uploads\/2024\/12\/qa_chain_flowchart-400x306.webp 400w, https:\/\/www.artiquare.com\/wp-content\/uploads\/2024\/12\/qa_chain_flowchart-600x459.webp 600w, https:\/\/www.artiquare.com\/wp-content\/uploads\/2024\/12\/qa_chain_flowchart.webp 632w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 632px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-6 fusion-text-no-margin\" style=\"--awb-content-alignment:left;--awb-margin-top:15px;--awb-margin-bottom:15px;\"><p><strong>Erl\u00e4uterung des Diagramms<\/strong>:<\/p>\n<ul>\n<li><strong>Dokumentenverarbeitung<\/strong>: Rohdokumente (z. B. PDF- oder HTML-Dateien) werden gechunked und zur Speicherung in eine Vektordatenbank eingebettet.<\/li>\n<li><strong>Abrufverfahren<\/strong>: Wenn ein Nutzer eine Anfrage stellt, werden relevante Chunks mit Techniken wie MMR, Hybrid Retrieval und Reranking abgerufen.<\/li>\n<li><strong>Generierungsphase<\/strong>: Der ermittelte Kontext wird zusammen mit der Abfrage an die QA-Kette weitergeleitet, um mithilfe des Sprachmodells Antworten zu generieren.<\/li>\n<li><strong>Zus\u00e4tzliche Komponenten<\/strong>:\n<ul>\n<li>Der Pufferspeicher speichert den Chatverlauf f\u00fcr den Gespr\u00e4chskontext.<\/li>\n<li>Die QS-Kette verwendet eine anpassbare Prompt-Vorlage, um die Eingaben f\u00fcr das Modell zu formatieren.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/div><div class=\"fusion-text fusion-text-7 fusion-text-no-margin\" style=\"--awb-content-alignment:left;--awb-margin-top:15px;--awb-margin-bottom:15px;\"><p>Eine der wichtigsten Erkenntnisse aus unserem Workshop war, dass RAG-Pipelines nur so stark sind wie ihre schw\u00e4chste Phase. Die Optimierung des Abrufs und der Erweiterung bildet eine solide Grundlage f\u00fcr genaue und verl\u00e4ssliche Ergebnisse, selbst wenn kleinere Modelle verwendet werden. <\/p>\n<h4><strong>Die wichtigsten Erkenntnisse aus dem Workshop<\/strong>:<\/h4>\n<ol>\n<li><strong>Herausforderungen in der RAG<\/strong>:\n<ul>\n<li>Abrufen von irrelevanten, redundanten oder unvollst\u00e4ndigen Daten.<\/li>\n<li>Schlechte Kontextualisierung der abgerufenen Informationen.<\/li>\n<li>Sie erzeugen unvollst\u00e4ndige oder irref\u00fchrende Ergebnisse.<\/li>\n<\/ul>\n<\/li>\n<li><strong>Pipeline-Optimierung<\/strong>:\n<ul>\n<li>Verbesserungen in der Einbettungs- und Abrufphase sind einfacher, kosteng\u00fcnstiger und sehr wirkungsvoll.<\/li>\n<li>Wir haben unter anderem folgende Techniken untersucht:\n<ul>\n<li><strong>MMR<\/strong>: Diversifiziert die Abfrageergebnisse.<\/li>\n<li><strong>Hybrid Retrieval<\/strong>: Kombiniert Suchbegriffsrelevanz mit semantischer \u00c4hnlichkeit f\u00fcr eine bessere Genauigkeit.<\/li>\n<li><strong>Reranking<\/strong>: Hebt die relevantesten Inhalte f\u00fcr mehr Pr\u00e4zision an.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<li><strong>Gelernte Lektionen<\/strong>:\n<ul>\n<li>Die Qualit\u00e4t des Abrufs ist die Grundlage f\u00fcr den Erfolg der RAG.<\/li>\n<li>Inkrementelle Optimierungen f\u00fchren zu erheblichen Gewinnen.<\/li>\n<li>Die Kombination von Strategien verbessert sowohl die Relevanz als auch die Genauigkeit der Ergebnisse.<\/li>\n<li>Optimierte Pipelines erm\u00f6glichen es kleineren Modellen, auf effiziente Weise pr\u00e4zise, kontextbezogene Antworten zu liefern.<\/li>\n<\/ul>\n<\/li>\n<\/ol>\n<p>F\u00fcr eine praktische Demonstration kannst du dir das <a href=\"https:\/\/youtu.be\/T5YPpQVuuGE?feature=shared&amp;t=1943\" target=\"_blank\" rel=\"noopener\">Workshop-Video<\/a> ansehen oder das <a href=\"https:\/\/github.com\/artiquare\/mastering_rag_workshop\" rel=\"noopener\" target=\"_blank\">GitHub-Repository<\/a> mit dem gesamten Code und den Beispielen erkunden.<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-6 fusion-flex-container has-pattern-background has-mask-background nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:5%;--awb-margin-bottom:5%;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:1372.8px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-5 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:20px;--awb-spacing-right-large:1.92%;--awb-margin-bottom-large:20px;--awb-spacing-left-large:1.92%;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:1.92%;--awb-spacing-left-medium:1.92%;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:1.92%;--awb-spacing-left-small:1.92%;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-5 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-top:15px;--awb-margin-bottom:25px;--awb-margin-top-small:12px;--awb-margin-right-small:0px;--awb-margin-bottom-small:24px;--awb-margin-left-small:0px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:54;line-height:1.14;\">Ausblick auf zuk\u00fcnftige Techniken<\/h2><\/div><div class=\"fusion-text fusion-text-8 fusion-text-no-margin\" style=\"--awb-content-alignment:left;--awb-margin-top:15px;--awb-margin-bottom:15px;\"><p data-pm-slice=\"1 1 &#091;&#093;\">W\u00e4hrend die hier behandelten Schritte eine solide Grundlage bilden, ist die RAG-Optimierung eine kontinuierliche Reise. Fortgeschrittene Techniken wie Query Rewriting, Reflective RAG und agentische RAG-Systeme versprechen noch gr\u00f6\u00dfere Verbesserungen bei der Bearbeitung komplexer Abfragen und dynamischer Kontexte. Bleib dran f\u00fcr zuk\u00fcnftige Beitr\u00e4ge, in denen wir uns mit diesen innovativen Ans\u00e4tzen besch\u00e4ftigen werden.  <\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-7 fusion-flex-container has-pattern-background has-mask-background nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:5%;--awb-margin-bottom:5%;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:1372.8px;margin-left: calc(-4% \/ 2 );margin-right: calc(-4% \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-6 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:20px;--awb-spacing-right-large:1.92%;--awb-margin-bottom-large:20px;--awb-spacing-left-large:1.92%;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:1.92%;--awb-spacing-left-medium:1.92%;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:1.92%;--awb-spacing-left-small:1.92%;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-6 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-top:15px;--awb-margin-bottom:25px;--awb-margin-top-small:12px;--awb-margin-right-small:0px;--awb-margin-bottom-small:24px;--awb-margin-left-small:0px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:54;line-height:1.14;\"><p data-pm-slice=\"1 1 &#091;&#093;\">Fazit<\/p><\/h2><\/div><div class=\"fusion-text fusion-text-9 fusion-text-no-margin\" style=\"--awb-content-alignment:left;--awb-margin-top:15px;--awb-margin-bottom:15px;\"><p data-pm-slice=\"1 1 &#091;&#093;\">Die Optimierung von RAG-Pipelines muss nicht \u00fcberw\u00e4ltigend sein. Indem sie mit einfachen Schritten wie MMR, Hybrid Retrieval und Reranking beginnen, k\u00f6nnen Unternehmen die Leistung ihrer Systeme erheblich steigern. Diese Verbesserungen sind nicht nur kosteneffizient, sondern bringen auch messbare gesch\u00e4ftliche Vorteile in Bezug auf Genauigkeit, Geschwindigkeit und Kundenzufriedenheit.  <\/p>\n<p>Schau dir das <a href=\"https:\/\/youtu.be\/T5YPpQVuuGE?feature=shared&amp;t=1943\" target=\"_blank\" rel=\"noopener\">Workshop-Video<\/a> und das <a href=\"https:\/\/github.com\/artiquare\/mastering_rag_workshop\" target=\"_blank\" rel=\"noopener\">GitHub-Repository<\/a> an, um den n\u00e4chsten Schritt beim Aufbau einer robusten RAG-Pipeline f\u00fcr dein Unternehmen zu machen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-7 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-top:15px;--awb-margin-bottom:25px;--awb-margin-top-small:12px;--awb-margin-right-small:0px;--awb-margin-bottom-small:24px;--awb-margin-left-small:0px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:54;line-height:1.14;\"><p data-pm-slice=\"1 1 &#091;&#093;\">Danksagung<\/p><\/h2><\/div><div class=\"fusion-text fusion-text-10\"><p>Dieser Workshop wurde in Zusammenarbeit mit <a href=\"https:\/\/www.ki-park.de\" target=\"_new\" rel=\"noopener\">KI Park<\/a> organisiert, wo wir praktische Schritte zur Optimierung von RAG-Pipelines untersuchten. Unser besonderer Dank gilt KI Park f\u00fcr die Organization der Veranstaltung und die Bereitstellung des Videos auf ihrem Kanal. Der Workshop beinhaltete auch eine aufschlussreiche Session \u00fcber Multimodale RAG-Techniken, die von Taras Hnot von <a href=\"https:\/\/www.softserveinc.com\/de-de\" target=\"_blank\" rel=\"noopener\">SoftServe<\/a> pr\u00e4sentiert wurde. Sein Fachwissen \u00fcber die Kombination von Retrieval mit multimodalen F\u00e4higkeiten vermittelte einen umfassenden Einblick in das Potenzial von RAG in verschiedenen Anwendungen.<\/p>\n<\/div><\/div><\/div><\/div><\/div><\/p>\n","protected":false},"excerpt":{"rendered":"","protected":false},"author":1,"featured_media":9693,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"content-type":"","footnotes":""},"categories":[200,226,234],"tags":[320,243,230,319],"class_list":["post-9695","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-generative-ki","category-llms-de","category-rag-de","tag-abruf-erweiterte-erzeugung","tag-fortgeschrittene-lappen-techniken","tag-rag-de","tag-rag-pipeline-de"],"_links":{"self":[{"href":"https:\/\/www.artiquare.com\/de\/wp-json\/wp\/v2\/posts\/9695","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.artiquare.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.artiquare.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.artiquare.com\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.artiquare.com\/de\/wp-json\/wp\/v2\/comments?post=9695"}],"version-history":[{"count":2,"href":"https:\/\/www.artiquare.com\/de\/wp-json\/wp\/v2\/posts\/9695\/revisions"}],"predecessor-version":[{"id":9697,"href":"https:\/\/www.artiquare.com\/de\/wp-json\/wp\/v2\/posts\/9695\/revisions\/9697"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.artiquare.com\/de\/wp-json\/wp\/v2\/media\/9693"}],"wp:attachment":[{"href":"https:\/\/www.artiquare.com\/de\/wp-json\/wp\/v2\/media?parent=9695"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.artiquare.com\/de\/wp-json\/wp\/v2\/categories?post=9695"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.artiquare.com\/de\/wp-json\/wp\/v2\/tags?post=9695"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}