Darmowy szablon automatyzacji

RAG: Kontekstowe dzielenie na fragmenty | Google Drive do Pinecone przez OpenRouter i Gemini

5923

7 mies. temu

bloków

Opis automatyzacji w n8n

Ta automatyzacja w n8n służy do wydobywania, przetwarzania i przechowywania treści z dokumentów w magazynie wektorowym Pinecone z wykorzystaniem chunkingu opartego na kontekście. Workflow poprawia dokładność wyszukiwania w systemach RAG (Retrieval-Augmented Generation), zapewniając, że każdy fragment zachowuje znaczący kontekst.

Szczegóły workflow

Google Drive - Pobieranie dokumentu

Automatyzacja rozpoczyna się od pobrania dokumentu źródłowego z Google Drive. Dokument zawiera ustrukturyzowaną treść z wcześniej zdefiniowanymi znacznikami granic sekcji.

Ekstrakcja treści tekstowej

Po pobraniu dokumentu, jego tekst jest wyodrębniany do przetworzenia. Specjalne znaczniki granic sekcji służą do podziału tekstu na logiczne części.

Węzeł Code - Tworzenie chunków opartych na kontekście

Niestandardowy węzeł kodu przetwarza wyodrębniony tekst, identyfikując granice sekcji i dzieląc dokument na znaczące fragmenty. Każdy fragment jest strukturyzowany tak, aby zachować kontekst w całym dokumencie.

Węzeł Loop - Przetwarzanie każdego chunka

Workflow przechodzi przez każdy fragment w pętli, zapewniając ich indywidualne przetworzenie przy zachowaniu powiązania z ogólnym kontekstem dokumentu.

Węzeł Agent - Generowanie kontekstu dla każdego chunka

Używamy węzła Agent z wykorzystaniem OpenAI GPT-4.0-mini przez OpenRouter do generowania metadanych kontekstowych dla każdego fragmentu, co poprawia dokładność wyszukiwania.

Dodawanie kontekstu do chunków i tworzenie embeddingów

Wygenerowany kontekst jest dołączany do oryginalnego fragmentu, tworząc bogate w kontekst embeddingi, które poprawiają możliwości wyszukiwania.

Google Gemini - Tekstowe embeddingi

Przetworzony tekst jest przekazywany przez Google Gemini text-embedding-004, który konwertuje tekst na reprezentacje wektorowe.

Pinecone Vector Store - Przechowywanie embeddingów

Ostateczne embeddingi wraz z wzbogaconą treścią fragmentów i metadanymi są przechowywane w Pinecone, co ułatwia ich późniejsze wyszukiwanie w aplikacjach opartych na RAG.

Przykłady zastosowań

Ta automatyzacja znacząco poprawia efektywność systemów RAG, zapewniając bardziej trafne odpowiedzi AI. Jest idealna dla aplikacji wymagających zaawansowanego przetwarzania dokumentów i inteligentnego wyszukiwania.

Semantyczne wyszukiwanie w dużych zbiorach dokumentów
Zarządzanie wiedzą wspomagane sztuczną inteligencją
Inteligentne systemy obsługi dokumentów prawnych
Automatyzacja badań naukowych i analiz
Systemy pomocy technicznej z AI
Personalizowane rekomendacje treści
Automatyzacja procesów edukacyjnych i szkoleniowych

Inne możliwości automatyzacji

Zautomatyzuj ankiety CSAT za pomocą Freshdesk i przechowuj odpowiedzi w Arkuszach Google

Zarządzanie Kalendarzem Google z uwzględnieniem kontekstu przy użyciu protokołu MCP

Przepływ pracy eksportu wiadomości e-mail z Gmaila do Dysku Google

Dynamiczny router modelu AI do optymalizacji zapytań z OpenRouter

Posty na LinkedIn generowane przez AI z OpenAI, Arkuszami Google i przepływem pracy zatwierdzania wiadomości e-mail

Generuj faktury, zapisuj na dysku i wysyłaj e-maile do klientów za pomocą JS + G Sheets

Generuj artykuły bazy wiedzy za pomocą GPT i Perplexity AI dla Contentful CMS

Wyodrębnij i zapisz dane faktur z Dysku Google do Arkuszy za pomocą Dumpling AI

Wyślij motywujące cytaty do Slacka

Spersonalizowany biuletyn technologii AI wykorzystujący RSS, OpenAI i Gmail

Generator obrazów AI z tekstu zbudowany na fal.ai

GPT-4o – Dumpling AI i agent LangChain - GPT-4o – Dumpling AI i agent LangChain

1 2 3 … 30 Następne »

Skopiuj kod szablonu

cpde
Javascript
JS
Python
Script
Custom Code
Function
LangChain
Chat
Conversational
Plan and Execute
ReAct
Tools

RAG: Kontekstowe dzielenie na fragmenty | Google Drive do Pinecone przez OpenRouter i Gemini

Opis automatyzacji w n8n

Szczegóły workflow

Google Drive - Pobieranie dokumentu

Ekstrakcja treści tekstowej

Węzeł Code - Tworzenie chunków opartych na kontekście

Węzeł Loop - Przetwarzanie każdego chunka

Węzeł Agent - Generowanie kontekstu dla każdego chunka

Dodawanie kontekstu do chunków i tworzenie embeddingów

Google Gemini - Tekstowe embeddingi

Pinecone Vector Store - Przechowywanie embeddingów

Przykłady zastosowań

Bądź na bieżąco z AI

Inne możliwości automatyzacji

Pozostałe

AI w biznesie

OpenAI

AI w analizie danych

AI w automatyzacji

Etyka AI

AI i praca zdalna

Sztuczna inteligencja w marketingu

Agent AI

AI w zdrowiu i medycynie

AI on-device

AI w cyberbezpieczeństwie

Generowanie treści AI

Microsoft AI

AI w nauce

AI w automatyzacji biura

AI w finansach

Chatboty

AI w robotyce

Google DeepMind