Własna wyszukiwarka RAG dla filmów z YouTube
Chcesz zbudować własną wyszukiwarkę RAG dla filmów z YouTube? Teraz możesz! Ten szablon n8n pokazuje, jak stworzyć wydajną wyszukiwarkę YouTube, wykorzystującą Apify, Qdrant i wybrany model językowy (LLM), aby szybko i efektywnie przeszukiwać wiele filmów w celach badawczych.
Jak to działa
Proces składa się z dwóch głównych etapów:
- Etap 1: Pobieranie transkrypcji filmów z YouTube i umieszczanie ich w bazie danych wektorowej. W tym przypadku wykorzystano Apify do scrapowania YouTube i Qdrant do przechowywania osadzeń (embeddings). Transkrypcje są dzielone na mniejsze fragmenty i opatrzone metadanymi, aby ułatwić późniejsze wyszukiwanie i filtrowanie.
- Etap 2: Budowa interfejsu webowego umożliwiającego użytkownikom przeszukiwanie zwektoryzowanych transkrypcji. Wykorzystano webhook do obsługi prostej aplikacji webowej i API, które dynamicznie pobiera wyniki. Wyszukiwanie wykorzystuje funkcję grupowania wyników Qdrant, która w tym przypadku działa lepiej, zwracając szerszy zakres wyników.
Jak używać
- Po skonfigurowaniu wszystkich wymaganych poświadczeń, uruchom kroki 1-3, aby wypełnić magazyn wektorowy danymi.
- Następnie aktywuj workflow, aby udostępnić interfejs webowy. Odwiedź URL webhooka w przeglądarce, aby z niego korzystać.
- Jeśli korzystasz z szablonu tylko do użytku osobistego, możesz usunąć mechanizm ograniczania liczby żądań w kroku 4.
Wymagania
- Apify do scrapowania kanałów i filmów na YouTube
- Qdrant jako magazyn wektorowy
- OpenAI do modeli językowych i generowania osadzeń
Dostosowywanie szablonu
- Nie interesują Cię filmy z oficjalnego kanału n8n? Możesz zmienić kanał na dowolny inny - szablon będzie działał pod warunkiem, że filmy nie są prywatne lub zablokowane przed osadzaniem.
- Technicznie każdy magazyn wektorowy powinien działać, ale może nie oferować tej samej funkcjonalności grupowania wyników. W takim przypadku możesz użyć prostego węzła magazynu wektorowego i wrócić do podstawowego wyszukiwania.
Przykłady zastosowań
Ta automatyzacja może być wykorzystana w wielu różnych scenariuszach, takich jak:
- Badania rynkowe - szybkie przeszukiwanie treści konkurencji
- Edukacja - wyszukiwanie konkretnych fragmentów wykładów lub tutoriali
- Dziennikarstwo - weryfikacja faktów i szukanie wypowiedzi w materiałach wideo
- Tworzenie treści - wyszukiwanie inspiracji w istniejących materiałach
- Nauka języków - analiza transkrypcji w obcym języku
- Customer support - szybkie znajdowanie odpowiedzi w materiałach instruktażowych
- Analiza trendów - śledzenie pojawiających się tematów w określonych niszach