Интерактивный онлайн-семинар по архитектуре RAG
Основная концепция, архитектура, компоненты RAG системы
Методы эмбеддингов, Sentence Transformers, модели
FAISS, HNSW, Annoy - сравнение алгоритмов
Recall@k, Precision@k, оценка RAG систем
Базовый RAG-конвейер, примеры кода
Интеграция с YandexGPT, эмбеддинги, API
RAG (Retrieval-Augmented Generation) — гибридная архитектура, объединяющая механизмы поиска с генеративными языковыми моделями.
Проблема:
LLM склонны к галлюцинациям и не имеют доступа к актуальной информации
Решение:
Внешние источники знаний + генеративная модель = точные и обоснованные ответы
документы → чанки → эмбеддинги → векторная БД
запрос → поиск → контекст → LLM → ответ
Алгоритм | Скорость | Память | Точность | Сжатие | GPU |
---|---|---|---|---|---|
HNSW | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ❌ | ❌ |
FAISS | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ✅ | ✅ |
Annoy | ⭐⭐ | ⭐⭐ | ⭐⭐⭐ | ❌ | ❌ |
Hierarchical Navigable Small World
Facebook AI Similarity Search
Approximate Nearest neighbors Oh Yeah
Доля релевантных документов среди топ-k результатов
Точность среди топ-k результатов
Mean Reciprocal Rank - обратный ранг первого релевантного результата
Релевантность ответа запросу
Отсутствие галлюцинаций относительно контекста
Релевантность извлеченного контекста
💡 Совет: Измените код ниже и нажмите "Запустить" для экспериментов!
Проверьте, насколько хорошо вы усвоили материал семинара. 5 вопросов о ключевых концепциях RAG.
Лучший выбор для сложных RAG задач с длинным контекстом
Сбалансированное решение для большинства RAG применений
Быстрые ответы для простых RAG запросов
Количество документов для контекста
Токенов на чанк
Ваш Folder ID из Yandex Cloud
Код будет сгенерирован здесь
Настройте параметры слева и нажмите "Сгенерировать код"
Выполните сгенерированный код с реальными данными (без моков)
Ваш Folder ID из Yandex Cloud
API ключ или IAM токен
🚀 Быстрый старт с Yandex Foundation Models
pip install yandexcloud
Совет: Начните с OpenAI Compatible API - это самый простой способ интеграции с существующими проектами.
Вы изучили основы RAG технологии и готовы применить знания на практике
Спасибо за участие в семинаре! Удачи в изучении RAG технологий 🚀