Вернуться в блог

RAG для бизнеса: как внедрение технологии помогает использовать корпоративные данные

RAG для бизнеса: как внедрение технологии помогает использовать корпоративные данные

RAG или Retrieval-Augmented Generation — это технология, помогающая радикально увеличить эффект от внедрения ИИ в бизнес и повысить точность ответов LLM. Что это, как работает, и главное — в чем польза для бизнеса, разобрался в этой статье. Как обычно, я буду приводить множество реальных примеров. Поехали!

Внедрение ИИ и различная автоматизация бизнеса с помощью нейросетей идет полным ходом, но преимущественно в околоайтишных областях. Бизнес реального сектора пока раздумывает. Что ж, это вполне объяснимо.

Несмотря на всю мощь современных языковых моделей, таких как Claude, ChatGPT 5 и Gemini, проблема галлюцинаций все еще стоит довольно остро. Следовательно, доверять ИИ какие-то по-настоящему критичные задачи невозмо… 

Стоп! Вот в этот момент как раз и появляется технология RAG. Оказывается, именно использование RAG помогает направить бурную энергию нейросетей в конструктивное русло, заставив их, наконец, приносить пользу и не выдумывать отсебятину.

Что такое RAG простыми словами

Retrieval-Augmented Generation (RAG) — это подход, при котором искусственный интеллект отвечает на запрос, опираясь не на общие знания модели, полученные в ходе ее обучения, а на фактические документы, подключенные к модели: регламенты, отчеты, договоры, и даже историю переписки. 

И это многое меняет именно в контексте бизнес-применений.

Сегодня объем корпоративных данных растет экспоненциально, а требования к точности и скорости решений ужесточаются. В теории LLM способны многократно ускорить обработку данных, но на практике доля ошибочных ответов даже рассуждающих моделей составляет около 25%. А в частных случаях доля откровенного вранья достигает аж 79%! 

Казалось бы, это ставит крест на всех попытках внедрить ИИ в какие-то серьезные процессы. Как сказал мне недавно один руководитель производства: «Наши запросы требуют большей точности и человеческого внимания, чем может предложить нейросеть».

Однако RAG-система полностью переписывает эту историю. Ведь теперь весь вывод модели привязан к конкретным документам и опирается на них. Следовательно, любая галлюцинация или простая неточность немедленно удаляется из контекста и не попадает в окончательный ответ нейросети.

Что это значит на практике? Например, в производственных компаниях RAG помогает инженерам и техникам быстро находить инструкции и отчеты, уменьшая простои. Запрос на естественном языке дает точную цитату из регламентов с привязкой к текущему процессу, оборудованию, и даже рабочей смене (если ИИ был интегрирован с ERP-системой предприятия).

Промышленное приложение My Measurement Assistant+ компании ABB недавно обзавелось как раз таким ИИ-помощником на основе RAG.

Результат внедрения.

Или возьмем страхование. Здесь RAG ускоряет проверку полисов и урегулирование убытков, повышая качество обслуживания клиентов. Вместо длительных ручных проверок благонадежности, страховой агент просто вводит запрос в корпоративную LLM и мгновенно получает всю подноготную по клиенту. Без галлюцинаций, я подчеркиваю! К слову, про использование ИИ в страховании у нас в блоге был отдельный большой материал.

Lemonade — цифровая страховая компания, в которой заявки обрабатывает AI.

То же самое применимо для юридических отделов или отделов продаж практически любой организации. LLM, усиленная технологией RAG, моментально анализирует нормативные документы и судебную практику или данные о заказах из ERP, поддерживая соответствие требованиям и экономя время экспертов.

Как работает технология RAG

Технология RAG объединяет два ключевых механизма — извлечение информации (retrieval) и генерацию текста (generation). 

Когда пользователь формулирует запрос — например, «покажи актуальные правила страхования для клиентов малого бизнеса» или «каков порядок действий при остановке карусельного конвейера ROTOMATIC» система сначала обращается к корпоративным источникам — базе документов, политик, отчетов или инструкций — и находит релевантные фрагменты. Эти данные подаются модели искусственного интеллекта в качестве контекста для формирования ответа, тем самым изменяя (augment) процесс генерации модели.

Такой принцип решает проблему традиционных языковых моделей, ограниченных знаниями, полученными на этапе обучения. В RAG информация хранится вне модели и обновляется напрямую — достаточно добавить новые документы в индекс.

Архитектура RAG включает три компонента: 

  1. Хранилище данных (векторную базу или поисковый индекс).
  2. RAG-система, которая определяет наиболее подходящие документы под запрос.
  3. Генеративная модель, которая формирует итоговый ответ.

Упрощенная архитектура RAG. Точность ответов LLM обеспечивается через поиск соответствия в хранилище данных.

Что такое RAG-система? Это совокупность ретривера (retriever), реранкера (reranker) и генератора. 

Ретривер преобразует запрос пользователя в математический вектор с помощью модели встраивания (embedding model), сопоставляя его с индексированной базой знаний через семантическое сходство. Это позволяет находить в базе наиболее релевантные фрагменты информации на основе смысла запроса, а не только точных ключевых слов.

Как работает ретривер (RAG)

Реранкер оценивает и сортирует извлеченные результаты по релевантности запросу, прежде чем передать их генератору.

Генератор собирает из релевантных результатов контекст для LLM.

В корпоративной среде эти компоненты дополнительно обернуты в управляющие слои  — аутентификация, фильтрация по ролям, валидация источников, возможно, та или иная синхронизация с другими системами (CRM, ERP, логистика и т.д.).

Результат — система, способная не просто искать информацию, а формировать осмысленные, проверяемые и фактологически правильные ответы на основе актуальных данных организации.

Без RAG нейросеть не дает ответа или выдумывает его. После интеграции RAG нейросеть сверяется с базой данных (в данном случае — история переписки в корпоративном мессенджере или email) и находит релевантную информацию. Источник: NVIDIA

Точность ответа RAG-системы контролируется рядом метрик на этапе развертывания. Так, метрики faithfulness и relevance отвечают за точную передачу фактов и соответствие запросам пользователя. А метрики precision и recall измеряют полноту ответа на запрос.

100% точность, конечно, недостижима. Но уже сейчас RAG-системы дают в среднем более точные (и быстрые!) ответы, чем человек. Тем самым полностью закрывается возражение о неприменимости ИИ в реальных бизнес-процессах потому что он, дескать, ненадежен в ответах. Надежен.

И выгоден. Об этом расскажу прямо сейчас.

Улучшите свой продукт!

Мы в Siberian.pro сделали 220+ цифровых решений для бизнеса и будем рады помочь вам в улучшении или цифровизации компании

Ключевые выгоды от внедрения RAG для бизнеса

Снижение затрат

Внедрение RAG в бизнес снижает операционные расходы за счет автоматизации использования корпоративных данных. Вместо долгих ручных проверок — автоматическая обработка. Документы, инструкции и отчеты обрабатываются быстро, а сотрудник сразу получает готовый и точный ответ. Результат — экономия.

Например, разработчик крупнейшей CRM Salesforce недавно отчитался о годовой экономии в $100 млн. за счет внедрения ИИ в отдел работы с клиентами. В основе системы — технология RAG.

А Reddit сумел сократить среднее время разрешения вопросов в техподдержку на 84%, с девяти минут до полутора, что не только сократило операционные расходы, но и помогло увеличить лояльность рекламодателей.

Похожие результаты публикуют производитель напитков Pepsico, трэвел-агент Engine и многие другие компании.

Ускорение процессов

Помимо прямой экономии есть и косвенная: за счет сокращения времени от запроса до результата. Например, в производственном цехе инженеры смогут найти документацию к оборудованию почти мгновенно. Следовательно, обслуживание оборудования пройдет быстрее, а значит сократятся простои и финансовые потери.

Например, банк JP Morgan Chase разработал интеллектуального ассистента Ask David на основе RAG. Конкретные цифры не разглашаются, однако представители компании говорят не просто о значительном повышении скорости принятия решений, но даже о принятии их в реальном времени.

Пример работы RAG-системы в финансовом секторе. Источник: JPMorgan.

На картинке выше можно увидеть, что оператор уточняет у LLM причины закрытия фонда. Нейросеть же с помощью RAG анализирует доступную документацию и формулирует понятный ответ. На кону — миллиарды долларов, на секундочку! Это к вопросу о доверии AI-агентам.

В России аналогичную систему на основе RAG реализовал ПСБ.

Минимизация ошибок

Хотя руководители бизнеса пока опасаются внедрять ИИ из-за возможных ошибок, в действительности, ошибок при использовании RAG становится меньше. Благодаря RAG, искусственный интеллект всегда покажет актуальные данные, даст точные ссылки на регламенты, гарантирует соответствие требованиям регуляторов и т.д.

Когда речь заходит об ИИ в промышленности, обойтись без упоминания компании Siemens почему-то не получается. Система управления электрическим оборудованием Siemens Sm@rtGear® IE AI включает полноценный ИИ-ассистент с функциями RAG. 

Работает вот как. В систему можно загрузить произвольное число документов — PDF-спецификаций, документов Word, таблиц Excel, электрических схем, чертежей, а также презентаций и аудиозаписей. Затем можно задавать ИИ-агенту вопросы, общаясь с ним, как с обычной нейросетью.

Что это дает?

  • быстрое устранение неполадок на основе рекомендаций ИИ и технической документации;
  • извлечение знаний и семантический поиск по сотням технических документов одновременно;
  • обучение и онбординг персонала с помощью интерактивных Q&A-сессий на основе документов;
  • практическое руководство по осуществлению технического обслуживания через диалоговый ИИ-интерфейс;
  • анализ документов и составление кратких «выжимок» для быстрого доступа к информации;
  • гарантия соответствия технических процедур регламентам.

Похожие проекты есть у российской MWS AI, официальными партнерами которой является Siberian.pro.

Повышение производительности сотрудников

Внедрение ИИ в бизнес как таковое само по себе способно повысить производительность сотрудников. Например, у нас был кейс, когда мы в 4 раза увеличили производительность отдела, используя простой ИИ-инструмент. А RAG поднимает планку еще выше.

В результате юристы тратят меньше времени на поиск норм и прецедентов, инженеры — на изучение технических отчётов, страховые специалисты — на поиск справочной информации и т.д. Вместо нудной рутины —  более глубокий анализ и разумное принятие решений. 

Примеры:

Американская финтех компания Ramp внедрила внутреннюю систему классификации клиентов на основе технологии RAG. Скорость выполнения этой операции выросла, как и точность.

А Pinterest внедрила RAG в работу своих аналитиков. Раньше аналитики компании просто выбирали таблицы для анализа вручную и формировали промт для LLM.

Было так. Источник.

В целом система работала. Однако таблиц у такого монстра, как Pinterest, — тысячи. Выбрать из них нужные именно для этой конкретной аналитической задачи непросто. Даже опытные специалисты тратили на это много времени.

Стало так. Источник.

Компания внедрила архитектуру Retrieval-Augmented Generation и производительность сотрудников в подобных задачах выросла до 10 раз!

Похожее усиление работы своих аналитиков с помощью технологии RAG выполнила команда Юго-Восточного супераппа Grab. А Яндекс повышает производительность сотрудников поддержки своих (и чужих тоже) сервисов с помощью системы Neurosupport.

Заключение

Здесь я практически не касался технической стороны внедрения RAG в бизнес-процессы. Моя цель была в том, чтобы продемонстрировать, как внедрение RAG поможет бизнесу использовать корпоративные данные для решения самых разных задач. Если у вас остались вопросы, или вы увидели в приведенных примерах что-то, что было бы интересно реализовать в своей компании — напишите нам. Мы с радостью поможем воплотить ваши идеи.

Что ещё почитать по теме