RAG-архитектура против галлюцинаций ИИ: как работает первый в России доверенный поисковик для врачей и фармацевтов
на главную спецпроекта
Digital Generation
Digital Generation
RAG-архитектура против галлюцинаций ИИ: как работает первый в России доверенный поисковик для врачей и фармацевтов

Утоляем голод врачей по профессиональным знаниям. И никаких ИИ-выдумок в меню.

E-mail
Телефон
Имя
CAPTCHA

Автор:



Денис Вязников,
генеральный директор RX CODE

Представьте картину: врач в перерыве между приёмами открывает браузер, вводит запрос «лечение крапивницы при низком гемоглобине» и получает пять статей с рекламой БАДов, два устаревших протокола из 2010 года, три коммерческих сайта клиник и в конце — что-то похожее на клинические рекомендации. На проверку каждой ссылки — минимум 5 минут. А у него 7 минут до следующего пациента.

Это не выдуманная ситуация. Это ежедневная реальность сотен тысяч российских врачей, которые в эпоху информационного изобилия фактически страдают от профессионального цифрового голода.

Внедрение искусственного интеллекта в профессиональные сферы — уже не тренд, а необходимость. Однако в таких чувствительных областях, как медицина, каждая ошибка системы может иметь критические последствия. Одна из ключевых проблем современных языковых моделей — так называемые «галлюцинации»: генерация правдоподобной, но фактически неверной или непроверенной информации. Именно эта проблема стала главным барьером на пути внедрения ИИ-инструментов в повседневную практику врачей.

Для медицинского сообщества вопрос доступа к точным, актуальным и проверенным данным — вопрос профессиональной ответственности и качества оказания помощи. Врач, ищущий информацию о редком диагнозе, схеме лечения или взаимодействии препаратов, не может позволить себе тратить время на верификацию каждого факта, сгенерированного нейросетью. Ему нужен ответ, основанный на клинических рекомендациях, научных публикациях, протоколах — и с чёткой ссылкой на источник.

Почему «умного» поиска недостаточно для фармы

Публичные языковые модели обучаются на огромных массивах интернет-данных, где научная информация соседствует с рекламой, блогами, устаревшими статьями и непроверенными мнениями. ИИ учится предсказывать следующее слово в последовательности, опираясь на статистические закономерности, а не на истинность утверждений.

Результат — убедительно звучащие, но иногда фатально ошибочные ответы по медицинской тематике. Несмотря на технологический прогресс и интеграцию онлайн-поиска, доля ложных утверждений в ответах нейросетей выросла с 18 до 35%.

Попытки тонкой настройки (fine-tuning) моделей на медицинских текстах частично решают проблему, но не гарантируют актуальности: медицина стремительно развивается, и модель, обученная на данных двухлетней давности, может устареть. Кроме того, такие модели остаются «чёрным ящиком»: непонятно, на каких именно источниках основан ответ, и можно ли этим источникам доверять.

Технология, которая «приземляет» ИИ: Retrieval-Augmented Generation (RAG)

Именно здесь на первый план выходит архитектура RAG (Retrieval-Augmented Generation — извлечение с усилением генерации). Это не просто ещё одна модель, а принципиально иной подход к построению интеллектуальных ассистентов.

Как это работает?

  1. Извлечение (Retrieval): когда пользователь задаёт вопрос, система не начинает сразу генерировать ответ. Вместо этого она обращается к специально подготовленной, курируемой и постоянно обновляемой базе знаний. Это могут быть клинические рекомендации Минздрава, авторитетные медицинские журналы, учебники, инструкции к препаратам, материалы конференций. Система находит в этой базе релевантные документы и фрагменты текстов, наиболее точно соответствующие запросу.

  2. Усиление (Augmentation): найденные проверенные фрагменты усиливают контекст, в котором работает модель. Они служат её временной, точной и авторитетной «памятью» для данного конкретного запроса. Без этого этапа модель вынуждена генерировать ответ только из своих обобщённых, потенциально устаревших знаний.

  3. Генерация (Generation): найденные проверенные фрагменты передаются языковой модели в качестве контекста и основы для формирования ответа. Модель не «выдумывает» факты, а структурирует, обобщает и адаптирует под запрос пользователя ту информацию, которая уже прошла экспертный отбор.

Ключевые преимущества RAG для медицины

Борьба с галлюцинациями: ответ привязан к конкретным источникам, что радикально снижает риск «сочинительства».

Актуальность: базу знаний можно обновлять ежедневно, включая самые свежие исследования и протоколы. Модель всегда оперирует последними данными.

Прозрачность и доверие: система может и должна показывать, на основании каких документов сформирован ответ, предоставляя ссылки и цитаты. Это критически важно для принятия врачебных решений.

Контроль качества: эксперты могут влиять не на «мозги» модели, а на содержимое базы знаний, гарантируя её достоверность.

Российский кейс: экосистема для профессионального сообщества

Практическим воплощением RAG-подхода в России стала разработка профессиональной цифровой экосистемы МедИнтернет, представленная в 2025 году. Этот проект интересен не просто как ещё один ИИ-поисковик, а как целостное решение системной проблемы информационного шума в профессиональной среде.

Исследования (например, совместный проект агентства RX CODE и порталов для врачей в октябре 2025 года) показали, что лишь 20% медицинских специалистов могут быстро найти нужную информацию. Более 40% оценивают уровень доверия к информации из открытого интернета как низкий, главными раздражителями называя рекламу и отсутствие ссылок на доказательную базу.

МедИнтернет построен вокруг RAG-поисковика с функцией web-поиска по ограниченным ресурсам. Пополнение базы знаний данными от фармацевтических компаний происходит после верификации и при методологической поддержке Сеченовского Университета. Это важный момент: для борьбы с галлюцинациями недостаточно просто применить технологию. Нужна экспертиза в формировании и верификации самой базы знаний, в разработке методик контроля качества ответов. Участие ведущего медицинского вуза стало ключевым фактором для формирования доверия со стороны профессионального сообщества.

Недоверие к ИИ в медицине чаще всего связано именно с источниками информации. Международные данные это подтверждают: по исследованию The 2025 Physicians AI Report (Offcall), 81% врачей недовольны тем, как ИИ внедряется в клиниках, а 71% не участвуют в выборе ИИ-инструментов и в итоге используют личные аккаунты универсальных ИИ без контроля качества источников.

В МедИнтернет эта проблема решена архитектурно. ИИ-поисковик работает на базе RAG-технологии (проверенная база знаний). Но в отличии от существующих ИИ-агентов поисковик так же имеет web-поиск, обращаясь только к проверенным медицинским источникам с высокой доказательной базой: PubMed, Cochrane, Harvard Medical School, официальные ресурсы Минздрава и другим источникам доказательной медицины. Это позволяет максимально оперативно добавлять в ответы самые свежие данные.

Дополнительно формирование ответов происходит через специализированную медицинскую (обученную на огромном массиве медицинских знаний и регулярно обновляемую) нейросеть, а сами ответы верифицируются и пользователями и далее специалистами Сеченовского университета.

Что особенно важно, экосистема задумана не как пассивный инструмент, а как среда соучастия. Специалисты могут корректировать базу знаний, участвовать в оценке и ранжировании контента, создавать собственные материалы. Таким образом, RAG-архитектура здесь работает в связке с человеческим экспертным сообществом, создавая цикл постоянного улучшения и валидации информации.

image1.jpg

Ключевой вывод для маркетологов: в сложных профессиональных сегментах на смену универсальным ИИ приходят доверенные специализированные решения, где ценность создаёт не «вау»-эффект, а верифицируемость данных (например, через RAG-архитектуру) и глубокое партнёрство с экспертами. Успешный продукт — это целая экосистема, решающая смежные задачи пользователя, а RAG становится стратегией снижения рисков в ответственных отраслях. Будущее — за отраслевыми «доверенными экосистемами», где цена ошибки высока, а ценность точного знания критична.