Нам необходимо было разработать модель, которая будет классифировать тексты на две категории: корректный текст / текст с содержанием “галлюцинаций”. Это позволит избежать случаев дезинформации пользователя или предоставления ему некорректных результатов. Проблемой стали некоторые темы: город, года - которые мы обрабатываем специальным промтом и LLM.
Score:
F1 Micro: 0.95
Данные представляют собой набор [текст документа] - [контекст] - [бинарная метка] (в обучающем множестве). Для тестового множества требуется по тексту документа и контексту определить метку документа. Из-за малого кол-ва данных мы сгененрировали синтетику благодрая Mixtral 8x22B, которая принесла + 0.02 F1 score.
В качестве классификатора мы используем microsoft/deberta-v3-base дообученный на галлюцинациях при суммаризации на английском языке. Базовая модель: vectara/hallucination_evaluation_model. Дообучалась на train выборке. F1-score - 0.92
Было замечено, что ошибки bert-like решения типовые и тематические и связаны с факт-чекингом. Для валидации фактов можно использовать RAG-подход: LLM и “контекст” вопроса.
ОДНАКО: из-за серверных проблем пайплайн не запускался. Score не был обсчитан.
ЛОКАЛЬНО: увеличение F1_score с 0.92 до 0.97.
Алгоритм: 1) Проверка длинны ответа модели 2) Поиск дат в ответе модели c помощью regex 3) Поиск названий городов, стран в ответе модели благодаря NER через SlovNet 4.1) Передает в LLM вопросы с датами или NERами для фактчекинга, в зависимости от характера изменяется промт. 4.2) Передаем в DeBerta остальные вопросы длы быстрого ответа.
SOTA-решения: использование LLM и банка знаний для фактчекинга;
Наше решение: saiga_llama3_8b_q4 с настраиваемым промтом;
Промт: проверка пары вопрос-ответ по контексту с уточнением “что именно” проверять;
Стек: llama.cpp
- Гибкость настройки 2) Простота масштабирования 3) Высокая точность: f1 score: 0.97 4) Универсальность: Пайплайн позволяет автоматически обрабатывать аномалии разных типов разными подходами.
- Интеграция мощных LLM 2) Подключение “банка знаний” 3) Собственные NERы 4) Создание RESTful-API