🏆 X5 Tech Hack - алгоритм для детектировании аномалий в LLM

❓ Задача

Нам необходимо было разработать модель, которая будет классифировать тексты на две категории: корректный текст / текст с содержанием “галлюцинаций”. Это позволит избежать случаев дезинформации пользователя или предоставления ему некорректных результатов. Проблемой стали некоторые темы: город, года - которые мы обрабатываем специальным промтом и LLM.

🎉 Результат

🏆 Место: 5/40 место

Score:
F1 Micro: 0.95

📄 Данные

Данные представляют собой набор [текст документа] - [контекст] - [бинарная метка] (в обучающем множестве). Для тестового множества требуется по тексту документа и контексту определить метку документа. Из-за малого кол-ва данных мы сгененрировали синтетику благодрая Mixtral 8x22B, которая принесла + 0.02 F1 score.

📝 Решение: №1

В качестве классификатора мы используем microsoft/deberta-v3-base дообученный на галлюцинациях при суммаризации на английском языке. Базовая модель: vectara/hallucination_evaluation_model. Дообучалась на train выборке. F1-score - 0.92

📝 Решение: №2

Было замечено, что ошибки bert-like решения типовые и тематические и связаны с факт-чекингом. Для валидации фактов можно использовать RAG-подход: LLM и “контекст” вопроса.

ОДНАКО: из-за серверных проблем пайплайн не запускался. Score не был обсчитан. ЛОКАЛЬНО: увеличение F1_score с 0.92 до 0.97.
Алгоритм: 1) Проверка длинны ответа модели 2) Поиск дат в ответе модели c помощью regex 3) Поиск названий городов, стран в ответе модели благодаря NER через SlovNet 4.1) Передает в LLM вопросы с датами или NERами для фактчекинга, в зависимости от характера изменяется промт. 4.2) Передаем в DeBerta остальные вопросы длы быстрого ответа.

📝 LLM

SOTA-решения: использование LLM и банка знаний для фактчекинга;
Наше решение: saiga_llama3_8b_q4 с настраиваемым промтом;
Промт: проверка пары вопрос-ответ по контексту с уточнением “что именно” проверять;
Стек: llama.cpp

💡 Уникальность и Точки роста

Гибкость настройки 2) Простота масштабирования 3) Высокая точность: f1 score: 0.97 4) Универсальность: Пайплайн позволяет автоматически обрабатывать аномалии разных типов разными подходами.
Интеграция мощных LLM 2) Подключение “банка знаний” 3) Собственные NERы 4) Создание RESTful-API

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
classes		classes
data		data
image		image
llama_w		llama_w
seporator messages		seporator messages
vsevolo_de_bert		vsevolo_de_bert
.dockerignore		.dockerignore
.gitignore		.gitignore
Dockerfile		Dockerfile
LLM.py		LLM.py
README.md		README.md
city_detector.py		city_detector.py
make_prediction.py		make_prediction.py
pipeline.py		pipeline.py
requirements.txt		requirements.txt
seporator_messeges.py		seporator_messeges.py
vsevolo_de_bert.py		vsevolo_de_bert.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🏆 X5 Tech Hack - алгоритм для детектировании аномалий в LLM

❓ Задача

🎉 Результат

🏆 Место: 5/40 место

📄 Данные

📝 Решение: №1

📝 Решение: №2

📝 LLM

💡 Уникальность и Точки роста

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🏆 X5 Tech Hack - алгоритм для детектировании аномалий в LLM

❓ Задача

🎉 Результат

🏆 Место: 5/40 место

📄 Данные

📝 Решение: №1

📝 Решение: №2

📝 LLM

💡 Уникальность и Точки роста

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages