- Участвовать можно с опытом и без.
- Индивидуально или в команде (до 4 человек).

🏆 Абсолютный победитель — 2 000 000 ₸
📚 Лучший по блоку OCR — 1 500 000 ₸
🧠 Лучший по блоку Advanced Retrieval — 1 000 000 ₸
- 2 недели — чтобы потренироваться на открытом датасете.
- 3 часа — чтобы решить приватный набор.
- 2 блока вопросов - чтобы разработать мультимодальный пайплайн.
- Все ответы — в JSON.
JSON-файл с ответами
График проведения
RAG Challenge построен как марафон с кульминацией. Вся подготовка — до 24 августа. После — 3 часа на решение.Часто задаваемые вопросы
Нет. Решения принимаются только на основе предоставленных датасетов. Но в качестве основной LLM модели вашего пайплайна можете пользоваться чем угодно.
Желательно, но не обязательно. Ещё не поздно начать изучать и в этом и цель всех хакатонов – научиться чему-то новому за короткое время.
Да. Формат — 1–4 человека в команде.
После дедлайна (18:00, 24 августа) приём решений закроется.
Онлайн. Все этапы, включая регистрацию, проходят на сайте.
Блок OCR включат вопросы, в которых информацию для ответа нужно будет извлечь либо из документов, не представленных текстовым образом, либо из сложных структур, где часть информации подается визуально.
Блок Advanced Retrieval включает вопросы, для ответа на которые будет недостаточно Naive RAG и требуется разработка более гибкого решения.
Публичный сет вопросов будет содержать 15 вопросов, а также ответы к ним в требуемом шаблоне. Они являются примерами вопросов, которые могут встречаться в приватном сете.
Приватный сет вопросов будет составлять 200 вопросов, ответы к которым участники хакатона должны будут приготовить за 3 часа в день хакатона.
Каждый вопрос может относиться либо к блоку OCR, либо к блоку Advanced Retrieval, или же относиться к обоим блокам. В третьем случае, балл за правильный ответ на такой вопрос идёт в зачёт в каждом из блоков.
Всего будет 3 победителя: абсолютный победитель, лучший по блоку OCR, лучший по блоку Advanced Retrieval. Одна команда может выиграть только один приз. В случае, если команда становится победителем в нескольких категориях, то ей предоставляется приз за категорию с наибольшим призовым фондом из выигранных командой.
В случае равенства баллов, победителем назначается та команда, у которой выигрышная попытка была отправлена раньше.
Вместе с публичным сетом вопросов вам будет отправлен также пример json файла с ответами на эти вопросы. Каждый ответ должен содержать 3 компонента: номер вопроса, ответ, а также список источников в виде названий документов и страниц в них.
Публикация на сайте 1 сентября