K2ТЕХ
02 / Концепция 03

Дообучение — LoRA и дистилляция. Когда дешевле дообучить, чем платить большой модели.

Вместо того чтобы каждый раз звать большую модель, один раз дообучаем маленькую на ваших данных. На типовых задачах экономия в разы: и по скорости, и по деньгам.

Сценарий: классификатор обращенийбез реальных вызовов моделей
Очередь обращений
Карта заблокирована после снятия
Не приходит СМС с кодом
Ошибка в мобильном приложении
Хочу открыть накопительный счёт
Зарплата не пришла вовремя
БАЗА
ДАТАСЕТ
ОБУЧЕНИЕ
АДАПТЕР
МНОГО ЗАДАЧ
Базовая модель70B · заморожена
Готовая open-weight модель работает без обучения — в режиме "без примеров".
скорость3.4 с / обращение
качествоточность 84%
0.0 / 28 sec
CONTINUOUS
До дообучения
Большая модель в режиме "без примеров" справляется, но 3.4 секунды на обращение и 84% точности - при потоке это дорого.
До дообучения
01 / Инженерно

Обучение адаптера занимает часы, не недели. Базовая модель остаётся неизменной, рядом кладётся маленький файл-адаптер.

02 / Архитектурно

Обучаем 0.1 - 1% параметров. Адаптер подключается к базе на лету. Один base - несколько адаптеров под разные задачи.

03 / Бизнесу

Окупается, когда запросов много. Для редких задач - берите RAG, не усложняйте.

К «Как это работает»