Обзор 01LLM 02RAG 03LoRA 04Агент 05MCP 06Мультиагент

02 / Концепция 01

Как думает LLM. Предсказание следующего токена, раз за разом.

Языковая модель не «думает» в человеческом смысле. Она предсказывает следующий токен - и так раз за разом. При большом масштабе эта простая механика даёт эффект рассуждения.

Сценарий: ответ клиенту банкабез реальных вызовов моделей

K2ТЕХ · Чат поддержки

АС

Не могу войти в личный кабинет, подскажите что делать?

К2

QUERY

CONTEXT

PREDICT

SAMPLE

LOOP

ANSWER

0.0 / 28 sec

CONTINUOUS

Запрос

Сотрудник задаёт вопрос естественным языком - без форм и полей.

Запрос

01 / Инженерно

Память видеокарты под контекст растёт квадратично: удвоили контекст - в четыре раза дороже обработка.

02 / Архитектурно

Декодер с вниманием: промпт и ответ - это один поток токенов. Модель просто продолжает его.

03 / Бизнесу

Чем длиннее контекст, тем дороже ответ. Оптимизация контекста - прямая экономия на эксплуатации.

Решения портфеля с этой концепцией

On-prem LLM-моделиДанные, безопасность, инженерка →ПАК НейроТех / KageCore AI HubПлатформы и мощности →ИИ-Сотрудник · RuClawПрикладной →

Кейсы с этой концепцией

Стратегия развития ИИ · от россыпи пилотов к единой дорожной картеБанк · 2025 →AI Discovery · курс, после которого команды уносят собственные гипотезыИнститут развития · 2025 →

Все концепции Знания — RAG02 →