В последнее время все только и делают, что меряются параметрами. У кого модель больше, у кого контекстное окно длиннее, у кого база жирнее. Гнаться за этим — верный способ сжечь бюджет и получить на выходе умного, но абсолютно бесполезного «философа».
Я помню, как мы впервые пытались внедрить тяжёлую нейронку в рабочий процесс. Ощущение было, будто я нанял профессора из Оксфорда, чтобы он помогал мне фасовать картошку. Он очень красиво рассуждал о сортовых особенностях крахмала, цитировал классиков, но картошка в мешки сама не прыгала.
Сейчас хайп вокруг гигантов типа GPT понемногу остывает. На сцену выходят SLM — Small Language Models. И это, по факту, лучшее, что могло случиться с бизнесом.
Что под капотом
Большие модели обучаются на «всем интернете». А интернет, если без розовых очков, это на 80% мусор, споры в комментариях и котики. В итоге модель умеет всё по чуть-чуть, но когда дело доходит до специфики, начинает «галлюцинировать». Она просто не понимает, где заканчивается реальный регламент и начинается фантазия копирайтера.
SLM работают иначе. Их не кормят Википедией. Их запирают в «библиотеке» с документами по медицине, юриспруденции или узкому инжинирингу.
Почему это выгодно
Первое — цена вопроса. Запускать огромную махину на своих серверах — это разориться на железе. Маленькую модель можно крутить чуть ли не на ноутбуке. Для бизнеса это значит автономность и безопасность. Данные не улетают куда-то в облако к чужому дяде, а живут внутри контура.
Второе — точность. Если мне нужен юрист, я хочу, чтобы он знал кодексы, а не умел писать стихи в стиле Маяковского. Узкая специализация убирает лишний шум. Модель просто не знает, как нести чепуху на отвлеченные темы, потому что её этому не учили.
Третье — контроль. Я точно знаю, на каких данных обучен мой «цифровой сотрудник». Если он ошибся, я могу подправить конкретный пласт знаний, а не гадать, почему у огромной нейронки сегодня плохое настроение.
Что дальше
Мы переходим от этапа «вау, оно разговаривает» к этапу «так, а что оно конкретно умеет».
Скоро никто не будет покупать «просто ИИ». Вы будете выбирать конкретный инструмент. Нужен маркетолог, который понимает именно ваш рынок и вашу нишу? Берете SLM, натасканную на ваших успешных кейсах. Нужен технолог на производство? Берете модель, которая знает ваши станки лучше, чем мастер Михалыч.
Это и есть настоящий вин-вин. Мы перестаем платить за избыточность и начинаем платить за результат.
А вы готовы доверить специфические задачи «малышу», который знает свое дело, или спокойнее работать с огромным, но непредсказуемым гигантом?
Как думаете, в какой сфере специализированный ИИ выстрелит первым? Могу разобрать варианты, если интересно.