Репозиторий devstral-small-24b-senior-bitrix-developer - для тех кто хочет обучить самостоятельно или изучить устройство.
Архив с готовой моделью выложу после обучения.
Что за нейросеть и как она обучалась
Основа: Devstral-Small-2 от Mistral AI (24B параметров). Это одна из сильнейших открытых моделей для кода: 65.8% на SWE-Bench Verified при весе всего 15 ГБ. Для сравнения - Claude Sonnet 4.5 набирает 77.2%, но он в 20 раз больше и работает только онлайн.
Дообучение планирую через QLoRA (ранг 32) на своём MacBook M5 Pro с 48 ГБ памяти. Метод щадящий - базовая модель не переписывается, а доучивается тонким слоем адаптера (около 400 МБ). Это значит, что общие знания Devstral никуда не денутся, а специфика Битрикса и свежих версий PHP/JS/CSS добавится поверх.
Всего подготовлено 14 929 пар «вопрос - ответ». Каждая пара проверена, дубли отфильтрованы.
Откуда брал знания
- Свой MCP-сервер bxmcp.camouf.ru - разобрал кодовую базу ядра Битрикса. 53 модуля, 2 020 классов, 2 587 функций, 200+ событий, 907 компонентов. Для каждого класса - методы с сигнатурами, константы, цепочки наследования, ORM-поля. Это основная часть датасета: 13 870 пар (93% всех Q&A).
- php.net - документация PHP 8.0-8.5. Pipe-оператор, property hooks, асимметричная видимость, array_find, match, enum, readonly, fibers, атрибуты - всё, чего нет в базовой модели (она училась на данных до октября 2023). 207 пар.
- MDN - документация JavaScript и CSS, актуальная на 2024-2026 год. Temporal API, CSS Nesting, View Transitions, @scope, Anchor Positioning, WebGPU, контейнерные запросы, :has(), oklch. CSS 99 + JS 119 = 218 пар.
- SQL / Tool Calling / Domain Rejection - шаблонные примеры. SQL-запросы к таблицам Битрикса, формат вызова инструментов, отказы на нецелевые вопросы. ~350 пар.
Результат - модель отвечает с реальными примерами кода и существующими вызовами API. Если какого-то метода или функции нет в ядре Битрикса - она скажет, что нет, а не придумает.
Какие технологии знает модель
- 1C-Битрикс - D7 ORM (DataManager, Query, Entity), компоненты, события, агенты, Highload-блоки, инфоблоки, REST API, админка, модульная система
- PHP 8.0-8.5 - ООП, трейты, неймспейсы, enum, readonly, match, атрибуты, property hooks, асимметричная видимость, pipe-оператор, fibers, генераторы
- JavaScript - ES6+, Temporal API, Promise.withResolvers, Object.groupBy, Array.fromAsync, WebGPU, async/await, Fetch, Proxy, Event Loop
- CSS - Flexbox, Grid, View Transitions, CSS Nesting, @scope, Anchor Positioning, oklch, color-mix, :has(), контейнерные запросы, @layer, SCSS, БЭМ
- SQL / MariaDB - SELECT, JOIN, GROUP BY, оконные функции, индексы, EXPLAIN, транзакции, оптимизация
Системные требования
| Вес модели | 15 ГБ |
| Контекст | 384 000 токенов |
| Оперативная память | от 24 ГБ unified memory |
| Комфортно | от 32 ГБ unified memory |
| Процессор | Apple Silicon (M1, M2, M3, M4, M5) |
| ОС | macOS |
| Движок | MLX (нативный Apple фреймворк) |
Модель использует unified memory - чем больше свободной памяти, тем длиннее контекст. На 16 ГБ будет работать, но с ограничением по длине диалога. На 32+ ГБ - полный комфорт со всем контекстом.
На Intel Mac и других ОС версия пока не готова - нужен GGUF, который появится позже.
Установка и запуск на Mac
В архиве будет готовая к работе модель в формате MLX. Ничего дополнительно качать не нужно.
# Распаковать архив
tar xzf devstral-small-24b-senior-bitrix-developer.tar.gz
# Запустить MLX-сервер
mlx_lm.server \
--model ./devstral-small-24b-senior-bitrix-developer
# OpenAI-совместимый API на http://localhost:8080/v1
Если MLX ещё не установлен, понадобится Python 3:
pip install mlx mlx-lm
После запуска подключается к любой IDE - Continue, Cline, Kilo Code. Просто указать localhost:8080 как провайдера.
Альтернатива - oMLX: нативное macOS-приложение с меню-баром. Скачать с omlx.ai, указать папку с моделью, готово. Плюсы: веб-дашборд, SSD-кеширование контекста, continuous batching, не надо держать терминал.
Стоимость и лицензия
Разработка обошлась меньше чем в доллар (API DeepSeek для генерации части данных). Всё остальное - бесплатные источники.
Лицензия CC BY-NC 4.0: для себя, для дома, для изучения. Коммерческое использование запрещено. Базовая Devstral под Apache 2.0, мой адаптер сверху под CC BY-NC 4.0. Если кому-то принципиально: качайте оригинальную модель и дообучайте.
Когда модель полезна, а когда нет
Эта модель хороша в коротких спринтах: дал чёткую задачу, получил код, применил, пошёл дальше. Найти метод ORM, написать компонент, поправить запрос, добавить событие - с этим она справляется уверенно.
Но есть нюанс. Если задача требует многошагового рефакторинга через пять файлов, с анализом связей и абстрактными формулировками вроде «приведи проект к единому стилю» - модель упрётся.
Можно взять модель крупнее - например, ту же Qwen Coder 72B, натаскать на Битрикс, и она будет держать длинные цепочки рассуждений. Но: эти модели от 40 до 300 ГБ, им нужно много дорогих GPU, а стоить такой компьютер будет как подписка на облачные API лет на десять вперёд.
Проще уж подключить DeepSeek или Claude онлайн на сложные задачи, а локальную модель использовать на каждодневной рутине, где не нужно гонять тонны токенов и светить кодом направо и налево. В коротких спринтах она вывозит - и быстрее, и дешевле, и код остаётся на вашей машине.