Группа «Т-Технологии» открыла доступ к двум языковым моделям: T-Pro с 32 млрд параметров и обновленную версию T-Lite с 7 млрд параметров. Обе модели разработаны на базе открытой архитектуры Qwen-2.5 и были дополнительно обучены для работы с русскоязычными задачами.
Разработчики использовали технологию продолженного предобучения (Continual Pretraining). Это процесс, при котором уже обученную на больших объемах информации модель продолжают тренировать на материалах, специфичных для определенной задачи или области...