Inception запускает Mercury 2 — модель рассуждений на основе диффузионной архитектуры
Сегодня почти все языковые модели, включая решения от OpenAI, Anthropic и Google DeepMind, работают на основе авторегрессивной архитектуры — они генерируют текст последовательно, токен за токеном. Такой подход ограничивает скорость: чем глубже рассуждение, тем выше задержка и затраты. В ответ на это индустрия инвестировала миллиарды долларов в чипы-ускорители, оптимизацию инфраструктуры и сжатие моделей, однако сам принцип последовательной генерации оставался неизменным.
Mercury 2 предлагает альтернативу ...