Добавить новость

Ru24.pro News‑life.pro News‑life.org 29ru.net 123ru.market Sportsweek.org Iceprice.info

123ru.net

Интернет

Все сайты В Москве

В Москве Все сайты Добавить сайт Прислать новость

Обучая ИИ быть «злым», она становится лишь добрее: методика Anthropic

Исследователи из компании Anthropic нашли неожиданный способ сделать больших языковых моделей (LLM) безопаснее. Вместо того чтобы подавлять «вредные» черты, такие как льстивость или агрессивность, они предложили включать их прямо во время обучения.

Обычно нежелательное поведение в LLM, как, например, чрезмерная лесть или выдумывание фактов, связано с определёнными «паттернами» активности в модели. Исследователи смогли точно определить такие паттерны и показали, что можно их отслеживать — а значит, и предотвращать.

Читать полностью...

Губернаторы России

Агрегатор новостей 24СМИ

Заголовки

Трамп своими тарифами еще сильнее закапывает потребительский рынок DDR-памяти

Целых 70% игр с PS3 отныне играбельны в эмуляторе RPCS3

Что такое rebound relationship и как не стать человеком-«подорожником»

Раскрыты цены на Pixel 10a: похоже, Google снова продаст нам прошлогодний смартфон

Док-станция-конструктор: HW Media Lab показала модульный хаб DockFrame с мультиметром с USB-C и не только

Уся по маньхуа и Джет Ли в первом трейлере фильма «Клинки хранителей» от режиссера «Пьяного мастера»

Цифровой релиз провалившегося в прокате фильма «Гренландия 2: Миграция» назначен на 27 января

Представлен тонкий геймерский смартфон RedMagic 11 Air с батареей на 7000 мА·ч, вентилятором и Snapdragon 8 Elite

Авторы Marvel Rivals будут наказывать тех, кто любит стоять AFK в матчах

Marathon с ноги ворвалась в список топ-продаж Steam

Разработчики Path of Exile 2 продемонстрировали царицу Атзири и её древний храм

Первые игровые ноутбуки на Arm-чипах Nvidia выйдут уже в этом квартале, если слухи верны

Заголовки

A New Home for WordPress Education Programs

Как накачать руки: 20 лучших упражнений и план тренировок

Рынок ПК пошёл в рост, но не благодаря ИИ — во всём виновата Microsoft

Поставки первых систем на ускорителях Nvidia Rubin стартуют в конце лета

Топ аниме-вайфу 2025 года для настоящих людей культуры

Забираем снегоуборщик от Boxbot со скидкой 68%

Стоматологи выяснили: курица, орехи и сыр защищают зубы от кариеса и налета

Asus прекратит разработку новых моделей смартфонов

Tesla завершила разработку чипа AI5 для избавления от NVIDIA и возрождает Dojo 3

Золотой год Кремниевой долины: как близость к Трампу стала самым выгодным активом бигтехов

В Бельгии разработали подушки безопасности для велосипедистов, встраиваемые в шорты

Продажи Divinity: Original Sin 2 взлетели после анонса новой части серии

Ria.city

Новости России

Музыкальные новости

Новости тенниса

Новости спорта

Все новости сегодня от А до Я