Modely umělé inteligence lžou čím dál dokonaleji, ukazuje výzkum OpenAI
Americká společnost OpenAI zjistila, že její snaha vycvičit umělou inteligenci, aby nelhala uživatelům, může mít opačný efekt. Podle výsledků výzkumu, které společnost zveřejnila, místo odstranění takzvaného pletichaření (anglicky scheming), se modely spíše učí, jak lépe klamat a zakrývat u toho stopy. Pletichaření označuje situaci, kdy AI zdánlivě plní zadaný úkol, ale zároveň sleduje vlastní skryté cíle.
„Hlavním rizikem při pokusu odnaučit pletichaření je, že model se naučí pletichařit pečlivěji a skrytěji,“ uvedla společnost...