مدلهای هوش مصنوعی رفتارهای خطرناک را از هم یاد میگیرند
پژوهش جدیدی نشان میدهد مدلهای هوش مصنوعی قادرند حتی بدون مشاهده مستقیم محتوای مرتبط، برخی گرایشها و رفتارها را از مدلهای دیگر بیاموزند.
پژوهشگران در مطالعهای جدید پدیدهای نگرانکننده در دنیای هوش مصنوعی شناسایی کردهاند که میتواند چالشهای تازهای برای توسعه ایمن مدلهای زبانی بزرگ ایجاد کند. این پدیده که «یادگیری ناخودآگاه» یا Subliminal Learning نام گرفته، نشان میدهد مدلهای هوش مصنوعی ممکن است ویژگیها و گرایشهایی را از مدلهای دیگر دریافت کنند؛ حتی زمانی که هیچ نشانه آشکاری از آن ویژگیها در دادههای آموزشی وجود ندارد.