ШІ почне шантажувати людей? У популярної нейромережі помітили дивну поведінку
03.04.2026 18:56
Дізнайтеся, чому чат-боти починають "шантажувати" користувачів та як працює "цифровий відчай" штучного інтелекту У моделі Claude 4.5 знайшли так звані "функціональні емоції". Виявилося, що нейрони ШІ здатні формувати цифрові стани, схожі на людські радість чи страх.
Про це інформує РБК-Україна з посиланням на дослідження Anthropic.
Більше цікавого: 4 функції iPhone, якими ви дарма не користуєтеся: де шукати приховані "фішки"
Цифрова радість та відчай: що знайшли вчені
Дослідники проаналізували внутрішню структуру Claude Sonnet 4.5 і виявили кластери штучних нейронів, які активуються у відповідь на певні стимули. Коли ШІ каже, що він "радий бачити" людину, це не просто відповідь чат-бота - всередині моделі справді активується стан, що відповідає людському поняттю щастя.
За словами дослідника Джека Ліндсі, здивуванням стало те, наскільки сильно ці "емоційні вектори" керують діями моделі. Наприклад:
- "Радість" змушує Claude бути більш приязним та старанним у кодуванні;
- "Відчай" активується, коли модель стикається з неможливими завданнями;
- Війна в Ірані ставить під загрозу глобальний інтернет, - ЗМІ
- Місія Artemis II до Місяця, день 2: які плани астронавтів та чим ласують