Чат-боти ШІ тупішають після тривалого спілкування з людьми, - дослідження Microsoft

24.02.2026 в 21:00 | Ольга Чернявська, джерело: «Facenews»

Нове спільне дослідження Microsoft Research з Salesforce демонструє, що популярні чат-боти ШІ дурнішають після тривалого спілкування з людьми. Сумарний рівень помилок може зрости більш ніж на 100% при аналізі понад 200 тисяч розмов.

В останні роки провідні IT-розробники представили цілу лінійку просунутих великих мовних моделей, прагнучи закріпити лідерство на ринку. Проте користувачі регулярно скаржаться на "галюцинації" і неправильні відповіді. Нова наукова робота підтверджує: навіть топові нейромережі нерідко "губляться" в розмові, коли завдання розбивається на природний діалог з декількох реплік.

Як відомо, У TikTok шириться нова хвиля ШІ-відео із закликами до насильства проти працівників ТЦК

В ході експерименту експерти вивчили понад 200 000 діалогів за участю флагманських LLM, включаючи GPT-4.1, Gemini 2.5 Pro, Claude 3.7 Sonnet та DeepSeek R1. Якщо при поодиноких запитах такі моделі демонструють понад 90% успішних відповідей, то в довгих бесідах з уточненнями і додатковими питаннями показник падає до 65%. Іншими словами, у міру ускладнення контексту ефективність помітно знижується.

Дослідники виявили ще одне цікаве явище – "роздування відповідей". У багатоходових діалогах відповіді моделей ставали довшими на 20–300%. Разом з обсягом зростала і кількість припущень і галюцинацій, які потім закріплювалися в контексті розмови і використовувалися як основа для наступних реплік. Причому навіть моделі з розширеними "токенами роздумів", такі як OpenAI o3 і DeepSeek R1, не змогли повністю уникнути цього ефекту.

Автори підкреслюють, що різке погіршення якості в довгих бесідах не означає, що моделі "тупішають" в буквальному сенсі – скоріше, це вказує на їх обмеженість в утриманні й правильній інтерпретації великого обсягу інформації в ході діалогу. Незважаючи на це, ШІ все ще демонструє вражаючі здібності при відповідях на окремі запити.

Як зазначає Windows Central, такі особливості слід враховувати при використанні чат-ботів у продуктах, орієнтованих на тривалу взаємодію з користувачем. Можливі помилки та галюцинації можуть ввести людей в оману, особливо якщо користувач покладається на ШІ як на джерело точної і критично важливої інформації.

Сьогодні ChatGPT займає понад 80% світового ринку чат-ботів. Найближчі конкуренти – Perplexity і Google Gemini. На них припадає частка в 15% від усіх користувачів.

Читайте також: "Помиї ШІ" та "гниття мозку": настали останні дні соцмереж, а штучний інтелект зламає інтернет?
Читайте FaceNews в Google Новости

Популярные видео на YouTUBE

Росіяни перекривають дороги, аби заправитися: дефіцит пального та вербування на війну
Крим залишився без бензину: окупаційна влада припинила продаж пального
Напруження на Близькому Сході: Ізраїль оточує підземний комплекс Хезболли, Іран погрожує США
Чому крадіжка ковбаси карається суворіше за корупцію: Розбір українського правосуддя
Чи загрожує людству ядерний апокаліпсис: Аналіз реальних ризиків та міфів
Смерть військового в київській лікарні: службова недбалість чи системні проблеми?
Центробанк РФ тримає ставку: що це означає для російської економіки?
Українська компанія "Узол" виводить на ринок сервісних роботів "Ліра" та AI-агентів
Все видео

Лента новостей

Батько та син здобули світовий рекорд Гіннеса за найдовшу велоподорож
🕑 29 хвилин тому
Шахраї масово блокують акаунти Instagram: як розпізнати фейк та захиститися
🕑 29 хвилин тому
Молдова на шляху до ЄС: попри російську агресію, курс на виживання
🕑 35 хвилин тому
Туск: Втягування політиків Польщі та України в конфлікт – стратегічна помилка
🕑 1 годину 44 хвилини тому
Польські громадяни започатковують власний орден для Зеленського та українців у відповідь на рішення про Орден Білого Орла
🕑 1 годину 45 хвилин тому
Євген Адамцевич: як кобзар зберіг «Запорізький марш» від забуття
🕑 2 години 42 хвилини тому
Одеський терцентр соцобслуговування обрав підрядника, пов'язаного з розслідуванням на мільярд гривень
🕑 3 години 26 хвилин тому
День батька: Сила українських чоловіків у захисті майбутнього своїх дітей
🕑 4 години 3 хвилини тому
Західну Європу накрила сильна спека: Франція та Іспанія попереджені про +40°C
🕑 4 години 22 хвилини тому
Топпосадовці Одеси задекларували мільйони готівкою, Rolex та біткоїни
🕑 4 години 28 хвилин тому
День батька: Україна вшановує захисників, які передають любов до землі та обов'язок захищати
🕑 4 години 29 хвилин тому
Військово-Морські Сили України закликають українців за кордоном повертатися та приєднуватися до лав флоту
🕑 4 години 29 хвилин тому
Кожен 13-й нардеп має підозру у корупції: розслідування щодо чинних депутатів тривають
🕑 4 години 34 хвилини тому
Олександр Філатов став лідером за доходами серед топпосадовців Одеси у 2025 році
🕑 4 години 39 хвилин тому
ССО України уразили Тюменський НПЗ за 2500 км від кордону
🕑 4 години 43 хвилини тому
Все новости