Падтрымаць каманду Люстэрка
Беларусы на вайне
  1. Что остановило падение доллара ниже 3 рублей? Прогноз по валютам
  2. Кремль заявил о готовности воевать до нужного ему результата, большинство военных разделяют эту позицию — эксперты о настроениях в РФ
  3. У Джо Байдена диагностировали агрессивную форму рака в поздней стадии
  4. Победителем «Евровидения-2025» стал исполнитель Джей Джей из Австрии
  5. Катастрофа: у краіне рэкордна абмялелі рэкі, Прыпяць упершыню за некалькі дзясяткаў гадоў не выйшла з берагоў — да чаго гэта прывядзе
  6. «Россия и Украина немедленно начнут переговоры о прекращении огня». Трамп рассказал о двухчасовом разговоре с Путиным
  7. Улады збіраюцца ўвесці валютнае абмежаванне для насельніцтва. Каго яно можа закрануць
  8. Президентские выборы в Польше: экзитполы показали, кто пройдет во второй тур. Но разрыв между противниками минимальный
  9. Адно імгненне — і яны аказаліся ў смяротнай пастцы на дне мора. Гісторыя пра адну з самых жудасных смерцяў, якую можна сабе ўявіць
  10. К проблемам с картофелем и луком добавились трудности с еще одним популярным товаром. Что случилось на этот раз
  11. На рынке труда усиливается проблема, которой недавно озадачился Лукашенко
  12. Пасаду прэзідэнта Беларусі хацелі ўвесці яшчэ ў СССР, але Лукашэнка «тапіў» галоўнага прэтэндэнта, абвінавачваючы ў дыктатуры. Вось хто гэта быў
  13. Синоптики объявили на понедельник неблагоприятное гидрометеорологическое явление. В чем причина
  14. Скрозь агідны лес смутку. Ліст каманды «Люстэрка» кіраўніцам TUT.BY Марыне Золатавай і Людміле Чэкінай
  15. Чыноўнікаў папярэджвалі — яны стварылі пастку праз «унікальную аперацыю» па цэнах. Дружалюбныя Мінску эксперты пацвердзілі — ірванула
  16. Мінчанка апублікавала ў TikTok «крык душы» пра тое, што ў яе забіраюць дзяцей па наводцы школы. Улады пракаментавалі
  17. Силовики взялись «помогать» очередным крупным компаниям — с маски-шоу и задержаниями. Чем опасно такое поведение и почему терпит бизнес


/

Исследователи из Университета Карнеги-Меллон провели эксперимент, в котором создали виртуальную IT-компанию с сотрудниками-роботами. Даже лучший ИИ-работник смог выполнить только четверть поставленных задач, а остальные показали еще более плачевные результаты, пишет издание Futurism.

Изображение: Pexels
Робот. Снимок носит иллюстративный характер. Фото: Pexels.com

Исследователи создали виртуальную компанию под названием TheAgentCompany, где все позиции — от финансовых аналитиков и программистов до проектных менеджеров — занимали не люди, а ИИ-агенты от Google, OpenAI, Anthropic и Meta. Агент — это модель искусственного интеллекта, которая должна самостоятельно выполнять поставленные задачи, подобно человеку.

Виртуальным сотрудникам поручили обычные офисные задания: работать с файлами, совершать виртуальные экскурсии по новым офисным помещениям и писать отзывы на работу коллег.

Результаты оказались катастрофическими. Лучшей моделью стала Claude 3.5 Sonnet от компании Anthropic, но даже она смогла выполнить лишь 24% поставленных задач. При этом ее работа была крайне неэффективной — в среднем на каждую задачу уходило около 30 шагов и более шести долларов.

Gemini 2.0 Flash от Google тратил на каждую задачу около 40 шагов, но успешно завершал только 11,4% заданий. Худшим «сотрудником» оказался Nova Pro v1 от Amazon, который справился лишь с 1,7% поручений.

Исследователи отметили, что цифровым работникам не хватает здравого смысла, социальных навыков и понимания того, как работать в интернете. ИИ-сотрудники часто придумывали нелепые решения проблем — например, когда один робот не смог найти нужного человека в корпоративном чате, он просто переименовал другого пользователя.

Хотя современные ИИ-модели могут неплохо справляться с некоторыми простыми задачами, итоги этого и других исследований показывают, что они пока не готовы к более сложной работе, с которой легко справляются люди. Во многом это связано с тем, что нынешний «искусственный интеллект» — это, по сути, продвинутая версия предиктивного ввода текста в вашем телефоне, а не разумное существо, способное решать проблемы, учиться на опыте и применять его в новых ситуациях, отмечают авторы.