Inżynierowie Microsoftu opracowują niezawodnych agentów AI do użytku na komputerach

Inżynierowie Microsoftu opracowują niezawodnych agentów AI do użytku na komputerach

Zwiększanie niezawodności agentów AI dzięki rozwiązaniu UI-Evol firmy Microsoft

W ramach ekscytującego odkrycia, badacze z Microsoft Research Asia zaprezentowali przełomowy komponent o nazwie UI-Evol. Ta innowacja ma na celu zwiększenie dokładności i niezawodności agentów sztucznej inteligencji (AI) korzystających z komputera, czyli algorytmów zdolnych do autonomicznego wykonywania zadań poprzez współpracę z systemem operacyjnym. Pomimo zaawansowanych możliwości, te modele AI od dawna borykały się z problemami z precyzją.

Wyzwanie luki między wiedzą a działaniem

Agenci sztucznej inteligencji (AI) korzystający z komputerów często pobierają informacje z internetu, aby nauczyć się interakcji z interfejsami użytkownika. Jednak biorąc pod uwagę stale ewoluującą naturę interfejsów użytkownika, agenci ci często mają trudności z zastosowaniem swojej wiedzy teoretycznej w rzeczywistych interakcjach z interfejsem użytkownika. To rozdźwięk jest znany jako luka między wiedzą a działaniem i stanowi istotną przeszkodę, która zmniejsza ich skuteczność.

Niedawne badanie Microsoftu podkreśla ten problem: agenci AI działający z nawet 90% poprawnych instrukcji osiągali pomyślne wykonanie zadań tylko w 41% przypadków. Co więcej, agenci ci wykazują nieprzewidywalność, często wykonując tę ​​samą operację z różnymi rezultatami. Ta niespójność wymagała ukierunkowanego rozwiązania.

Przedstawiamy UI-Evol

Poznaj UI-Evol — wszechstronny komponent, który płynnie integruje się z przepływem pracy agenta AI. Wykorzystując informacje w czasie rzeczywistym z rzeczywistego interfejsu użytkownika, UI-Evol został zaprojektowany z myślą o ciągłym udoskonalaniu i aktualizowaniu wiedzy AI o interfejsie. To udoskonalenie zwiększa niezawodność i dokładność agentów.

Jak działa UI-Evol

UI-Evol wykorzystuje proste, dwuetapowe podejście:

  • Retrace: Ta metoda polega na szczegółowym rejestrowaniu dokładnych działań podejmowanych przez agenta AI — takich jak kliknięcia, naciśnięcia klawiszy i decyzje — podczas wykonywania zadania.
  • Krytyka: Po nagraniu, ta metoda porównuje działania agenta z ustalonymi instrukcjami zewnętrznymi. W przypadku zidentyfikowania rozbieżności, system odpowiednio dostosowuje swoją bazę wiedzy, zapewniając, że odzwierciedla ona praktyczne i skuteczne strategie w środowisku oprogramowania.

Udowodniona skuteczność

Aby zweryfikować skuteczność UI-Evol, przetestowano go na agencie S2, znanym z wysokiej wydajności agentów w testach wykorzystania komputera, za pomocą benchmarku OSWorld. Eksperymenty przeprowadzone z agentami wytrenowanymi na wiodących, dużych modelach językowych, takich jak GPT-4o i OpenAI-o3, przyniosły imponujące rezultaty: znaczną poprawę wskaźników sukcesu zadań i większą spójność, co zmniejszyło zmienność zachowań agentów. Dzięki temu agenci AI są bardziej niezawodni.

Konsekwencje na przyszłość

Dzięki wprowadzeniu UI-Evol, Microsoft jest gotowy znacząco zwiększyć możliwości agentów AI w zakresie automatyzacji pracy biurowej i zadań asystentów wirtualnych. To ulepszenie nie tylko plasuje Microsoft jako lidera w badaniach nad sztuczną inteligencją, ale także toruje drogę do przyszłości, w której agenci AI będą mogli pracować wydajniej i niezawodniej w różnych aplikacjach.

Zdjęcie za pośrednictwem Depositphotos.com

Źródło i obrazy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *