10/06/2025
Nowe badanie przeprowadzone przez Apple Machine Learning Research kwestionuje powszechny pogląd dotyczący zdolności dużych modeli językowych, takich jak o1 firmy OpenAI czy warianty myślenia Claude’a, w zakresie tzw. „rozumowania” sztucznej inteligencji. Wyniki badania wskazują na fundamentalne ograniczenia tych systemów, sugerując, że nie są one w rzeczywistości zdolne do prawdziwego rozumowania, a ich działanie opiera się raczej na zaawansowanym dopasowywaniu wzorców. W eksperymencie badacze Apple postanowili odejść od standardowych matematycznych testów, które często są podatne na zanieczyszczenia danych. Zamiast tego stworzyli kontrolowane środowiska zagadek, takie jak wieża Hanoi czy przeprawa przez rzekę, co pozwoliło na precyzyjną analizę nie tylko ostatecznych odpowiedzi, ale również wewnętrznych śladów rozumowania modeli na różnych poziomach złożoności problemu....
Nowe badanie przeprowadzone przez Apple Machine Learning Research kwestionuje powszechny pogląd dotyczący zdolności dużych modeli językowych, takich jak o1 firmy OpenAI czy warianty myślenia Claude’a, w zakresie tzw. „rozumowania” sztucznej inteligencji. Wyniki badania wskazują na funda...