
Choć technologia aparatów Samsunga może obecnie nie osiągać znaczących przełomów, jej postępy w dziedzinie sztucznej inteligencji (AI) są godne uwagi. Najnowsza inicjatywa firmy w zakresie AI opiera się na modelu, który imponująco przewyższył inne modele dużych języków (LLM), z których niektóre są około 10 000 razy większe.
Przedstawiamy innowacyjny, miniaturowy model rekurencyjny firmy Samsung

- Model ten, znany jako Tiny Recursive Model (TRM), jest niezwykle zwarty i obejmuje zaledwie 7 milionów parametrów, podczas gdy w większych modelach LLM znajdują się ich miliardy.
- TRM wykorzystuje swoje dane wyjściowe do kierowania kolejnymi krokami, skutecznie tworząc samodoskonalący się mechanizm sprzężenia zwrotnego.
- Wykorzystując iteracyjne rozumowanie na każdym wyjściu, można emulować głębszą architekturę neuronową bez ponoszenia typowego obciążenia pamięciowego lub obliczeniowego.
- W każdym cyklu rekurencyjnym model zwiększa dokładność swoich przewidywań i wyników.
Strategia Samsunga przypomina skrupulatny proces rewizji pisemnego projektu; model iteracyjnie identyfikuje i koryguje błędy – to znacząca poprawa w porównaniu z tradycyjnymi modelami LLM, które często zawodzą w obliczu problemów logicznych, jeśli pojawi się choćby jeden błąd. Chociaż model ten wspomaga rozumowanie oparte na łańcuchu myślowym, jego skuteczność pozostaje krucha pod presją.
Najważniejsze wnioski: Postaw na prostotę
Początkowo Samsung próbował zwiększyć złożoność modelu poprzez zwiększenie liczby warstw; jednak takie podejście prowadziło do nadmiernego dopasowania i utrudniało generalizację. Co ciekawe, przejście w kierunku mniejszej liczby warstw w połączeniu ze wzrostem liczby iteracji rekurencyjnych zaowocowało poprawą wydajności TRM.
Wyniki wydajności
- Osiągnięto wskaźnik dokładności na poziomie 87, 4% w Sudoku-Extreme, w porównaniu do zaledwie 55% w przypadku konwencjonalnych modeli rozumowania hierarchicznego.
- Osiągnięto 85% celności w łamigłówkach o poziomie trudności Maze-Hard.
- Osiągnięto 45% dokładności w wyzwaniach ARC-AGI-1.
- Uzyskano 8% dokładność w zadaniach ARC-AGI-2.
Co godne uwagi, TRM firmy Samsung nie tylko dorównuje wydajnością większym systemom LLM, takim jak DeepSeek R1, Google Gemini 2.5 Pro i OpenAI o3-mini, ale w wielu przypadkach je przewyższa, wykorzystując przy tym zaledwie ułamek ich parametrów.
Dodaj komentarz