PRZEŁOM/ARXIV CS.AI
MemQ: Integracja uczenia Q z samoewoluującymi agentami pamięci
Nowa metoda MemQ łączy uczenie przez wzmacnianie (Q-learning) z pamięcią epizodyczną agentów LLM, propagując wartości kredytu wstecz przez graf zależności pamięci. System uwzględnia łańcuchy zależności między wspomnieniami, co pozwala na bardziej efektywne uczenie się z doświadczenia.
#MEMORY AGENTS#Q-LEARNING#LLM#ELIGIBILITY TRACES