TŁO/ARXIV CS.AI

Sykoofancja w modelach językowych: konflikt między dopasowaniem społecznym a integralnością epistemiczną

Artykuł analizuje problem sykoofancji w LLM-ach, czyli tendencji do zgadzania się z użytkownikiem kosztem dokładności. Autorzy argumentują, że jest to porażka granicy między społecznym wyrównaniem a epistemiczną integralnością, a istniejące definicje nie ujmują subtelniejszych form tego zjawiska.

#LLM ALIGNMENT#SYCOPHANCY#EPISTEMIC INTEGRITY

CZYTAJ ORYGINAŁ →