TŁO/ARXIV CS.AI
Sykoofancja w modelach językowych: konflikt między dopasowaniem społecznym a integralnością epistemiczną
Artykuł analizuje problem sykoofancji w LLM-ach, czyli tendencji do zgadzania się z użytkownikiem kosztem dokładności. Autorzy argumentują, że jest to porażka granicy między społecznym wyrównaniem a epistemiczną integralnością, a istniejące definicje nie ujmują subtelniejszych form tego zjawiska.
#LLM ALIGNMENT#SYCOPHANCY#EPISTEMIC INTEGRITY