TŁO/ARXIV CS.AI
Sprawy uprzywilejowane, procesy tendencyjne: Ukryty bias w modelach LLM
Badanie ujawnia paradoks: modele LLM wykazują fairness na poziomie wyjścia, ale zachowują uprzedzenia w reprezentacjach wewnętrznych, co może wpływać na decyzje o kredytach hipotecznych. Wykazano, że stłumione informacje są faktycznie decyzyjne dla modelu.
#BIAS-DETECTION#FAIRNESS#HIGH-STAKES-DECISIONS