TŁO/ARXIV CS.AI

Sprawy uprzywilejowane, procesy tendencyjne: Ukryty bias w modelach LLM

Badanie ujawnia paradoks: modele LLM wykazują fairness na poziomie wyjścia, ale zachowują uprzedzenia w reprezentacjach wewnętrznych, co może wpływać na decyzje o kredytach hipotecznych. Wykazano, że stłumione informacje są faktycznie decyzyjne dla modelu.

#BIAS-DETECTION#FAIRNESS#HIGH-STAKES-DECISIONS

CZYTAJ ORYGINAŁ →