Research2026-05-01

Beyond Accuracy: LLM Variability in Evidence Screening for Software Engineering SLRs

arXiv:2604.27006v1 Announce Type: cross Abstract: Context: Study screening in systematic literature reviews is costly, inconsistency-prone, and risk-asymmetric, since false negatives can compromise validity. Despite rapid uptake of Large Language Models (LLMs), there is limited evidence on how such...

Read Original Article on Arxiv CS.AI

arxivpapers