Das folgende Papier präsentiert Ergebnisse einer kürzlich durchgeführten Untersuchung auf drei großen Konferenzen zu Software Engineering und Programmiersprachen (ASE, OOPSLA und PLDI 2016).
Claire Le Goues, Yuriy Brun, Sven Apel, Emery Berger, Sarfraz Khurshid und Yannis Smaragdakis: Wirksamkeit der Anonymisierung im Doppelblind-Review. AdRR abs / 1709.01609 (2017)
Während des Überprüfungsprozesses wurden die Prüfer aufgefordert, eine Vermutung anzustellen, wenn sie glaubten, einen Autor des angegebenen Papiers zu kennen.
Zum Prozentsatz der Beiträge, bei denen eine Vermutung angestellt wurde:
Bei den drei Konferenzen wurden 70% bis 86% der Bewertungen ohne Vermutungen eingereicht, was darauf hindeutet, dass die Prüfer normalerweise nicht glaubten, dass sie es wussten oder sich nicht darum kümmerten Wer hat die meisten der besprochenen Papiere geschrieben?
Zur Richtigkeit der Vermutungen:
Wenn die Gutachter geraten haben, war es wahrscheinlicher, dass sie richtig sind (ASE 72) % der Vermutungen waren korrekt, OOPSLA 85% und PLDI 74%. 75% der ASE-, 50% der OOPSLA- und 44% der PLDI-Papiere hatten jedoch keine Rezensenten richtig erraten, und die meisten Bewertungen enthielten keine korrekten Vermutungen (ASE) 90%, OOPSLA 74%, PLDI 81%).
Über die Auswirkung des Fachwissens der Prüfer auf das Raten:
Wir schließen daraus, dass Gutachter sich selbst als Experten betrachteten waren eher zu erraten Autor Identitäten, aber es war nicht wahrscheinlicher, dass sie richtig erraten wurden.
Zur Auswirkung von (richtigen und falschen) Vermutungen auf die Papierakzeptanz:
Wir beobachteten ein unterschiedliches Verhalten Auf den drei Konferenzen: ASE-Beiträge wurden unabhängig vom Bewertungsverhalten der Prüfer statistisch gleich häufig angenommen. [...] OOPSLA- und PLDI-Einreichungen ohne Vermutungen wurden mit geringerer Wahrscheinlichkeit akzeptiert (p < = 0,05) als solche mit mindestens einer korrekten Vermutung. PLDI-Einsendungen ohne Vermutungen wurden ebenfalls weniger wahrscheinlich akzeptiert (p < = 0,05) als Einsendungen mit allen falschen Vermutungen.
Zusammenfassung:
Wir stellen fest, dass 74% –90% der Bewertungen keine korrekten Vermutungen enthalten und dass Gutachter, die sich selbst als Experten für das Thema eines Papiers identifizieren, eher versuchen, zu raten, aber nicht mehr richtig raten.