Frage:
Warum ist Peer Review so zufällig?
Allure
2018-08-13 11:43:06 UTC
view on stackexchange narkive permalink

8 wissenschaftliche Arbeiten, die abgelehnt wurden, bevor ein Nobelpreis gewonnen wurde

Finanzierungsanalyse: Forscher sagen, die NIH-Zuschussfinanzierung scheint nicht besser zu sein als eine Lotterie

Dasselbe Papier, das nach mehreren Jahren erneut in derselben Zeitschrift eingereicht wurde, wird häufig aufgrund „schwerwiegender methodischer Fehler“ abgelehnt.

Für Personen, deren Beruf sich dreht Wenn es darum geht, aus scheinbar zufälligen Beobachtungen Ordnung zu schaffen, sind Wissenschaftler sicher uneinheitlich darin, die Arbeit anderer Wissenschaftler zu beurteilen. Warum? Es scheint sicherlich nicht auf allen Ebenen so zu sein. Zum Beispiel erhält jeder Aufsatz gemäß der GRE-Website,

für den Abschnitt Analytisches Schreiben eine Bewertung von zwei geschulten Bewertern unter Verwendung einer ganzheitlichen Sechs-Punkte-Skala. Bei der ganzheitlichen Bewertung werden die Bewerter darin geschult, die Bewertungen auf der Grundlage der Gesamtqualität eines Aufsatzes als Antwort auf die zugewiesene Aufgabe zuzuweisen. Wenn sich die beiden zugewiesenen Bewertungen um mehr als einen Punkt auf der Skala unterscheiden, wird die Diskrepanz von einem dritten GRE-Leser beurteilt. Andernfalls werden die beiden Bewertungen für jeden Aufsatz gemittelt.

Dies impliziert, dass es ungewöhnlich ist, dass sich zwei zugewiesene Bewertungen um mehr als einen Punkt auf der Skala unterscheiden, d. H. Die GRE-Aufsatzbewerter stimmen normalerweise zu. Soweit ich weiß, kommen Leser von Diplomarbeiten, Leser von Diplomarbeiten und sogar Leser von Doktorarbeiten in der Regel nicht zu diametral entgegengesetzten Urteilen über die Arbeit. Sobald es jedoch um Material auf Forschungsebene geht, scheinen sich Peer-Reviewer nicht mehr einig zu sein. Warum?

Danke für die Links, @Allure.Ich wurde so sehr abgelehnt, dass ich sicher bin, dass mein Nobelpreis per Post verschickt wird.Ich fange besser an, meine Dankesrede vorzubereiten.:) :)
Dies motiviert das Einkaufen von Veröffentlichungen unter https://academia.stackexchange.com/questions/115080/is-there-anything-that-has-been-tried-to-stop-publication-shopping
Weil der Raum sehr spärlich und unberührt ist und es daher in neuartigen Bereichen nur wenige Statistiken gibt, um zu beurteilen, wie gut die Arbeit ist?
Es ist erwähnenswert, dass im Fall der NIH-Zuschusszuweisungen die tatsächliche Schlussfolgerung lautete, dass der Rang unter den Top 20% zufällig war, dass sich die Prüfer jedoch im Allgemeinen darüber einig waren, welche Anträge unter den Top 20% lagen.Das ist mehr Übereinstimmung als Ihr GRE-Beispiel.
Wir hören nur von den wenigen Fällen, in denen Peer Review schief gelaufen ist.Aber in den meisten Fällen macht es das, was es soll.
Ein grundlegendes Problem ist, dass es sowohl für Peer Review als auch für Auszeichnungen keine (gute) objektive Möglichkeit gibt, Dinge zu bewerten / zu bewerten - vgl.https://academia.stackexchange.com/a/103167/19607
Verwandte Themen: [Ist es für Prüfer möglich, ein Qualitätspapier fälschlicherweise abzulehnen?] (Https://academia.stackexchange.com/questions/18540/is-it-possible-for-reviewers-to-mistakenly-reject-a-quality-Papier)
[Nature führte Peer Review erst 1967 ein] (http://michaelnielsen.org/blog/three-myths-about-scientific-peer-review/), so dass die von Nature abgelehnten Artikel aus den 1930er Jahren vom Herausgeber abgelehnt wurden, nicht alsErgebnis der Begutachtung.
Sie müssen die Möglichkeit berücksichtigen, dass einige Peer Reviewer faul sind.
Ein häufiges Problem ist die mangelnde Reproduzierbarkeit.Open Science und Open Data entstanden als Antwort: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4898932/ Dann geht es darum, dass nicht-akademische Mitarbeiter redaktionelle Entscheidungen treffen und die berühmten Geschichten über Unsinnmaschinen-generierte Papiere, die von "angesehenen" "traditionellen" Zeitschriften akzeptiert werden.
* Wie drei MIT-Studenten die Welt der wissenschaftlichen Zeitschriften zum Narren gehalten haben *: «2013 haben IEEE und Springer Publishing mehr als 120 Artikel von ihren Websites entfernt, nachdem eine Analyse eines französischen Forschers ergab, dass sie über SCIgen generiert wurden» https://news.mit.edu/ 2015 / wie-drei-mit-Studenten-betrogen-wissenschaftliche-Zeitschriften-0414
Verwandte https://academia.stackexchange.com/q/33031/532
@GEdgar: Nein.Die anderen Fälle umfassen: 1. Fälle, in denen nicht trivial nachweisbar ist, dass eine Überprüfung unangemessen war 2. Fälle, in denen Überprüfungen schlampig / von geringer Qualität waren, aber letztendlich ein akzeptables Papier akzeptierten oder ein ablehnungswürdiges Papier ablehnten.3. Diejenigen, in denen die Autoren nicht die Zeit, den Willen und das Nötigste hatten, um zu veröffentlichen, was geschehen war.
@CountIblis Laut der Quelle wurden vor 1967 einige Artikel überprüft und andere nicht (es war Sache des Herausgebers, zu entscheiden).Auch Mythos Nr. 2 beschreibt effektiv den Kern dieser Frage.
Ein weiteres gutes Beispiel: [NIPS] (https://en.wikipedia.org/wiki/Conference_on_Neural_Information_Processing_Systems) (einer der Top-Veranstaltungsorte für maschinelles Lernen) führte 2014 ein wissenschaftliches [Konsistenz-Experiment] durch (http: //blog.mrtz).org / 2014/12/15 / the-nips-experiment.html).Die Ergebnisse waren nicht großartig - die Annahme- / Ablehnungsentscheidungen waren eher zufällig als deterministisch.
Elf antworten:
user93911
2018-08-13 12:28:41 UTC
view on stackexchange narkive permalink

Gute Frage. Schwer zu beantworten. Einige Gedanken:

  • Gutachter sind nicht geschult
  • Gutachter sind anonym
  • Gutachter erhalten geringfügiges Feedback zu ihrer Leistung
  • Gutachter Auch Autoren, die um die gleichen Mittel / das gleiche Prestige konkurrieren
  • Gutachter sind auf eine enge Disziplin spezialisiert
  • Gutachter sind Freiwillige
  • Gutachter sind rar
  • Dem Überprüfungssystem fehlt ein externes (unabhängiges) Kontrollsystem (Audit).
  • Prüfer sind Menschen mit ihren eigenen persönlichen Interessen, Emotionen und Fähigkeiten.

In Anbetracht dieser Beobachtungen Es ist unwahrscheinlich, dass zwei Überprüfungsberichte aufeinander abgestimmt werden. Dann wird die schwierige Entscheidung auf den Associate Editor übertragen, der ebenfalls ein Freiwilliger ist und nicht auf das Gebiet des Autors spezialisiert ist.

Lässt die Frage, warum sie akzeptiert wird, wenn dies außerhalb der Wissenschaft nicht der Fall ist. Ehrlich gesagt, ich weiß es nicht. Nur einige Vermutungen:

  • Wissenschaft ist ein mächtiger isolierter Sektor mit eigenen Regeln?
  • Das derzeitige System funktioniert für etablierte Forschungsgruppen?
  • Zeitschriften tun dies Sie haben nicht die Mittel, um qualifizierte Fachkräfte / Wissenschaftler als Gutachter auszubilden und anzuziehen?
  • Es gibt keine einfache Lösung oder Alternative?

Hinzugefügt aufgrund eines Kommentars: - Gutachter sind beschäftigt Wissenschaftler-Gutachter werden beruflich nicht für die Durchführung von Gutachten belohnt

Gute Liste!Ich würde hinzufügen, dass die Rezensenten möglicherweise nicht viel Zeit haben und sich schnell über das Papier informieren, obwohl sie sich freiwillig gemeldet haben.Einige Leute sind möglicherweise auch nicht sehr in eine gründliche Überprüfung investiert, da sie nicht direkt davon profitieren.Beides ist wahrscheinlich nicht oft der Fall, aber es scheint wahrscheinlich.
Etwas Neues ist schon unterwegs!http://www.researchers.one/
Vielen Dank, @Ian.Ich stimme voll und ganz zu und habe Ihre Punkte am Ende meines Beitrags hinzugefügt.
Vielen Dank, dass Sie @Peacefull.Ich folge dir hierher.Die Wissenschaft verändert sich.Eigentlich glaube ich, dass dies eine sehr interessante Zeit ist, in der Wissenschaftler auf der ganzen Welt die Zukunft der Wissenschaft gestalten können und werden.
"Zeitschriften haben nicht die Mittel, um qualifizierte Fachkräfte / Wissenschaftler als Gutachter auszubilden und anzuziehen?"Ich würde sagen, dass es keine Nachfrage nach Zeitschriften gibt, und sie werden es nicht tun, bis die Nachfrage sie dazu zwingt.
Der letzte Punkt auf dieser Liste ist größtenteils irrelevant, da die Varianz zwischen Menschen signifikant reduziert werden kann - und im Fall der GRE-Bewertung signifikant reduziert wird.
Ian Sudbery
2018-08-13 14:29:09 UTC
view on stackexchange narkive permalink

Der größte Unterschied besteht darin, dass die Person, die die Bewertung durchführt, bis zur Stufe der Doktorarbeit eher ein Experte ist als die Person, die bewertet wird. In fast allen diesen Fällen gibt es eine Reihe vereinbarter Standardfähigkeiten, -techniken und -kenntnisse, über die jeder Prüfer verfügen kann und an denen jeder Prüfer gemessen wird.

Dies gilt nicht so für eine Doktorarbeit Aber am Ende, wenn ein Betreuer / Diplomarbeitskomitee einen Studenten grün beleuchtet hat, werden fast alle Doktorarbeiten bestanden.

Es ist definitiv nicht höher. In fast allen Fällen ist die zu überprüfende Person eher ein Experte in ihrer Arbeit als jeder, der die Überprüfung durchführt. Die einzigen Ausnahmen sind direkte Wettbewerber, und sie werden ausgeschlossen. Wir sprechen direkt am Rande des menschlichen Wissens, verschiedene Menschen haben unterschiedliche Kenntnisse und Fähigkeiten.

Ich bin ziemlich überrascht, dass die GRE-Werte so konsistent sind. Es ist seit langem bekannt, dass die Kennzeichnung von Aufsätzen ziemlich willkürlich ist (siehe zum Beispiel Diederich 1974 [1]). Wohlgemerkt, 1 Punkt auf einer 6-Punkte-Skala beträgt 15% - ein ziemlich großer Unterschied. In unserem Abschluss ist ein 70er und höher ein erstklassiger Abschluss - die beste Note gibt es, während 55 ein 2: 2-Abschluss ist, ein Abschluss, bei dem Sie für die meisten Absolventenjobs kein Vorstellungsgespräch erhalten. Wenn Sie bei einer Zuschussbewertung 15% verlieren, verlieren Sie mit ziemlicher Sicherheit den Zuschuss.

Aber selbst um dieses Maß an Konsistenz zu erreichen, müssen die Bewerter eine ziemlich vorgeschriebene Bewertungsrubrik erhalten haben. In der Forschung gibt es keine solche Rubrik; Es gibt keine vordefinierten Kriterien, an denen eine Forschungsarbeit gemessen wird, und jeder Versuch, eine festzulegen, würde den gesamten Forschungspunkt mehr oder weniger zerstören.

* "In der Forschung gibt es keine solche Rubrik, es gibt keine vordefinierten Kriterien, an denen eine Forschung gemessen wird" * ... wirklich?Ich habe definitiv das Gefühl, dass es gut etablierte Kriterien gibt. Die Forschung wird beurteilt nach: (1) Korrektheit, (2) Neuheit, (3) Schwierigkeit, (4) Nützlichkeit, (5) Reproduzierbarkeit ...
@Mehrdad Bereits stoßen Sie auf Probleme.Was bedeutet "Reproduzierbarkeit" für einen mathematischen Satz?Was bedeutet "Korrektheit" für einen philosophischen Text?Und ich denke, jeder würde es schwer haben, für jede dieser Kategorien bei einem Papier numerische Noten zu vergeben.Und es gibt keine Schwelle, oberhalb derer ein Papier angenommen und unterhalb derer das Papier abgelehnt wird.
@NajibIdrissi: Dies sind keine Probleme ... Sie bewerten einfach alles, was nicht zutreffend ist, als N / A.Was die Vergabe von numerischen Noten angeht, wäre es noch schwieriger, einem GRE-Aufsatz ähnliche numerische Noten zu geben, daher verstehe ich hier nicht, wie das ein Gegenargument ist.
Die Fußnote zur Erweiterung "Diederich 1974" fehlt.
Ich glaube, [1] ist "Diederich, P. B. (1974). Messung des Wachstums in Englisch. Urbana, IL: Nationaler Rat der Englischlehrer."(https://eric.ed.gov/?id=ED097702) Ein weiteres verwandtes Papier des Autors mit einer etwas nützlicheren Zusammenfassung: Diederich, PB, Französisch, JW und Carlton, ST (1961), FAKTOREN BEI SCHRIFTLICHEN URTEILENFÄHIGKEIT.ETS Research Bulletin Series, 1961: i-93.[doi: 10.1002 / j.2333-8504.1961.tb00286.x] (https://doi.org/10.1002/j.2333-8504.1961.tb00286.x) (der "freier Zugang" sagt, aber möglicherweise nur meine Universität ist)
@mehrdad - Ihre 2,3 und 4 sind alle äußerst subjektiv.
@Mehrdad das sind Kriterienkategorien, keine Rubrik.Ob eine bestimmte Arbeit eines Ihrer Kriterien erfüllt, ist, wie oben erwähnt, völlig subjektiv.In der Zwischenzeit wird ein Aufsatz vom Typ GRE sehr spezifische Kriterien haben: Wenn wir UG-Aufsätze abschließen, enthält der Aufsatz eine 2- oder 3-seitige Liste geeigneter Inhalte + eine Anleitung, die Folgendes enthält: Inhalt - 5: Meist gelehrte Inhalte (einige Lücken zulässig),plus einige nicht unterrichtete Inhalte, 4: Die meisten unterrichteten Inhalte, aber einige Lücken 3: Hauptlücken ... Struktur - 5: Gut konstruierte und logisch wasserdichte Argumentation usw.
"Die einzigen Ausnahmen sind direkte Wettbewerber, und sie werden ausgeschlossen."- Je nach Fachgebiet kann die Überprüfung der Arbeit Ihrer direkten Konkurrenten aus genau den beschriebenen Gründen sehr häufig sein.
Ich wurde von Leuten überprüft, die weniger Fachwissen haben als ein Student, der gerade gelesen hat.Diese Antwort würde einige Variationen erklären, nicht die extreme Zufälligkeit, die wir oft erleben.-1.
@einpoklum Ein Student in einem Labor, der genau das tut, was überprüft wird, und der Zeit zum Lesen hat (im Gegensatz zu jedem akademischen, den Sie kennen), ist wahrscheinlich besser informiert als ein Prüfer.
Ray
2018-08-13 23:42:00 UTC
view on stackexchange narkive permalink

In Bezug auf das Problem, dass gute Papiere abgelehnt werden , scheint ein Faktor, der noch nicht erwähnt worden zu sein, dass die Konsequenzen der Annahme eines gefälschten Papiers viel schlimmer sind als die der Ablehnung eines guten Papiers Papier. Wenn ein gutes Papier abgelehnt wird, kann es jederzeit erneut in einem anderen Journal eingereicht werden. Und wenn die Autoren zuerst gemäß den Kommentaren des Rezensenten überarbeiten, ist die Version, die am Ende veröffentlicht wird, möglicherweise besser geschrieben als die, die abgelehnt wurde. Alles, was verloren geht, ist Zeit.

Wenn jedoch ein gefälschtes Papier akzeptiert wird, können andere Wissenschaftler es in der Literatur sehen, davon ausgehen, dass seine Ergebnisse gültig sind, und ihre eigene Arbeit darauf aufbauen es. Dies könnte zu einem erheblichen Zeitverlust von ihrem Teil führen, da Experimente, die vom falschen Ergebnis abhängen, nicht so funktionieren, wie sie sollten (was zumindest dazu führen kann, dass das falsche Papier zurückgezogen wird, wenn die Fehler vorliegen Schlecht genug). Oder sie vermeiden es, nach einer Linie zu recherchieren, die funktioniert hätte, , weil das falsche Papier impliziert, dass dies nicht der Fall wäre, oder schlimmer noch, sie werden selbst ungenaue Ergebnisse erzielen und am Ende ein weiteres Papier mit schlechten Daten in die Literatur. All dies sind weitaus schlechtere Ergebnisse als die Notwendigkeit, ein Papier erneut einzureichen. Daher werden bei der Überprüfung falsch negative Ergebnisse falsch positiven vorgezogen.

Dies ist wirklich die beste Antwort und macht am meisten Sinn und beinhaltet den geringsten Zynismus.Ich bin mir nicht sicher, warum dies nicht sehr positiv bewertet wird, da es wirklich die Kernherausforderungen des Prozesses erklärt (Gefahr, ein schlechtes Papier anzunehmen).
Dies ist definitiv eine gute Perspektive und ein gutes Argument.Derzeit bestehen jedoch auch viele gefälschte Papiere den Überprüfungsprozess.Ich kann sie auf meinem Gebiet hervorheben.Und gute Papiere oder gute Papiere mit widersprüchlichen Ergebnissen schaffen es nicht.Ich habe ein Beispiel, in dem Menschen getötet wurden, weil ein veröffentlichtes Papier zum Standard wurde (in der Medizin) und gegnerische Papiere abgelehnt wurden (was zu sehr verärgerten und enttäuschten Wissenschaftlern führte). Persönlich glaube ich, dass ein Wissenschaftler niemals von der Beurteilung der Qualität veröffentlichter Papiere entlastet wird.Ich verlasse mich nicht darauf, dass ein Artikel veröffentlicht wird.Ich benutze meine eigenen Urteilsfähigkeiten.
Darüber hinaus deutet nichts darauf hin, dass die abgelehnten Papiere zum Zeitpunkt der ursprünglichen Einreichung schlecht waren und erst nach ihrer Überarbeitung klar genug für die Veröffentlichung waren.Es ist selten, dass ein Autor das Schreiben / die Präsentation nach der Ablehnung nicht wesentlich überarbeitet. Schließlich besteht die Wahrscheinlichkeit, dass das Ergebnis zweimal dasselbe ist, wenn Sie dasselbe Papier zweimal einreichen.Ich bin tatsächlich überrascht, dass nur 8 solcher Papiere gefunden wurden.
Buffy
2018-08-13 21:50:41 UTC
view on stackexchange narkive permalink

Dies wird Ihre Frage nicht wirklich beantworten, aber ich möchte auf Ihr erstes Beispiel eingehen - abgelehnte Papiere, die später zu Nobelpreisen führten.

Manchmal ist eine Arbeit Frame Breaking und führt zu einem Paradigmenwechsel innerhalb eines Feldes. Dies ist in der Geschichte schon oft vorgekommen, zumindest seit Copernicus und Galileo. Einsteins frühes Relativitätswerk wurde von der Physik / Astronomie hoi oligoi abgelehnt, da es sich zu sehr vom damaligen Glauben an den Äther unterschied. Die prominentesten Mitglieder des Fachs lehnen eine radikal neue Idee ab, und ihre Studenten, die allgegenwärtig vertreten sind, machen normalerweise mit.

Es wurde gesagt, dass Revolutionen in der Physik den Tod oder die Pensionierung der angesehensten Forscher erfordern, damit die Ideen der Jugend ein faires Gehör finden und in den Vordergrund treten können.

Dies ist in der Tat eine Erklärung für mindestens einige der acht Artikel, auf die in Ihrem ersten Link verwiesen wird.

Ich glaube nicht, dass viele von uns paradigmenwechselnde Artikel schreiben, aber es kommt gelegentlich vor. Die wirklich brillanten (nicht schuldigen) unter uns müssen für den größten Teil einer Generation oft in nahezu Stille und Dunkelheit arbeiten. Die nächste Generation kann sie feiern, oder es kann noch länger dauern.

Wenn ein Prüfer mit einem wirklich rahmenbrechenden Papier konfrontiert ist, hat er per Definition keinen Bezugsrahmen, in dem er es bewerten kann. Es ist orthogonal zu ihrer gesamten Denkweise. "Das muss Unsinn sein", lautet die allzu natürliche Antwort.

Lesen Sie zum Beispiel die kurze Wikipedia-Biografie von Ramanujan.

Thomas Kuhns Buch "Die Struktur wissenschaftlicher Revolutionen" ist die klassische Lesart in diesem Punkt.
Dies ist die relevanteste Antwort auf die direkte Frage: Nobelpapiere sind von Natur aus radikal oder revolutionär.Dies macht ihre Überprüfung natürlich umso skeptischer.
Es ist nicht nur die Physik, in der Revolutionen einen Wachwechsel erfordern.Dies geschieht auch in der Geologie und Chemie.
@PeterShor, stimmt und nicht nur die Wissenschaft.
aeismail
2018-08-13 14:51:35 UTC
view on stackexchange narkive permalink

Unterschiedliche Aufgaben, unterschiedliche Ergebnisse.

Die GRE-Bewerter müssen lediglich Punktzahlen zuweisen, dies tun jedoch Dutzenden oder Hunderten von Aufsätzen. Sie erhalten klare Anleitungen und Beispiele dafür, welche Punktzahl bestimmte Aufsätze wahrscheinlich erhalten sollten. Es handelt sich also im Grunde genommen um Kontrollkästchen, um eine kleine Reihe von Ergebnissen zu rechtfertigen.

Eine Peer-Review-Analyse unterscheidet sich grundlegend, da Sie nach einer technisch viel schwierigeren Aufgabe fragen. Sie müssen bewerten, ob die Analyse korrekt ist, und nicht, ob sie auf eine Aufforderung reagiert. Es gibt auch keine Beispiele, auf die man zurückgreifen könnte. Daher kann der Schwerpunkt der Begutachtung durch Fachkollegen für verschiedene Prüfer sehr unterschiedlich sein, die möglicherweise über unterschiedliche Fachkenntnisse verfügen und sicherlich ihre eigenen Standpunkte vertreten.

* Es gibt auch keine Beispiele, auf die man zurückgreifen könnte * Was ist mit all den bereits veröffentlichten Artikeln?
Pete L. Clark
2018-08-13 21:51:47 UTC
view on stackexchange narkive permalink

Um akademische Peer Review mit GRE-Einstufung zu vergleichen - das lässt Äpfel und Orangen so gut wie identisch aussehen. Gehen wir etwas näher heran:

Soweit ich weiß, kommen Leser von Diplomarbeiten, Leser von Diplomarbeiten und sogar Leser von Doktorarbeiten in der Regel nicht zu diametral entgegengesetzten Urteilen über die Arbeit .

Das ist sicherlich nicht immer wahr und stark feldabhängig. In bestimmten Teilen der Wissenschaft ist es eine Standard-Horrorgeschichte für Studenten, dass Komiteemitglied A darauf besteht, dass die These in Bezug auf die theoretische Perspektive X gegossen wird, während Komiteemitglied B darauf besteht, dass die These in Bezug auf die theoretische Perspektive Y gegossen wird, wobei X und Y kann intellektuell inkompatibel oder soziologisch inkompatibel sein: dh jede Theorie hat die Ablehnung der anderen als zentralen Grundsatz. Dies ist häufiger in den Geisteswissenschaften der Fall, wo die Natur der "Theorie" sich vom Rest der Arbeit unterscheidet, aber auch in den Wissenschaften nicht ungewöhnlich ist.

Als häufiges Ausschussmitglied weiß ich zufällig auch, dass es sowohl ein soziologisches als auch ein intellektuelles Phänomen ist, zu einem Konsensurteil zu gelangen - dh einige Unterschiede im Urteil beschränken sich nur auf die folgende private Diskussion Die Verteidigung und andere Unterschiede in der Beurteilung werden niemals verbalisiert.

Dies ist hilfreich, um die Unterschiede bei der Begutachtung durch Fachkollegen zu verstehen: Bei der Begutachtung durch Fachkollegen sind die verschiedenen Schiedsrichter (zumindest nach meiner Erfahrung) niemals direkt Kommunikation untereinander, und in der Tat kann es sein, dass sie die Urteile des anderen überhaupt nicht sehen: Als Schiedsrichter glaube ich, dass mir noch nie ein anderer Schiedsrichterbericht gezeigt wurde. In der Tat,

Wer beobachtet die Wächter?

Es gibt keinen Aspekt des akademischen Prozesses, durch den ich mich mehr als einsamer maskierter Bürgerwehrmann fühle als als Schiedsrichter. Sicherlich durchlaufen Menschen, die eine GRE-Einstufung durchführen, einen langwierigen Trainingsprozess mit wiederholten Praxisbewertungen, Rückmeldungen zu diesen Bewertungen, Diskussion der größeren Ziele usw. Für akademische Schiedsrichter gibt es nichts Vergleichbares. Wir bekommen keine Übung und es gibt sehr wenig Bewertung unserer Arbeit. Wenn ich einen ungewöhnlich umfassenden Bericht (ich denke!) Ungewöhnlich schnell einreiche, bekomme ich oft ein "Hey, danke!" E-Mail vom Herausgeber. In der (zum Glück eher geringen) Anzahl von Fällen, in denen meine Schiedsrichterberichte monatelang überfällig waren, hörte ich entweder nichts von den Redakteuren (ich schäme mich zu sagen, dass ich, sobald ich selbst herausgefunden hatte, dass ich ein Papier habe Ich dachte, ich hätte ein paar Monate lang tatsächlich ein ganzes Jahr verbracht) oder bekam sorgfältig höfliche Bitten, den Bericht einzureichen. Ich habe nachträglich nie ein negatives Feedback erhalten. Im Gegensatz zu GRE-Gradern sind Schiedsrichter Freiwillige .

Ich finde (wieder in meiner Erfahrung und in meinem akademischen Bereich der Mathematik), dass Schiedsrichter fast nie mehr Anweisungen erhalten, die sich auf mehr belaufen als "1) Verwenden Sie Ihr bestes Urteilsvermögen. 2) Wir sind eine wirklich gute Zeitschrift und möchten, dass Sie hohe Standards auferlegen." Ich stelle auch fest, dass 2) für Zeitschriften von sehr unterschiedlicher Qualität gesagt wird. Was bedeutet es, "hohe Standards aufzuerlegen"? Ich nehme diese Anweisung ernst und feuere meine Schüsse so sorgfältig wie möglich in die Dunkelheit, aber ... das ist natürlich lächerlich, maximal subjektiv.

Auf der anderen Seite ist Ihr dritter Link ziemlich alarmierend.Es beschreibt einen systematischen Prozess der erneuten Einreichung von Artikeln, die von renommierten Fachzeitschriften in den letzten drei Jahren angenommen und veröffentlicht wurden, an dieselbe Zeitschrift, die sie veröffentlicht hat.In den meisten Fällen erkannten die Zeitschriften nicht an, dass sie die Artikel zuvor veröffentlicht hatten.Das finde ich sehr überraschend.
Has QUIT--Anony-Mousse
2018-08-13 21:28:41 UTC
view on stackexchange narkive permalink

Übermittlung der Übermittlung

Wir schreiben immer mehr und die typische Übermittlungsqualität scheint zu sinken. Dies hat verschiedene Gründe, einschließlich schlechter Anreize , insbesondere in China. Wenn Ihr Gehalt direkt auf den Papieren akzeptiert wird, schlägt Quantität Qualität ...

IMHO sind wir jetzt kurz vor einem Wendepunkt. Viele der Experten lehnen fast jede Überprüfungsanfrage ab - weil so viele Einsendungen so schlampig sind, dass es ziemlich ärgerlich ist, sie zu überprüfen. Es sollte anders sein: Die meisten Einsendungen sollten von so hoher Qualität sein, dass Sie das gerne lesen und sich auf die Details konzentrieren können. So ärgern sich immer mehr Experten. Sie delegieren mehr Überprüfungen an die Schüler oder lehnen sie einfach ab. Aber das bedeutet jetzt, dass die verbleibenden Gutachter mehr Anfragen und mehr schlechte Papiere erhalten. Dies kann wie bei den meisten Ökosystemen schnell kippen.

Die Redakteure müssen also andere Prüfer finden, und wir erhalten immer weniger fachkundige Prüfer. Dies öffnet auch Türen für Betrug und Pläne. Multimedia-Tools und -Anwendungen scheinen beispielsweise dem Manipulationsschema von Redakteuren und Rezensenten zum Opfer gefallen zu sein.

Was ist also die Lösung? Ich weiß es nicht.

  • Machen Sie den Bearbeitungseditor und die Namen der Prüfer öffentlich und damit für akzeptierte Papiere rechenschaftspflichtig - dies war früher recht üblich. Experten überprüfen ihre Bewertungen in der Regel öffentlich, wenn sie das Papier akzeptieren (dies war in einigen Bereichen eine tatsächliche Bestätigung der Arbeit). Dies erleichtert die Aufdeckung von Korruption und Schemata mit modernen Analysen. Dies wird es jedoch wahrscheinlich nur schwieriger machen, Experten-Reviewer zu finden ...
  • Führen Sie die erste Review nur mit einem Reviewer durch (um die Belastung der Reviewer zu verringern), mögliche Ergebnisse "vorzeitige Ablehnung" und "vollständige Überprüfung" ".
  • Fordern Sie die Autoren auf, 5 Überprüfungen pro akzeptierter Veröffentlichung durchzuführen (damit die Experten die Überprüfung nicht einfach vollständig beenden können, es sei denn, sie gehen in den Ruhestand - die erste Veröffentlichung ist" kostenlos ", aber Sie können Überprüfungsanfragen nicht weiter ablehnen)?
  • Bezahlen Sie tatsächlich die Experten! Sobald Sie sicher sind, dass sich eine Einreichung lohnt, sollte dies angesichts der absurden Gewinnspanne von Elseviers eine Option sein. Ich glaube, das Hauptproblem hierbei ist die hier beteiligte Bureokratie (die entscheidet, ob eine Überprüfung von hoher Qualität ist) und die unterschiedlichen Lohnkosten in verschiedenen Ländern. In Kombination mit der obigen Vorbewertung wird dies jedoch den "Wert" guter Bewertungen erhöhen. Dies wiederum erhöht jedoch das Risiko, dass Systeme damit Geld verdienen ...
  • Überprüfen Sie die Bewertungen und vergeben Sie die besten Bewertungen.
  • Bestrafen Sie wiederholte Ablehnungen mit einer Verzögerung von Machen Sie Spam teuer.
  • Begrenzen Sie die Anzahl der Einreichungen pro Autor und Jahr (bedeutet wahrscheinlich nur, dass die Einreichungen an einen anderen Ort gehen - dies kann also einer bestimmten Zeitschrift helfen, aber nicht der gesamten Community)?
  • Finanzielle Anreize verbieten - Wenn Ihr Land / Ihre Universität einen solchen direkten finanziellen Anreiz hat, dürfen Sie keine bestimmten Top-Zeitschriften einreichen. Dann werden diese schlechten Anreize schnell abgeschafft, weil sie dazu neigen, auch nach Top-Zeitschriften zu fragen. Aber es kann nur dazu führen, dass die Zahlungen verzögert oder versteckt werden ... Ich weiß es nicht. Ich bin kein Experte für Politik. Dies sind nur einige Ideen.
WBT
2018-08-13 22:12:58 UTC
view on stackexchange narkive permalink

Einen Punkt über andere Antworten hinaus beitragen:

Unterschiedliche Anstrengungen bei der Überprüfung führen zu unterschiedlichen Ergebnissen.

Papiere werden häufig so geschrieben, dass Bei einem ersten Durchgang sollte es "ziemlich gut" lauten, selbst wenn ein kritischeres tiefes Lesen und / oder Überprüfen von Referenzen klaffende Löcher, schwerwiegende methodische Probleme und alternative Erklärungen für die beobachteten Ergebnisse aufdecken würde. Manchmal kann eine noch aufwändigere Überprüfung ergeben, dass diese Probleme im speziellen Fall, der für dieses bestimmte Papier gilt, nicht wirklich von Bedeutung sind (obwohl der Autor dies im Allgemeinen dem Papiertext selbst hinzufügen sollte).

Während Gutachter durch das allgemeine Wissen, dass das System davon abhängt, einen Anreiz erhalten, gute Arbeit zu leisten, werden bestimmte Instanzen im Allgemeinen nicht angeregt, und Bewertungen werden manchmal bis zur letzten Minute von einem Gutachter belassen, der wenig Schlaf hat und lange auf andere Aufgaben, die sich nicht um eine gute Bewertung bemühen. Daher kann das Ergebnis sehr unterschiedlich sein, als wenn sogar dasselbe Papier zu einem anderen Zeitpunkt vom gleichen Gutachter geprüft wird. Ohne Einblick in die Faktoren, die dieses Ergebnis beeinflussen, scheint es zufällig zu sein.

Wrzlprmft
2018-08-14 18:24:56 UTC
view on stackexchange narkive permalink

Um den Aspekt zu behandeln:

Dasselbe Papier, das nach mehreren Jahren erneut bei derselben Zeitschrift eingereicht wurde, wird häufig aufgrund schwerwiegender methodischer Fehler abgelehnt.

In etwa einem Drittel der von mir überprüften Papiere habe ich grundlegende Mängel festgestellt, die durch eine Überarbeitung des Papiers nicht behoben werden konnten (Sie müssten stattdessen ein neues Papier schreiben). Einige Beispiele, um Ihnen einen Vorgeschmack zu geben:

  • Die gesamte Analyse war eine sich selbst erfüllende Prophezeiung, dh das Ergebnis war eine Annahme.
  • Ein vorgeschlagenes Merkmal war ein Kreisverkehr Art und Weise, etwas viel trivialeres Eigentum zu messen. (Dies geschah bereits zweimal.)
  • Ein vorgeschlagenes Modell ignoriert den vorherrschenden Mechanismus für das, was es modellieren soll.
  • In der gesamten Studie ging es darum, ein Artefakt eines bekannten Anfängers zu verstehen Fehler (ohne diesen Fehler zu identifizieren).

Obwohl ich mich in diesen Dingen geirrt habe, haben die Autoren meine Bedenken nie angesprochen, sei es in einer Gegenargumentation oder einer Version des Papiers, die in einer anderen Zeitschrift veröffentlicht wurde (was in den meisten Fällen nie passiert ist) - was sie tun sollten, auch wenn ich falsch liege.

Nun scheinen diese Probleme leicht zu erkennen zu sein, aber offensichtlich waren sie es nicht : Ich habe einige dieser Mängel erst beim Verfassen der eigentlichen Rezension entdeckt und bei der Diskussion von Papieren mit Kollegen, von denen ich wusste, dass sie gründlich sind, einige Kieferkot gesehen (und durchgeführt). In einigen Fällen habe ich auch Berichte von anderen Schiedsrichtern gesehen, die ansonsten erschöpfend waren, aber die Probleme nicht erkannt haben.

Fazit: Selbst grundlegende Mängel sind schwer zu erkennen. Ein bestimmter Rezensent hat nur eine vergleichsweise geringe Chance, einen bestimmten Fehler in einem Artikel zu erkennen. Daher besteht eine beträchtliche Wahrscheinlichkeit, dass alle Prüfer scheitern.


¹Ja, das ist eine Sache in meinem Bereich und wird von den Zeitschriften voll akzeptiert. Sup>

Ich bin neugierig auf den Teil "Diskussionen mit Kollegen besprechen", da dies (wie ich in meiner Antwort erwähnt habe) in meinem Bereich (Mathematik) absolut keine Sache ist.(Obwohl in meinem Bereich die häufigste Anzahl von Schiedsrichtern eins ist.) Wie funktioniert das?
@PeteL.Clark: Im Wesentlichen darf ein Schiedsrichter die Beiträge von Kollegen einholen, sofern diese sicherstellen, dass das überprüfte Material vertraulich behandelt wird, und die zusätzlichen Prüfer bei der Einreichung der Überprüfung benennen ([Richtlinienbeispiel] (https: //journals.aps).org / pre / Autoren / redaktionelle Richtlinien-Praktiken # Anonymität)).In der Regel nimmt ein Berater einen Berater in das Team auf.
BruceET
2018-08-16 13:04:30 UTC
view on stackexchange narkive permalink

Der grundlegende Unterschied zwischen der Bewertung von GRE-Aufsätzen und der Überprüfung von zur Veröffentlichung eingereichten wissenschaftlichen Arbeiten wurde in mehreren früheren Antworten mit Nachdruck erörtert. Der grundlegende Unterschied zwischen der Prüfung von Zuschussanträgen und Veröffentlichungen besteht nicht.

Veröffentlichungen. Wenn eine Veröffentlichung bei einer Zeitschrift eingereicht wird, handelt es sich normalerweise um ein fertiges Produkt oder um mindestens ein abgeschlossener Schritt in Richtung eines definierten Ziels. Es ist wirklich schwierig, Rezensenten zu finden, die in der Lage sind, die Bedeutung eines Papiers einzuschätzen und jede Lücke in der Argumentation oder jede Unvollkommenheit in der Technik zu finden, aber zumindest Rezensenten von Zeitschriftenartikeln haben die Ergebnisse einer Forschungsarbeit bei Hand.

Ein potenzielles Nobelpapier kann Material abdecken, das so neu oder so weit von den ausgetretenen Pfaden entfernt ist, dass es besonders schwierig ist, es fair zu überprüfen. Ein nach mehreren Jahren erneut eingereichtes Papier basiert möglicherweise auf Verfahren oder Techniken, die in der Zwischenzeit erheblich verfeinert wurden. Vielleicht waren sie zum Zeitpunkt der ursprünglichen Einreichung auf dem neuesten Stand der Technik, sind aber jetzt in Bezug auf die derzeit verfügbaren Methoden „ernsthaft fehlerhaft“. Es ist daher nicht verwunderlich, dass Rezensenten bei diesen Aufgaben nicht 100% erreichen.

Obwohl es sich bei den Gutachtern um unbezahlte, überarbeitete Freiwillige handelt, die ohne spezielle Schulung oder Rückmeldung zu den Einzelheiten der Prüfung arbeiten, finde ich es überraschend, wie gut die Prüfung von Zeitschriften in der Praxis funktioniert.

Zuschüsse. Im Gegensatz dazu ist die Beurteilung von Forschungsstipendien etwas ganz anderes Art der Aktivität. Vor einigen Jahren (als die US-Bundesmittel auf einem viel höheren Niveau als heute verfügbar waren) verbrachte ich mehrere Jahre bei einer Bundesbehörde mit einem relativ großen Budget für die Unterstützung der Grundlagenforschung und angewandten Forschung in verschiedenen wissenschaftlichen Bereichen. Deshalb werde ich versuchen, diesen Teil des Bildes kurz anzusprechen. Zunächst möchte ich sagen, dass ich überhaupt nicht überrascht bin, dass eine Gruppe von Wissenschaftlern die Finanzierung des NIH (oder einer anderen US-Regierungsbehörde) als „nicht besser als eine Lotterie“ ansieht.

Im Allgemeinen Wenn Sie genau wissen, was Sie tun, wie lange es dauern wird und wie viel es kosten wird, forschen Sie nicht. Gutachter können oft hilfreich sein, um die Erfolgsbilanz eines Antragstellers zu bewerten und eine ungefähre Vorstellung davon zu vermitteln, ob der Antragsteller befugt ist, in einem bestimmten Bereich Forschung zu betreiben. (Ich sollte hinzufügen, dass die meisten Programmdirektoren die Standards, Vorurteile, Schwächen und Stärken der von ihnen verwendeten Gutachter gut kennen. Ich war selten vom Inhalt einer angeforderten Prüfung überrascht, aber die wenigen Überraschungen waren äußerst wertvoll.) Die Eingabe von Gutachtern ist nur ein Teil des Bildes.

Über die Eingabe von Gutachtern hinaus müssen Programmdirektoren bei der Gewährung von Agenturen andere Faktoren berücksichtigen. Bis zu einem gewissen Grad müssen sie finanzielle, politische und infrastrukturelle Faktoren berücksichtigen. "Politisch" bedeutet normalerweise, dass dieses Geld speziell zur Unterstützung eines bestimmten wissenschaftlichen Ziels verwendet oder gespendet wurde. Infrastrukturelle Belange können sich auf die Entwicklung von Technologien konzentrieren, die Agenturziele sind, die Ausbildung von Doktoranden in Bereichen, in denen es nicht genügend Forscher gibt, ob die Institution, die den Zuschuss beantragt, die Raffinesse für eine angemessene Verwaltung hat, und so weiter.

In den USA können Agenturen wie NIH, NSF, DoE, EPA, verschiedene Verteidigungsagenturen und verschiedene privat finanzierte Stiftungen sehr unterschiedliche Ziele verfolgen. Jedoch klar diese Agentur Missionen und Ziele können in „Aufforderungen zur Einreichung von Vorschlägen“ formuliert werden. Sie werden häufig von Antragstellern ignoriert, die ihre Arbeit besser begründen könnten, wenn die entsprechenden Zusammenhänge klargestellt würden.

Trotz dieser Einschränkungen Bei der Vergabe von Stipendien bemühen sich die Programmdirektoren, nur die Wissenschaft von höchster Qualität zu unterstützen, und ich glaube, dass ihnen dies normalerweise gelingt. Nach meiner Erfahrung sehen sich fast alle zuerst als Wissenschaftler und dann als Bürokraten der Agentur. Ihr Erfolg beruht häufig auf der beträchtlichen Hilfe von Gutachtern, manchmal jedoch nicht.

Keith
2018-08-20 06:23:49 UTC
view on stackexchange narkive permalink

Als ich in der Informatikschule war, bemerkte ich einige Herausforderungen bei der Überprüfung der Arbeit. Die meisten dieser Dinge habe ich durch die Erfahrungen anderer beobachtet:

  1. Zeitschriften und Konferenzen nutzen die Community früherer Autoren, um Artikel zu überprüfen. Die Leute, die am meisten veröffentlichen, arbeiten sehr hart. Sie können möglicherweise nicht genügend Zeit investieren, um ein Papier gut zu überprüfen. Wenn das Material in dem Artikel neuartig, ungewohnt, langweilig, hochtechnisch oder unklar ist, ist es aufgrund dieser Faktoren weniger wahrscheinlich, dass es sorgfältig geprüft wird.
  2. Der Prüfer, der ursprünglich von der Veröffentlichung ausgewählt wurde, kann das Material aushändigen Überprüfen Sie die Aufgabe an einen Doktoranden. Der Student lernt möglicherweise gerade, Forschungsarbeiten auf diesem Gebiet zu lesen und zu verdauen. Wenn das Material schwierig ist, kann der unerfahrene Prüfer es möglicherweise nicht angemessen prüfen und hat möglicherweise nicht gelernt, seine Urteile entsprechend ihrem Verständnis zu qualifizieren.
  3. Die qualifiziertesten Prüfer haben häufig starke Ansichten zu den Gegenstand und kann einen ganz anderen Ansatz haben. Die kognitive und emotionale Dissonanz, die man verspürt, wenn man versucht, die Anwendung unbekannter Werkzeuge auf vertraute Probleme zu verstehen, kann zu viel sein, um sie zu überwinden. Natürlich kann diese harte Arbeit für beide Seiten zu Vorteilen führen, wenn der Prozess funktioniert.
  4. Ein erfolgreicher neuer Ansatz kann sogar als Bedrohung für andere Forscher oder die gesamte Gemeinschaft empfunden werden. Echte Durchbrüche werden die Forschungslinien stören, die andere verfolgen. Dies ist ein Grund dafür, dass starke Ansprüche an einen höheren Rechtfertigungsstandard gestellt werden.
  5. Autoren konkurrieren um begrenzten Platz in Zeitschriften und Konferenzen. Ich habe Autoren sagen hören, dass sie das Gefühl haben, dass ein Artikel aufgrund einer unfairen Überprüfung durch einen selbstinteressierten Rivalen abgelehnt wurde. Natürlich können sie das normalerweise nicht sicher wissen.
  6. Manchmal machen Rezensenten gültige Kommentare, aber die starke emotionale Bindung des Autors an ihre Arbeit führt dazu, dass sie das Feedback ablehnen. Dies kann den Prozess blockieren und es aufgrund unkorrigierter Fehler schwierig machen, Arbeiten zu veröffentlichen, selbst wenn die Arbeiten stark sind. Ich habe sogar in einigen berühmten Zeitungen darüber gelesen.
  7. ol>

    Das Veröffentlichen von Papieren ist für die meisten Autoren eine wesentliche berufliche Tätigkeit, aber das Überprüfen von Papieren ist ein Akt des Zivildienstes. Das fasst viele der spezifischen Probleme zusammen.



Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 4.0-Lizenz, unter der er vertrieben wird.
Loading...