Frage:
Streit um Präzision mit dem Mitautor
Sideshow Bob
2014-06-09 18:27:05 UTC
view on stackexchange narkive permalink

Ich habe derzeit eine Meinungsverschiedenheit mit einem Mitautor auf einem Papier über die Frage der signifikanten Zahlen.

Er möchte (zum Beispiel) angeben, dass eine bestimmte Organisation einen ökologischen Fußabdruck von 7.622 gha hat. Der ökologische Fußabdruck beruht auf einer Tonne von Annahmen und ist keine präzise Methode. Ich glaube daher nicht, dass wir in unseren Berechnungen etwa 4 signifikante Präzisionszahlen haben - höchstens 2. Daher möchte ich diese Zahl als 7.600 gha veröffentlichen.

Ich habe darauf hingewiesen, dass ein anderes Maß an Präzision impliziert, das wir nicht haben. Gegenwärtig veröffentlichen wir eine Zusammenfassung vor dem Peer-Review-Journal. Daher sagte ich auch, dass es peinlich wäre, wenn die Präzisionsprobleme in der Peer-Review-Phase aufgegriffen würden und wir am Ende zwei verschiedene Zahlen veröffentlichen würden. Er antwortet, dass er nie ein Problem damit hatte, genauere Zahlen in früheren Zeitschriftenveröffentlichungen zu veröffentlichen.

Der Koautor hat keinen quantitativen Hintergrund und hat daher nur begrenztes Verständnis für dieses Problem, ist jedoch älter. P. >

Also zwei Fragen

  • spielt dieses Problem überhaupt eine Rolle?
  • Was würden Sie dagegen tun?

UPDATE

Es sieht so aus, als ob Sie mir alle zustimmen, dass dies wichtig ist. Gut, ich bin nicht verrückt :)

Da wir derzeit eine Zusammenfassung / Pressemitteilung für die breite Öffentlichkeit schreiben, gibt es keinen Platz für wissenschaftliche Notationen oder Fehlerschätzungen - sie werden es schwieriger machen lesen und wahrscheinlich einige Leute abschrecken.

Kann mich jemand mit einer guten, höflichen und maßgeblichen Beschimpfung darüber verbinden, warum dies wichtig ist, die ich meinem Kollegen zeigen kann? Das Problem mit fast allem Material, das ich bei signifikanten Zahlen gesehen habe, ist, dass es nicht darum geht, Ziffern links vom Dezimalpunkt abzurunden. d.h. es geht darum, 7.36654 in 7.4 zu verwandeln, aber nicht 736654 in 740000. Ich vermute, mein Kollege zeichnet eine beliebige Linie in seinem Kopf am Dezimalpunkt, da er nicht weiß, dass die Position des Punktes nur eine Funktion der verwendeten Einheiten ist. Und ich bezweifle, dass sie für solche Argumente offen sind.

Hat Ihr Mitautor einen Grund angegeben, warum er die 7600-Zahl nicht verwenden möchte? Warum kümmert es ihn überhaupt?
Nein, und mein nächster Schritt könnte sein, ihm diese Frage zu stellen, aber ich möchte innehalten und zuerst nachdenken!
Die besten (Semi-) Rants, die ich bei einer Schnellsuche gefunden habe, sind https://suite.io/isaac-m-mcphee/yhv2y0 und http://web.mit.edu/10.001/Web/Course_Notes/Statistics_Notes/Significant_Figures .html weiß nicht, ob eines davon wirklich das ist, wonach Sie suchen.
Es kann sich lohnen, diese Frage Ihrem Kollegen zu zeigen (senden Sie ihm den Link oder sehen Sie sie nebeneinander an), um zu beweisen, dass Sie in diesem Bestreben nicht verrückt sind. Obwohl diese Frage keine primäre Quelle ist, zeigt sie, dass mindestens 13 Personen in den ersten 2 Stunden seit dem Posten (die 15 oder mehr Mitarbeiter auf dieser Website haben) festgestellt haben, dass dieses Problem, das sich speziell auf Ihre aktuelle Arbeit bezieht, wert ist diskutieren. Die Antwort mit der höchsten Stimme unterstützt auch Ihre Argumentation.
Ich glaube nicht, dass sie gut antworten würden - ich würde die Frage eher löschen, als sie lesen zu lassen! Aber nehmen wir an, ich könnte einen anderen fragen, der entpersönlicht ist.
Wenn Sie maßgebliche Referenzen wünschen, suchen Sie nach Handbüchern im Journalstil. Dieses Problem wird nicht so oft erwähnt, weil es zumindest in technischen Disziplinen stillschweigend verstanden wird. Einige Beispiele sind jedoch [der AMA Style Guide] (http://www.amamanualofstyle.com/view/10.1093/jama/9780195176339.001.0001/med-9780195176339-div1-214) und [der J. Food Comp. Anal. Leitfaden für Autoren] (http://www.elsevier.com/journals/journal-of-food-composition-and-analysis/0889-1575/guide-for-authors).
Dies ist das Problem - disziplinübergreifende Forschung - Sie können stillschweigendes Verständnis nicht für selbstverständlich halten!
Für mich sind 7.600 gha nicht weniger genau als 7.622 gha. Wie wäre es mit 7,6 kgha?
Wenn Sie 4 signifikante Stellen basierend auf Ihrer Quelldatengenauigkeit nicht rechtfertigen können, verwenden Sie nicht so viele. Sie werden während der Papierprüfung darauf hingewiesen. 7,6 kgha wären besser (vorausgesetzt, 2 signifikante Stellen sind unterstützbar), aber wenn Sie auch für ein Laienpublikum schreiben möchten, würde ich mich für die Pressemitteilung an 7600 halten, da dies verständlicher ist.
Wenn Ihr Kollege nicht verstehen kann, dass der Dezimalpunkt für die Anzahl der signifikanten Stellen irrelevant ist, nehmen Sie eine Zahl wie 736654 und präsentieren Sie sie in wissenschaftlicher Notation: 7.36654x10 ^ 5. Bitten Sie ihn, auf 2 signifikante Stellen zu runden - es ist jetzt 7,4x10 ^ 5. Ändern Sie es entweder wieder in die reguläre Notation (740000) oder in die technische Notation (740x10 ^ 3). Vergisst er es dann?
Leider Phil, du liegst wahrscheinlich falsch, dass wir darauf angerufen werden. Mein Kollege hat bereits mehrere Artikel dieser Art veröffentlicht und war zuvor nicht auf Präzision angewiesen.
Fünf antworten:
#1
+19
aeismail
2014-06-09 18:53:37 UTC
view on stackexchange narkive permalink

Nur weil Sie die zusätzlichen Ziffern haben, heißt das nicht, dass Sie sie melden sollten.

Genauigkeit und Präzision sind äußerst wichtige Konzepte bei der Berichterstattung über wissenschaftliche Daten. Übermäßige Präzision bedeutet, wie Sie meinen, zu viel Zuverlässigkeit bei der Genauigkeit wissenschaftlicher Daten. Zum Beispiel hat mir jemand einen Bericht vorgelegt, der besagt, dass ein bestimmter Parameter bekannt ist:

E = 1.3405987423423 GPa

Wenn dies in einem Artikel veröffentlicht würde, könnte es wegen Inkompetenz sofort abgelehnt werden, da der Parameter E oft nur mit einer oder zwei Dezimalstellen bekannt ist, geschweige denn mit vier.

Im Allgemeinen müssen Sie Ihre Berichterstattung mit den Annahmen und der Genauigkeit der Messtechniken in Einklang bringen. Eine Möglichkeit, dies herauszufinden, besteht darin, die Genauigkeit Ihrer Messung zu notieren. Was ist der erwartete Fehler bei der Messung? Wenn der Fehler in Ihrer Messtechnik beispielsweise plus oder minus 1 globaler Hektar beträgt, melden Sie ihn auf jeden Fall dem nächsten Hektar. Wenn es jedoch plus oder minus 1000 ist, sieht die Meldung auf den nächsten Hektar ziemlich albern aus.

Wie gehen Sie damit um? (Ich musste tatsächlich so etwas tun Dies zuvor. Ähnliches Argument, aber nicht genau dasselbe.) In diesem speziellen Fall kann es nützlich sein, sich auf eine kleine Übertreibung einzulassen. Zeigen Sie ihm eine Version des Textes, in der die Daten mit der vollen Genauigkeit aufgelistet sind, die Ihnen zur Verfügung steht, anstatt sie mit vier signifikanten Stellen zu melden - etwas eindeutig Lächerliches, das Dinge nach Möglichkeit mit sechs oder sieben Dezimalstellen meldet. Wenn er dann argumentiert, dass das, was Sie tun, keinen Sinn ergibt, können Sie argumentieren: "Was schadet es, zusätzliche Ziffern zu melden?" Das sollte ausreichen, damit Ihr Mitautor "das Licht sieht".

Leider glaube ich nicht, dass diese Taktik funktionieren würde: /
Protip: "Das bigfloat-Paket ist ein Python-Wrapper für die MPFR-Bibliothek für Gleitkomma-zuverlässige Arithmetik mit beliebiger Genauigkeit." :-)
#2
+9
nivag
2014-06-09 18:59:52 UTC
view on stackexchange narkive permalink

Idealerweise sollten Sie einen Hinweis auf die Unsicherheit geben, die mit Ihrem Wert einhergeht, z. 7600 ± 100 (oder was auch immer), auch wenn die Unsicherheit nur eine grobe Schätzung ist.

Das Problem ist, dass Ihre vorgeschlagene Lösung keinen wirklichen Hinweis auf Ihre Genauigkeit gibt. 7600 ist der wahre Wert, haben Sie gerundet bis 2s.f oder 3? Andererseits schlägt die andere Lösung eine zu große Genauigkeit vor, die ebenfalls falsch ist.

Wenn Sie eine Unsicherheit angeben, ist der tatsächliche Wert, den Sie eingeben, etwas weniger wichtig. Idealerweise sollten Sie die Antwort immer noch auf ähnliche Ebenen wie in Ihrer Unsicherheit geben, wie Sie vorgeschlagen haben, aber ich sage mehr, dass Sie keine Mehrdeutigkeit erzeugen.

Ob es darauf ankommt, vermute ich in vielen Bereichen kümmere mich nicht wirklich um so etwas. Aber es ist wichtig, also sollten sie sich darum kümmern und Sie auch.

hmm, weiß jemand warum mein latex hier nicht funktioniert? Ich denke es ist richtig.
Nicht alle SE-Sites unterstützen das gleiche Markup-Level. Wir benötigen im Allgemeinen kein LaTeX-Markup, daher haben wir es nicht. Sie können die Dinge in unserer [Sandbox] testen (http://meta.academia.stackexchange.com/questions/681/formatting-sandbox-please-test-stuff-here).
Leider ist die Angabe von Unsicherheiten für die Zielgruppe des Dokuments, das wir gerade schreiben, nicht angemessen (siehe mein Update).
@SideshowBob: Würden Ihre Zielgruppe und Ihre Daten es erlauben, eine allgemeine Aussage über die Genauigkeit zu treffen, z. B. an einer geeigneten Stelle zu schreiben: „Die relative Genauigkeit der hier angegebenen Umweltabdrücke variiert zwischen 0,1% und 2%?“ (Dies wäre dann ein zusätzliches Argument gegen Ihre Mitautoren, da Sie jetzt Ziffern melden würden, die Ihrer Meinung nach nicht zuverlässig sind.)
Leider entfernen wir wirklich alle unnötigen Zahlen aus der Pressemitteilung - ich bezweifle, dass dies die Bearbeitung bestehen würde (und die Berechnung in jedem Fall eine Weile dauern würde).
@SideshowBob In diesem Fall ist der Vorschlag von Peter Jansson wahrscheinlich der beste. Obwohl es für eine Pressemitteilung wahrscheinlich weniger wichtig ist. Tatsächlich würde ich mich für kgha entscheiden, da x10 ^ 3 für ein nicht wissenschaftliches Publikum möglicherweise nicht klar ist.
Wenn Sie die Unsicherheit im Wert kennen, können Sie den Wert einfach mit der Genauigkeit angeben, die Sie würden, wenn Sie die Unsicherheit einbeziehen würden, z. Wenn es 7600 ± 200 ist, geben Sie die Antwort als 7600 oder 7620 ± 50 als 7620 an.
#3
+9
Andy W
2014-06-09 21:42:44 UTC
view on stackexchange narkive permalink

Um die Antworten mit einigen akademischen Zitaten zu ergänzen, wird dieser Punkt in den Stilrichtlinien für Tabellen häufig aufgeführt. Obwohl sie häufig Beispiele für irrelevante gebrochene Ziffern geben (da dies in der Regel die ungeheuerlichsten Beispiele dafür sind, wo sie unlogisch sind), erstreckt sich die Logik hinter der Rundung überall dort, wo sich die signifikanten Ziffern befinden.

Zum Beispiel Feinberg & Wainer (2011) schlagen vor, dass maximal nur 3 Ziffern in der Tabelle angezeigt werden sollten, da es für Menschen schwierig ist, Vergleiche zwischen weiteren Ziffern anzustellen (und dies wird dringend empfohlen) zwei oder weniger). Hier finden Sie Ratschläge, die über Dezimalstellen hinausgehen. (In Tabelle 3 geben sie ein Beispiel für eine Rundung auf die Milliarden.)

Sie appellieren auch an die geringfügige Fehlermenge, die durch eine solche Rundung verursacht wird. In Ihrem Beispiel wäre der Fehler 22/7622 ~ 0,003 - ich denke, 0,3 Prozent sind für eine Vielzahl von Umständen in Ordnung.

Um die Meldung aller 4 Ziffern aus statistischer Sicht zu rechtfertigen, müsste der Standardfehler der Schätzung kleiner als 0,5 sein. Wenn der Fehler mehr als 50 beträgt, sollten Sie wirklich nicht mehr als Hunderte melden.

Ich gebe in meinem Blog-Beitrag mehr Zitate für die Statistikseite; Einige Hinweise zum Erstellen effektiver Tabellen , obwohl nicht alle auf diese Frage anwendbar sind.

#4
+4
Peter Jansson
2014-06-09 19:13:26 UTC
view on stackexchange narkive permalink

Dies ist eine Ergänzung zu der Antwort von aeismail, der ich zustimme. Wenn Sie Zahlen wie 7600 melden, sind die nachgestellten Nullen nicht signifikant, aber es gibt keine Möglichkeit, dies zu erkennen. Daher zeigt das Schreiben der Zahl als 7,6 kgha oder 7,6 x 10 ^ 3 gha direkt auf die signifikanten Zahlen. Ein wichtiger Punkt bei der Veröffentlichung von Informationen besteht darin, dem Leser ein genaues Bild der Ergebnisse zu liefern, und die Bereitstellung quantitativer Informationen im richtigen Kontext ist der Schlüssel. Die Verwendung einer geeigneten Notation zur Darstellung von Zahlen ist daher wichtig. Anstatt nicht als signifikant erachtete Ziffern zu entfernen, ist es besser, die Daten in einer anderen Notation darzustellen, indem entweder etablierte SI-Präfixe oder wissenschaftliche verwendet werden Notation.

Siehe mein Update. Die wissenschaftliche Notation ist für das Publikum dieses Dokuments leider nicht geeignet.
@SideshowBob Steht Gha für Giga-Hektar? Sie könnten 7,6 Pha schreiben?
Nein, globaler Hektar.
Ich würde die wissenschaftliche Notation mit diesem speziellen Beispiel vermeiden. Am Ende werden mehr Ziffern hinzugefügt, z. 4 Ziffern in "7622" im Vergleich zu 5 (numerischen) Ziffern in "7,6 x 10 ^ 3". Dies wird wahrscheinlich das Lesen der Tabelle erschweren, zumal "7,6 x 10 ^ 3" und "7,6 x 10 ^ 4" in rechtsbündigen Daten nicht sehr hervorstechen, wie dies beim Ausschreiben der gesamten Schätzungen der Fall wäre.
#5
+4
avid
2014-06-09 23:30:36 UTC
view on stackexchange narkive permalink

Wenn Sie speziell an dem Schreiben für ein allgemeines Publikum interessiert sind, kann dieses Problem meines Erachtens sinnvoll gelöst werden, indem Sie über Ihre Wahl der Einheiten nachdenken. Ich habe sehr wenig Ahnung, was ein globaler Hektar eigentlich ist oder wie man es visualisiert. Können Sie diese Mengen in Einheiten / Objekten ausdrücken, die für Ihre Leser möglicherweise leichter zugänglich sind? Eine Diskussion finden Sie unter this und this. Vermutlich fallen die Argumente für Präzision weg, wenn Sie zu nichtwissenschaftlichen Einheiten gewechselt sind ...

"Ich habe sehr wenig Ahnung, was ein globaler Hektar eigentlich ist". Guter Punkt. Ich hatte bis jetzt noch nichts von einem "globalen Hektar" gehört, ich habe den Wikipedia-Link zu Ihrer Antwort gelesen ... und es stellt sich heraus, dass es die komplizierteste und verwirrendste "Maßeinheit" ist, die ich je gesehen habe. Nach dem Lesen scheint das OP zu sagen, dass es zweifelhaft ist, * irgendetwas * in globalen Hektar an vier signifikanten Zahlen zu messen. Für eine * Pressemitteilung * ist es vielleicht am besten, "gha" überhaupt nicht zu verwenden: Wenn STEM - meine Akademiker wissen nicht, was das ist, frage ich mich, wie viele Leute das tun werden?
Ich bedauere die Angstzitate um * Maßeinheit * in meinem letzten Kommentar. Ich möchte diesen speziellen Bereich der Wissenschaft nicht als abweisend empfinden. Aber als MINT-Experte habe ich einige Einwände (i): Die "Dimensionen" eines globalen Hektars sind (ökologisch-biologische Produktivität) / (Hektar). Ich habe noch nie eine Einheit gesehen, die nach der Maßgröße in ihrem * Nenner * benannt ist: Das scheint fast verwirrend zu sein ...
Und (ii) genauer gesagt ist ein globaler Hektar definiert als die gesamte ökologisch-biologische Produktivität der Erde geteilt durch die Anzahl der "produktiven" Hektar. Okay: Tolle Idee, dies zu quantifizieren, wenn auch grob. Aber als "Einheit": Auf wie viele signifikante Zahlen können wir den Zähler und den Nenner wirklich berechnen? Wenn zwei Forscher diese Größen unabhängig voneinander berechnen würden, mit wie vielen signifikanten Zahlen würden ihre Antworten übereinstimmen? Ich würde eine zuverlässige Berechnung von drei signifikanten Zahlen äußerst beeindruckend finden.
Entschuldigung, ich habe meine Worte etwas verwirrt. Es handelt sich nicht um eine Pressemitteilung als solche, sondern um eine Zusammenfassung, die auch einem nicht technischen Publikum öffentlich zugänglich gemacht wird. Die Einheiten, die wir verwenden, können ich nicht auswählen, wir erklären sie jedoch im Dokument. Dies ist gerechtfertigt, da wir versuchen, das ökologische Denken zu fördern. Ein ökologischer Fußabdruck einer Organisation ist der Bereich der Erdoberfläche, der erforderlich ist, um die Aktivitäten dieser Organisation kontinuierlich zu unterstützen. Ich denke, es ist ein recht einfaches, nützliches und lehrreiches Konzept und ein Standard für den Fußabdruck.
Übrigens stimme ich Ihrer Einschätzung der Genauigkeit von allem, was in globalen Hektar gemessen wird, voll und ganz zu. Ich gehe davon aus, dass die Genauigkeit solcher Berechnungen zwischen 1 und 2 signifikanten Zahlen liegt (... und ja, ich weiß, dass es bessere Möglichkeiten gibt, die Genauigkeit zu messen, aber dies ist eine sehr grobe Schätzung!). Oh, und die Dimensionen von gha sind nur Flächen: Die Dimensionen, die Sie angeben, beziehen sich auf den (invertierten) Skalierungsfaktor, der die ökologischen Anforderungen in Flächen umwandelt, wie Sie sagen.
@Sideshow Bob: Ich bin mir nicht sicher, ob ich damit einverstanden bin, dass die Dimension "globaler Hektar" "Fläche" ist: Dies scheint eine "globale Hekatare" mit einer "Hektar" gleichzusetzen, was nicht die gewünschte Absicht ist. Aber da ich gestern nicht wusste, was ein Gha ist, bin ich mehr als bereit zu glauben, dass mir etwas Subtilität fehlt. Es ist keine große Sache, aber ich bin neugierig: Könnten Sie mich auf eine akademische Quelle für die Definition von * gha * verweisen?
@PeteL.Clark: Ich denke, Sie lesen falsch. Die Dimension ist in der Tat Fläche: 1 gha = 1 Hektar * Produktivität_des_Landes / Standard_Produktivität. Es ist ähnlich wie bei "behindertengerechten Lebensjahren": 1 daly = 1 Jahr * Behinderung_Faktor.
Aus der Bibliographie meines Kollegen (ich habe diese nicht gelesen, gehe aber davon aus, dass sie in die richtige Richtung führen werden): - Wackernagel, M. und Rees, W. (1996) Unser ökologischer Fußabdruck: Verringerung der menschlichen Auswirkungen auf die Erde. Gabriola Island, BC: New Society Publishers. Gössling, S., Borgström, C., Hörstmeier, O. und Saggel, S. (2002) Ökologische Fußabdruckanalyse als Instrument zur Bewertung der Nachhaltigkeit des Tourismus. Ökologische Ökonomie. 43: 199 & ndash; 211.
@Max: Hmm. Ein globaler Hektar war die verwirrendste Maßeinheit, die mir je begegnet war ... bis ich etwas über behindertengerechte Lebensjahre erfuhr. Auf den ersten Blick - bitte verzeihen Sie mir meinen Mangel an Fachwissen - bin ich mir nicht sicher, ob ein * Daly * überhaupt eine "Maßeinheit" ist. Die Wikipedia-Seite (nicht die ultimative Autorität, aber normalerweise ziemlich solide ...) nennt es eine "Metrik", die nicht unbedingt genau dieselbe ist. Ich hatte noch nie eine Einheit mit der Definition der Form "X + Y" getroffen. Ich frage mich, ob es eine SE-Site gibt, auf der ich grundlegende Fragen zur Dimensionsanalyse stellen könnte.
@PeteL.Clark: Wie wäre es mit einem Beispiel aus der "harten" Wissenschaft? Ein Sievert ist die gleiche Art von Einheit: ein Joule / kg (oder grau), aber gewichtet nach "Qualität".
@Max: Nun, ich bin immer noch verwirrt, danke, dass Sie versucht haben zu helfen. Wenn in dem, was Sie oben geschrieben haben, Hektar * (Produktivität des Landes) / (Standardproduktivität) in Bezug auf die Fläche dimensioniert werden, müssen Produktivität und Standardproduktivität dieselben Dimensionen haben. Aber wie kann das sein: Ist Standardproduktivität nicht definiert als Gesamtproduktivität geteilt durch die Gesamtzahl der produktiven Hektar?


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 3.0-Lizenz, unter der er vertrieben wird.
Loading...