SPSS–>Medizinische Statist

SPSS–>Medizinische Statistik
Man unterscheidet bei der Erfassung von Daten bzw. der Aufstellung von Erhebungsbögen unter:
1. optische Kriterien die messbar sind, wie Größe, Gewicht und als abhängige Variabeln bzw. Merkmale bezeichnet werden und
2. objektive Kriterien, die in gleich große Einheiten z.B. cm, mm, kg oder als feste Zahl z.B. Jahre festgelegt bzw. definiert werden können,
3. subjektive Kriterien, sind zunächst nicht messbar, können aber je nach persönlicher Abschätzung in eine Skala eingeteilt werden und somit messbar werden.
Variabeln, wie z.B. Geschlecht werden als intervenierende Variabeln bezeichnet, weil sie das Ergebnis, durch die zählbare Anzahl z.B. wie viel männl. und wie viel weibl. bzw. die Verwertbarkeit der optischen Kriterien beeinflussen. Diese Variabeln haben wiederum Merkmalsausprägungen wie z.B. männlich, weiblich.
Richtlinien für die Erarbeitung im SPSS
> Eindeutigkeit==>der Variabel muss vorhanden sein, weil die Variabel nur ein isoliertes Merkmal des Objektes beschreibt.
> Ausschließlichkeit==>nur 1Ausprägung des Merkmales trifft auf 1Objekt zu.
> Vollständigkeit==>keines der Objekte bleibt ohne eine Merkmalsausprägung
Variabel:
> ist die Zuordnung der Ausprägungen
> enthalten Fallgebundene Informationen zu einem Thema
> Va.-Name–>hat 8 Zeichen (Kürzel verwenden z.B. Interviewnummer = intnr für Fall und Interviewer z.B. 0501, 0502 usw.)
> Va.-Label–>viel Platz zur Beschreibung und lässt Sonderzeichen zu
> Va.-Ansicht–>Eintragungen des Va.-Namen, Va.-Label, Dezimalbestimmung, Wert…
Wert:
> ist für Computer wichtig(Fallbez. Infos zum Thema, verwendet werden Ziffern 0,1,2,3, usw. oder 0,6 usw. mit Dezimal oder ohne je nach Skala(Code).
> Wert-Label–>ist die Bezeichnung/Beschreibung z.B. Eltern = 1, usw.
Skalen:
nominal ist das geringste Skalenniveau (sind Bennungen ohne jeden Bezug zueinander)
Intervall/metrisch z.B. Tassen Kaffee, Rauchen, cm, kg,
ordinal ist eine Rangreihe ohne Intervall z.B. tägl., wöchentl., monatl, kann aber in eine ordinal Skala mit Intervall-Niveau umgewandelt werden z.B.
sehr gut ungenügend

stetige Skalen(fest)
sehr gut ungenügend

ordinal Skalen mit Intervallniveau (Intervall nicht mehr unterteilbar)
1 2 3 4 5 6 =

diskrete Skalen (unendlich unterteilbar)
Das Zusammenfügen der Dateien:
Die erste Datei öffnen über Symbolleiste Daten–>Daten zusammenfügen–>indem Fälle hinzugefügt werden. Fälle sind die anderen Dateien. Auswahl der Datei, wenn Fehlermeldung links im Fenster auftaucht, dann –>markieren, und zwar den Variabel-Namen mit (+) und korrigieren–>dann Variabel-Namen mit (*) suchen, beide markieren und als Paar auf die reichte Seite übernehmen, dann oke’ und die Fälle der anderen Datei werden in der Datenblattansicht hinzugefügt.
Die Variabel-Namen müssen identisch sein beim Daten zusammen fügen !!!
Deskriptive Statistik ist eine beschreibende Statistik, wie z.B. bei der Häufigkeit = Auszählung. Die Auswahl wird im linken Fenster gewählt und oke’. PC zeigt Liste der gewählten Variabeln und ein Abgleich bzw. Vergleich oder Fehlersuche kann beginnen.
Englisch-Deutsch–>Erläuterung der Häufigkeitstabelle:
valid = gültig
missing = fehlend
frequency = Häufigkeit
percent = Prozent inklusive fehlend(missing)
valid percent = gültige Prozente ohne missing(fehlend)
cumulative percent = kumulierte Prozente (aufaddierte Prozentanteile der gültigen Prozente)–>teilt die Anzahl der gültigen Fälle in zwei gleiche große Hälften, der Median (meau x )ist dabei annährend genau bestimmt
system missing = fehlendes System(keine Angaben)
total = gesamt
Mit transformieren–>Berechnung der Variabel möglich, wie z.B. das Berechnen des Alters der Patienten mit –>transformieren–>Berechnen–>Eingabe der Zielvariabel 2004 – gebjahr = Alter des Patienten
Absolute Werte sind = Häufigkeit, Anzahl nach Alter, wie viel Fälle, welches Alter

Grafiken:
Histogramm:
o Ist geeignet für Variabel mit vielen Kategorien(Werte) und
o für intervallskalierte/metrische Variabeln bzw. Skalen
o N = number of cases = Anzahl der gültigen Fälle
o erstellt eine Normalverteilungskurve sowie eine Zusammenfassung in 5er/10er Schritten–>Berechnungen sind möglich
Normalverteilungskurve:
o versucht die Verteilung zu vergrößern, indem sie glättet und anzeigt wo die Fälle zu wenig oder zu viel vorhanden sind
o verteilt die Fälle in Intervalle/in 5er und 10er Schritten
o ist geeignet für Variabeln mit sehr großen Ausprägungen/Kategorien; also Variabeln mit Intervallen (diskreten)
Balkendiagramm:
o ist geeignet für Variabel mit wenig Ausprägungen/Kategorien
o nominal/ordinal Skalen
Format – Änderungen der Diagramme können mit Doppelklick auf das jeweilige zu verändernde Format z.B. Farbe, Schrift usw. im SPSS-Editor vorgenommen werden.
Typeinteilung der Variabeln
string = Zeichenfolge als Text
Nummerisch = als Zahl
Datum = Zeichenfolge des Datums
Typ 8 = F steht für Format und 8 für die einsetzbare Zahlengröße; F 8 Standardeinstellung einschließlich dezimal ??????, ?? –>8.1 mit einem Dezimalzeichen sieben Zahlen ein dezimal
Fehlende Werte –>können angegeben werden z.B. wenn fehlend dann 99
Variablenbeschreibung auf Symbolleiste das Zeichen–>#? Suchen über gehe zu
T-Test–>steht für zwei Mittelwerte und vergleicht sie; vergleicht Mittelwerte für Variablen, die intervallskaliert sind; es wird unterschieden zwischen:
1. T-Test bei unabhängigen Stichproben
a. Sind zwei Gruppen, die über eine Variable ihre Mittelwerte ziehen zwei Median
b. Die Variable ist hier eine abhängige Variable, die Variable der Gruppen z.B. geschlecht ist die Gruppenvariable–>Gruppen sind m und w = zwei Median, die Gruppen müssen über die Werte definiert werden z.B. 0 = nicht angekreuzt und 1 = angekreuzt
z.B.
2.
T-Test bei gepaarter Stichprobe
a. Ist eine Gruppe mit zwei Variablen, die z.B. vorher/nachher oder AM A mit AM B vergleichen; hat auch zwei Mittelwerte
z.B.

Wichtig –> gepaarte Stichproben können nur bei Skalen mit gleicher Skaleneinteilung gemacht werden
Signifikanz–>Deutlichkeit des Unterschiedes bzw. heißt immer ein Unterschied; Relevanz für eine Aussage; Ausschlaggebend für die Auswertung/Aussage bzw. der Verwertbarkeit des Ergebnisses.

Irrtumswahrscheinlichkeit
p < .001 0,1%
p < .01 1%

p < .05 5%
0,245 = 24,5% n.s. –>nicht signifikant

1. desto kleiner die Zahl/Prozent, desto höher die Signifikanz(Aussagekraft)
2. desto höher die Zahl/Prozent, desto niedriger bzw. keine Signifikanz(Aussagekraft)
3. anhand der Verteilung der Werte, wird die Signifikanz errechnet

ANOVA–>Varianzanalyse = Untersuchung der Verteilung; Ermittlung der Mittelwerte
==> ist nicht für gepaarte Gruppen geeignet, weil diese gleiche Skaleneinteilung haben müssen
==> kann mehr als zwei Mittelwerte vergleichen
==> Variablen für Ermittlung des M_Wertes müssen intervallskaliert und können auch ordinal mit intervallskala sein–>sind die abhängige Variable
==> es gibt den ANOVA-FAKTOR und die ABHÄNGIGE VARIABLE
==> der ANOVA-Faktor kann nominal/ordinal sowie intervall- oder ordinal/intervallskaliert sein, aber
==> intervallskalierte bzw. ordinal mit Intervallen sind aufgrund ihrer vielen Ausprägungen bzw. ihrer Unterteilbarkeit ungünstig als ANOVA-Faktor; können jedoch anhand
==> einer Umkodierung mit dem Erstellen einer neuen Variable als Faktor verwendet werden und sind somit wieder stetig d.h. das Zusammenfassen von mehreren Einzelgruppen/Ausprägungen zu einer z.B. alter = von 14 bis 18 eine Gruppe Wert 1 und von 19 bis 25 eine Gruppe Wert 2 usw.
z.B. Variable ” pausen “=nominal/ordinal?? Variable ” bewält “=ordinal mit intervallskala
3 2 1 0 Werte 0 1 2 3 4
regelmäßig häufig selten nie leicht schwer
19 22 22 6 Anzahl Kreuze 10 20 35 5 2

ANOVA-FAKTOR abhängige Variable
2,16 2,36 2,09 1,83 Mittelwerte aus abhängiger “gesund” ermittelt
==> einzelne Anzahl sind voneinander unabhängige Gruppen z.B. Variable “pausen” machen 19 von ihnen regelmäßig Pause oder 6 nie

KONFIDENZINTERVALL–>gibt die Spanne an in der der Mittelwert mit 95%iger Wahrscheinlichkeit liegt
z.B. die unabhängig voneinander stehenden Gruppen vom Anova Faktor werden mit der abhängiger Variable –>hier “gesund” verglichen
==> Anova Faktor –> “pausen”–>Wert = 3–>19x angekreuzt = 19 Probanten
==> Abhängige Variable “gesund”
==> Frage für eine Gruppe–>wie fühlen sich die 19 Probanten bei regelmäßiger Pauseneinhaltung
“pausen”
Wert = 3
regelmäßig
1 2 3 4 5
gut schlecht
Untergrenze Obergrenze

==> die Spanne ist ohne Extremwerte; dadurch werden die Unterschiede deutlicher
Kreuztabellen –>mit chi2 nach Pearson –>steht auch für p< bei d. Signifikanz
==> sind für die Analyse von nominal/ordinal Variablen am aussagekräftigsten, da bei diesen Variablen kein Mittelwert und keine Varianzanalyse = Untersuchung der Verteilung stattfindet
==> Skalen bzw. Variablen sollten also für die Ausführung von Kreuztabellen wenig Ausprägungen bzw. Kategorien haben
==> Kreuztabellen sind aber mit ordinal intervallskalierten s. Tabelle 2 durchführbar ohne Umkodierung; dabei erhält man eine annährend deskeptive/beschreibende Aussage (bei Häufigkeit)
Dabei wird von einer beobachteten Häufigkeit und einer erwarteten Häufigkeit ausgegangen:
==> beobachtete Häufigkeit ist die, von den in der Datenbank vorhandenen Daten mit der Angabe von Prozentanteiele von 100% pro Zeile
==> erwartete Häufigkeit ist die zu errechnende Anzahl = absoluter Wert, wenn kein Unterschied in der beobachteten Häufigkeit besteht;
i. Gesamtanzahl einer Gruppe z.B. männl.* Prozentanteil einer Ausprägung der anderen Gruppe z.B. weibl./überhaupt nicht –>dividiert durch 100 = Anzahl der erwarteten Häufigkeit der Ausprägung z.B. männl./überhaupt nicht s. Tabelle 1
==> man spricht dann von der so genannten NULL-HYPOTHESE = KEIN UNTERSCHIED
Bedingungen für die Relevanz des chi2 sind:
==> die erwartete Häufigkeit darf nicht unter 5 sein
==> die Tabelle sollte wenig Felder haben, muss mehr als 5 Felder haben und sollte nicht zu viel Felder haben –>Spanne zwischen 6 und 15 Felder relevant
==> je größer die Felderanzahl/Tabelle, desto unzuverlässiger der chi2 – Test = die statistische Auswertung nimmt ab
==> ist auch mit vier Tafeln mit besonders mäßiger Rechnung möglich

Tabelle 1 mit nominal/ordinal
oftred
geschl 0
überhaupt nicht 1
monatl. 2
wöchentl. 3
täglich
Gesamt
beobachtete
Häufigkeit männl. 2 8 12 4 26 Anzahl 7,7% 30,8% 46,2% 15,4% 100% Prozent 2,21 8,84 11,6 3,38 erwartete
Häufigkeit weibl. 4 16 21 6 47 Anzahl 8,5% 34,0% 44,7% 12,8% 100% Prozent 3,62 14,47 21,71 7,23 erwartete
Häufigkeit
Rechenbeispiel für männl. erwartete Häufigkeit–>26*8,5/100 = 2,21
Rechenbeispiel für weibl. erwartete Häufigkeit–>47*7,7/100 = 3,62

Tabelle 2 mit ordinal intervallskaliert
belast
geschl 0
nicht
genug 1
2
3
4
sehr
Gesamt
beobachtete
Häufigkeit männl. 2 7 5 8 5 27 Anzahl 7,4% 25,9% 18,5% 29,6% 18,5% 100% Prozent 12,6 erwartete
Häufigkeit weibl. 1 9 22 8 7 47 Anzahl 2,1% 19,1% 46,8% 17% 14,9% 100% Prozent 8,6 erwartete
Häufigkeit
Rechenbeispiel für männl. erwartete Häufigkeit–>27*46,8/100 = 12,6
Rechenbeispiel für weibl. erwartete Häufigkeit–>47*18,5/100 = 8,6

Streuungsmaße/Verteilungsmaße sind:
==> Modalwert = erster Wert, der in der Skala am häufigsten vorkommt = “Häufigkeitswert”/ist kennzeichnet für nominal/ordinal Skalen
==> Median = 50% Perzentil (Prozentanteil der Prozente) –>eine Stichprobe die das Ganze annährend in zwei gleich große Teile aufteilt–>wird durch die Verteilung d. angegebenen Werte ermittelt
==> Mittelwert = Summe der gültigen Werte, dividiert durch deren Anzahl
==> Spannweite = Maximum und Minimum
==> Varianz = Summe des quadrierten Abstandes zum Mittelwert
==> Standardabweichung = Wurzel aus der Varianz (Maßeinheit wie Skala) = durchschnittlicher Abstand zum Mittelwert
==> Formel für Varianz = v? quadrierten Abst. z. = Standardabweichung
Fallzahl

“Standardabweichung”
1 2 3 4 5

==> desto breiter auseinander die Verteilung, desto größer die Varianz/Standardabweichung, desto schlechter die Aussage
==> desto enger zusammen die Verteilung, desto geringer die Varianz/Standardabweichung, desto besser die Aussage
==> Kortosis (Exzess) = Steilheit–>errechnet die durchschnittliche Steigung der Verteilung
==> Positiver Wert ist steiler als Normalverteilung
==> Negativer Wert ist flacher als Normalverteilung
==> Ist die Steilheit gleich Null –>dann 45°C weicht nicht von Normalverteilung ab

“Standardabweichung”
1 2 3 4 5

==> Schiefe = Ansicht der Verteilung
o linksschiefe Verteilung (Schiefe <0)
o rechtsschiefe Verteilung (Schiefe >0)
o 0 heißt symetrisch gleich mit Normalverteilung

Antwortkatalog anhand der durchgeführten Tests

Was muss beim Zusammenfügen von Dateien beachtet werden?
> Die Variablen (ihre Werte und ihre Labels) müssen identisch sein, wenn Fälle von zwei Dateien zusammengefügt werden sollen.

Was zeigt die Häufigkeitstabelle?
> Die fehlenden Eintragungen= Missings, werden bei Berechnung der gültigen Prozente = valid percent, außer Acht gelassen.
> Die angezeigten kumulierten Häufigkeiten, summieren aufsteigend die gültigen Prozente.

Welche grafische Darstellung ist geeignet?
> Intervallskalierte Variabeln mit vielen Werten, stellt man am Besten mit einem Histogramm mit Normalverteilungskurve dar.
> Mit einem Balkendiagramm lassen sich Variabeln mit wenigen Werten besser darstellen = Übersichtlichkeit

Welches sind Grundbedingungen einer Codierung?
> Jede Variable z.B. alter–>beschreibt nur ein isoliertes Merkmal des Objektes und bestätigt damit die Eindeutigkeit (Eindimensionalität).
> Nur eine Ausprägung des Merkmals (=Kategorie der Variabeln z.B. Altersgruppen) trifft auf jeweils ein Objekt zu und bestätigt so die Ausschließlichkeit der Merkmale.
> Kein Objekt bleibt ohne eine der Merkmalsausprägungen und bestätigt so die Vollständigkeit.

Welche Aussagen über Skalierungen treffen zu?
> Bei nominalskalierten Variablen besteht kein sinnvoller Abstand zwischen den Werten, weil die Bennungen ohne jeden Bezug zueinander sind.
sehr gut ungenügend

stetige Skalen(fest)

Was muss bei der Variablendefinition beachtet werden?
> Werte sind die in einer Variable enthaltenen Informationen zu einem Thema z.B. 14 bis 17 –>Wertelabels sind oft unerlässlich zur Bezeichnung der Werte = Altersgruppe.
> Ein Variablenname z.B. geschle –>darf nur 8 Zeichen lang sein. Das Variablelabel dient der ausführlichen Beschreibung der Variable.

Folgende Aussagen stimmen–>T-Test!
> Der T-Test steht für zwei Mittelwerte und vergleicht nur Mittelwerte von Variablen, die intervallskaliert sind.
> Man verwendet den T-Test für unabhängige Stichproben wenn z.B.:
o …die Mittelwerte der Körpergröße für Männer und Frauen miteinander verglichen werden sollen
o …der Gesundheitszustand von Rauchern und Nichtrauchern miteinander verglichen werden soll
o bei unabhängige Stichproben sind es zwei Gruppen, die über eine Variable ihre Mittelwerte ziehen–>zwei Median–>dabei müssen die Gruppen über die Werte definiert werden

z.B.
> Man verwendet den T-Test für gepaarte Stichproben wenn z.B.
o …in unserer Studie die Mittelwerte der Belastung mit dem Gesundheitszustand verglichen werden soll
o …die Gesundheit einer Stichprobe vor und nach einer Medikamenteneinnahme miteinander verglichen werden soll
o bei gepaarten Stichproben ist es eine Gruppe mit zwei Variablen–>haben auch zwei Mittelwerte

z.B.

Wichtig–>gepaarte Stichproben können nur bei Skalen mit gleicher Skaleneinteilung gemacht werden

Was kann die ANOVA (One-Way)?
ANOVA = Varianzanalyse = Untersuchung der Verteilung; Ermittlung der Mittelwerte
> …kann die Mittelwerte für mehr als zwei Gruppen vergleichen
> …kann die Mittelwerte nur für unabhängige Gruppen vergleichen–>[gepaarte Gruppen sind nicht geeignet, weil sie gleiche Skaleneinteilung haben müssen]

Mit der ANOVA können
> intervallskalierte Variablen sowohl als auch ordinalskalierte Variablen mit Intervallskalenniveau analysiert werden
> Variablen für die Ermittlung des Mittelwertes müssen intervallskaliert und können aber auch ordinalskaliert mit Intervallniveau sein –>diese Variablen sind dann die abhängigen Variablen

ANOVA-Faktor kann nominal/ordinal sowie intervall- oder ordinal/intervallskaliert sein, aber aufgrund ihrer vielen Ausprägungen bzw. ihrer unendlichen Unterteilbarkeit sind intervallskalierte Variablen bzw. ordinalskalierte mit Intervallniveau ungünstig als ANOVA-Faktor–>können jedoch
> Anhand einer Umkodierung mit dem Erstellen einer neuen Variable als ANOVA-Faktor verwendet werden, und sind somit wieder stetig, dass heißt:

==> das Zusammenfassen von mehreren Einzelgruppen/Ausprägungen zu einer z.B. alter = von 14 bis 18 eine Gruppe Wert 1 und von 19 bis 25 eine Gruppe Wert 2 usw.

Beispiel für ANOVA-Faktor und abhängige Variable
z.B. Variable ” pausen “=ordinal mit Intervall–>Variable ” bewält “=ordinal mit Intervallskala
3 2 1 0 Werte 0 1 2 3 4
regelmäßig häufig selten nie leicht schwer
19 22 22 6 Anzahl Kreuze 10 20 35 5 2

ANOVA-FAKTOR abhängige Variable
==> einzelne Anzahl sind voneinander unabhängige Gruppen z.B. Variable “pausen” machen 19 = ANOVA-Faktor von ihnen regelmäßig Pause oder 6 = ANOVA-Faktor nie eine Pause
Der Bereich, indem der Mittelwert mit einer Wahrscheinlichkeit von 95% liegt ist der Konfidenzintervall.

Dabei werden z.B. die unabhängig voneinander stehenden Gruppen vom Anova Faktor mit der abhängiger Variable –>hier “gesund” verglichen
==> Anova Faktor –> “pausen”–>Wert = 3–>19x angekreuzt = 19 Probanten
==> Abhängige Variable “gesund”
==> Frage für eine Gruppe–>wie fühlen sich die 19 Probanten bei regelmäßiger Pauseneinhaltung
“pausen”
Wert = 3
regelmäßig
1 2 3 4 5
gut schlecht
Untergrenze Obergrenze

==> die Spanne ist ohne Extremwerte; dadurch werden die Unterschiede deutlicher

Kreuztabellen

Wann sollte eine Kreuztabelle erstellt werden?
> …wenn die beiden zu untersuchenden Variablen eher weniger Kategorien haben und
> …wenn Variablen mit einer Nominalskalierung, wie etwa “Geschlecht” oder “Augenfarbe” untersucht werden sollen
Begründung:
Kreuztabellen sind für die Analyse von nominal/ordinal Variablen am aussagekräftigsten, da bei diesen Variablen kein Mittelwert und keine Varianzanalyse = Untersuchung der Verteilung stattfindet.

Bedingungen für den Einsatz des CH2-Tests sind:
> die erwartete Häufigkeit darf nicht unter 5 sein
> die Tabelle sollte wenig Felder haben, muss mehr als 5 Felder haben und sollte nicht zu viel Felder haben –>Spanne zwischen 6 und 15 Felder relevant
> je größer die Felderanzahl/Tabelle, desto unzuverlässiger der chi2 – Test = die statistische Auswertung nimmt ab
> ist auch mit vier Tafeln mit besonders mäßiger Rechnung möglich

Signifikanz = Deutlichkeit des Unterschiedes

Welche Irrtumswahrscheinlichkeit spricht für einen signifikanten Zusammenhang zweier Variablen?
> …eine Irrtumswahrscheinlichkeit von 1 % (p < .01) und
> …eine Irrtumswahrscheinlichkeit von 0,1% (p < .001)

Begründung:
> desto kleiner die Zahl/Prozent, desto höher die Signifikanz(Aussagekraft)
> desto höher die Zahl/Prozent, desto niedriger bzw. keine Signifikanz ab p < .05 = 5% (Aussagekraft)
> anhand der Verteilung der Werte, wird die Signifikanz errechnet

Spannweite ist
> …der größte Wert (max.) minus dem kleinsten Wert (min.)
> …der Abstand zwischen Min. und Max.

Median wird
> …durch die Verteilung der angegeben Werte ermittelt
> …auch 50% – Perzentil = Prozentanteil der Prozente genannt
> …teilt die Stichprobe = das Ganze in zwei gleich große Teile

Kortosis (Exzess) = Steilheit–>errechnet die durchschnittliche Steigung der Verteilung
==> Positiver Wert ist Verteilung steiler als Normalverteilung
==> Negativer Wert ist Verteilung flacher als Normalverteilung
==> Ist die Steilheit gleich Null –>dann 45°C weicht nicht von Normalverteilung ab

“Standardabweichung”
1 2 3 4 5

Schiefe = Ansicht der Verteilung
o linksschiefe Verteilung (Schiefe <0) –>hat die größten Häufigkeiten eher rechts vom Mittelwert und läuft links flach aus
o rechtsschiefe Verteilung (Schiefe >0) –>hat die größten Häufigkeiten eher links vom Mittelwert und läuft rechts flach aus
o 0–> heißt symetrisch gleich mit Normalverteilung
Standardabweichung
> …ist Quadratwurzel aus der Varianz (Maßeinheit wie Skala)
> …ist der durchschnittlicher Abstand aller Werte zum Mittelwert
Modalwert
> …ist der in einer Stichprobe am häufigsten vorkommende Wert = “Häufigkeitswert”/ist kennzeichnet für nominal/ordinal Skalen

Normalverteilung der Daten
> …die Signifikanz [Deutlichkeit des Unterschiedes] des Tests auf Normalverteilung zeigt, wie zuverlässig die untersuchten Daten von einer Normalverteilung abweichen–>also nicht normal verteilt sind
> …praktischer als ein Test auf Normalverteilung ist die Beurteilung (anhand eines Q-Q-Verteilungsdiagramms), ob die Abweichung der Verteilung der Daten von einer Normalverteilung einer (einem Muster) folgt. Dann kann die Verteilung der Daten als nicht normalverteilt angesehen werden.

Menü “Dateien zusammenfügen”; Befehl “Variablen hinzufügen”
> …mit dem Befehl “Variablen hinzufügen”, kann die Arbeitsdatei mit einer externen SPSS-Datei zusammengefügt werden–>hat die dieselben Fälle aber andere Variablen
> …ausgeschlossene Variablen werden nicht in die neue , zusammengefügte Datei aufgenommen
> …wenn eine oder mehrere Schlüsselvariablen zum Zuordnen der Fälle verwendet werden, müssen die beiden Datendateien in aufsteigender Ordnung der Schlüsselvariable(n) sortiert sein.
> …die Reihenfolge der Variablen in der Liste “Schlüsselvariablen” muss mit ihrer Sortierfolge übereinstimmen–>dass heißt: Sortierschlüssel muss mit Sortierung der Variable übereinstimmen
Menü “Dateien zusammenfügen”; Befehl “Fälle hinzufügen”
> …die Variablen können in den beiden Dateien in beliebiger Reihenfolge vorliegen. Die Variablen werden nach ihrem Namen zugeordnet.
> …aus Variablen, die nicht mit gleichem Namen in den beiden Dateien enthalten sind, aber die selben Inhalte besitzen, können Paare gebildet werden, um diese in die neue, zusammengefügte Datei aufzunehmen.