SPSS Schule

SPSSMedizinische Statistik
Man unterscheidet bei der Erfassung von Daten bzw. der Aufstellung von Erhebungsbögen unter:
1. optische Kriterien die messbar sind, wie Größe, Gewicht und als abhängige Variabeln
bzw. Merkmale bezeichnet werden und
2. objektive Kriterien, die in gleich große Einheiten z.B. cm, mm, kg oder als feste Zahl
z.B. Jahre festgelegt bzw. definiert werden können,
3. subjektive Kriterien, sind zunächst nicht messbar, können aber je nach persönlicher
Abschätzung in eine Skala eingeteilt werden und somit messbar werden.
Variabeln, wie z.B. Geschlecht werden als intervenierende Variabeln bezeichnet, weil sie das
Ergebnis, durch die zählbare Anzahl z.B. wie viel männl. und wie viel weibl. bzw. die
Verwertbarkeit der optischen Kriterien beeinflussen. Diese Variabeln haben wiederum
Merkmalsausprägungen wie z.B. männlich, weiblich.
Richtlinien für die Erarbeitung im SPSS
Eindeutigkeitder Variabel muss vorhanden sein, weil die Variabel nur ein isoliertes Merkmal
des Objektes beschreibt.
Ausschließlichkeitnur 1Ausprägung des Merkmales trifft auf 1Objekt zu.
Vollständigkeitkeines der Objekte bleibt ohne eine Merkmalsausprägung
Variabel:
ist die Zuordnung der Ausprägungen

enthalten Fallgebundene Informationen zu einem Thema
Va.-Namehat 8 Zeichen (Kürzel verwenden z.B. Interviewnummer = intnr für Fall und
Interviewer z.B. 0501, 0502 usw.)
Va.-Labelviel Platz zur Beschreibung und lässt Sonderzeichen zu
Va.-AnsichtEintragungen des Va.-Namen, Va.-Label, Dezimalbestimmung, Wert...
Wert:
istfür Computer wichtig(Fallbez. Infos zum Thema, verwendet werden Ziffern 0,1,2,3, usw.
oder 0,6 usw. mit Dezimal oder ohne je nach Skala(Code).
Wert-Labelist die Bezeichnung/Beschreibung z.B. Eltern = 1, usw.
Skalen:
nominal ist das geringste Skalenniveau (sind Bennungen ohne jeden Bezug zueinander)
Intervall/metrisch z.B. Tassen Kaffee, Rauchen, cm, kg,
ordinal ist eine Rangreihe ohne Intervall z.B. tägl., wöchentl.,

monatl, kann aber in eine ordinal Skala mit Intervall-Niveau
umgewandelt werden z.B.
sehr gut ungenügend
nominal/ordinal sind:
stetige Skalen(fest)

1 2 3 4 5 6 7 8 9 ordinal sind:
ordinal Skalen mit Intervallniveau (Intervall nicht mehr unterteilbar)
intervallskalierte/
metrische sind:
1 2 3 4 5 6=
diskrete Skalen (unendlich unterteilbar)
Das Zusammenfügen der Dateien:
Die erste Datei öffnen über Symbolleiste DatenDaten zusammenfügenindem Fälle hinzugefügt
werden. Fälle sind die anderen Dateien. Auswahl der Datei, wenn Fehlermeldung links im Fenster
auftaucht, dann markieren, und zwar den Variabel-Namen mit (+) und korrigierendann
Variabel-Namen mit (*) suchen, beide markieren und als Paar auf die reichte Seite übernehmen,
dann oke’ und die Fälle der anderen Datei werden in der Datenblattansicht hinzugefügt.
Die Variabel-Namen müssen identisch sein beim Daten zusammen fügen !!!
Deskriptive Statistik ist eine beschreibende Statistik, wie z.B. bei der Häufigkeit = Auszählung. Die
Auswahl wird im linken Fenster gewählt und oke’. PC zeigt Liste der gewählten Variabeln und ein
Abgleich bzw. Vergleich oder Fehlersuche kann beginnen.
Englisch-DeutschErläuterung der Häufigkeitstabelle:

valid = gültig
missing = fehlend
frequency = Häufigkeit
percent = Prozent inklusive fehlend(missing)
valid percent = gültige Prozente ohne missing(fehlend)
cumulative percent = kumulierte Prozente (aufaddierte Prozentanteile der gültigen Prozente)teilt
die Anzahl der gültigen Fälle in zwei gleiche große Hälften, der Median (meau x )ist dabei
annährend genau bestimmt
system missing = fehlendes System(keine Angaben)
total = gesamt
Mit transformierenBerechnung der Variabel möglich, wie z.B. das Berechnen des Alters der
Patienten mit transformierenBerechnenEingabe der Zielvariabel 2004 – gebjahr = Alter des
Patienten
Absolute Werte sind = Häufigkeit, Anzahl nach Alter, wie viel Fälle, welches Alter
Grafiken:
Histogramm:
o Ist geeignet für Variabel mit vielen Kategorien(Werte) und
o für intervallskalierte/metrische Variabeln bzw. Skalen
o N = number of cases = Anzahl der gültigen Fälle
o erstellt eine Normalverteilungskurve sowie eine Zusammenfassung in 5er/10er Schritten
Berechnungen sind möglich
Normalverteilungskurve:
o versucht die Verteilung zu vergrößern, indem sie glättet und anzeigt wo die Fälle zu wenig
oder zu viel vorhanden sind
o verteilt die Fälle in Intervalle/in 5er und 10er Schritten
o ist geeignet für Variabeln mit sehr großen Ausprägungen/Kategorien; also Variabeln mit
Intervallen (diskreten)
Balkendiagramm:
o ist geeignet für Variabel mit wenig Ausprägungen/Kategorien
o nominal/ordinal Skalen
Format - Änderungen der Diagramme können mit Doppelklick auf das jeweilige zu verändernde
Format z.B. Farbe, Schrift usw. im SPSS-Editor vorgenommen werden.
Typeinteilung der Variabeln

string = Zeichenfolge als Text
Nummerisch = als Zahl
Datum = Zeichenfolge des Datums
Typ 8 = F steht für Format und 8 für die einsetzbare Zahlengröße; F 8 Standardeinstellung
einschließlich dezimal ∆∆∆∆∆∆, ∆∆ 8.1 mit einem Dezimalzeichen sieben Zahlen ein dezimal
Fehlende Werte können angegeben werden z.B. wenn fehlend dann 99
Variablenbeschreibung auf Symbolleiste das Zeichen#? Suchen über gehe zu
T-Teststeht für zwei Mittelwerte und vergleicht sie; vergleicht Mittelwerte für Variablen, die
intervallskaliert sind; es wird unterschieden zwischen:
1. T-Test bei unabhängigen Stichproben

a. Sind zwei Gruppen, die über eine Variable ihre Mittelwerte ziehen zwei Median
b. Die Variable ist hier eine abhängige Variable, die Variable der Gruppen z.B.
geschlecht ist die GruppenvariableGruppen sind m und w = zwei Median, die
Gruppen müssen über die Werte definiert werden z.B. 0 = nicht angekreuzt und 1 =
angekreuzt
z.B. 1+1
x x Mittelwert
Gruppe definiert
Wert= Abhängige Variable = gesund
m w
0m 1=w
Gruppenvariabl in DBgeschl
x
2. T-Test bei gepaarter Stichprobe

a. Ist eine Gruppe mit zwei Variablen, die z.B. vorher/nachher oder AM A mit AM B
vergleichen; hat auch zwei Mittelwerte
z.B.
Mittelwert
x x
Eine Gruppe
gesund alter
Zwei Variablen aus DB
Wichtig  gepaarte Stichproben können nur bei Skalen mit gleicher

Skaleneinteilung gemacht werden
SignifikanzDeutlichkeit des Unterschiedes bzw. heißt immer ein
Unterschied; Relevanz für eine Aussage; Ausschlaggebend für die
Auswertung/Aussage bzw. der Verwertbarkeit des Ergebnisses.
Irrtumswahrscheinlichkeit
p < .001 0,1%
p < .01 1%
p < .05 Ab hier 5%
0,245 = 24,5% n.s. nicht

signifikant
1. desto kleiner die Zahl/Prozent, desto höher die Signifikanz(Aussagekraft)

2. desto höher die Zahl/Prozent, desto niedriger bzw. keine Signifikanz(Aussagekraft)
3. anhand der Verteilung der Werte, wird die Signifikanz errechnet
ANOVAVarianzanalyse = Untersuchung der Verteilung; Ermittlung der

Mittelwerte
⇒ ist nicht für gepaarte Gruppen geeignet, weil diese gleiche Skaleneinteilung
haben müssen
⇒ kann mehr als zwei Mittelwerte vergleichen
⇒ Variablen für Ermittlung des M_Wertes müssen intervallskaliert und können
auch ordinal mit intervallskala seinsind die abhängige Variable
⇒ es gibt den ANOVA-FAKTOR und die ABHÄNGIGE VARIABLE
⇒ der ANOVA-Faktor kann nominal/ordinal sowie intervall- oder
ordinal/intervallskaliert sein, aber
⇒ intervallskalierte bzw. ordinal mit Intervallen sind aufgrund ihrer vielen
Ausprägungen bzw. ihrer Unterteilbarkeit ungünstig als ANOVA-Faktor;
können jedoch anhand
⇒ einer Umkodierung mit dem Erstellen einer neuen Variable als Faktor
verwendet werden und sind somit wieder stetig d.h. das Zusammenfassen von
mehreren Einzelgruppen/Ausprägungen zu einer z.B. alter = von 14 bis 18
eine Gruppe Wert 1 und von 19 bis 25 eine Gruppe Wert 2 usw.
z.B. Variable « pausen »=nominal/ordinal??Variable « bewält »=ordinal mit
intervallskala
3 2 1 0 Werte 0 1 23 4
regelmäßig häufig selten nie leicht
schwer
19 22 22 6 Anzahl Kreuze 10 20 35
5 2
ANOVA-FAKTOR abhängige Variable

x 2,16 2,36 2,09 1,83 Mittelwerte aus abhängiger „gesund“
ermittelt
⇒ einzelne Anzahl sind voneinander unabhängige Gruppen z.B. Variable
„pausen“ machen 19 von ihnen regelmäßig Pause oder 6 nie
KONFIDENZINTERVALLgibt die Spanne an in der der Mittelwert mit

95%iger Wahrscheinlichkeit liegt
z.B. die unabhängig voneinander stehenden Gruppen vom Anova Faktor
werden mit der abhängiger Variable hier „gesund“ verglichen
⇒ Anova Faktor  „pausen“Wert = 319x angekreuzt = 19 Probanten
⇒ Abhängige Variable „gesund“
⇒ Frage für eine Gruppewie fühlen sich die 19 Probanten bei regelmäßiger
Pauseneinhaltung
„pausen“
Wert = 3
regelmäßig
95%
Spanne
X 19
2,16 Probanten
von 1 bis 5 sind 100% bei Mittelwerterrechnung mit
1 2 3 4 5 Extremwerten Können den Mittelwert erheblich
gut schlecht beeinflussen
X X
1,62 2,70
Untergrenze Obergrenze
⇒ die Spanne ist ohne Extremwerte; dadurch werden die Unterschiede
deutlicher
Kreuztabellen mit chi2 nach Pearson steht auch für p< bei d.
Signifikanz
⇒ sind für die Analyse von nominal/ordinal Variablen am aussagekräftigsten, da
bei diesen Variablen kein Mittelwert und keine Varianzanalyse =
Untersuchung der Verteilung stattfindet
⇒ Skalen bzw. Variablen sollten also für die Ausführung von Kreuztabellen
wenig Ausprägungen bzw. Kategorien haben
⇒ Kreuztabellen sind aber mit ordinal intervallskalierten s. Tabelle 2
durchführbar ohne Umkodierung; dabei erhält man eine annährend
deskeptive/beschreibende Aussage (bei Häufigkeit)
Dabei wird von einer beobachteten Häufigkeit und einer erwarteten
Häufigkeit ausgegangen:
⇒ beobachtete Häufigkeit ist die, von den in der Datenbank vorhandenen
Daten mit der Angabe von Prozentanteiele von 100% pro Zeile
⇒ erwartete Häufigkeit ist die zu errechnende Anzahl = absoluter Wert, wenn
kein Unterschied in der beobachteten Häufigkeit besteht;
i. Gesamtanzahl einer Gruppe z.B. männl.* Prozentanteil einer Ausprägung der
anderen Gruppe z.B. weibl./überhaupt nicht dividiert durch 100 = Anzahl
der erwarteten Häufigkeit der Ausprägung z.B. männl./überhaupt nicht s.
Tabelle 1
⇒ man spricht dann von der so genannten NULL-HYPOTHESE = KEIN
UNTERSCHIED
Bedingungen für die Relevanz des chi2 sind:
⇒ die erwartete Häufigkeit darf nicht unter 5 sein
⇒ die Tabelle sollte wenig Felder haben, muss mehr als 5 Felder haben und
sollte nicht zu viel Felder haben Spanne zwischen 6 und 15 Felder relevant
⇒ je größer die Felderanzahl/Tabelle, desto unzuverlässiger der chi2 – Test = die
statistische Auswertung nimmt ab
⇒ ist auch mit vier Tafeln mit besonders mäßiger Rechnung möglich
Tabelle 1 mit nominal/ordinal

Rechenbeispiel für männl. erwartete Häufigkeit26*8,5/100 = 2,21
Rechenbeispiel für weibl. erwartete Häufigkeit47*7,7/100 = 3,62
Tabelle 2 mit ordinal intervallskaliert
Rechenbeispiel für männl. erwartete Häufigkeit27*46,8/100 = 12,6

Rechenbeispiel für weibl. erwartete Häufigkeit47*18,5/100 = 8,6
Streuungsmaße/Verteilungsmaße sind:
⇒ Modalwert = erster Wert, der in der Skala am häufigsten vorkommt = „Häufigkeitswert“/ist
kennzeichnet für nominal/ordinal Skalen
⇒ Median = 50% Perzentil (Prozentanteil der Prozente) eine Stichprobe die das Ganze
annährend in zwei gleich große Teile aufteiltwird durch die Verteilung d. angegebenen Werte
ermittelt
⇒ Mittelwert = Summe der gültigen Werte, dividiert durch deren Anzahl
⇒ Spannweite = Maximum und Minimum
⇒ Varianz = Summe des quadrierten Abstandes zum Mittelwert
⇒ Standardabweichung = Wurzel aus der Varianz (Maßeinheit wie Skala) = durchschnittlicher
Abstand zum Mittelwert
⇒ Formel für Varianz = √∑ quadrierten Abst. z. X = Standardabweichung
Fallzahl
Abstand z. Mittelwert z.B. 0,8 * 3Fälle + 1,8 * 2Fälle / 5

„Standardabweichung“2,4 + 3,6 = 4
4/5
X
2,16
1 2 3 4 5
⇒ desto breiter auseinander die Verteilung, desto größer die

Varianz/Standardabweichung, desto schlechter die Aussage
⇒ desto enger zusammen die Verteilung, desto geringer die
Varianz/Standardabweichung, desto besser die Aussage
⇒ Kortosis (Exzess) = Steilheiterrechnet die durchschnittliche Steigung der Verteilung
⇒ Positiver Wert ist steiler als Normalverteilung
⇒ Negativer Wert ist flacher als Normalverteilung
⇒ Ist die Steilheit gleich Null dann 45°C weicht nicht von Normalverteilung ab
„Standardabweichung“
+1
Normalverteilungskurve = Standardverteilung
⇒ Ist das Maß der Dinge

⇒ Annährend symmetrisch mit 45°C
X
2,16 -2
1 2 3 4 5
⇒ Schiefe = Ansicht der Verteilung

o linksschiefe Verteilung (Schiefe <0)
o rechtsschiefe Verteilung (Schiefe >0)
o 0 heißt symetrisch gleich mit Normalverteilung
Antwortkatalog anhand der durchgeführten Tests
Was muss beim Zusammenfügen von Dateien beachtet werden?
Die Variablen (ihre Werte und ihre Labels) müssen identisch sein, wenn Fälle von
zwei Dateien zusammengefügt werden sollen.
Was zeigt die Häufigkeitstabelle?

Die fehlenden Eintragungen= Missings, werden bei Berechnung der gültigen
Prozente = valid percent, außer Acht gelassen.
Die angezeigten kumulierten Häufigkeiten, summieren aufsteigend die gültigen
Prozente.
Welche grafische Darstellung ist geeignet?

Intervallskalierte Variabeln mit vielen Werten, stellt man am Besten mit einem
Histogramm mit Normalverteilungskurve dar.
Mit einem Balkendiagramm lassen sich Variabeln mit wenigen Werten besser
darstellen = Übersichtlichkeit
Welches sind Grundbedingungen einer Codierung?

Jede Variable z.B. alterbeschreibt nur ein isoliertes Merkmal des Objektes und
bestätigt damit die Eindeutigkeit (Eindimensionalität).
Nur eine Ausprägung des Merkmals (=Kategorie der Variabeln z.B. Altersgruppen)
trifft auf jeweils ein Objekt zu und bestätigt so die Ausschließlichkeit der Merkmale.
Kein Objekt bleibt ohne eine der Merkmalsausprägungen und bestätigt so die
Vollständigkeit.
Welche Aussagen über Skalierungen treffen zu?

Bei nominalskalierten Variablen besteht kein sinnvoller Abstand zwischen den
Werten, weil die Bennungen ohne jeden Bezug zueinander sind.
nominal/ordinal sind:
stetige Skalen(fest)
Was muss bei der Variablendefinition beachtet werden?

Werte sind die in einer Variable enthaltenen Informationen zu einem Thema z.B. 14
bis 17 Wertelabels sind oft unerlässlich zur Bezeichnung der Werte = Altersgruppe.
Ein Variablenname z.B. geschle darf nur 8 Zeichen lang sein. Das Variablelabel
dient der ausführlichen Beschreibung der Variable.
Folgende Aussagen stimmenT-Test!

Der T-Test steht für zwei Mittelwerte und vergleicht nur Mittelwerte von Variablen,
die intervallskaliert sind.
Man verwendet den T-Test für unabhängige Stichproben wenn z.B.:
o ...die Mittelwerte der Körpergröße für Männer und Frauen miteinander
verglichen werden sollen
o ...der Gesundheitszustand von Rauchern und Nichtrauchern miteinander
verglichen werden soll
o bei unabhängige Stichproben sind es zwei Gruppen, die über eine
Variable ihre Mittelwerte ziehenzwei Mediandabei müssen die
Gruppen über die Werte definiert werden
z.B. 1+1
x x Mittelwert
Gruppe definiert
Wert= Abhängige Variable = gesund
m w
0m 1=w
Gruppenvariabl in DBgeschl
Man verwendet den T-Test für gepaarte Stichproben wenn z.B.

o ...in unserer Studie die Mittelwerte der Belastung mit dem
Gesundheitszustand verglichen werden soll
o ...die Gesundheit einer Stichprobe vor und nach einer
Medikamenteneinnahme miteinander verglichen werden soll
o bei gepaarten Stichproben ist es eine Gruppe mit zwei Variablenhaben
auch zwei Mittelwerte
z.B.
Mittelwert
x x
Eine Gruppe
gesund alter
Zwei Variablen aus DB
Wichtiggepaarte Stichproben können nur bei Skalen mit gleicher

Skaleneinteilung gemacht werden
Was kann die ANOVA (One-Way)?

ANOVA = Varianzanalyse = Untersuchung der Verteilung; Ermittlung der
Mittelwerte
...kann die Mittelwerte für mehr als zwei Gruppen vergleichen
...kann die Mittelwerte nur für unabhängige Gruppen vergleichen[gepaarte
Gruppen sind nicht geeignet, weil sie gleiche Skaleneinteilung haben müssen]
Mit der ANOVA können

intervallskalierte Variablen sowohl als auch ordinalskalierte Variablen mit
Intervallskalenniveau analysiert werden
Variablen für die Ermittlung des Mittelwertes müssen intervallskaliert und können
aber auch ordinalskaliert mit Intervallniveau sein diese Variablen sind dann die
abhängigen Variablen
ANOVA-Faktor kann nominal/ordinal sowie intervall- oder ordinal/intervallskaliert

sein, aber aufgrund ihrer vielen Ausprägungen bzw. ihrer unendlichen Unterteilbarkeit
sind intervallskalierte Variablen bzw. ordinalskalierte mit Intervallniveau ungünstig als
ANOVA-Faktorkönnen jedoch
Anhand einer Umkodierung mit dem Erstellen einer neuen Variable als ANOVA-
Faktor verwendet werden, und sind somit wieder stetig, dass heißt:
⇒ das Zusammenfassen von mehreren Einzelgruppen/Ausprägungen zu einer z.B.

alter = von 14 bis 18 eine Gruppe Wert 1 und von 19 bis 25 eine Gruppe Wert 2
usw.
Beispiel für ANOVA-Faktor und abhängige Variable

z.B. Variable « pausen »=ordinal mit Intervall-->Variable
« bewält »=ordinal mit Intervallskala
3 2 1 0 Werte 0 1 23 4
regelmäßig häufig selten nie leicht
schwer
19 22 22 6 Anzahl Kreuze 10 20 35
5 2
ANOVA-FAKTOR abhängige Variable

⇒ einzelne Anzahl sind voneinander unabhängige Gruppen z.B. Variable
„pausen“ machen 19 = ANOVA-Faktor von ihnen regelmäßig Pause oder 6 =
ANOVA-Faktor nie eine Pause
Der Bereich, indem der Mittelwert mit einer Wahrscheinlichkeit von 95% liegt ist der
Konfidenzintervall.
Dabei werden z.B. die unabhängig voneinander stehenden Gruppen vom Anova Faktor
mit der abhängiger Variable hier „gesund“ verglichen
⇒ Anova Faktor  „pausen“Wert = 319x angekreuzt = 19 Probanten
⇒ Abhängige Variable „gesund“

⇒ Frage für eine Gruppewie fühlen sich die 19 Probanten bei regelmäßiger
Pauseneinhaltung
„pausen“
Wert = 3
regelmäßig
95%
Spanne
X 19
2,16 Probanten
von 1 bis 5 sind 100% bei Mittelwerterrechnung mit
1 2 3 4 5 Extremwerten Können den Mittelwert erheblich
gut schlecht beeinflussen
X X
1,62 2,70
Untergrenze Obergrenze
⇒ die Spanne ist ohne Extremwerte; dadurch werden die Unterschiede deutlicher
Kreuztabellen
Wann sollte eine Kreuztabelle erstellt werden?

...wenn die beiden zu untersuchenden Variablen eher weniger Kategorien haben und
...wenn Variablen mit einer Nominalskalierung, wie etwa „Geschlecht“ oder
„Augenfarbe“ untersucht werden sollen
Begründung:
Kreuztabellen sind für die Analyse von nominal/ordinal Variablen am
aussagekräftigsten, da bei diesen Variablen kein Mittelwert und keine Varianzanalyse
= Untersuchung der Verteilung stattfindet.
Bedingungen für den Einsatz des CH2-Tests sind:

die erwartete Häufigkeit darf nicht unter 5 sein
die Tabelle sollte wenig Felder haben, muss mehr als 5 Felder haben und sollte nicht
zu viel Felder haben Spanne zwischen 6 und 15 Felder relevant
je größer die Felderanzahl/Tabelle, desto unzuverlässiger der chi2 – Test = die
statistische Auswertung nimmt ab
ist auch mit vier Tafeln mit besonders mäßiger Rechnung möglich
Signifikanz = Deutlichkeit des Unterschiedes
Welche Irrtumswahrscheinlichkeit spricht für einen signifikanten

Zusammenhang zweier Variablen?
...eine Irrtumswahrscheinlichkeit von 1 % (p < .01) und
...eine Irrtumswahrscheinlichkeit von 0,1% (p < .001)
Begründung:
desto kleiner die Zahl/Prozent, desto höher die Signifikanz(Aussagekraft)
desto höher die Zahl/Prozent, desto niedriger bzw. keine Signifikanz ab p < .05 =
5% (Aussagekraft)
anhand der Verteilung der Werte, wird die Signifikanz errechnet
Spannweite ist
...der größte Wert (max.) minus dem kleinsten Wert (min.)
...der Abstand zwischen Min. und Max.
Median wird
...durch die Verteilung der angegeben Werte ermittelt
...auch 50% - Perzentil = Prozentanteil der Prozente genannt
...teilt die Stichprobe = das Ganze in zwei gleich große Teile
Kortosis (Exzess) = Steilheiterrechnet die durchschnittliche

Steigung der Verteilung
⇒ Positiver Wert ist Verteilung steiler als Normalverteilung
⇒ Negativer Wert ist Verteilung flacher als Normalverteilung
⇒ Ist die Steilheit gleich Null dann 45°C weicht nicht von Normalverteilung ab
„Standardabweichung“
+1
Normalverteilungskurve = Standardverteilung
⇒ Ist das Maß der Dinge

⇒ Annährend symmetrisch mit 45°C
X
2,16 -2
1 2 3 4 5
Schiefe = Ansicht der Verteilung

o linksschiefe Verteilung (Schiefe <0) hat die größten Häufigkeiten eher rechts
vom Mittelwert und läuft links flach aus
o rechtsschiefe Verteilung (Schiefe >0) hat die größten Häufigkeiten eher links
vom Mittelwert und läuft rechts flach aus
o 0 heißt symetrisch gleich mit Normalverteilung
Standardabweichung
...ist Quadratwurzel aus der Varianz (Maßeinheit wie Skala)
...ist der durchschnittlicher Abstand aller Werte zum Mittelwert
Modalwert
...ist der in einer Stichprobe am häufigsten vorkommende Wert =
„Häufigkeitswert“/ist kennzeichnet für nominal/ordinal Skalen
Normalverteilung der Daten

...die Signifikanz [Deutlichkeit des Unterschiedes] des Tests auf Normalverteilung
zeigt, wie zuverlässig die untersuchten Daten von einer Normalverteilung abweichen
also nicht normal verteilt sind
...praktischer als ein Test auf Normalverteilung ist die Beurteilung (anhand eines Q-
Q-Verteilungsdiagramms), ob die Abweichung der Verteilung der Daten von einer
Normalverteilung einer (einem Muster) folgt. Dann kann die Verteilung der Daten als
nicht normalverteilt angesehen werden.
Menü „Dateien zusammenfügen“; Befehl „Variablen

hinzufügen“
...mit dem Befehl „Variablen hinzufügen“, kann die Arbeitsdatei mit einer externen
SPSS-Datei zusammengefügt werdenhat die dieselben Fälle aber andere Variablen
...ausgeschlossene Variablen werden nicht in die neue , zusammengefügte Datei
aufgenommen
...wenn eine oder mehrere Schlüsselvariablen zum Zuordnen der Fälle verwendet
werden, müssen die beiden Datendateien in aufsteigender Ordnung der
Schlüsselvariable(n) sortiert sein.
...die Reihenfolge der Variablen in der Liste „Schlüsselvariablen“ muss mit ihrer
Sortierfolge übereinstimmendass heißt: Sortierschlüssel muss mit Sortierung der
Variable übereinstimmen
Menü „Dateien zusammenfügen“; Befehl „Fälle hinzufügen“
...die Variablen können in den beiden Dateien in beliebiger Reihenfolge vorliegen.
Die Variablen werden nach ihrem Namen zugeordnet.
...aus Variablen, die nicht mit gleichem Namen in den beiden Dateien enthalten sind,
aber die selben Inhalte besitzen, können Paare gebildet werden, um diese in die neue,
zusammengefügte Datei aufzunehmen.

SPSS Schule

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

SPSS Schule

Uploaded by

Copyright:

Available Formats

SPSSMedizinische Statistik

Richtlinien für die Erarbeitung im SPSS

Ausschließlichkeitnur 1Ausprägung des Merkmales trifft auf 1Objekt zu.

Vollständigkeitkeines der Objekte bleibt ohne eine Merkmalsausprägung

ist die Zuordnung der Ausprägungen

Intervall/metrisch z.B. Tassen Kaffee, Rauchen, cm, kg,

ordinal ist eine Rangreihe ohne Intervall z.B. tägl., wöchentl.,

sehr gut ungenügend

ordinal Skalen mit Intervallniveau (Intervall nicht mehr unterteilbar)

diskrete Skalen (unendlich unterteilbar)

Das Zusammenfügen der Dateien:

Englisch-DeutschErläuterung der Häufigkeitstabelle:

Typeinteilung der Variabeln

1. T-Test bei unabhängigen Stichproben

2. T-Test bei gepaarter Stichprobe

Zwei Variablen aus DB

Wichtig  gepaarte Stichproben können nur bei Skalen mit gleicher

p < .05 Ab hier 5%

0,245 = 24,5% n.s. nicht

1. desto kleiner die Zahl/Prozent, desto höher die Signifikanz(Aussagekraft)

ANOVAVarianzanalyse = Untersuchung der Verteilung; Ermittlung der

ANOVA-FAKTOR abhängige Variable

KONFIDENZINTERVALLgibt die Spanne an in der der Mittelwert mit

Tabelle 1 mit nominal/ordinal

Rechenbeispiel für männl. erwartete Häufigkeit27*46,8/100 = 12,6

Abstand z. Mittelwert z.B. 0,8 * 3Fälle + 1,8 * 2Fälle / 5

⇒ desto breiter auseinander die Verteilung, desto größer die

⇒ Ist das Maß der Dinge

⇒ Schiefe = Ansicht der Verteilung

Was zeigt die Häufigkeitstabelle?

Welche grafische Darstellung ist geeignet?

Welches sind Grundbedingungen einer Codierung?

Welche Aussagen über Skalierungen treffen zu?

sehr gut ungenügend

Was muss bei der Variablendefinition beachtet werden?

Folgende Aussagen stimmenT-Test!

Man verwendet den T-Test für gepaarte Stichproben wenn z.B.

Zwei Variablen aus DB

Wichtiggepaarte Stichproben können nur bei Skalen mit gleicher

Was kann die ANOVA (One-Way)?

Mit der ANOVA können

ANOVA-Faktor kann nominal/ordinal sowie intervall- oder ordinal/intervallskaliert

⇒ das Zusammenfassen von mehreren Einzelgruppen/Ausprägungen zu einer z.B.

Beispiel für ANOVA-Faktor und abhängige Variable

ANOVA-FAKTOR abhängige Variable

⇒ Abhängige Variable „gesund“

Wann sollte eine Kreuztabelle erstellt werden?

Bedingungen für den Einsatz des CH2-Tests sind:

Signifikanz = Deutlichkeit des Unterschiedes

Welche Irrtumswahrscheinlichkeit spricht für einen signifikanten

Kortosis (Exzess) = Steilheiterrechnet die durchschnittliche

⇒ Negativer Wert ist Verteilung flacher als Normalverteilung

⇒ Ist das Maß der Dinge

Schiefe = Ansicht der Verteilung

Normalverteilung der Daten

Menü „Dateien zusammenfügen“; Befehl „Variablen

You might also like