Literatur

Die nachfolgende Vorgehensweise ist in Anlehnung an

Introduction to the R package plspm

PLS Path Modeling with R

Die nachfolgende Dokumentation ersetzt in keinen fall das Lesen der Literatur!!!!

Datenimport

Siehe Rubrik Daten via API Schnittstelle

Die Daten können auch einfach als csv in R eingelesen werden mittels data<-read.csv2()

Laden der erforderlichen Pakete in R

library(mosaic)

library(plspm)

Daten für die Analyse vorbereiten

Eventuell bzw. ziemlich sicher müssen die Daten vorher vorbereitet werden.

Vorbereitung heißt:

  • Daten richtig codieren (negativ formulierte Items müssten recodiert werden)
  • Missing values ersetzen (Hier kann es unter Umständen Probleme mit PLSPM geben, sollten Missing values vorhanden sein)

Pfadmodell erstellen

Jetzt kommt das wichtigste, das Pfadmodell definieren.

Im nachfolgenden Beispiel ist das Modell sehr einfach. Die Matrix spiegelt hierbei das Pfadmodell wieder. Aus der Theorie wissen wir, dass die GFK (in der Matrix in der ersten Zeile r1) einen Einfluss auf die Arbeitszufriedenheit hat. Deshalb schreiben wir in Zeile zwei und Spalte eins einen 1. Eine 0 bedeutet kein Einfluss. Es wird immer von oben (Spalte) nach unten (Zeile) gelesen. Die Matrix ist symetrisch und es sollte nur die untere Triangel ausgefüllt werden bzw. mit Einsen besetzte sein. Die Matrix heißt deshalb auch untere Triangelmatrix.

r1 = c(0, 0, 0, 0)

r2 = c(1, 0, 0, 0)

r3 = c(1, 1, 0, 0)

r4 = c(0, 0, 1, 0)

path = rbind(r1, r2, r3, r4)

rownames(path) = c("GFK", "Arbeitszufriedenheit", "MBI", "Krankheit")

colnames(path) = rownames(path)

Mit path kann dann das Pfadmodell ausgegeben werden und geprüft werden, ob alle Pfade richtig gesetzt sind.

Zuweisung der Items zu Modell

Das Konstrukt GFK wurde in der Umfrage operationalisiert mit den Items von Variable 20 bis 43, usw.

Deswegen bilden wir die Blöcke für alle Konstrukte:

blocks = list(20:43, 5:10, 11:19, 45:54)

Festlegung der Art Messmodelle

Es gibt zwei Möglichkeiten: formativ und reflektiv

In unserem Beispiel haben wir 4 reflektive Blöcke, deswegen wiederholen wir 4 Mal A.

modes = rep("A", 4)

Sollen wir einen oder mehrere Blöcke haben die A oder B sind, könnte man schreiben modes = ("A", "B", etc.)

Durchführung der PLSPM Analyse mit Bootstrap Validierung.

pls = plspm(data, path, blocks, modes = modes)

plot(pls)

summary(pls)

Durchführung der PLS Analyse mit verschiedenen Gruppen

Die Modellprüfung wird stets mit dem gobalen Modell (ohne Gruppen) durchgeführt. Es können aber auch Teilmodelle analysiert werden. Hier steht nicht die Modellprüfung im Vordergrund, sondern die Pfadkoeffizienten der Teilmodelle und insbesondere die Differenz der Pfadmodell. Die Diefferenz wir dann mittels t-test auf Signifikanz geprüft.

Hierzu muss als erstes ein Teildatensatz extrahiert werden. Wir nehmen hier zunächst zwei Merkmalesausprägungen aus einer Gruppenvariable. Wichig hierbei ist, dass die Gruppenvariable nicht mehr als zwei Merkmalsausprägungen hat. Sollten mehr als zwei vorhanden sein, muss ein Teildatensatz gebildet werden und die gespeicherte Infrormation über die levels (mehr als zwei) gelöscht werden. Die Gruppenvariable sollte auch immer als Faktor definiert sein.

Beispiel:

mga<-ds%>%

filter(Faktorvariable=="Merkmal_1"|Faktorvariable=="Merkmal_2")%>%

droplevels()

Anschließend kann über das Bootstrapping ein Gruppenvergleich der Pfadkoeffizienten vorgenommen werden:

gpa_boot = plspm.groups(pls, mga$Faktorvariable, method = “bootstrap”)

Anschließen können die Unterschiede zwischen den Pfadkoeffizienten der beiden Teilmodelle analysiert und interpretiert werden:

mga_boot$test