Stabilitätsbestimmung von Stichproben (Staffelkorpus)

Hier wird das Verfahren beschrieben, mit dem in VDM

Für den theoretischen Hintergrund wird das RKM (siehe Goebl 1984, 179ff. ) sowie die Bestimmung der Konfidenzintervalle (siehe Goebl Goebl 1984, 210) vorausgesetzt.

Schritte des Verfahrens

  1. Stichprobenkorpora erstellen: Durch einen Zufallsgenerator wird eine vorgegebene Anzahl von Arbeitskarten ausgewählt. Ausgewählte Arbeitskarten werden in der Tabelle _title in der Spalte "isInCorpus" mit 1 markiert.
  2. Metrisierung der Datenmatrix: Basierend auf der Datenauswahl "DATA_Staffelkorpus" (vgl. Goebl 1984, 81f.) wird jedes Taxat (nominaler Wert) durch seine relative Häufigkeit innerhalb der Arbeitskarte ersetzt (intervallskalierter Wert). Die relative Häufigkeit erhält man aus absoluter Häufigkeit dividiert durch Anzahl der nulleintragsfreien Meßpunkte.
  3. RKM für jeden Ort berechnen aus den Daten der Stichprobe (benötigt alle Daten eines Ortsvektors)
  4. Mittelwert, Standardabweichung, Stichprobenverteilung, Grenzen des Konfidenzintervalls der RKMs aller Orte berechnen
  5. Ergebnisse als Tabelle speichern
  6. Diese Tabelle kann mit Excel geöffnet und die Werte als Grafik angezeigt werden: Wenn man in Excel die Spalten C bis G inklusive Header markiert und Menüpunkt „Einfügen – Diagramm“ wählt, gibt es einen Wizzard zum Erstellen eines Diagramms. Um die Korpusmächtigkeit im Diagramm anzuzeigen, muss in Step 2 bei Abteilung „Reihe“ in Beschriftung X die Spalte A ohne Überschrift angegeben werden.

Notwendige Änderungen an der VDM Projektdatei

Damit die Stabilität der Staffelkorpora kalkuliert werden kann, müssen folgende Erweiterungen an einer VDM Projekt Datenbank vorgenommen werden:

  1. Tabelle _title um die Spalte "isInCorpus" (Zahl - Byte) erweitern.
  2. Abfrage DATA_Staffelkorpus hinzufügen mit folgendem SQL Ausdruck:
    SELECT [_data].[_KarteNr], [_data].[_KarteMerk], [_data].[_OrtNr], [_data].[_TaxNr]
    FROM _title INNER JOIN _data ON ([_title].[_KarteNr] = [_data].[_KarteNr]) AND ([_title].[_KarteMerk] = [_data].[_KarteMerk])
    WHERE ((([_title].isInCorpus)=1))
    ORDER BY [_data].[_KarteNr], [_data].[_KarteMerk], [_data].[_OrtNr];

Visualisierung als Excel Grafik

Die Tabelle aus Goebl 1984,210 wird als Datei erstellt (Werte sind mit ; getrennt, so kann die Datei mit Doppelklick direkt in Excel geöffnet werden).

Wenn man in Excel die Spalten C bis G inklusive Header markiert und Menüpunkt „Einfügen – Diagramm“ wählt, gibt es einen Wizzard zum Erstellen eines Diagramms. Um die Korpusmächtigkeit im Diagramm anzuzeigen, muss in Step 2 bei Abteilung „Reihe“ in Beschriftung X die Spalte A ohne Überschrift angegeben werden.

Das ist z.B. das Ergebnis in Excel für die ALD Daten:

n: Anzahl Arbeitskarten im Korpus

s: Standardabweichung

x - alpha n; x + alpha n: Konfidenzintervalle