Roland BAUER – Universität Salzburg

FWF–Projekt P14566-HIS

Kurzbericht über den Projektfortschritt im Jahr 2001

Die Arbeiten am Projekt ALD-DM, dessen offizieller Start am 15.12.2000 erfolgte, konnten mit Beginn des Jahres 2001 definitiv aufgenommen werden. Wie im Projektantrag vermerkt, mussten seitens der Projektleitung zunächst einige Vorarbeiten getätigt werden, um künftige Mitarbeiter autonom einsetzen zu können. Dies betraf v.a. die Erstellung verbindlicher Richtlinien zur Datenverkodung, die Produktion geeigneter Formulare zur Datenerfassung sowie den Aufbau einer Datenbankschiene.

Im Jänner 2001 lag eine erste, rund 30 Seiten starke Version der Kodierungsrichtlinien vor, die neben allgemeinen Prämissen zur Taxierung von Sprachatlaskarten u.a. aus so genannten Nummerierungslisten besteht, in denen jeder einzelne Typus von im Projekt zulässigen Taxierungen mit einer eigenen ID vermerkt ist. Hierbei wird zwischen Makro- und Mikrotaxierungen unterschieden, innerhalb derer innerlinguistisch relevante Teilbereiche (Lexikon, Vokalismus, Konsonantismus, Morphologie…) als eigene Teilcorpora kodiert werden können. Diese Art der Datenverkodung gewährleistet einen nach möglichst individuellen Bedürfnissen ausgerichteten Zugriff auf die so generierte Projektdatenbank im Rahmen der (in späterer Folge durchzuführenden) dialektometrischen Auswertung. Die o.a. Kodierungsrichtlinien werden seit dem Projektstart laufend aktualisiert bzw. ergänzt.

Um eine standardisierte Datenaufbereitung sicherzustellen, wurden ferner vier verschiedenfarbige Kodierungsformulare in großer Stückzahl gedruckt, die von Beginn an nach einem genau festgelegten Schema eingesetzt werden und die überdies für Kontrollzwecke als Taxierungsarchiv im Projekt verbleiben.

Ferner wurde eine auf Modellen aus dialektometrischen Nachbarprojekten (vgl. dazu FWF-Projekt-Nr. P12414-SPR) basierende Datenbankschiene eingerichtet, die (unter Einsatz von MS Access) die Erfassung, Korrektur und Verrechnung der statistischen Verteilung aller Taxierungsdaten erlaubt. Die Projektdatenbank wir über das universitäre Netzwerk auf einem Server verwaltet (zur Struktur der Datenbank vgl. Graphik im Anhang). Zur Außendokumentation des Projektfortschritts wurde unter der Internet-Adresse http://ald.sbg.ac.at/ald/alddm/ eine eigene Projekt-Homepage eingerichtet.

Über Werkvertrag (mit Dr. Edgar Haimerl) konnten im Berichtsjahr 2001 zudem folgende softwaretechnische Schritte gesetzt werden: Anbindung der Projektdatenbank an das dialektometrische Analyse- und Visualisierungsprogramm VDM (Visual DialectoMetry); Aufbau einer Schnittstelle zwischen dem Programm IRS (Index Retrieval System; Projekt ALD I, FWF-Nr. P11331-SPR) und VDM zum Import automatisch taxierten Atlasdaten. Die in den FWF-Projekten “ALD I” und “Dialektometrie” (unter Leitung von Prof. Goebl) von Dr. Haimerl gesammelten Erfahrungen bzw. die von ihm dabei geleisteten Programmierarbeiten stellen den EDV-technischen Grundstock für unser Projekt dar. Der Umstand, dass Computerprogramme mit relativ kurzen Laufzeiten behaftet sind und daher regelmäßiger Updates und Portierung auf neue Benutzeroberflächen bedürfen, erfordert die Einbindung ausgewiesener Informatik-Experten. Als besonders glücklicher Umstand darf hier mit Dank vermerkt werden, dass unserem Projekt mit Dr. Haimerl ein in diesem Zusammenhang auch nach internationalen Maßstäben hochgradiger Spezialist als Mitarbeiter zu Verfügung steht. Für den weiteren Verlauf des Projekts ist eine Reihe von Erweiterungen des Programmpakets VDM vorgesehen, die im Jahr 2002 realisiert werden sollen.

Ab 15.12.2000 wurden zum Zwecke der Taxierung von Sprachatlaskarten mehrere Werkverträge mit externen Mitarbeiterinnen abgeschlossen. Im Rahmen dieser Werkverträge konnten im Berichtsjahr 620 Arbeitskarten erstellt, in der Datenbank erfasst und endkorrigiert werden. Der Umfang der über WV-Mittel erstellten Datenbank beläuft sich demnach mit Ende des Jahres 2001 auf 135.160 Einträge bzw. Zellen  (620 Arbeitskarten mal 218 Messpunkte). Bei den Werkvertragsnehmern handelt es sich einerseits um zwei bereits in dialektometrischen Nachbarprojekten (unter Leitung von Prof. Goebl) erfahrene Projekt-Mitarbeiterinnen (Dr. Irmgard Dautermann, Mag. Susanne Oleinek), die aufgrund ihrer spezifischen Vorkenntnisse auch Einschulungsaufgaben innerhalb der Projektgruppe übernehmen konnten, und andererseits um zwei aus dem Nachwuchs des hiesigen Instituts für Romanistik stammende Neueinsteigerinnen (Mag. Brigitte Rührlinger, Liza Klinger). Für einen weiteren Werkvertrag konnte kurzfristig Dr. Julia Kuhn (Romanistik, Universität Innsbruck) gewonnen werden. Rückblickend betrachtet ist somit innerhalb des ersten Projektjahres eine durchaus kompakte Arbeitsgruppe entstanden, deren innere Dynamik sich v.a. durch guten Zusammenhalt, gegenseitige Motivation (durch regelmäßige gemeinsame Problemanalyse und Erfahrungsaustausch) und ein von allen Beteiligten als angenehm empfundenes Arbeitsklima sehr befruchtend auf den Projektfortschritt ausgewirkt hat (bzw. wohl auch weiter auswirken wird).

 

Fazit zum Berichtsjahr 2001 und Ausblick auf das Jahr 2002:

Unter Einbeziehung der von der Projektleitung in Eigenregie erledigten Arbeiten stand Ende 2001 eine Datenbank mit knapp 800 taxierten Arbeitskarten zur Verfügung. Dies entspricht bereits rund 20% des insgesamt zu erwartenden Datenvolumens von ca. 4.000 Arbeitskarten. Für das zweite Projektjahr darf, bei in etwa gleich bleibendem Einsatz an Werkvertragsnehmern, eine Steigerung auf zumindest 50% des angepeilten Gesamtumfangs erwartet werden. Eine den Arbeitsfortschritt beschleunigende Einstellung von ganz- bzw. halbbeschäftigten Dienstvertragsnehmern ist aus Mangel an verfügbaren Kandidaten leider auch derzeit nicht absehbar.

Die bislang verfügbare Datenmenge erlaubt bereits erste dialektometrische Probeverrechnungen und Visualisierungen. In diesem Zusammenhang konnte das Projekt anlässlich eines in Bayonne (Südfrankreich) im Juni 2001 ausgetragenen ESF-Workshops zum Thema “Corpus et traitement informatisé en géolinguistique” erstmals auch international vorgestellt werden. Für das Jahr 2002 sind weitere Präsentationen geplant, so u.a. beim 10. Österreichisch-Italienischen Linguistentreffen “Parallela X” (Udine, V/2002) und anlässlich eines Rätoromanischen Kolloquiums (St. Martin in Thurn, Südtirol, IX/2002).

 

Anhang: Struktur der Beziehungen innerhalb der Projektdatenbank