Die menschliche Sprache ist ein sehr komplexes Medium. Der Mensch unterscheidet sich durch das Kommunikationsmittel Sprache eindeutig von anderen Lebewesen. Die Sprache dient dem Menschen sowohl als Kommunikationsmittel als auch als Informationsquelle. Denn Sprache kann ohne Informationsverlust aufgezeichnet und archiviert werden und ist demnach vom Sprechzeitpunkt unabhängig. Zudem ist Sprache nicht vom Ort abhängig. Man denke an das Telefon, das Radio, das Fernsehen usw.. Weiter haben Umgebungsfaktoren wie die Dunkelheit, Regen oder Hitze keinen Einfluss auf diese Kommunikationsform.
Die automatische Verarbeitung von Sprache ist mit der Entwicklung von immer leistungsfähigeren Computern stark voran geschritten und hat in einigen Anwendungsgebieten bereits Einzug gehalten. Anwendungsgebiete, die sich mit der automatisierten Verarbeitung digitalisierter Sprachsignale befassen sind beispielweise [Kießling97, S. 2]:
- Spracherkennung und Sprachverstehen (z.B. Kommando-, Diktiersysteme)
- Sprechererkennung (z.B. Zugangskontrolle)
- Schlüsselworterkennung (z.B. Telefonüberwachung)
- Sprachübertragung (z.B. Telefon)
In der vorliegenden Arbeit wird das Setzen von Phrasengrenzen¹ mit Hilfe von intonatorischen² Mitteln näher behandelt. Es handelt sich dabei um die Erkennung und das Finden von Wortgrenzen sowie Satzgrenzen. Wenn es möglich ist diese Phrasengrenzen und Satzzeichen automatisch zu erkennen, bringt das die Entwicklung der automatischen Sprachverarbeitung einen großen Schritt nach vorne. Der Computer kann somit das Sprachsignal eines Wortes eindeutig einem Wort zuordnen und die damit verbundene Weiterverarbeitung leichter ausführen. Da in Anwendungsgebieten wie Call-Centern, die Personendaten speichern oder auch bei automatisierten Diktiersystemen immer wieder Fehler auftreten und demnach oft nachbearbeitet werden muss, wird natürlich versucht, den Vorgang der Sprachverarbeitung so zu optimieren, dass keine Korrektur mehr nötig ist. Am einfachsten ist eine solche Optimierung zu erreichen, indem der Computer so viel Informationen bezüglich eines Sprachsignals bekommt und errechnet wie nur möglich. Die Markierung von Phrasengrenzen ist eine Möglichkeit, die dazu beiträgt, das komplexe Medium Sprache zu vereinfachen. Bei der Markierung von Phrasengrenzen scheint vor allem die Grundfrequenz¹ ein nützliches Hilfsmittel zu sein und wird daher auch vertieft in dieser Arbeit behandelt.
_________________
¹"Die Phrase bezeichnet in der Linguistik gemeinhin Satzteile, die nur geschlossen im Satz verschoben werden können." [Wikipedia Phrase]
²Siehe 3.2.1
³Siehe 3.2.2



Mein Name ist 