20 Jan
2011

Zusammenfassung - Markierung von Phrasengrenzen

Nachdem festgehalten wurde, dass die Sprachproduktion in die drei Prozesse Respiration (Luftstromerzeugung), Phonation (Stimmbildung), bei welcher der Bernoulli-Effekt im Bezug auf die Stimmlippenschwingungen eine große Rolle spielt, und Artikulation (Lautbildung) unterteilt werden kann, wurde auf das lineare Sprachmodell eingegangen. Das lineare Modell stellt den komplexen Vorgang der Spracherzeugung vereinfacht dar. Wichtig für ein gutes Verständnis von Sprache sind die prosodischen Mittel. Prosodie beinhaltet alle sprachlichen Eigenschaften. Dazu gehören unter anderem Intonation (Tonhöhenverlauf), Akzent (Betonung), Satzmodus und Sprechpausen.


Die Grundfrequenz ist der aus dem Kehrwert eines glottalen Zyklus. Zur Bestimmung der Grundfrequenz an Hand des Sprachsignals wurden Kurzzeitverfahren eingeführt. Hierbei wird ein Algorithmus auf einen ca. 40 ms langen Abschnitt eines Sprachsignals angewendet. In dieser Arbeit wurde das AMDF-Verfahren und das SENEFF-Verfahren näher erläutert. Beim AMDF-Verfahren wird das Sprachsignal analysiert und mit Hilfe der Ermittlung der Summe von der zeitversetzten Subtraktion von Funktionswerten eine neue Funktion berechnet, bei der die Abstände zwischen den absoluten Minima die Grundfrequenz darstellen. Das SENEFF-Verfahren dagegen berechnet die Grundfrequenz über das Frequenzspektrum eines Sprachsignals. Hierbei wird das Frequenzspektrum so umgeformt, dass die Harmonischen (Vielfache der Grundfrequenz) sehr gut sichtbar sind. Folglich werden die Abstände zwischen den Harmonischen ermittelt und in ein Histogramm eingetragen, in dem der wahrscheinlichste Wert der Grundfrequenz entspricht.

Bei der Analyse des Grundfrequenzverlaufs bei verschiedenen Sprachsignalen verschiedener Personen konnte kein völlig regelmäßiges Ergebnis erhalten werden. Die dabei aufgetretenen Unregelmäßigkeiten konnten allerdings auf die meist undeutliche Aussprache des Sprechers zurückgeführt werden. Solange sich eine Person intonatorisch gut verständlich ausdrückt, kann zwischen den analysierten Phrasengrenzen immer eine Grundfrequenzverringerung festgestellt werden. Die Analyse der Grundfrequenz kann also durchaus als hilfreiches Mittel für die automatische Spracherkennung angesehen werden und stellt somit einen weiteren Schritt in Richtung "perfekte automatische Spracherkennung" dar.

In der Kategorie Mustererkennung erschienen.
Noch kein Kommentar Kommentare zu "Zusammenfassung - Markierung von Phrasengrenzen"
Kommentar verfassen
Bitte beantworte noch diese einfache mathematische Frage
rechtes menue hintergrund oben
rechtes menue hintergrund unten