Zum Inhalt Zur Navigation

Sie sind hier

SALB 2012/13 - 2014/15

Projekt SALB, Arbeit am PC mit Sprachausgabe

Speech synthesis of auditory lecture books for blind children (Sprachsynthese von Auditiven Lehrbüchern für Schülerinnen und Schüler mit Blindheit)

Information technology

in general and speech technology in particular have enhanced the accessibility to information for blind and partially sighted users. Nowadays, blind users are able to access the entire amount of information on the web by using speech-based User Interfaces (UI), the advantage of those over Braille-lines being clearly increased cost-efficiency and the usage without any special training.
Through a combination of speech-based UIs and Braille-lines a more robust interaction is possible.
Parametric methods of speech synthesis are nowadays used in many speech-based UIs, since they use up little memory, can be calculated efficiently and are highly flexible. Regarding intelligibility of speech these methods are sufficient, but there is still need for improvements in the quality and intelligibility of speech at high speaking rates.
Parametric methods that are based on hidden Markov models (HMM), allow a high degree of flexibility.
Through model adaptation, it is easily possible to create voices for certain speakers. Adaptive methods can also be used for the generation of fast speech, which is very important for blind users to interact efficiently with an information system.

Informationstechnologie

im Allgemeinen und Sprachtechnologie im Besonderen haben den Zugang zu Informationen für blinde und sehgeschädigte BenutzerInnen stark verbessert. Heute können blinde NutzerInnen auf die gesamte Information im Web mittels sprachbasierter User Interfaces (UI) zugreifen.
Der Vorteil von sprachbasierten UIs gegenüber Braillezeilen ist, dass erstere kostengünstiger sind und ohne spezielles Training verwendet werden können. Durch eine Kombination von sprachbasierten UIs und Braillezeilen ist eine noch robustere Interaktion möglich.
Parametrische Methoden der Sprachsynthese werden heute in vielen sprachbasierten UIs verwendet, da sie wenig Speicher benötigen, effizient berechnet werden können und flexibel sind. Bezüglich der Verständlichkeit sind diese Methoden hinreichend gut, aber bezüglich der Qualität, der Adaptierbarkeit und der Verständlichkeit von schnell gesprochener Sprache gibt es noch Verbesserungsbedarf.
Parametrische Methoden, die auf hidden Markov Modellen (HMM) basieren, erlauben ein großes Maß an Flexibilität. Mittels Adaption von Modellen ist es möglich, einfach Stimmen für eine(n) bestimmt(e) Sprecher(in) zu entwickeln. Adaptive Methoden können auch für die Generierung von schnell gesprochener Sprache verwendet werden, was für blinde NutzerInnen sehr wichtig ist, um effizient mit einem Informationssystem zu interagieren.

Weitere Informationen finden Sie auf der Website von Sparkling Science und ftw.

Koordinator: Prof. Mag. Erich Schmid