foot_stamps napisał:
> faktycznie niezly jest ten syntezator, ale powiedz mi macku jak to
> jest technicznie zrobione? to znaczy sa wszystkie dzwieki
> wprowadzane tzn gloski?
W ten sposób jak piszesz zrobione są (a raczej były) proste syntezery, typu np.
SynTalk, charakteryzowały się sztucznym, syntetycznym brzmieniem bez intonacji i
akcentu.
Z kolei syntezery stosowane w prostych urządzeniach, które mają zdeterminowane z
góry komunikaty a jedynie zmienia się sekwencja komunikatów składająca się na
ich treść - takie jak np. nawigacje GPS - opierają się na zasadzie doboru
określonych sampli (przeważnie są to całe wyrazy nagranego rzeczywistego głosu
ludzkiego). Tutaj programista z góry może przewidzieć wszystkie możliwe
kombinacje komunikatów i sprawa jest prosta.
Obecne algorytmy stosowane w syntezerach potrafiących odczytać "otwarty" (czyli
nie znany uprzednio programiście) tekst, to tajemnica ich autorów, ale ogólnie
ich działanie polega na pełnej symulacji modelu głosu ludzkiego. Czyli
analizowane są nie tylko poszczególne wyrazy (w kontekście wyodrębnienia głosek)
ale całe zdania, co pozwala zachować akcent i intonację zbliżoną do realnego
głosu ludzkiego.
Nie sposób tego opisać w kilku zdaniach. W najprostszym przypadku, tzn.
pojedynczy wyraz analizowane są kolejne, sąsiednie grupy znaków i dobierane
odpowiadające im dźwięki zgodnie z założonym indywidualnym (męski/żeński,
wysoki/niski, ciepły/ostry itp.) modelem głosu. Rozbijanie wyrazu na głoski
tutaj nie ma sensu, bo wrócimy do dawnych, "sztucznych" algorytmów.
--
"Umiera powoli, kto nie podróżuje, kto nie czyta książek, nie słucha muzyki, kto
nie obserwuje, nie rozmawia z nieznajomymi..."
Pablo Neruda