Katedra Akustyki, Multimediów i Przetwarzania Sygnałów K76
oraz
Poland Chapter of IEEE Signal Processing Society
zapraszają na seminarium otwarte.
Prelegent: Prof. Ryszard Makowski
Tytuł wystapienia: Automatyczne rozpoznawanie wyrazów
Termin: 03/11/2025 13:15-14:30
Miejsce: pok. 409 bud. C5
Streszczenie:
Prezentacja zawiera opis metodologii automatycznego rozpoznawania ciągu wyrazów oraz uzyskane w ten sposób wyniki rozpoznawania.Wykorzystywanymi podstawowymi jednostkami mowy są stany i fonemy. Stanami są fragmenty fonemów i innych dźwięków z uwzlędnieniem kontekstowości. Zastosowano klasyczne podejście do problemu rozpoznawania, tzn. wyznaczanie prawdopodobieństw na bazie rozkładów GMM z diagonalną i pełną macierzą kowariancji oraz bigramy i trigramy w nieco zmodyfikowanych ukrytych szeregach Markowa.
W centrum zainteresowania są jednak problemy wstępnego przetwarzania, parametryzacji mowy i budowania modeli akustycznych stanów. Główną specjalnością Autora jest bowiem cyfrowe przetwarzanie sygnałów losowych.


