Cikkek

MRI- és UH-felvételek geometriai elemzése a beszédszintézisben

Megjelent:
2020-11-29
Szerző
Megtekintés
Kulcsszavak
Licenc

Copyright (c) 2020 Acta Medicinae et Sociologica

Creative Commons License

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

Hogyan hivatkozzuk
Kiválasztott formátum: APA
Trencsényi, R. (2020). MRI- és UH-felvételek geometriai elemzése a beszédszintézisben. Acta Medicinae Et Sociologica, 11(31), 55-65. https://doi.org/10.19055/ams.2020.11/31/5
Absztrakt

A gépi beszéd előállításának egyik új vonulata az artikulációs beszédszintézis, ami a hangképzéshez kapcsolódó vizuális információk feldolgozásán alapszik. A hangképző szervek statikus és dinamikus geometriai paramétereinek pontos ismerete alapvető szerepet játszik a beszédszintézis megvalósításában. Ezen adatok vizuális kinyerésének alkalmas forrásai lehetnek a beszéd közben készült MRI- és UH-felvételek, melyek különböző geometriával jellemezhetők. Az UH-keretek képpontjai egy polárkoordináta-rendszer kijelölésével kezelhetők a legkényelmesebben, míg az MRIkeretek képpontjainak leírásához egy descartes-i koordináta-rendszer adhat megfelelő kiindulópontot. Mivel az UH-felvételeken nem látható a nyelv hátsó része és a nyelvhegy, így az MRI-hez képest csak részleges információt kaphatunk a nyelv mozgásáról. Ennélfogva fontos és egyben nem triviális feladat az MRI- és UH-források geometriájának összehangolása. A publikációban bemutatom a geometriai transzformációk egy lehetséges módját.