Tesztek Android Google Apple Microsoft Samsung Huawei Nokia Linux Biztonság Tudomány Facebook Film
ga
/ContentUploads/M3673/elo_ember_modjara_beszel_a_google_uj_hangja_5a479febec441.jpg

Élő ember módjára beszél a Google új hangja

2017.12.30. 15.17
A Tacotron 2 (merthogy így nevezték el a programot) kapásból két neurális hálózatból épül fel azért, hogy az emberi hangot a lehető legpontosabban utánozza komplex mondatok esetében is. A hang változik, ha egy mondatba vesszőt iktatunk, a CSUPA NAGYBETŰS RÉSZEKET feszültséggel teli hangon olvassa, és még a félreírt szövegeket is az eredeti jelentéstartam szerint olvassa fel. A két neurális háló közül az első a szöveg alapján spektogrammokat készít, a második a spektogramm hanggá alakításáért felel.

Rövid mondatoknál gyakorlatilag lehetetlen megkülönböztetni, hogy a hallott anyagot egy gép, vagy egy színész olvassa nekünk. Két hátránya van: egyrészt a kérdéseket (szerintem) rosszul hangsúlyozza, mert felkapja a végén a hangot (rendkívül elterjedt hiba), a másik pedig, hogy a hang generálásáért felelős MI egy bizonyos női hang kialakítására lett kiképezve. Ha másik hangot akarunk, az egészet elölről kell kezdeni. A további infók alatt találtok egy példagyűjteményt az új felolvasóprogram eredményeiről.
További részletek
Összes hozzászólás