FORMUŁA PROJEKTU
Unikalna formuła pionierskiego utrwalenia emocji na potrzeby syntezy mowy z połączonymi charakterystykami emocji i interpretacji jeszcze nigdy nie została wykonana. Obecne narzędzia pozwalają klonować głosy - ale nie dowolnie kreować interpretacje. Pracujemy nad tym, by dzięki zapisowi bazy danych opartej o difony, trifony, alofony w ramach rejestracji korpusów zbalansowanych (prace nad projektem prowadzili znakomici naukowcy: prof. J.Hamela prof. K.Szklanny, dr J.Bachan, dr J. Trela–Ptaszyńska, dr J.Rafałko, będziemy w przyszłości w stanie stworzyć bazę pod prototyp narzędzia zamieniającego tekst na mowę (powszechnego już dziś w wielu wersjach) z gamą charakterystyk emocjonalnych (co wciąż stanowi o unikalności przedsięwzięcia). Dziś badamy cechy tego głosu, który wyjątkowo ciepło przyjmowany jest przez dzieci i młodzież (co może mieć zastosowane w spersonalizowanych terapiach i coachingach) i badamy jakimi cechami się wyróżnia, że jest tak powszechnie akceptowany.
Wartość edukacji zależy od sposobu podania wiedzy (np. poprzez tak chętnie dziś słuchanych podcastów pełniących rolę książek, coraz rzadziej czytanych). Możliwość użycia bardzo lubianego głosu, umiejącego interpretować (a przynajmniej dającego się modyfikować tak, by można było nim sterować w ramach wzorca gamy interpretacyjnej aktora) otwiera morze możliwości. W świecie naukowców mało jest artystów. W świecie artystów - mało jest naukowców. Łączymy te dwa światy w ramach projektu „INTERPRETACJA W SYNTEZIE MOWY”.
Testy wykonane z polskimi naukowcami (a warto dodać, że Polska jest jednym ze światowych pionierów w syntezie mowy) pokazują jak różne są to światy. Pomiędzy poprawną syntezą (zrozumiałą i przyjmowaną neutralnie) a emocją interpretacyjną rodem z wielkich ról – znajduje się wciąż wielka przepaść jakościowa, nad zasypaniem której chcemy pracować.
Współpracując ze znakomitym operatorem dźwięku prof. Jackiem Hamelą (zdobywcą kilku PNF Orłów m.in. za "Katyń", "Wołyń", "Imagine") - nadajemy syntezie języka polskiego nową wartość. Staramy się wykazać i pokazać naukowcom, czym jest subtelność interpretacji emocjonalnej znanej nam z pracy w filmie, a naukowcy uświadamiają nas w tym, czym są algorytmy otwierające nam drogę do nowych możliwości. Reżyserzy mogą nie wiedzieć, jak powstaje grafika 3D, ale umieją z jej dobrodziejstw korzystać kreując nowe wizje. Podobnie w przyszłości powinna wyglądać praca nad dźwiękiem i interpretacją aktorską.