Forenzní fonetika

smrckal.com: Se známým novinářem jsme debatovali na téma audio a video dokumentace podpisu
směnky. V této souvislosti jsem se dozvěděl o existenci forenzní fonetiky, dle mého laického
názoru, velmi zajímavé disciplíny. Takže, něco málo informací.

Jeden z prvních případů, které vešly do dějin forenzní fonetiky, se udál v roce 1932. Obětí se stal syn
Charlese Lindbergha, slavného amerického pilota, který v roce 1927 přeletěl jako první Atlantik.
Únosce, jehož pravděpodobný portrét byl vůbec poprvé v rámci boje se zločinem zveřejněn v televizi,
se tehdy spojil s pilotem telefonicky za účelem dojednání způsobu předání výkupného. Pak Lindbergh
slyšel jeho hlas ze stometrové vzdálenosti na hřbitově, což mu postačilo, aby o dva a půl roku později
vraha „hlasově“ identifikoval.

 

Voiceprint neexistuje

 V USA následně realizovali řadu studií ve snaze prokázat, zdali je vůbec možné pamatovat si hlas
osoby, kterou svědek slyšel z takové vzdálenosti a za takových podmínek. Jistá profesorka
psychologie postavila v roce 1937 svůj výzkum na velkém počtu studentů, které rozdělila do několika
skupin. Všichni slyšeli stejný čtený text a jednotlivé skupiny měly v různých časových odstupech
identifikovat z pěti hlasů hlas předčítajícího. Ještě po jednom týdnu byla úspěšnost 83%, ale pak už
výrazně klesala. Po pěti měsících spadla až na 13 %, tedy pod úroveň náhody (která je při pěti hlasech
20%), což zpochybňovalo Lindberghovu identifikaci pachatele na základě hlasu. Únosce a vrah byl ale
usvědčen a odsouzen k trestu smrti na základě jiných přímých důkazů.


Objektem pečlivého studia pravosti hlasu byl i Adolf Hitler. Stalo se tak v roce 1944 po neúspěšném
pokusu o jeho fyzickou likvidaci, který vešel do dějin pod názvem Operace Valkýra. Jistý čas totiž
nebylo zcela jisté, jestli atentát přece jen nebyl úspěšný a pod Hitlerovým jménem nevystupuje
a projevy nevysílá „náhradník“. Zkoumání amerických vědců tehdy potvrdilo, že projevy stále pronáší Hitler. Po druhé světové válce se forenzní fonetika v USA vydala cestou vizuálního srovnávání spektrogramů, neboli grafických záznamů řeči, s cílem propojení hlasu s jeho akustickým obrazem. Jak se však nakonec ukázalo, jednalo se o slepou uličku, která velmi výrazně zbrzdila výzkum identifikace mluvčího. Na druhou stranu se s konečnou platností prokázalo, že „voiceprint“, neboli konstantní hlasový otisk každého mluvčího, neexistuje.

 

Neexistence nezvratných důkazů

Vznik forenzní, tedy soudní fonetiky (odvozeno od slova forum, prostranství, na němž probíhaly
soudní procesy) jakožto vědního oboru se datuje do roku 1991. Tehdy v anglickém Yorku proběhla
ustavující konference Mezinárodní asociace forenzní fonetiky a akustiky, jejímž členem je rovněž je
český zástupce, doc. Radek Skarnitzl, ředitel Fonetického ústavu Filozofické fakulty UK. Dle stanov
organizace vychází její členové z vědeckých základů a musí si být vědomi možností a limitů analýzy
lidského hlasu. Nemají se proto pokoušet odhalovat z řeči lež, případně podvod a vynášet soudy

ohledně osobnostních charakteristik. „Nejčastějším úkolem je pro forenzní fonetiky identifikace
mluvčích, nikoli odhadování jejich psychického stavu, osobnostních rysů či pravdomluvnosti. Forenzní
fonetika využívá kombinace poslechu a akustické analýzy. V praxi to znamená, že sedím u počítače,
pečlivě poslouchám, porovnávám například výslovnost konkrétních samohlásek nebo souhlásek 
a měřím jejich frekvence ve spektru,“ vysvětluje Radek Skarnitzl. Zároveň dodává, že přestože se forenzní fonetika využívá v soudnictví, na rozdíl od forenzní genetiky či daktyloskopie neposkytuje nezvratné důkazy. „Struktura DNA či otisk prstu jsou čistě fyziologickou, neměnnou záležitostí. Hlas sice má nějaké fyziologicky dané limity – vokální trakt je nějak dlouhý, členitý, hlasivky mají svou délku a tloušťku – ale přece jen existuje možnost s hlasem a řečí výrazně manipulovat. Jen zřídkakdy může být závěr hlasové analýzy stoprocentní, a proto by analýza hlasu nikdy neměla být jediným důkazem proti obviněnému.“

 

Může, ale nemusí

Základním předpokladem pro zvládnutí práce forenzního fonetika je schopnost se poslechem zaměřit na dílčí vlastnosti hlasu a řeči, ovládání nástrojů na akustickou analýzu a samozřejmě také znalost
zkoumaného jazyka. „Člověk by se taky neměl za každou cenu pouštět do něčeho, co překračuje
možnosti spolehlivé analýzy,“ odpovídá Radek Skarnitzl na dotaz spojený s odposlechem debaty dvou
potenciálních zločinců, jejichž obhajoba může být u soudu postavena na tom, že si prostě dělali
legraci. „Realita je taková, že ironie může, ale nemusí mít zvukové projevy. Například větu Tak to se
nám povedlo je možno říci několika různými způsoby. Navíc my Češi rádi hovoříme ironicky, aniž by to
bylo ze samotného zvuku patrné. Proto si netroufám na základě poslechu nebo akustické analýzy
hlasů určit, kdy si člověk dělá legraci a kdy to naopak myslí smrtelně vážně. Opět jde o věci, ke kterým
by se forenzní fonetik ani vyjadřovat neměl, protože to prostě není spolehlivé.“

 

Nemožný průnik do stavu mysli

Je rovněž prokázáno, že projev psychiky v hlase může být různorodý. Obecně platí, že zatímco
extrovert by měl mít živější intonaci, introvert naopak plošší. Stejně tak je tomu s dalšími afektivními
stavy, například emocemi, náladami či postoji. Rozrušený člověk většinou mluví výš a s větším
intonačním rozpětím, hlasitěji, na druhou stranu existuje více možností, kterak se hlasově
„vypořádat“ se vztekem. „Nevím o žádném fonetikovi, který by dokázal proniknout do stavu mysli
poslouchaného člověka. Právě proto můžeme zkoumat zmíněné korelace, neboli vzájemný vztah
mezi dvěma procesy nebo veličinami, ale nikoli vynášet soudy o emocích či pravdomluvnosti
mluvčího na konkrétní nahrávce. Ještě slabší je korelace v případě výšky či hmotnosti mluvčího.
Přestože existuje fyziologický základ řeči, takže vysoký muž by měl mít nízký hlas a obráceně, 
pracoval u nás na Filozofické fakultě kolega, který měl nějakých 170 centimetrů, ale přitom měl hlas hluboký jako dvoumetrový chlap,“ konstatuje Radek Skarnitzl.

 

Není jazyk jako jazyk

V souvislosti s forenzní fonetikou vyvstává otázka, do jaké míry platí vztah mezi konkrétním jazykem a 
komplikovaností odhalení mluvčího? Jak je tomu například u Angličanů či Čechů? V prvním případě lze použít kauzu tzv. Yorkshirského rozparovače. Jednalo se o případ brutálního vraha žen z druhé poloviny 70. let. V roce 1979 se policii ozval muž, který se k vraždám přiznal a dodal, že nebude nikdy dopaden. Přizvaný fonetik a dialektolog určil, že volající pochází z pomezí dvou čtvrtí města Sunderland, vzdálených od sebe asi tři kilometry. Yorkshirský rozparovač byl v roce 1981 zatčen, ale jeho hlas neodpovídal hlasu volajícího. Ten byl dopaden až v roce 2005 díky a obviněn z maření policejního vyšetřování. Každopádně volající byl skutečně z oblasti určenou fonetikem. „V případě češtiny je to komplikovanější, náš jazyk je totiž ve srovnání s angličtinou daleko více nivelizovaný. Angličtina má mnohem více akcentů, v řeči se výrazně projevuje horizontální i vertikální
(regionální i sociální) členění společnosti. U nás by se dalo nejspíše říci, že dělník v 
továrně mluví jinak než vysoký manažer, ale v Kolíně tomu bude stejně jako v Pardubicích, i když leží nějakých padesát kilometrů od sebe,“ říká Radek Skarnitzl.