A Hacktion című magyar krimisorozatban a nyomozócsoporthoz csatlakozik egy bűnügyi nyelvész, akit Erdélyi Tímea alakít. Amikor egy blogger álnéven arról ír, hogy lövöldözésre készül, a szakértő a szöveg stílusából és utalásaiból levezeti, hogy az illető budapesti bölcsész egyetemista lehet. A nyomozók lefuttatnak egy programot, amivel az egyetemeken leadott esszékben a blogger sajátos kifejezéseit és helyesírási hibáit keresik. Így néhány főre szűkítik a kört, és végül megtalálják a fiút, aki bosszút akar állni a volt barátnőjén. Erről a történetről mit gondol?
Teljesen életszerű. Én is futottam már bele olyan emberölési ügybe, amelyben valaki névtelenül gyanús dolgokat jelentett meg a közösségi oldalon. Ott például sejtették, ki az elkövető, és a korábbi megnyilvánulásait össze kellett hasonlítanom a bejegyzéssel, hogy lehet-e ő a szöveg szerzője. Az emberek azt hiszik, hogy az interneten névtelenül bármit megtehetnek, csak azt hagyják figyelmen kívül, hogy amit leírnak vagy elmondanak, az szintén az ő lenyomatuk, az is vizsgálható. Emlékszem, pályakezdőként még láttam olyan klasszikus esetet, hogy újságpapírból vágták ki a betűket. Mert, ugye, akkor a köztudatban az volt, hogy a grafológus az írásképet összehasonlíthatja más kézírással. Pedig a szöveg is lehet árulkodó. Ráadásul egy nyelvész hanganyaggal és videóval is dolgozhat, hiszen ha valaki nógrádi tájszólással beszél, akkor például zsarolni is abban a nyelvjárásban fog.
Azt elárulhatjuk az olvasóknak, hogy a Hacktion szereplője miért hasonlít önre?
Amikor készült a film, a karakter szakmai felügyelője voltam. Emlékszem, egyszer bekapcsoltam a tévét, és először nem ismertem fel, hogy a sorozat megy. Mondom, de érdekes, ennek a nőnek ugyanaz a munkája, nekem is volt egy ilyen ügyem.
Egy bűnügyi nyelvész feladatait hogyan foglalhatnánk össze?
A pályám elején itthon a bűnügyi nyelvész többnyire csak profilozott, tehát megpróbálta az álnéven írt szöveg szerzőjét azonosítani, majd például olyanokkal foglalkoztunk, hogy két szövegnek lehet-e ugyanaz a szerzője. Az online tér megjelenése óta gyakori, hogy öt-hat különböző profilról közölnek szövegeket, és meg kell állapítanom, ismerik-e egymást, illetve hogy egy vagy több szerző írta-e őket. Vagy hogy diktált-e valaki. A hanganyagoknál például meg lehet állapítani, hogy spontán, élő beszédet, vagy betanított, betanult szöveget hallunk-e.
Ennek mikor lehet jelentősége?
Például valaki telefonon bejelentette, hogy egy házból bűncselekmény hangját hallotta, és azt elemeztük, lehetett-e ő az elkövető. De láttunk olyat is, hogy a gyanúsítottak az előzetesből megfenyegették a sértetteket, akik aztán az ügyvéden keresztül, egy videóban visszavonták a feljelentést. Amikor beszéltem velük, két jel árulkodott arról, hogy betanított szövegről van szó. Az egyik, hogy az ő szókincsükben a visszavon szó valószínűleg nem szerepelhetett, vagy csak simán félrehallották, mit kell nyilatkozniuk, de úgy fogalmaztak, hogy „visszamondják” a feljelentést. A másik pedig, ami instrukcióként hangozhatott el, hogy Józsi nem hadonászott a bozótvágóval. Na most azt a szót sem ismerték, mert helyette „bozontvágót” mondtak. De érdekesek azok a búcsúlevelek is, amelyeknél felmerül a gyanú, hogy az elhunyt mögött állt valaki, aki lediktálta a szöveget, mielőtt megölte volna az illetőt.
A profilozásnak mik a lehetőségei és a korlátai?
Azt, hogy a szerzőt Kovács Pistának hívják, huszonhat éves és dunaújvárosi, nem tudom megmondani, de a szociodemográfiai jellemzőit, például hogy férfi-e, vagy nő, van-e valamilyen nyelvjárási jellegzetessége, az anyanyelvén írt-e, tartozik-e valamilyen vallási csoporthoz, azt igen. Mindig az adott szövegtől függ, mit kezdhetünk vele; ha olyan, akkor a szóhasználatból következtethetünk a szerző érdeklődésére vagy foglalkozására is. Ezek a nyomozásban segíthetnek leszűkíteni a gyanúsítottak körét. A nagy kérdés majd a mesterséges intelligencia lesz, amikor mindenféle chatbot által előállított anyagokat kell profiloznunk. Arra fel kell készülnie a rendszernek.
Nagyon tetszett az a gondolata, hogy a nyelvhasználatunk egyedi, akár az ujjlenyomatunk.
Mindenkinek megvan a rá jellemző, úgynevezett szövegezési sajátossága. Amikor találkozom egy szöveggel, mindig azt keresem, mi az, ami elsőre kitűnik belőle. Az átlagember nem tud úgy gondolkodni a nyelvről, hogy csak azért használ például szólásokat és közmondásokat, hogy idősebbnek tűnjön, és megtévessze vele a rendőrséget. Mert mi az átlag szövegtorzítási stratégia? Pontos j helyett ly-os, rövid magánhangzó helyett hosszú, és mondjuk, nem a hogy szó elé teszi a vesszőt, hanem utána. Ha ilyet látok, nem arra gondolok, hogy az illető negyedikig járt iskolába, az jut eszembe, hogy a fenyegető levélben azért írta a hülyét pontos j-vel, hogy ne ismerjék fel a barátai.
Igaz, hogy találkozott már egymondatos lebuktató szöveggel?
Kaptam egy mondatot, és megkérdezték, mit lehet vele kezdeni. Akkoriban sok katonai szlenggel kapcsolatos szakirodalmat olvastam, és az a mondat nagyon katonásnak tűnt, indokolatlan felkiáltójellel a végén. Szóval parancs volt. Mondtam, hogy ez az ember biztos, hogy katona, és akkor kiderült, hogy a három gyanúsított közül az egyik tényleg az.
Egy interjúban említett két-három mondatos eseteket is.
Az egyiknél egy ügyész a saját temetéséről kapott levélben gyászhírt, olyat, amilyen az újságokban is megjelenik. Sima szabványszöveg volt, kivéve a dátumot. Ugyanis azt írták: „Felejthetetlen halottunkról 2013. év 03. hó 15. napján 10 órakor veszünk búcsút a szolnoki temető ravatalozójában.” Na most a legtöbb magyar anyanyelvű ember nem azt mondja, hogy „március 15. napján”, hanem hogy „március 15-én”. Ez a dátumozás jogi végzettségre utal, a rendőrök, ügyészek, bírók fogalmaznak így. És a gyanúsítottak között volt egy jogász.