Charles Explorer logo
🇨🇿

Využití česko-anglických paralelních dat při automatické identifikaci "it"

Publikace na Matematicko-fyzikální fakulta |
2012

Abstrakt

Tento článek má dvojí cíl: jednak chceme prezentovat tu část anotačního schématu nedávno vydaného korpusu PCEDT2.0, která je spjata s anotací anglického zájmene “it” na tektogramatické rovině, jednak představujeme experimenty týkající se automatické identifikace anglického “it” a jeho českého protějšku. Navrhli jsme soubor pravidel pro stromové struktury, která v rámci anglické části korpusu kombinujeme se současnými statistickými systémy, což v důsledku vede ke zlepšení automatické detekce.

Mimoto jsme také navrhli a úspěšně aplikovali pravidla, která využívají informace z paralelních českých struktur.