Závislostní parser pro tamilštinu: výsledky pravidlového a korpusového přístupu

Publikace na Matematicko-fyzikální fakulta |

2011

Abstrakt

Lze nalézt jen velice málo informací o syntaktické analýze tamilštiny. V tomto článku popisujeme prvotní experimenty zaměřené na syntaktickou analýzu tamilštiny na základě pravidel a s pomocí korpusu.

Anotační schéma bylo odvozeno od Pražského závislostního treebanku, proběhla ruční anotace cca 3000 slov. Pro analýzu založenou na korpusu používáme MST parser a Malt parser.

Pro pravidlový přístup jsme implementovali řadu gramatických pravidel. V obou přístupech překročila úspěšnost analýzy 74%.

Klíčová slova

závislostní parser tamilštinu výsledky pravidlového korpusového přístupu