Lze nalézt jen velice málo informací o syntaktické analýze tamilštiny. V tomto článku popisujeme prvotní experimenty zaměřené na syntaktickou analýzu tamilštiny na základě pravidel a s pomocí korpusu.
Anotační schéma bylo odvozeno od Pražského závislostního treebanku, proběhla ruční anotace cca 3000 slov. Pro analýzu založenou na korpusu používáme MST parser a Malt parser.
Pro pravidlový přístup jsme implementovali řadu gramatických pravidel. V obou přístupech překročila úspěšnost analýzy 74%.