Charles Explorer logo
🇨🇿

Využití velkých neanotovaných dat v automatickém hodnocení koherence v češtině

Publikace na Matematicko-fyzikální fakulta |
2019

Abstrakt

Využíváme velkých neanotovaných dat (n-gramový model, odhady hustoty featur) ke zlepšení kvality automatického hodnocení koherence textů v češtině. Spolu s novými featurami z různých jazykových rovin přispělo využití neanotovaných dat k signifikantnímu zlepšení výsledků systému.