Spaanse en Italiaanse nieuwsclassificatie

Paris_-_Woman_reading_a_journal_-_3206In 2012 is een nieuwe methode ontwikkeld om projecten voor de bouw van automatische metadatering aanzienlijk goedkoper te maken. Voorheen waren honderden uren handwerk nodig om een systeem zodanig te trainen dat het professioneel kon worden ingezet. Met de nieuwe methode is nog slechts ongeveer 20% van deze tijd nodig, de rest wordt door het systeem zelf opgelost. De “truc” die hiervoor wordt toegepast, is de automatische generatie van traindata met behulp van geavanceerde taaltechnologie. De nieuwe methode is reeds succesvol toegepast voor de bouw van twee professionele systemen voor LexisNexis, voor de talen Spaans en Italiaans.