Sophie

Sophie

distrib > Mandriva > 2008.1 > i586 > by-pkgid > 93ba0e46f1596d8956b1f185809a412c > files > 9

flemm-3.1-6mdv2008.1.noarch.rpm

#!/usr/bin/env perl

###########################################################################
# FLEMM-v3.1 -- French Lemmatizer : Lemmatisation du français à partir de # 
# corpus étiquetés - Version 3.1				          #
# Copyright (C) 2004 (NAMER Fiammetta)					  #
###########################################################################

# Input (Brill) : 1 paragraphe par ligne
# Sortie souhaitée : XML

# perl flem_ex4.pl < tests/test_bll_1.input > tests/test_bll_1_4.xml
# perl flem_ex4.pl < tests/agatha.bll > tests/agatha_bll_4.xml

use Flemm;
use Flemm::Result;

my $lemm=new Flemm(
		   "Tagger" => "brill"
		   );

print "<?xml version='1.0' encoding='ISO-8859-1'?>\n\n";
print "<FlemmResults>\n";

while (<>) {
    chomp;
    
    foreach my $ff (split(/ /,$_)) {
	
	my $res = $lemm->lemmatize($ff);
	print $res->asXML."\n";
    }
}

print "</FlemmResults>\n";