Changeset 1313


Ignore:
Timestamp:
Sep 3, 2010, 12:00:21 AM (10 years ago)
Author:
goya
Message:

parsing lois amélioré

File:
1 edited

Legend:

Unmodified
Added
Removed
  • cpc/trunk/project/batch/hemicycle/parse_hemicycle.pl

    r1303 r1313  
    8484    chop $no;
    8585    if ($no) {
    86 #        print "TEST3 $titre -_- $no\n";
     86        #print "TEST3 $titre -_- $no\n";
    8787        $ploi{$titre} = $no;
    8888    }
     
    9292$string =~ s/<\/?sup>//g;
    9393$string =~ s/<!--[^A-Z]+-->//g;
    94 #Recherche des numéros de  de loi
    95 while($string =~ /#item#\d+\.?\s*([^#]+)\(n\D+(\d+[^\)]+)\)\s*#\/item#/ig) {
    96 #    print "TEST1 $1 -_- $2 \n";
    97     $titre = lc $1;
    98     $no = $2;
    99     savepLoi();
    100 }
     94#Recherche des numéros de loi
    10195while($string =~ /ordre du jour([^<]+\W(proposition|loi)\W[^<]+)\(n\D+(\d+[^\)]+)\)/ig) {
    10296    if ($1 =~ /#item#/i) {
    10397      next;
    10498    }
    105 #    print "TEST2 $1 -_- $2 -_- $3\n";
     99    #print "TEST2 $1 -_- $2 -_- $3\n";
    106100    $titre = lc $1;
    107101    $no = $3;
     
    109103    savepLoi();
    110104}
     105while($string =~ /#item#\d+\.?\s*([^#]+)\(n\D+(\d+[^\)]+)\)\s*#\/item#/ig) {
     106    #print "TEST1 $1 -_- $2 \n";
     107    $titre = lc $1;
     108    $no = $2;
     109    savepLoi();
     110}
    111111
    112112sub getProjetLoi {
    113113    $titre_cleaned = $titre = lc shift;
     114    return unless ($titre);
     115    return $ploi{$titre} if (defined($ploi{$titre}));
     116    $intervention = lc shift;
     117    foreach $k (keys %ploi) {
     118        if ($intervention =~ /$k/i) {
     119            $ploi{$titre} = $ploi{$k};
     120            return $ploi{$k};
     121        }
     122    }
    114123    return unless ($titre);
    115124    return $ploi{$titre} if (defined($ploi{$titre}));
     
    139148    }
    140149    $out =  '{"contexte": "'.$contexte.'", "intervention": "'.$intervention.'", "timestamp": "'.$cpt.'", "date": "'.$date.'", "source": "'.$source.'", "heure":"'.$heure.'", "session": "'.$session.'", ';
    141     if (($ploi = getProjetLoi($titre1)) && $contexte !~ /questions?\sau|ordre\sdu\sjour|nomination|suspension\sde\séance|rappels?\sau\srèglement/i) {
     150    if (($ploi = getProjetLoi($titre1, $intervention)) && $contexte !~ /questions?\sau|ordre\sdu\sjour|nomination|suspension\sde\séance|rappels?\sau\srèglement/i) {
    142151        $out .= "\"numeros_loi\": \"$ploi\", ";
    143152    }
Note: See TracChangeset for help on using the changeset viewer.