Changeset 2406


Ignore:
Timestamp:
Oct 19, 2011, 1:52:57 AM (9 years ago)
Author:
teymour
Message:

Nom des commission plus propre et moins de prénoms sans nom

File:
1 edited

Legend:

Unmodified
Added
Removed
  • cpc/branches/senat/project/batch/jo/parse_jo.pl

    r2395 r2406  
     1
    12#!/usr/bin/perl
    23
     
    2021$on = 0;
    2122while(<FILE>) {
    22     if (!$on && /<b>C?O?M?MISSION /) {
     23    if (!$on && /<b>C?O?M?MISSION /i) {
    2324        $_ = "$_\n";
    2425        $on = 1;
    2526    }
    26     if (/<b>Convocation/i) {
     27    if (/<b>Convocation|<b>Réunion|<b>Composition/i) {
    2728        $on = 0;
    2829    }
     
    4142$lines =~ s/&nbsp;<b>/ /g;
    4243$lines =~ s/&nbsp;/ /g;
     44$lines =~ s/([^\.>]) \n/$1 /g;
    4345$lines =~ s/<\/b> *<b>/ /g;
    4446$lines =~ s/<\/b>/<\/b>\n/g;
     
    7375
    7476foreach (split /\n/, $lines) {
    75     if (/(Comité\W|Commission\W|Mission\W|Office|Observatoire|Délégation)/i && !/Ordre du jour/ && !/(réunion|séance)/i && !/Membres/i && !/^\s*\(/) {
     77#    print "l: $lines\n";
     78    if (/(Comité\W|Commission\W|Mission\W|Office|Observatoire|Délégation)/i && !/Ordre du jour/ && !/(réunion|séance|nommé)/i && !/Membres/i && !/^\s*\(/ && length($_) < 250) {
    7679        $commission = $_;
    7780        $commission =~ s/.*\W(Comité|Commission|Mission|Office|Observatoire|Délégation)/$1/i;
    7881        $commission =~ s/\s*[\(:].*//;
    7982        $commission =~ s/[, \)]+$//;
     83        $commission =~ s/\W+$//;
    8084        $on = 0;
    8185    }
Note: See TracChangeset for help on using the changeset viewer.