Changeset 2454


Ignore:
Timestamp:
Nov 3, 2011, 4:15:38 PM (9 years ago)
Author:
komodo
Message:

problemes noms commissions

File:
1 edited

Legend:

Unmodified
Added
Removed
  • cpc/branches/senat/project/batch/commission/parse_commission.pl

    r2453 r2454  
    2525$content =~ s/<\/b>\s*(<\/h\d[^>]*>)/$1/gi;
    2626$content =~ s/[ \t]+/ /g;
    27 $content =~ s/&nbsp;/ /g;
     27$content =~ s/&(#160|nbsp);/ /ig;
    2828
    2929%fonctions = ();
     
    5353                }
    5454                $timestamp += 20;
    55                 $intervenant =~ s/\&nbsp;/ /g;
    5655                if ($date !~ /\d{4}\-\d{2}-\d{2}/) {
    5756                    print STDERR "ERROR pas de date pour $file\n";
     
    8887
    8988$interstrong = 1 if ($content =~ /<(a|strong)[^>]*>\s*($recointer[^<]*)<\/(a|strong)>/i);
    90 
    9189foreach (split /\n/, $content) {
    92         s/&(nbsp|#160);/ /ig;
    9390        s/ n<sup>[0os\s]+<\/sup>\s*/ n° /ig;
    9491        $begin = 1 if (/name="toc1"/);
    9592#print STDERR "title: $1\n" if (/<title>([^<]*)</);
    96         if (/TITLE>[^<]*(Commission[^\&:<]*)/i) {
     93        if (/TITLE>[^<]*(Commission[^:<]*)/i) {
    9794            $commission = $1;
     95            $commission =~ s/[\s\-]+S[é&eacut;]+nat\s*//i;
    9896        }else {
    99             $commission = $1 if (/TITLE>[^<]*((Mission|Office|Délégation|Groupe de travail)[^\&:<]*)/i);
     97            $commission = $1 if (/TITLE>[^<]*((Mission|Office|Délégation|Groupe de travail)[^:<]*)/i);
     98            $commission =~ s/[\s\-]+S[é&eacut;]+nat\s*//i;
    10099        }
    101100#       print ; print "\n";
    102         if ((!/\d{4}\-\d{4}/) && (/<(h[123])[^>]*>(\s*<[^>]*>)*([^<\(]+\d{4})\W*<\/(h[123])>/i)) {
     101        if ((!/\d{4}\-\d{4}/) && (/<(h[123])[^>]*>(\s*<[^>]*>)*([^<\(]+\d{4})(\W*<[^>]*>)*<\/(h[123])>/i)) {
    103102#print STDERR "date: $3 $url_year\n";
    104103                @date = datize($3, $url_year);
     
    124123                $context = $titre;
    125124                setfonction($titre);
    126                 $context =~ s/&nbsp;/ /g;
    127125                $context =~ s/ -{1,2} / > /;
    128126                $titre =~ s/[\s\(]+suite[\s\)]*$//i if ($context =~ s/[\s\(]+suite[\s\)]*$//i);
     
    138136                if ($inter =~ /<u>(Au cours[^<]*)<\/u>/) {
    139137                    $aucours = $1;
    140                     if ($aucours =~ /\Wapr[^s]+s( |&nbsp;|-)*midi($|\W)/) {
     138                    if ($aucours =~ /\Wapr[^s]+s( |-)*midi($|\W)/) {
    141139                        $nb_seance = 2;
    142140                    }elsif ($aucours =~ /\Wsoir(é|&[^;]*;)e($|\W)/) {
Note: See TracChangeset for help on using the changeset viewer.