Ignore:
Timestamp:
May 14, 2012, 12:35:57 AM (9 years ago)
Author:
teymour
Message:

Ajout des présences pour l'APF, l'UIP et les groupes d'amitiés

File:
1 edited

Legend:

Unmodified
Added
Removed
  • cpc/trunk/project/batch/presences/parse_orga_inter.pl

    r2647 r2707  
    88
    99$url = shift;
    10 $organisme = shift;
     10$deforganisme = shift;
    1111$a->get($url);
    1212$html = $a->content;
     
    5252       
    5353        my ( $year, $month, $day )  = split /-/, $datesrange[0];
     54        return () if($year < 2000);
    5455        my ($eyear, $emonth, $eday) = split /-/, $datesrange[1];
    5556
     
    7879                $titre =~ s/&#8217;/'/g;
    7980                $titre =~ s/&#8211;/-/g;
     81                $titre =~ s/&#8209;/-/g;
    8082                $titre =~ s/\xc2\x92/'/g;
    8183                $titre =~ s/\xc2\x96/-/g;
    8284                @date = findDate($_);
     85                $organisme = '';
     86                if($titre =~ /groupe d'amitié/i) {
     87                    $titre =~ s/\s+\-\s+/-/g;
     88                    $titre =~ s/- France/-France/gi;
     89                    $titre =~ s/Groupe d'amitié France \/ /Groupe d'amitié France-/gi;
     90                    $titre =~ s/Royaume Uni/Royaume-Uni/gi;
     91                    $titre =~ s/Île Maurice/Île-Maurice/gi;
     92                    $titre =~ s/Union des Comores/France-Comores/gi;
     93                    $titre =~ s/Cap Vert/Cap-Vert/gi;
     94                    $titre =~ s/Burkina Faso/Burkina-Faso/gi;
     95                    $titre =~ s/France-Union des Comores/France-Comores/gi;
     96                    $organisme = lc($1) if ($titre =~ /(groupe d'amitié [^:.,\( ]*) ?/i);
     97                    $organisme =~ s/(\S*)-france/France-$1/i;
     98                }
    8399                next;
    84100        }
     
    86102        while (/fiches_id.(\d+).asp">([^<]*)<\/a>/g) {
    87103                $nom = $2; $id = $1;
     104                $nom =~ s/députée?s?//;
    88105                next if ($id{$id});
    89106                $id{$id} = 1;
    90107                $nom =~ s/&nbsp;/ /g;
     108                $organisme = $deforganisme unless($organisme);
    91109                foreach $d (@date) {
    92110                        print "{\"depute\":\"$nom\", \"id_an\":\"$id\", \"reunion\":\"$d\", \"commission\":\"$organisme\", \"source\": \"$url\", \"session\":\"$titre\"}\n";
Note: See TracChangeset for help on using the changeset viewer.