Ignore:
Timestamp:
Feb 3, 2011, 12:41:15 AM (10 years ago)
Author:
teymour
Message:

Cas rapporteur spécial ++

File:
1 edited

Legend:

Unmodified
Added
Removed
  • cpc/trunk/project/batch/depute/parse_depute.pl

    r1754 r1767  
    3131        $p->get_tag('td');
    3232        $txt = $p->get_text('/td');
    33         if ($e =~ /groupe|président/i) {
    34             $fonction = ($e =~ /président/i) ? 'président' : 'membre';
    35             if ($txt =~ s/apparenté //i) {
    36                 $fonction = 'apparenté';
     33        if ($e =~ /groupe|président/i) {
     34            $fonction = ($e =~ /président/i) ? 'président' : 'membre';
     35            if ($txt =~ s/apparenté //i) {
     36                $fonction = 'apparenté';
    3737            }
    3838            ${$depute{'Groupe'}}{lc($txt)." / $fonction"} = 1;
     
    4141        next if ($e =~ /Commission/);
    4242        $depute{$e} = $txt;
    43         return if ($e =~ /Suppléant/);
     43        return if ($e =~ /Suppléant/);
    4444    }
    4545}
     
    5151        last if ($t->[0] =~ /^\//);
    5252        $_ = $p->get_text('/span');
    53         if (/Mél/) {
     53        if (/Mél/) {
    5454            $_ = $p->get_text('/li');
    5555            if (/MAILTO:([^_]+)_([\w\-]+)/i) {
     
    8686        last if ($t->[0] =~ /^\//);
    8787        $_ = $p->get_text('/span');
    88         if (/Mandat|Commission|Mission|Office|Délégation/) {
     88        if (/Mandat|Commission|Mission|Office|D.l.gation/) {
    8989            $text = $p->get_text('ul', '/ul');
    90             if ($text =~ /Date de début de mandat : ([\d\/]+) /) {
     90            if ($text =~ /Date de début de mandat : ([\d\/]+) /) {
    9191                $depute{'Debut_Mandat'} = $1;
    9292            }
    93             while ($t = $p->get_tag('li', '/li', '/ul')) {
    94                 last if ($t->[0] =~ /^\//);
     93            while ($t = $p->get_tag('li', '/li')) {
     94                last if ($t->[0] =~ /^\/li/);
    9595                $text = $p->get_text('/li');
    96                 if  ($text =~ /^(\S+\s*\S*\s*\S*)( du | de la | de l')\s*(.*)/) {
     96                if  ($text =~ /^([^(]\S+\s*\S*\s*(\S\S\S+\s*\S*\s*\S*|))( du | de la | de l')\s*([^:]*)/) {
    9797                    $fonction = $1;
    98                     $orga = $3;
     98                    next if ($fonction =~ /Mandat/);
     99                    $orga = $4;
     100                    next if ($orga =~ /mandat/);
     101                    $fonction =~ s/ au nom//;
     102                    $fonction =~ s/ par les groupes//;
     103                    $fonction =~ s/ du bureau//;
     104                    $orga =~ s/depuis le//;
    99105                    $orga =~ s/\s+$//;
     106                    $orga =~ s/Assemblée Nationale/Bureau de l'Assemblée Nationale/;
    100107                    $deb = "";
    101108                    if ($orga =~ s/ depuis le : ([\d\/]+)//) {
     
    164171    }
    165172    $_ = $p->get_text('/h2');
    166     if (/Informations générales/) {
     173    if (/Informations générales/) {
    167174        infosgene($p);
    168175    }elsif (/Contacts et site internet/) {
    169176        contact($p);
    170     }elsif (/Mandats et fonctions à l'Assemblée nationale/ && ! /Anciens/) {
     177    }elsif (/Mandats et fonctions à l'Assemblée nationale/ && ! /Anciens/) {
    171178        mandat($p);
    172179    }elsif (/Organismes extra-parlementaires/) {
     
    176183    }elsif (/^Fonctions dans les instances internationales ou judiciaires/) {
    177184        extra($p);
    178     }elsif (/Place dans l'hémicycle/) {
     185    }elsif (/Place dans l'hémicycle/) {
    179186        place($p);
    180187    }
    181188}
    182189
    183 #On récupère le nom de famille à partir des emails
     190#On récupère le nom de famille à partir des emails
    184191$nomdep = $depute{'Nom'};
    185 $nomdep =~ s/[éèêë]+/e/ig;
     192$nomdep =~ s/[éèêë]+/e/ig;
    186193@noms = split / /, $nomdep;
    187194if ((join " ", keys %{$depute{'Mails'}}) =~ /(\S+)\@assemblee/) {
     
    202209    }
    203210}
    204 #Si pas de nom de famille, on le récupère par le nom
     211#Si pas de nom de famille, on le récupère par le nom
    205212if (!$depute{'Nom_de_famille'}) {
    206213    if ($depute{'Nom'} =~ /\S (des? )?(.*)$/i) {
     
    247254    print "  depute_".$depute{'id_an'}.":\n";
    248255    foreach $k (keys %depute) {
    249         next if ($k =~ /suppléant/i);
     256        next if ($k =~ /suppléant/i);
    250257        if (ref($depute{$k}) =~ /HASH/) {
    251258            print "    ".lc($k).":\n";
     
    254261            }
    255262        }else {
    256             if ($k !~ /suppléant/i) {
     263            if ($k !~ /suppléant/i) {
    257264                print "    ".lc($k).": ".$depute{$k}."\n";
    258265            }
     
    266273print "{ ";
    267274foreach $k (keys %depute) {
    268     next if ($k =~ /suppléant/i);
     275    next if ($k =~ /suppléant/i);
    269276    if (ref($depute{$k}) =~ /HASH/) {
    270277        print '"'.lc($k).'" : [';
Note: See TracChangeset for help on using the changeset viewer.