Changeset 2593


Ignore:
Timestamp:
Jan 10, 2012, 6:47:44 AM (8 years ago)
Author:
goya
Message:

more debug

File:
1 edited

Legend:

Unmodified
Added
Removed
  • cpc/trunk/project/batch/depute/parse_depute_new.pl

    r2585 r2593  
    3030
    3131my %depute;
     32my %groupes;
    3233
    3334sub clean_vars {
     
    9293    $groupe = lc($1);
    9394    if ($groupe =~ s/^(apparentée?|présidente?)( du groupe)? //) {
    94       $depute{'groupe'} = $groupe." / ".$1;
     95      $gpe = $groupe." / ".$1;
    9596    } else {
    96       $depute{'groupe'} = $groupe." / membre";
    97     }
    98     $depute{'groupe'} .= "e" if ($depute{'sexe'} eq "F" && $depute{'groupe'} =~ /(président|apparenté)$/);
     97      $gpe = $groupe." / membre";
     98    }
     99    $gpe .= "e" if ($depute{'sexe'} eq "F" && $gpe =~ /(président|apparenté)$/);
     100    $depute{'groupe'}{$gpe} = 1;
    99101  } elsif ($line =~ /img [^>]*class="deputy-profile-picture[^>]* src="([^"]+)"/i) {
    100102    $depute{'photo'} = "http://www.assemblee-nationale.fr$1";
     
    177179      $type = "Groupe d'amitié France-";
    178180      $type = "Groupe d'études " if ($type_groupe =~ /étude/i);
     181      $type = "Groupe d'études France-" if ($type_groupe =~ /international/i);
    179182      foreach $gpe (split / - /, $line) {
    180         $depute{$encours}{$type.trim($gpe)." / ".lc(trim($fonction))} = 1;
     183        $gpe =~ s/\(République du\)/(République démocratique du)/i;
     184        if (!$groupes{$gpe}) {
     185          $groupes{$gpe} = 1;
     186          $depute{$encours}{$type.trim($gpe)." / ".lc(trim($fonction))} = 1;
     187        }
    181188      }
    182189    } else {
    183190      next if ($line =~ /Rapporteure? spécial/i);
    184191      if ($line =~ /^\s*(.*) \((.*) - mission débutée.*\)/i) {
    185         $organisme = "Mission temporaire pour le $2 : $1";
     192        $organisme = $1;
     193        $minist = $2;
     194        $minist =~ s/m(inistère d[^,]*),.*$/M\1/i;
     195        $organisme = "Mission temporaire pour le $minist : $organisme";
    186196        $fonction = "chargé".($depute{'sexe'} eq "F" ? "e" : "")." de mission";
    187197      } else {
     
    200210        $organisme = ucfirst($line);
    201211        $organisme =~ s/^(Assemblée nationale)/Bureau de l'\1/i;
    202         $organisme =~ s/(\s*"\s*|\(\s*|\s*\))//g;
     212        $organisme =~ s/("|\(\s*|\s*\))//g;
    203213      }
    204214      $depute{$encours}{trim($organisme)." / ".trim($fonction)} = 1;
Note: See TracChangeset for help on using the changeset viewer.