Changeset 2465


Ignore:
Timestamp:
Nov 4, 2011, 3:10:00 PM (9 years ago)
Author:
komodo
Message:

fix didascalies problématiques

Location:
cpc/branches/senat/project/batch/hemicycle
Files:
2 edited

Legend:

Unmodified
Added
Removed
  • cpc/branches/senat/project/batch/hemicycle/download_hemicycle.pl

    r2167 r2465  
    1717
    1818my ($sec,$min,$hour,$mday,$mon,$year) = localtime(time);
    19 
     19$mon += 1;
    2020$a = WWW::Mechanize->new();
    2121
     
    2424$lastmonth = $mon if ($year + 1900 == $annee);
    2525for($mois = $dmois ; $mois <= $lastmonth ; $mois++) {
    26 #    print STDERR "$mois ($lastmonth) $annee ($year)\n";
     26    print STDERR "$mois ($lastmonth) $annee ($year)\n";
    2727    $url = 'http://www.senat.fr/seances/s'.sprintf('%04d', $annee).sprintf('%02d', $mois).'/s'.sprintf('%04d', $annee).sprintf('%02d', $mois).'.html';
    2828
  • cpc/branches/senat/project/batch/hemicycle/parse_hemicycle.pl

    r2464 r2465  
    221221                $didasc =~ s/<[^>]*>//gi;
    222222                $didasc =~ s/\)//g;
    223                 $predida_inter = $inter;
    224                 $predida_urlinter = $url_inter;
    225                 $predida_fonction = $fonction;
    226                 print_inter();
    227                 $intervention = '<p>'.$didasc.'</p>';
    228                 print_inter();
    229                 $inter = $predida_inter;
    230                 $url_inter = $predida_urlinter;
    231                 $fonction = $predida_fonction;
     223                if ($didasc && $didasc !~ /^(suite|nouveau)$/i) {
     224                        $predida_inter = $inter;
     225                        $predida_urlinter = $url_inter;
     226                        $predida_fonction = $fonction;
     227                        print_inter();
     228                        $intervention = '<p>'.$didasc.'</p>';
     229                        print_inter();
     230                        $inter = $predida_inter;
     231                        $url_inter = $predida_urlinter;
     232                        $fonction = $predida_fonction;
     233                }
    232234            }
    233235        }
     
    243245                $iscontext = $1;
    244246                print_inter();
     247                s/<(i|span class="info_entre_parentheses")>\([^\)]*\)?<\/(i|span)>//;
    245248        }
    246249        if (s/.*id="(intv_|)par_[^>]*>\s*(.*)\s*<\/p>.*/$2/i) {
Note: See TracChangeset for help on using the changeset viewer.