Perlbeginner1 has asked for the wisdom of the Perl Monks concerning the following question:
Allgemeine Daten der Schule / Behörde:
04126159 http://www.kultusportal-bw.de/servlet/PB/menu/1188427/index.html?COMPL +ETEHREF=http://www.kultus-bw.de/did_abfrage/detail.php?id=04133309 <!-- WRAPPED CONTENT --> <table id="wrappedcontent"> <tr><td> <br/> <br> <p><a href="../../menu/1188427/index.html?COMPLETEHREF=h +ttp://www.kultus-bw.de/did_abfrage/schnellsuche.php">Schnellsuche</a> + | <a href="../../menu/1188427/index.html?COMPLETEHREF=http://www.kul +tus-bw.de/did_abfrage/maske.php">Erweiterte Suche</a> | <a href="../. +./menu/1188427/index.html?COMPLETEHREF=http://www.kultus-bw.de/did_ab +frage/hilfe.php">Hilfe</a><script language="javascript"> document.write(' | <a href="javascript:history.back()">zurück zur + Trefferliste</a>'); </script> </p><h1>Allgemeine Daten der Schule / Behörde:</h1> <table + border="0" bgcolor="#EFEFEF" leftmargin="15" topmargin="5"><tr> <t +d><strong>Schul-/Behördenname:</strong> </td> <td width=500> + Herzog-Philipp-Verbandsschule Grund- u. Werkrealschule + </td></tr><tr> <td><strong>Schulart:</strong> </td> <td width +=500> Öffentliche Schule (04139579) </td></tr><tr><td +><strong>Hausadressse:</strong> </td><td>Ebersbacher Str. 20,&nb +sp;88361 Altshausen</td></tr><tr> <td><strong>Postfachadresse:< +/strong> </td> <td> Keine Angabe </td></tr><tr> + <td><strong>Telefon:</strong> </td> <td> 07584/92270 + </td></tr><tr> <td><strong>Fax:</strong> </td> <td> + 07584/922729 </td></tr><tr> <td><strong>E-Mail:</stron +g> </td> <td> <a href="mailto:poststelle@04139579.schu +le.bwl.de" TARGET="_blank">poststelle@04139579.schule.bwl.de</a> + </td></tr><tr> <td><strong>Internet:</strong> </td> +<td> <a href="http://www.hpv-altshausen.de +" target="_blank">www.hpv-altshausen.de</a><br> </td +></tr><tr> <td><strong>Übergeordnete Dienststelle:</strong> + </td> <td> <a href="http://www.s +chulamt-markdorf.de" target="_blank">Staatliches Schulamt Markdorf </ +a><br> </td></tr><tr> <td><strong>Schulleitung:</st +rong> </td> <td> Mößle, Georg </td>< +/tr><tr> <td><strong>Stellv. Schulleitung:</strong> </td> <td> + Schneider, Cornelia </td> </td></tr><tr> <td><stro +ng>Anzahl Schüler:</strong> </td> <td> 456 + </td></tr><tr> <td><strong>Anzahl Klassen:</strong> </td> <td +> 19 </td></tr><tr> <td><strong>Anzahl Lehrer:</stro +ng> </td> <td> 39 </td></tr><tr> <td><strong>K +reis:</strong> </td> <td> Ravensburg </td></tr> +<tr> <td><strong>Schulträger:</strong> </td> <td> < +;kein Eintrag> (Ohne Zuordnung) + </td></tr></table><!--<table border="0"> <tr> <td><br><p>Die Adres +sdaten (Hausadresse, Postfachadresse, Telefon, Fax und Internet) werd +en vom Kultusministerium (Referat 15, Information und Kommunikation, +Iuk-Verfahren in Schulen und Schulverwaltung) zur Verfügung gestellt +- Änderungswünsche können Sie per E-Mail <a href="mailto:sc@schule.bw +l.de?subject=Meldung service-bw-Schuladressdatenänderung">an das Serv +ice Center SVN</a> übermitteln. </p><p>Für die Änderung aller anderen + Angaben wenden Sie sich bitte an Ihre obere Schulaufsichtsbehörde. < +/p><p>Die Schüler-, Lehrer- und Klassenzahlen beruhen auf Daten der l +etzten amtlichen Schulstatistik (Ende Januar).</p>//--><!-- </td> < +/tr></table>//--> </td></tr> </table> <!-- WRAPPED CONTENT END -->
#!/usr/bin/perl use strict; # use warnings; # use diagnostics; # use LWP::Simple; # use HTML::TokeParser; # my $url = ' '; # Just an example: the URL where we have to count up in order to g +et all the pages we have to count the URL from somewhat 041000000 to +04999999 or even better to 06000000 use LWP::Simple; my $content = get $url; die "Couldn't get $url" unless defined $content; # Then go do things with $content, like this: # start a new Parser-job with my $p = HTML::TokeParser->new($url) or die "Can't open $url: ($!)"; #find the tags 'xyz' while (my $tag = $p->get_tag('div', '/html')) # my output... !! my $out_file='./output.xml';
|
|---|