TYPE : D
####
0:
####
1:
####
####################################################
TYPE : T
####
0:
####
1:
####
2:
####
####################################################
TYPE : C
####
0:
####
1:
####
####################################################
TYPE : T
####
0:
####
1:
####
2:
####
####################################################
TYPE : S
####
0:html
####
1:HASH(0x1afe3f4)
####
2:ARRAY(0x1afe40c)
####
3:
####
4:
####
####################################################
####
#!/usr/bin/perl -w
use strict;
use LWP::Simple;
use HTML::TokeParser;
my $url = shift or die "usage: ". __FILE__ ." url";
my $rawHTML = get($url); # attempt to d/l the page to mem
die "LWP::Simple messed up $!" unless ($rawHTML);
my $tp;
$tp = HTML::TokeParser->new(\$rawHTML) or die "WTF $tp gone bad: $!";
# And now -- a generic HTML::TokeParser loop
while (my $token = $tp->get_token)
{
my $ttype = shift @{ $token };
print "TYPE : $ttype\n####\n";
printf( join( '',
map { "$_:%s\n####\n" } 0..@{$token}
)
,
@{$token}
);
print "####################################################\n\n";
}