in reply to HTML::TokeParser token dumper

HTML::Parser version here (same usage):
#!/usr/bin/perl -w use strict; use LWP::Simple; use HTML::Parser; my $url = shift or die "usage: ". __FILE__ ." url"; my $rawHTML = get($url); # attempt to d/l the page to mem my @parsed; die "LWP::Simple messed up $!" unless ($rawHTML); my %TPS =( api_version => 3, handlers => {default => [\@parsed, "event,text"]} ,); my $tp = HTML::Parser->new( %TPS ); $tp->parse($rawHTML); for my $token(@parsed) { my $ttype = shift @{ $token }; print "TYPE : $ttype\n####\n"; printf( join( '', map { "$_:%s\n####\n" } 0..@{$token} ) , @{$token} ); print "####################################################\n\n"; } __END__ TYPE : start_document #### 0: #### 1: #### #################################################### TYPE : declaration #### 0:<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" > #### 1: #### #################################################### TYPE : text #### 0: #### 1: #### #################################################### TYPE : comment #### 0:<!--took this out for IE6ites "http://www.w3.org/TR/REC-html40/loos +e.dtd"--> #### 1: #### ####################################################

 
___crazyinsomniac_______________________________________
Disclaimer: Don't blame. It came from inside the void

perl -e "$q=$_;map({chr unpack qq;H*;,$_}split(q;;,q*H*));print;$q/$q;"