use XML::LibXML; my $parser = XML::LibXML->new; my $doc = $parser->parse_html_file($file);