in reply to Matching text between tags
For stuff that looks like HTML, use an HTML parser:
#!/usr/bin/perl use strict; use warnings; use HTML::TreeBuilder; my $lines = <<'LINES'; Aliquam vitae ipsum id felis finibus congue. Ut molestie scelerisque p +urus, sit amet rhoncus leo aliquet ac. In eu lobortis quam. Maecenas auctor +semper enim, ut convallis sapien dictum eu. Sed arcu ex, ornare et porttitor vitae, + interdum a mi. Mauris rutrum luctus rhoncus. Quisque velit quam, convallis vel est at +, tincidunt accumsan velit. Fusce ut <u>metus ut which may either exceed $1,000.00 or OK. G. LAT, semper nunc, in dictum magna.</u> Aliquam ac vestibulum dolor. Praesent in magna nisi. Cras nec viverra +ligula. Suspendisse efficitur imperdiet eros, <u>sed rhoncus sapien euismod cursus. Vestib +ulum a posuere</u> elit, eget tristique eros. Etiam et lectus venenatis, aliquet dui vitae, pos +uere lectus."; LINES my $tree = HTML::TreeBuilder->new_from_content($lines); for my $node ($tree->guts()) { next if !ref $node || $node->tag() ne 'u'; print $node->as_text(), "\n\n"; }
Prints:
metus ut which may either exceed $1,000.00 or OK. G. LAT, semper nunc, + in dictum magna. sed rhoncus sapien euismod cursus. Vestibulum a posuere
|
|---|