my $token_grammar = qr { <[unit]>+ | \b \w+ \b | | \b \w+ ( - | -- ) \w+ \b \b \w+ ' \w \b ( \.+ | ,+ | ?+ | !+ | "+ | '+ | ;+ | :+ | -+ | &+ | \(+ | \)+ | \[+ | \]+ ) };