my @list = grep defined($_), split / \s+ |(?<=[A-Z])(?=[0-9]) # letter-number |(?<=[0-9])(?=[A-Z]) # number-letter | ( , |\+ |- |\/ |& ) /xi, $string; #### 129-129A & B-131 NORTH AV #### token: 129 token: - token: 129 token: A token: token: & token: token: B token: - token: 131 token: NORTH token: AV