analyse_text.pl --input-corpus input.txt --ngram-length 2 --output-state mystate --separator ' '