use encoding 'utf8'; print '&#' . ord('ä') . ';'; # prints ä