use Unicode::UCD 'charinfo';

  # Look for codepoints not in Basic Latin 
  while ( $string  =~ s/(\P{InBasic_Latin})// ) {     
        my $U_char = $1;                              
          # e.g. U_char = Гј  
        my $U_codepoint = ord($U_char);               
          # so U_codepoint = ord(Гј)  = 252
        $string =~ s/$U_char/$subs{$U_codepoint}/;    
          # and $subs{252} = ь
  }