Hello
Trop fort, le Patrpo !
C'est exactement ce que je cherchais.
Bon, je ne suis pas sortit de l'auberge, vu que le hfs+ écrit en Unicode-16 decomposed,
c'est à dire que chaque caractère accentué est composé de 3 charactères : la lettre, une liaison puis l'accent.
On peut voir les char en code avec "od -h"
( c'est pas hyper limpide mais l'info est là )
ç = "[c][\xcc][\xa7]"
à = "[a][\xcc][\x80]"
é = [e][\xcc][\x81]
ê = "[e][\xcc][\x82]"
etc ...
Bon, j'y retourne, je ferai un mail avec le résultat final, des fois que vous ayez envie de checker les noms de fichiers chez vos utilisateurs adorés ;-)
Un très grand merci patpro, et bravo aussi pour avoir trouvé cette solution :)
Nicolas
On 28 sept. 2012, at 16:32, Patrick Proniewski wrote:
> hop,
>
> Tu n'as plus qu'à te palucher la liste des caractères "autorisés" du côté de http://jrgraphix.net/r/Unicode/0020-007F (utilise le menu déroulant à droite pour changer de set).
> Puis créer ton filtre avec grep sous une forme qui ressemble à ça :
>
> grep -P "[\x41-\x5A]"
>
> ici je grep les caractères A à Z : à toi de compléter pour avoir un grep qui fait tout ce que tu veux.
>
> Pour prendre un peu d'altitude par rapport à ton problème : arrête de perdre ton temps à essayer de compenser les dérives de tes utilisateurs, c'est perdu d'avance :) Ça plante, c'est tant-pis pour eux. Si ils râlent, tu leur imprimes à chacun une feuille A4 avec la liste des caractères "autorisés".
_______________________________________________
archives :
http://listes.patpro.net/list/sshfr.fr.html
http://listes.patpro.net/mailman/listinfo/script_shell_fr