Abréviations et linguistique

INFO

Pour les 41065 itinéraires actuellement sur c2c, il y a 53014 versions linguistiques, dont catalan (616), espagnol (9172), francais (34990) et italien (6404).

Cela fait donc 51182 descriptions dans des langues utilisant l’abréviation O pour W.

Et pourtant j’en ai corrigé des centaines depus 10 ans ! Et oui !
Alors bien sûr, ça signifie que le texte saisi par des contributeur n’est pas bien correct. J’espère que tu ne le découvres pas ?
Il y a aussi ceux qui ajoutent une précision dans une phrase, ce qui donne une ambiguité là où c’était clair auparavant.
Et quand on fait une passe rapide sur un itinéraire, qu’on s’aperçoit qu’il faudrait passer 30 min à tout réécrire (en vérifiant sur la carte et des photos, car il ne faut pas faire confiance à ce qui est écrit quand c’est mal écrit, il y a peut être des erreurs de frappe ou de copier coller qui a mélangé le texte initial), on ne fait pas la correction complète. On se contente de mettre les abréviations des points cardinaux (et les nombres en chiffres, car des altitudes ou longueurs écrites en lettre il y en a un paquet aussi), c’est déjà plus clair et ça prend moins de temps.

En tout cas, la standardisation des abréviations pour les points cardinaux permet une évolution vers la possibilité de choisir le type d’affichage des points cardinaux, comme ça tu pourras afficher en lettre, d’autres en abréviation de leur choix, etc.
Mais pour cela, il ne faut pas détruire tout le travail qui a été fait depuis 11 ans.
Vouloir détruire ce travail, c’est une vision court termiste qui empêche une amélioration future du topoguide.

Je réponds en mode cours d’école, recadrage CAC 40 ou adulte à une sortie pareille ? Te rends quand même compte que tu te sers de l’exemple précédent pour démontrer l’immense nécessité de l’internationalisation des points cardinaux et tu me réponds ça ?

On va dire que je te connais avec tes défauts …

1 Like

Il y a 51182 descriptions dans des langues utilisant l’abréviation O pour W.

Ben oui. Tout le boulot fait depuis 11 ans a permis d’ajouter de la sémantique aux points cardinaux mentionnés dans le texte, car il n’y a plus d’ambiguité avec « est ».
Une fois qu’on n’a plus d’ambiguité, ça permet des évolutions.
Si on détruit tout en remplaçant par des mots, on perd cette sémantique, plus d’évolution possible. Il y a bien une perte d’info.

C’est totalement idiot donc : ce texte exemple censé me faire comprendre qu’il faut mettre N,W,S et E à la place de nord, Ouest, Sud et Est n’est pas écrit en français.

La version propre internationale passée au robot ne veut toujours rien dire pour les mêmes raisons qu’exposées précédement :

Donc, t’es gentil, tu relis, tu t’excuses auprès de @lutin.de.la.foret qui peut exposer ses idées aussi longtemps qu’il veut. La position de C2C a été tranchée, il y a 11 ans. Elle semble être validée aujourd’hui. Elle peut très bien être validée ou invalidée dans 11 ans … Tout roi soleil Bubu que tu sois.

1 Like

Il n’y a pas de version internationale, cela n’existe pas : verifier ISO !

Il y a un usage international maritime (anglais ?) utilisant N, S, E and W.

Mes deux centimes, parce que j’avoue ne pas tout lire, on se décourage vite…

De manière générale, je trouve que les règles même quand je les approuve (j’aime bien la généralisation de ENSW) ne sont que des règles indicatives ! Ou devraient l’être. Il y aura toujours des cas particuliers, des cas qui ne suivront pas la règle. C’est pas grave ! Un texte en français utilise O au lieu de W ? Ok c’est dommage. Est-ce que ça rend le topo inutilisable ? non. Est-ce que ça mériterait d’être corrigé ? Dans ce cas oui. Dans d’autres cas, on pourrait, mais on est pas obligé.

Y’a rien de plus relou que l’absolu et l’arbitraire.

ps : je ne suis pas forcément contre l’utilisation des robots pour ce genre de correction car les corrections il me semble ne sont pas automatiques, mais validées par le dresseur. Celui-ci peut (devrait) user de son jugement pour voir si c’est pertinent ou non.

pps : @Bubu t’as pas l’impression d’être un chouilla dans l’exagération en accusant de vouloir « détruire le travail » « faire plier la modération pour la gloire » ? Rien qu’un tout petit chouilla ?

3 Likes

Non.
Car changer toutes les abréviations des points cardinaux en mot prend qq minutes.
Par contre si un an plus tard on se rend compte que c’était une erreur et qu’on veuille revenir en arrière, ce ne serait pas possible, car on ne peut pas remplacer automatiquement tous les « est » par E.
Identifier si un « est » est un verbe ou ou un point cardinal doit être fait à la main. Et ce travail qui a demandé des centaines d’heures, et continue à demander du temps humain, ne doit pas être perdu.

Ok. Parce que moi je l’ai très fort :slight_smile:

1 Like

Je suis très septiquesceptique sur la faisabilité d’une telle évolution. Autant il y a un vrai problème avec « est » en français en toute lettre, mais l’abréviation NSEW ne permettra par de retirer toute ambiguïté. Il faudra obligatoirement rajouter une balise (abbr est un bon candidat), avec check visuel systématique avant d’envisager ce genre de bidouille. La seule lettre ne suffira pas.

Exemple tiré par les cheveux, mais pas trop non plus, qui montre que la seule lettre est ambigue, et qu’il ne faudra pas se baser dessus pour faire des templacements sémantiques systématiques :

Un W est présent au pied de la voie, à coté du chateau d’O. Venez avec la S.N.C.F. en Italie, il y a la voie E nel mezzo scorre un fiume.

Edit : et après réflexion je pense même que le mot en toute lettres n’est pas plus ambigu que la seule lettre. Les cas d’utilisation du mot « Est » point cardinal commencent à être très bien ciblés, merci @borut pour ce taf.

Qu’un travail ait demandé 1 minute, ou mille heures n’est pas un argument pour le conserver. Ok, c’est humainement plus compliqué à faire passer. Mais si c’est une mauvaise idée, c’est une mauvaise idée, point final.

Seul les arguments de fond doivent rentrer en considération.

Clairement non, ca serait un gros chantier. Voir ma remarque précédente. Plus facile avec les robots qu’avec la main, mais ca prendrait au bas mot une dizaine d’heures aux dresseurs pour valider visuellement les milliers d’iti.

caca

1 Like

J’ai vu aussi des trucs du genre « la cotation est donnée à vue, elle est à corriger pour une cotation après W » pour « après travail ».

Sauf qu’en pratique ces exceptions sont très rares, et sont éliminées progressivement par les corrections de mise en forme. Le dresseur n’aurait quasiment jamais à invalider la modif, et les cas où il faudrait faire la modif à la main seraient peu nombreuses.

Rien à voir avec le fait d’identifier les « est » comme verbe ou point cardinal.

En effet.
Mais le nb de cas non traités, qui demande donc un traitement manuel, est bien plus grand que tes exceptions au-dessus.

Sauf qu’on n’a pas fait ce travail pour le plaisir de faire ce travail. C’est bien pour apporter de l’info, ici pour entre autres sémantiser les points cardinaux (même si ce n’est pas parfait, c’est beaucoup mieux que de laisser en « est »).

En filtrant les occurences de EWNS qui ne respectent pas les cas identifiables comme point cardinal (avec des filtres similaires à ceux définis dans l’article), il ne resterait pas beaucoup de documents nécessitant une vérif manuelle, car il y a beaucoup moins de cas d’ambiguité avec les abréviations. Les autres docs pourraient être modifiés automatiquement, sans vérif.

Clairement, ce genre de modif est très loin du niveau de confiance suffisant pour etre fait sans vérification.

En tout cas, il est hors de question que je prenne cette responsabilité en tant que dresseur de bot. Et en tant que contributeur, je m’opposerai à que ca soit fait par un autre dresseur, sans vérification de chaque modification.

Ca serait un coup à insérer des erreurs sémantiques en masse.

C’est ton point de vue, et il est subjectif. Ok, il est semble être partagé par la majorité (et je me plierai de très bonne grâce à cette avis majoritaire). Mais je ne me considère pas relever de l’anathème à ne pas partager ton point de vue.

Tu n’as pas compris.
J’ai dit que l’utilisation des abréviations permet une sémantisation bien meilleure que les mots.
C’est à dire qu’il y a beaucoup moins d’exceptions en pratique, qu’avec les mots.
C’est un constat objectif, ce n’est pas une opinion.

J’ai très bien compris. Et je ne suis pas d’accord avec ce constat. Et encore moins sur son coté objectif. Cf démonstration de @Gros.

Edit : sincèrement @bubu. Tu poses un avis (le tien) comme un constat objectif. Et en conséquences, tu penses que le fait que si une personne n’y adhère pas ne peut être expliqué que par le souhait saboter le travail des autres? Le fait que ce constat ne soit pas aussi objectif que tu ne le crois ne t’effleure pas la tête?

Tu es lourd sur cette question. Tu n’apporte aucune info par ton remplacement de « est » par E … Si la phrase porteuse du mot « est » est à clarifier, elle est à clarifier; point barre. Et quand elle est claire, que ce soit écrit « E », « est » ou « Est » ou même « tartopum », elle est claire. C’est indépendant de la présentation de l’information sur la direction à prendre.

Si c’est écrit en français, il n’y a jamais eu d’ambiguïté entre « nord est » et « nord-est ». Bien avant que Bubu ou C2C n’y réfléchisse d’ailleurs. Les règles de typographie, d’orthographe et de grammaire sont claires :

« Le nord-est ? Par là ! »
« Le nord est par là ! »

« Merci C2C, je vais suivre le topo ! »

Et bien tant pis, tu n’es pas obligé de me croire.
Ayant mis à la main des milliers d’abréviations de points cardinaux, en éliminant les autres abréviations qui prêtent à confusion (du type « cotation après W »), je sais très bien qu’il y a beaucoup plus d’occurrences de « est » en tant que verbe (qu’on ne peut pas toujours éliminer en changeant la phrase), que d’occurences de E W N S qui ne sont pas des points cardinaux (que l’on peut éliminer, au pire en les mettant entre guillemets : un « W » est écrit au pied de la voie).

J’apporte la sémantisation, permettant le remplacement automatique par une balise abbr ou autre, avec un taux de refus (par le dresseur du robot lors de la phase de remplacement auto) bien plus faible qu’avec « est ».
Par ailleurs, pour permettre une fonctionnalité d’affichage personnalisé, c’est plus simple d’avoir le même code dans toutes les langues (du type [ptcard]W[ptcard], ou <abbr>W</abbr>), pour que le script de personnalisation soit identique pour toutes les langues. Et pour ajouter la balise, c’est plus simple d’avoir les mêmes abréviations dans toutes les langues.

Cette fonctionnalité existe-t-elle à l’heure actuelle ?
Au vu des ressources en développement actuel, d’ici combien de temps peut-on espérer qu’elle soit développée ?

Faux problème, tu peux maintenir la diversité dans les balises :

[ptcard]ouest[ptcard], ou <abbr>ouest</abbr>
[ptcard]Ouest[ptcard], ou <abbr>Ouest</abbr>
[ptcard]W[ptcard], ou <abbr>W</abbr>

Ça ajoute juste des cas à reconnaitre, mais qu’un script sache reconnaitre 1 ou 3 chaines, ce n’est pas ça le problème. Le problème, c’est qu’il faut déjà que le script existe.