Comment faire pour trouver un sommet qui porte plusieurs noms?

OK, ceci était ma première question. Donc oublions cette solution.

Dans la plupart des cas, ce serait évident… et de toute façon peu importe, puisque le moteur de recherche les prendrait tous en compte.

OK, sauf que personne ne cherche le Bec de Nannaz.

Fuir, non, mais se contenter de consommer sans rien apporter, ça c’est certain. Mais comme le site de saint-Bubu est parfait, il n’y a plus rien à apporter, donc tout est en ordre.

Une site communautaire, c’est une communauté, on ne peut pas la réduire à une personne.

Bubu abat un boulot de dingue sur le topoguide, et celui-ci serait de bien moindre qualité sans lui. Mais oui, ca ne lui donne pas tout les droits (et AMA il a bénéficié de trop bienveillance, ce qui n’a rendu service à personne, lui en premier), et le manque d’empathie qu’il montre sur les forums est un problème qui revient souvent.

Maintenant, c’est le rôle des autres membres habitués de tempérer son avis (et de ne pas prendre la mouche à chacun de ses écarts, tu ne fera pas croire que tu découvres Bubu :wink: ), et à lui de faire des efforts - et en trois ans de présence régulière sur le site, je peux affirmer qu’il y a eu de l’amélioration.

Bref, revenons sur le sujet :

OK, sauf que personne ne cherche le Bec de Nannaz.

C’est à dire? quelles sont les orthographes notables possibles ?

1 Like

C’est vrai, mais ça m’énerve quand je le redécouvre. Surtout que j’ai bien dit que je faisais une PROPOSITION. Et que je comprenais très bien si elle était annulée. Je n’ai pas repris tous les sommets d’un coup… en plus, j’ai choisi volontairement l’objet le plus emblématique pour tenter de comprendre la marche à suivre.

Sans doute, et c’est peut-être ça qui lui donne à penser que rien n’est améliorable. C’est peut-être humain, mais l’humanité m’énerve.

Bec de Nana, Bec de Nannaz, Becca de Nana, Falconetta (je suis tombé sur d’autres combinaisons de Becca et de Nannaz, je ne garde comme demandé que les orthographes notables).
Sur c2c, toutes ces orthographes sont mises dans le champ idoine. Mais pas prises en compte par la recherche.
Chacun de ces noms est présent sur des cartes fiables. Souvent sans alternative, et c’est ça qui est important.

Même chose avec la nouvelle nomenclature de swisstopo dont parle @Chti.nain. On ne trouvera plus que la nouvelle orthographe sur les cartes topo. Donc une grande part des sommets suisses devrait avoir deux noms sur c2c… n’est-ce pas un problème? Tous les « horn » deviennent « hore », les « Sex » deviennent « Sé » (bien triste), les noms patoisants sont ré-orthographiés, etc. Et je vous assure qu’on est bien loin de la problématique du Châtillon que plus personne n’appelle Taron depuis belle lurette ou du Pigne de la Lé dont l’orthographe Lex fait partie de l’histoire. Dans ce nouveau cas (modification générale de la nomenclature), l’ancienne nomenclature est encore habituellement usitée!

Elle est sympa, la modération.
Modérer un seul mot sous-entendu que chacun comprend, c’est pas un peu de la complaisance? Surtout si on se fait supprimer intégralement sa réponse à l’insulte (réponse qui n’est pas du tout agressive, d’après mon souvenir, sachant qu’il s’agissait d’une remarque générale sur la pollution de l’air).
ça me fait toujours rire, ces bouquins où on trouve des insultes de ce type : sale p*, tu n’es qu’une grosse m*!

Je crains que tes souvenirs ne te trahissent…

J’en sais rien quel pourcentage.
Je pensais surtout à des noms à l’orthographe flottante. @pog a cité le bec de Nana et ses diverses orthographes.
Moi je pensais à des camps au Pakistan. Traduction phonique de l’Urdu qui donne des écritures variables.
Jola, Jula, jullah, jollah…
Urdukas, urdokas, rdokass…
Saitchu, Saitcho, Saichu, Saicho…
Khuspang, Xhuspang…
Khoburtse, Khoburtze, Robutze…
Gore, Goro…
Gondogoro, Gondoghoro (même si la version avec h a tendance à se perdre, mais on la trouve encore)

Je ne sais pas si le Karakoram est dans l’épaisseur du trait pour C2C… Possible…

Je parle du Karakoram parce que je connais mais j’imagine qu’il y a d’autres coins montagneux du monde où ce souci existe.

Tiens… Karakoram/Karakorum
:wink:

Très clairement le Karakoram est dans l’épaisseur du trait : 48 points de passages et 14 itinéraires dans tous le Pakistan à ce jour.

J’avoue que je n’arrive pas à comprendre quel est le problème ?

  • Si un itinéraire est connu de plusieurs noms différents dans plusieurs langues => chaque version linguistique porte le bon titre => la recherche fonctionne quelque soit le nom recherché
  • Si un itinéraire est connu de plusieurs noms différents dans une même langue
    • Si l’outil de recherche trouve l’iti quelque soit le nom (variantes suffisamment proche) => mettre le nom le plus usité dans le titre, préciser les variantes dans la description => la recherche fonctionne
    • Si non, et que les variantes sont suffisamment utilisées (risque qu’un nombre important de recherche soit infructueuse), alors mettre les différentes variantes dans le titre la recherche fonctionne, sauf pour les cas peu utilisés.

Quel est le souci alors ? le fait que les cas peu utilisés ne fonctionnent pas dans la recherche ?

Il faut simplement savoir que la recherche en haut de page recherche la chaîne exacte s’il n’y a qu’un mot clé. C’est à dire que la recherche de khobur renvoie Khoburtse, mais la recherche de khoburtze ne renvoie rien.

La recherche approchée ne fonctionne qu’à partir de 2 mots clés. Mais ça ne fonctionne pas si le résultat qu’on cherche n’a qu’un mot, car si on ajoute un 2e mot clé bidon ça ne renvoie que les résultats relatifs à ce 2e mot clé.

Mais la recherche approchée fonctionne mal. Par exemple en doublant une consonne, on ne trouve rien, alors qu’il faudrait trouver les noms avec 1 ou 2 consonnes.
grande dommene > pas de Lance de Domene dans les résultats.
grande domene > Grande Lance de Domene en 1er résultat.

Mais par ailleurs, la recherche de « Col de la Combe » ne renvoie pas le Col de la Combe, alors que c’est un nom exact.
Certains mots communs ne sont pas pris en compte dans la recherche. Il faudrait seulement réduire leur poids dans le calcul de pertinence. Et en premier tester si la recherche exacte renvoie qqch.
Il y a pas mal d’améliorations possible de la recherche sur mots clés.

2 Likes

Ok merci pour l’explication.

Ca serait possible que tu ouvres une issue github sur l’API avec des exemples ? Pas du tout sur que je puisse m’y pencher tot, mais il faudrait garder une trace de ces cas de figures quand on pourra s’y pencher dessus.

1 Like

Oui bien sûr ca marche.
Pour illustrer je viens de le faire pour Jola
https://www.camptocamp.org/waypoints/1064663/fr/jola-jula-joula-jolla-julla-jullah-jhola

J’invente rien, toutes ces versions existent ici ou là et difficile de dégager la ou les plus usitées. Ce sont autant de versions de la transcription en alphabet latin d’un nom urdu.
J’ai enlevé Jollah qui en fait ne semble pas utilisé mais j’en ai rajouté d’autres, que j’avais oubliées. Et encore j’ai pas encore mis la version en alphabet urdu.

Bref moi si sur cet exemple ça vous va je ferai pareil pour les autres. C’est assez amusant à faire. Je trouve le résultat moche mais bon, c’est vrai, ça fonctionne. Dommage que ça ne permette pas de hiérarchiser. Pour Jola c’est pas trop le cas mais il y a des cas où une orthographe est un peu plus communément admise, plus courante.
Améliorer la recherche approchée oui certes, mais pour des noms courts comme jola ou gore, je doute que ça donne des résultats probants. Et ça me paraît a priori (mais ça c’est toi qui sais mieux) au moins aussi compliqué que rajouter un champ « autres noms » (mais je peux me tromper)
L’un n’empêche pas l’autre bien entendu :wink:

Et pour le Karakoram et l’épaisseur du trait je préfère ne pas prolonger le débat ici…

Faut mettre des / et non des - , sinon on croit que c’est un nom composé.
Si tu estmes qu’un tel empilement de noms ne nuit pas à l’ergonomie de lecture partout où ce titre peut être affiché, pas de problème.
Perso je trouve ça immonde. Ça donne des listes de titres peu lisibles, surtout sur mobile.
Imagine si chaque point de passage comporte 6 ou 7 noms dans la liste sur cet itinéraire : Camptocamp.org

Mais je ne regarde jamais le topoguide dans le karakoram, donc ça ne me dérange pas.
Par conte je reagirais si on faisait la même chose en Europe.

On est d’accord donc. Et du coup on fait quoi?
Ah non pardon c’est pas en Europe donc tu t’en fous…

Je ne savais pas pour les slash, merci pour l’info

Ces noms de lieu n’ont pas d’orthographe officielle en alphabet latin.
Donc on fait comme les auteurs des sources où tu as trouvé les différentes orthographes. On en choisit une, voire on en invente une, et basta. Les autres sont mentionnées dans la description.

A la différence près que les sources en question n’ont pas de moteur de recherche.
Mais je constate (avec un certain effarement) qu’il est plus important pour toi que le moteur de recherche permette de trouver des lieux en tapant leur nom avec une faute d’orthographe grossière (Dommène) qu’en entrant un des noms usuels sans faute

Utilise Google pour les recherches avec nom foireux. C’est le plus efficace.

Le sujet était C2C et le moteur de recherche de C2C.
Pas mes recherches personnelles (merci quand même de m’apprendre l’existence de Google…)

Google est le meilleur moteur de recherche c2c pour les noms de sommet c2c.

C’esr faux.
Si on utilise un seul des 7 noms pour ton bivouac dans le karakoram, le nom n’est pas faux.
Par contre il est utile de pouvoir le trouver en utilisant un des autres noms, qui sont le plus souvent juste une variante (une lettre en plus ou en moins, ou une lettre différente).
Ce fonctionnement de la recherche par mot clé est identique à la tolérance d’une faute d’orthographe ou de frappe dans le mot clé saisi.
C’est un fonctionnement élémentaire qu’on attend d’un moteur de recherche.
C’est un des fonctionnements de google. Et on a beaucoup reproché au moteur de recherche de c2c de ne pas être tolérant aux fautes de frappe.

Tape Jola sur Google et on en reparle.
Tape ensuite Jola sur C2C.
Renouvelle l’expérience avec tous les noms que j’ai donnés pour ce camp.
Ah ben oui… D’un coup C2C apporte un plus par rapport à Google.
Excusez-moi.

Il faut rechercher le mot clé + camptocamp dans Google !