Topoguide : vérifications automatiques

Objectif

Ce thread sert à donner une aide à l’entretien du topoguide de Camptocamp.

Les robots comme @rabot, @botopo ou @CaBot feront un rapport quotidien des contributions qui échoueront à un ensemble de vérifications. Ainsi, ceux qui le souhaitent pourront revoir, et corriger si besoin, ces modifications.


Vérifications fixes

  • Le champ historique est-il rempli?
  • Le document a-t-il été vidé en grande partie?
  • L’utilisateur est-il récemment arrivé (moins de 50 contributions)?
  • Le point de passage principal a-t-il été renseigné?
  • Le type de voie est-il renseigné pour les itinéraires d’escalade?

Vérification paramétrables

Les paramètres sont dans ce post, vous pouvez les mettre à jour simplement en l’éditant.

N’hésitez pas à demander de l’aide dans ce thread si vous voulez rajouter des vérifications.

Vous trouverez ci-dessous une liste de motifs à rechercher dans les documents du topoguide. Pour inspiration, voici la liste des vérifications faites sur la Wikipédia française.


Abréviations suspectes

Liste des abréviations suspectes
  • Erreur : ?

  • Corrigé : .

    \bAR\b

Termes suspects

Liste des termes suspects
  • Erreur : ?

  • Corrigé : .

    \b[Cc]amelot\b

Diverses erreurs

Liste des erreurs
  • Erreur : X

  • Corrigé : X

    (Est)

Utilisation d’abréviations non autorisées

Il faut utiliser exclusivement « pts » pour le nombre de points dans la description des longueurs

  • Erreur : X

  • Corrigé : X

    \b\d+[gpus]\b


Erreurs de syntaxe

Cette vérification remonte des syntaxes markdown valides, mais qui ne correspondent pas à nos conventions.

Liste des erreurs de syntaxe courantes

Titre de niveau 1

Ce test remonte l’utilisation des titres avec un unique #. Il faut utiliser des titres de niveau 2 (2 dièses)

(\n|^)#[^#]

Mise en forme de titre

Il ne faut pas mettre de gras ou italique dans un titre

(\n|^)#+[^\n]*\*

Mauvais usage de la balise L# 

  • Erreur : L#
  • Corrigé : L#

Les contributeurs ne connaissant pas L# vont avoir tendance à mettre L1, L2, etc en début de ligne. Le motif suivant recherche un L ou R, suivi d’un nombre.

(\n|^)[LR]\d+

Fausse liste numérotée

L’utilisateur utilise 1), 2) pour faire une liste numérotée. Il faut utiliser 1.

(\n|^)1\)

Titre terminant par deux petits-points

Il ne faut pas mettre de ponctuation à la fin d’un titre

(\n|^)#+.*: *(\r|\n|$)

Bidouille de mise en forme

Il ne faut pas utiliser la syntaxe pour bidouiller la mise en forme, car le rendu ne sera pas maîtrisé

(\n|^) *\* *(\r|\n|$)
1 Like

Vielles balises BBCodes

Missing history

Vielles balises BBCodes

Tu peux avoir des itinéraires en italien uniquement

Missing history

Fautes d’orthographe courantes

Vieilles balises BBCodes [b], [i] et [c]

Ancres sur titre

Pictos

C’est quoi l’idée ?
Car selon les critères, on pourra avoir des listes avec 5000 ou 10000 itinéraires, je ne vois pas trop l’intérêt de poster ça en vrac dans le forum.
En tout cas pour les itinéraires, il faut le nom complet car le titre « Face S » n’est pas bien utile.

Ok, c’est juste pour les derniers documents ?
En fait le problème est que vu la quantité de document, on a beau avoir un champ correct à 95%, les 5% restant font quand même des centaines ou milliers de documents. Si on met des listes avec des centaines de doc tous les jours sur le forum, plus personne ne les regardera au bout de qq jours, car le sentiment d’impossibilité dominera (à quoi bon corriger 3-4 documents, vu qu’il en sort tous les jours des centaines d’autres avec d’autres problèmes ?).
D’autant plus que parmi les contributeurs, certains ou la plupart n’ont rien à faire de certains champs, comme l’altitude max d’une voie d’escalade, qui est souvent inutile quand on regarde l’itinéraire mais qui est utile pour le filtre, ou pour des stats.

Ok pour le concept, mais il faut réfléchir à son utilisation pour éviter d’être noyé sous des listes postées automatiquement.

1 Like

OK, fait.

Missing history

Liens internes cassés

Vieilles balises BBCodes [b], [i] et [c]

Balises Url pouvant etre migrées

Balises url avec esperluette

Ancres

Ouais, si on commence à s’alarmer pour l’absence d’historique sur un itinéraire de ski de rando, on n’est pas rendu :slight_smile:

Ok, mais il ne faut surtout pas enlever les esperluettes dans une url, ça casse l’url généralement.

Ce qui ressort dans cette liste, c’est les docs que le robot ne peut pas corriger (pour les pbs de balises) et donc qu’il faut corriger à la mano ?

Il y a pour l’instant un peu de tout. ca va m’aider aussi a voir des trucs qui peuvent etre migré en auto, mais qui m’ont echappé.

Mais à terme, c’est très exactement cela : orthographe, historique manquant, grammaire, fautes de frappe courante, mauvais usage de syntaxe, voir meme vandalisme avec insulte. Le champ des possible est très très vaste.

Fait… Mais équipeurs non mentionnés dans le topo papier. Je l’ai donc indiqué dans l’historique :japanese_ogre:

On ne pourrait pas filtrer sur certaines activités ?

C’est bien de mentionner que le topo local ne donne pas l’historique, mais du coup cet iti disparait des radars du robot pour les iti manquants … je sais pas quel est le mieux à faire ?

Pour l’historique cela parait important, car en ski typiquement a part la pente raide, l’historique n’est ni connu ni vraiment important. Trié par activité ce serait top.

Sortir les itinéraires qui ont un historique rentré dans une langue mais pas toutes ? Facile à complété (mais relou).

On a un fichier comportant la liste des itinéraires de ce type (pas d’info dans les topos papier, et mention dans l’historique).
Attention, ne mentionner « Première ascension : inconnue » uniquement si on n’a rien trouvé dans plusieurs topos ou qu’il n’y a rien dans un topo de référence. Je ne sais pas si le topo en question est une référence ou juste une sélection de voies pour faire un topo vendeur.
Typiquement, quand un topo sur le web ne mentionne rien, ce n’est pas valable (exemple : tous les topos web du CAFMA, où il manque la mention des ouvreurs pour les 3/4 des voies : l’info existe surement, c’est simplement qu’ils n’ont pas pris le temps de la mettre en ligne).

Perso je ne le fais pas. Car à terme ce sera automatique (pas via un robot, mais par la structure de la BD).

Dans ce cas, filtrer pour n’avoir que les activités : escalade, rocher haute montage, neige glace mixte, cascade.

Fait (historique ajouté).

@Modo_Topo_FR_contact sur cet article : https://www.camptocamp.org/routes/diff/54580/fr/1432163/1441954

Je pense qu’il y a eu un gros doigt de trad. Je ne sais pas comment recuperer le code d’un version précédente, vous sauriez me dire comment faire?

Je vais corriger, mais pourquoi as tu supprimé le lien cassé vers un commentaire de doc ?
Tu as indiqué « on ne le retrouvera pas », mais en fait on le retrouve facilement : il suffit de chercher 54580-fr dans la catégorie « Commentaires » du forum :
54580_fr
En fait, ce sont les commentaires du doc.