Topoguide : vérifications automatiques

Objectif

Ce thread sert à donner une aide à l'entretien du topoguide de Camptocamp.

Les robots comme @rabot, @botopo ou @CaBot feront un rapport quotidien des contributions qui échoueront à un ensemble de vérifications. Ainsi, ceux qui le souhaitent pourront revoir, et corriger si besoin, ces modifications.


Vérifications fixes

  • Le champ historique est-il rempli?
  • Le document a-t-il été vidé en grande partie?
  • L'utilisateur est-il récemment arrivé (moins de 50 contributions)?
  • Le point de passage principal a-t-il été renseigné?
  • Le type de voie est-il renseigné pour les itinéraires d'escalade?

Vérification paramétrables

Les paramètres sont dans ce post, vous pouvez les mettre à jour simplement en l'éditant.

N'hésitez pas à demander de l'aide dans ce thread si vous voulez rajouter des vérifications.

Vous trouverez ci dessous une liste de motifs à rechercher dans les documents du topoguide. Pour inspiration, voici la liste des vérifications faites sur la Wikipédia française.


Abréviations suspectes

Liste des abréviations suspectes
  • Erreur : ?
  • Corrigé : .

    \bAR\b

Termes suspects

Liste des termes suspects
  • Erreur : ?
  • Corrigé : .

    \b[Cc]amelot\b

Diverses erreurs

Liste des erreurs
  • Erreur : X
  • Corrigé : X

    (Est)


Erreurs de syntaxe

Cette vérification remonte des syntaxes markdown valides, mais qui ne correspondent pas à nos conventions.

Liste des erreurs de syntaxes courantes

Titre de niveau 1

Ce test remonte l'utilisation des titres avec un unique #. Il faut utiliser des titres de niveau 2 (2 dièses)

(\n|^)#[^#]

Mise en forme de titre

Il ne faut pas mettre de gras ou italique dans un titre

(\n|^)#+[^\n]*\*

Mauvais usage de la balise L# 

  • Erreur : L#
  • Corrigé : L#

Les contributeurs ne connaissant pas L# vont avoir tendance à mettre L1, L2, etc en début de ligne. Le motif suivant recherche un L ou R, suivi d'un nombre.

(\n|^)[LR]\d+

Fausse liste numérotée

L'utilisateur utilise 1), 2) pour faire une liste numérotée. Il faut utiliser 1.

(\n|^)1\)

Titre terminant par deux petits-points

Il ne faut pas mettre de ponctuation à la fin d'un titre

(\n|^)#+.*: *(\r|\n|$)

Bidouille de mise en forme

Il ne faut pas utiliser la syntaxe pour bidouiller la mise en forme, car le rendu ne sera pas maîtrisé

(\n|^) *\* *(\r|\n|$)
1 Like

Vielles balises BBCodes

Bon, allez, dodo. Demain, je rajoute le "petit" test : historique vide? :slight_smile:

2 Likes

Missing history

Vielles balises BBCodes

Done. Par contre, c'est pertinent de mettre aussi les versions autre que françaises?

Tu peux avoir des itinéraires en italien uniquement

Yep. Bon, c'est assez flexible, @Moderation_Topoguide, n'hésitez pas à donner vos idées dans tout ce qui pourrait vous simplifier la vie.

Missing history

Fautes d'orthographe courantes

Vieilles balises BBCodes [b], [i] et [c]

Ancres sur titre

Pictos

C'est quoi l'idée ?
Car selon les critères, on pourra avoir des listes avec 5000 ou 10000 itinéraires, je ne vois pas trop l'intérêt de poster ça en vrac dans le forum.
En tout cas pour les itinéraires, il faut le nom complet car le titre "Face S" n'est pas bien utile.

L'idée, c'est de lutter contre l'entropie : tu auras beau, à un instant T, prendre une action pour lutter contre un biais du wiki (genre un bibliothon car tes champs historiques ne sont pas assez remplis), le fonctionnement du wiki fait que le bordel augmente dans le temps. Donc

  • soit tu fait tous les X ans une grosse action, mais tu acceptes qu'entre temps la qualité se dégrade petit à petit.
  • Soit tu monitores, et corriges, en live les soucis. De cette manière, tu arrives à conserver le niveau de qualité que tu as réussi à obtenir.

Dans l'idéal, le robot tourne en temps continu et te fait une sorte de fenetre whatsnew améliorée, en rajoutant des warning sur ce qu'il trouve.

Je n'ai pas d'ordi qui puisse faire ça pour le moment, donc a defaut, une fois par jour me semble faire le job.

Mais ce qui est sur, c'est que ces tests doivent etre utiles à @Modo_Topo_FR, car un humain doit passer derrière pour corriger, voir discuter avec le contributeur si besoin. D'ou l'importance de passer le prmeier post en wiki pour que vous puissiez vous-meme mettre ce qui vous sera vraiment utile, et virer ce qui occasionne du bruit inutile.

Corrigé.

Ok, c'est juste pour les derniers documents ?
En fait le problème est que vu la quantité de document, on a beau avoir un champ correct à 95%, les 5% restant font quand même des centaines ou milliers de documents. Si on met des listes avec des centaines de doc tous les jours sur le forum, plus personne ne les regardera au bout de qq jours, car le sentiment d'impossibilité dominera (à quoi bon corriger 3-4 documents, vu qu'il en sort tous les jours des centaines d'autres avec d'autres problèmes ?).
D'autant plus que parmi les contributeurs, certains ou la plupart n'ont rien à faire de certains champs, comme l'altitude max d'une voie d'escalade, qui est souvent inutile quand on regarde l'itinéraire mais qui est utile pour le filtre, ou pour des stats.

Ok pour le concept, mais il faut réfléchir à son utilisation pour éviter d'être noyé sous des listes postées automatiquement.

1 Like

C'est pour les documents édités recemment, ce qui inclut donc les derniers documents. Je peux même rajouter une petit mention pour distinguer les créations des simples modifications.

OK, fait.

Missing history

Liens internes cassés

Vieilles balises BBCodes [b], [i] et [c]

Balises Url pouvant etre migrées

Balises url avec esperluette

Ancres

Ouais, si on commence à s'alarmer pour l'absence d'historique sur un itinéraire de ski de rando, on n'est pas rendu :slight_smile:

Ok, mais il ne faut surtout pas enlever les esperluettes dans une url, ça casse l'url généralement.

yep, je précise dans le titre du check. Edit j'ai meme desactivé pour le moment.

Ce qui ressort dans cette liste, c'est les docs que le robot ne peut pas corriger (pour les pbs de balises) et donc qu'il faut corriger à la mano ?

Il y a pour l'instant un peu de tout. ca va m'aider aussi a voir des trucs qui peuvent etre migré en auto, mais qui m'ont echappé.

Mais à terme, c'est très exactement cela : orthographe, historique manquant, grammaire, fautes de frappe courante, mauvais usage de syntaxe, voir meme vandalisme avec insulte. Le champ des possible est très très vaste.

Fait... Mais équipeurs non mentionnés dans le topo papier. Je l'ai donc indiqué dans l'historique :japanese_ogre: