Page 1 sur 1

Affichage des statistiques de similarité des spuns

MessagePosté: Jeu 25 Oct 2018 17:57
par Nicolaseo
Sur l'outil MFA (Mise en Forme et Analyse) de Content-spinning.fr je viens d'ajouter des statistiques sous les spuns que l'on affiche en tirage aléatoire. Vous pouvez ainsi voir les différents taux de similiarité des différents algorithmes de calcul comme la "Distance de Levenshtein", "Simhash (utilisé par Google)", "l'Indice et distance de Jaccard" et "similar_text (fonction PHP)".

Image

Pour avoir ces taux de similarité, on doit comparer 2 textes.
Le texte de départ et le texte de sortie.

Si vous créez vos MasterSpins en utilisant le Formulaire Polymorphe, on connait le texte de départ. Par contre si vous testez un autre Masterspin via le formulaire MFA, nous n'avons pas le texte de départ...

Pour résoudre ce problème j'ai fait une fonction qui analyse le MasterSpins envoyé pour retrouver le "squelette" qui à servi à écrire le Masterspin (on part du principe que c'est la première version des variations, la "Racine"). Ce {squelette|texte de départ} est comparé à chaque spun tiré aléatoirement en sortie. On obtient ainsi les bons taux de similarité.

J'en ai profité aussi pour ajouter un compteur de mot et de caractères :super:

Re: Affichage des statistiques de similarité des spuns

MessagePosté: Ven 26 Oct 2018 16:24
par Cyril G.
Super nico merci