[Résolu] "Disallow:" de robots txt et CMS MS - Version imprimable +- Forum CMS Made Simple FR (https://forum.cmsmadesimple.fr) +-- Forum : Ressources (https://forum.cmsmadesimple.fr/forum-4.html) +--- Forum : Hébergement et référencement (https://forum.cmsmadesimple.fr/forum-11.html) +--- Sujet : [Résolu] "Disallow:" de robots txt et CMS MS (/thread-420.html) |
[Résolu] "Disallow:" de robots txt et CMS MS - blitzeur - 21/05/2010 Citation :#~~~~~ NE PAS SUPPRIMER CE BLOC ~~~~~Je pose ma question ici pour en avoir le coeur net: je dois utiliser le robots txt pour désinder plusieurs dizaines de pages à la fois. le code est: Disallow: /repertoire/chemin/page.html Imaginons que la page à désindexer soit: http://example.com/index.php/mapage Deux questions se posent à moi: 1) "index.php" n'étant pas un dossier mais un fichier dois je dans mon cas indiquer quand meme à robot txt: Disallow: /index.php/mapage ? 2) La procédure explique dans l'exemple "mapage.html" puis je ne pas mettre l'extention de la page et simplement "mapage" sans créer de dysfonctionnement? Merci aux spécialistes pour leur aide Philippe. [Résolu] "Disallow:" de robots txt et CMS MS - bess - 21/05/2010 a ma connaissance puisque le robot fonctionne comme un visiteur (et ne fait pas de distinction entre un fichier index.php et un dossier s'appelant index.php) tu dois spécifier effectivement Disallow: /index.php/mapage pour bloquer son indexage. pour le second point, si ta page peut s'appeler indistinctement http://www.site.fr/mapage.html ou http://www.site.fr/index.php?page=mapage par exemple, il te faudra préciser dans le fichier robots.txt : Disallow: /mapage.html Disallow: /index.php?page=mapage de la même façon si on peut y accéder par http://www.site.fr/mapage tu ajoute l'entrée ce qui donne Disallow: /mapage.html Disallow: /mapage Disallow: /index.php?page=mapage le problème des solutions globale la meilleur solution dans ton cas est de spécifier page à page quelle sont celles que tu ne souhaites pas indexer et coupler cela par une astuces qu'a décrite une personne pas plus tard qu'hier : http://www.cmsmadesimple.fr/forum/viewtopic.php?id=2642 [Résolu] "Disallow:" de robots txt et CMS MS - blitzeur - 21/05/2010 Merci Jess ! j'ai a peu près 100 pages que j'ai listées méticuleusement je vais voir si j'arrive à appréhender tous les cas mais je pense au avec tes explications ca devrait aller A bientot, Philippe. [Résolu] "Disallow:" de robots txt et CMS MS - blitzeur - 23/05/2010 Un cas qui me paraît épineux. Quelle syntaxe pour "Disallow" cette URL: http://example.com/index.php?mact=News,cntnt01,print,0&cntnt01articleid=1&cntnt01showtemplate=false&cntnt01returnid=61 Merci pour votre aide. Philippe [Résolu] "Disallow:" de robots txt et CMS MS - bess - 23/05/2010 bonne question. je doute que tu t'en sorte :/ enfin au pire test : Disallow: /index.php?mact=News mais j'ai un sérieux doute ^^ [Résolu] "Disallow:" de robots txt et CMS MS - blitzeur - 23/05/2010 Argh Je vais poser la question également sur un autre forum et dès que j'ai la réponse je la poste ici :p Philippe. [Résolu] "Disallow:" de robots txt et CMS MS - blitzeur - 24/05/2010 Je me réponds à moi même: Avec l'aide du forum OSEOX la solution est:/index.php?mact=News,cntnt01,print,0&cntnt01articleid=1&cntnt01showtemplate=false&cntnt01returnid=61 Et pour info voici toutes les syntaxes possibles: http://www.google.com/support/webmasters/bin/answer.py?hl=fr&answer=156449 Amitiés, Philippe |