[Résolu]Indexation Google et fichier robots.txt

Note de ce sujet :
  • Moyenne : 0 (0 vote(s))
  • 1
  • 2
  • 3
  • 4
  • 5
#1
Citation :#~~~~~ NE PAS SUPPRIMER CE BLOC ~~~~~
#~ Version du CMS: 1.7.1
#~ Nom de l'hébergeur : infomaniak
#~ Informations Système :
#~ ----------------------------------------------
#~ Cms Version: 1.7.1
#~ Installed Modules:
#~ * CMSMailer: 2.0
#~ * FileManager: 1.0.2
#~ * MenuManager: 1.6.3
#~ * ModuleManager: 1.3.3
#~ * News: 2.10.5
#~ * nuSOAP: 1.0.1
#~ * Printing: 1.0.4
#~ * Search: 1.6.3
#~ * ThemeManager: 1.1.1
#~ * TinyMCE: 2.7.0
#~ * FrontEndUsers: 1.8.2
#~ * CustomContent: 1.5.3
#~ * CGExtensions: 1.18.3
#~ * CGCalendar: 1.5.2
#~ Config Information:
#~ * php_memory_limit:
#~ * process_whole_template: false
#~ * max_upload_size: 48000000
#~ * default_upload_permission: 664
#~ * assume_mod_rewrite: true
#~ * page_extension: /
#~ * internal_pretty_urls: false
#~ * use_hierarchy: true
#~ Php Information:
#~ * phpversion: 5.2.13
#~ * md5_function: On (Vrai)
#~ * gd_version: 2
#~ * tempnam_function: On (Vrai)
#~ * magic_quotes_runtime: Off (Faux)
#~ * E_STRICT: 0
#~ * memory_limit: 64M
#~ * max_execution_time: 10
#~ * safe_mode: Off (Faux)
#~ * session_save_path: Aucune vérification à cause de la restriction spécifiée par PHP open_basedir
#~ * session_use_cookies: On (Vrai)
#~ Server Information:
#~ * Server Api: apache2handler
#~ * Server Db Type: MySQL (mysql)
#~ * Server Db Version: 5.0.84
#~ ----------------------------------------------
#~~~~~ NE PAS SUPPRIMER CE BLOC ~~~~~
Salut,

je suis en train de développer un site (dont je vous rabâche les oreilles depuis bientôt deux mois) et il n'est pas encore terminé. Cela dit, comme il est déjà en ligne et qu'il doit le rester, Google l'a déjà indexé. J'ai voulu l'empêcher et j'ai appris qu'on pouvait utiliser un fichier robots.txt pour ça. J'en ai un maintenant à la racine de mon site avec:

User-agent: *
Disallow: /test_cmsms/

Il se trouve donc dans le même dossier que le répertoire 'test_cmsms'. Après plusieurs jours, je vois que mon site est tjs indexé et je remarque aussi que le fichier robots.txt de CMSMS se trouve dans un dossier 'doc', donc pas dans le même dossier que les autres dont il empêche l'accès.

Est-ce que j'ai mal compris quelque chose ? Comment est-ce que je peux faire pour supprimer l'indexation de mon site ?

Merci !
#1
Citation :#~~~~~ NE PAS SUPPRIMER CE BLOC ~~~~~
#~ Version du CMS: 1.7.1
#~ Nom de l'hébergeur : infomaniak
#~ Informations Système :
#~ ----------------------------------------------
#~ Cms Version: 1.7.1
#~ Installed Modules:
#~ * CMSMailer: 2.0
#~ * FileManager: 1.0.2
#~ * MenuManager: 1.6.3
#~ * ModuleManager: 1.3.3
#~ * News: 2.10.5
#~ * nuSOAP: 1.0.1
#~ * Printing: 1.0.4
#~ * Search: 1.6.3
#~ * ThemeManager: 1.1.1
#~ * TinyMCE: 2.7.0
#~ * FrontEndUsers: 1.8.2
#~ * CustomContent: 1.5.3
#~ * CGExtensions: 1.18.3
#~ * CGCalendar: 1.5.2
#~ Config Information:
#~ * php_memory_limit:
#~ * process_whole_template: false
#~ * max_upload_size: 48000000
#~ * default_upload_permission: 664
#~ * assume_mod_rewrite: true
#~ * page_extension: /
#~ * internal_pretty_urls: false
#~ * use_hierarchy: true
#~ Php Information:
#~ * phpversion: 5.2.13
#~ * md5_function: On (Vrai)
#~ * gd_version: 2
#~ * tempnam_function: On (Vrai)
#~ * magic_quotes_runtime: Off (Faux)
#~ * E_STRICT: 0
#~ * memory_limit: 64M
#~ * max_execution_time: 10
#~ * safe_mode: Off (Faux)
#~ * session_save_path: Aucune vérification à cause de la restriction spécifiée par PHP open_basedir
#~ * session_use_cookies: On (Vrai)
#~ Server Information:
#~ * Server Api: apache2handler
#~ * Server Db Type: MySQL (mysql)
#~ * Server Db Version: 5.0.84
#~ ----------------------------------------------
#~~~~~ NE PAS SUPPRIMER CE BLOC ~~~~~
Salut,

je suis en train de développer un site (dont je vous rabâche les oreilles depuis bientôt deux mois) et il n'est pas encore terminé. Cela dit, comme il est déjà en ligne et qu'il doit le rester, Google l'a déjà indexé. J'ai voulu l'empêcher et j'ai appris qu'on pouvait utiliser un fichier robots.txt pour ça. J'en ai un maintenant à la racine de mon site avec:

User-agent: *
Disallow: /test_cmsms/

Il se trouve donc dans le même dossier que le répertoire 'test_cmsms'. Après plusieurs jours, je vois que mon site est tjs indexé et je remarque aussi que le fichier robots.txt de CMSMS se trouve dans un dossier 'doc', donc pas dans le même dossier que les autres dont il empêche l'accès.

Est-ce que j'ai mal compris quelque chose ? Comment est-ce que je peux faire pour supprimer l'indexation de mon site ?

Merci !
#2
Je vois qu'il y a une balise:
<meta name="ROBOTS" content="index, follow" />
... dans les métadonnées globales. Je vais mettre noindex, pour l'instant.

Je me suis ensuite baladé sur le site de Google et j'ai supprimé l'url. J'ai vu que mon fichier robots.txt était remarqué, donc ça c'est bon. J'ai aussi mis la balise de vérification google dans les métadonnées globales, pour ne pas oublier plus tard.

Je crois que j'ai finalement tout trouvé... Désolé du dérangement !

Mais si qqn a une remarque au sujet de l'indexation google et autres, ça m'intéresse !
#2
Je vois qu'il y a une balise:
<meta name="ROBOTS" content="index, follow" />
... dans les métadonnées globales. Je vais mettre noindex, pour l'instant.

Je me suis ensuite baladé sur le site de Google et j'ai supprimé l'url. J'ai vu que mon fichier robots.txt était remarqué, donc ça c'est bon. J'ai aussi mis la balise de vérification google dans les métadonnées globales, pour ne pas oublier plus tard.

Je crois que j'ai finalement tout trouvé... Désolé du dérangement !

Mais si qqn a une remarque au sujet de l'indexation google et autres, ça m'intéresse !


Atteindre :


Utilisateur(s) parcourant ce sujet : 1 visiteur(s)