Conseils Web de Dan: Répertoires et Fichiers défaut Index

Original: http://webtips.dan.info/subdir.html

 

Structurer votre site

CONSEIL: Assurez-utilisation intelligente des sous-répertoires de structurer logiquement votre site, de faciliter la maintenance, et de donner des parties de votre site URL mémorables.

Un site Web ne doit pas être tous dans un même répertoire. Vous pouvez utiliser des sous-répertoires (ce graphique-environnement types ont tendance à appeler «dossiers» de nos jours, mais nous informaticiens vieux temps préfèrent le terme plus technique) dans votre site. C’est une bonne façon de séparer votre contenu d’une manière logique, facilement maintenable. Si vous venez de vider tout dans un répertoire, il obtiendra lourd très rapide. Les sous-répertoires peuvent être utilisés aux fins suivantes:

  •      Pour séparer le contenu de votre site en sous-sites logiques. Si votre site a division des points sensibles, donner à chaque partie un sous-répertoire distinct. Par exemple, un site de l’entreprise peut avoir un répertoire pour la commercialisation de l’information sur ses produits, un autre pour des informations techniques supplémentaires, et un troisième pour les rapports d’actionnaires. Un sous-répertoire peut être divisée à son tour en sous-sous-répertoires au niveau suivant: le répertoire de marketing peut avoir un sous-répertoire pour chaque ligne de produits.
  •      Pour mettre les images dans un répertoire distinct des fichiers HTML. Lorsque vous modifiez les fichiers HTML et voulez tous les télécharger vers le serveur, vous ne voulez pas perdre de temps en téléchargeant les graphismes inchangés plus de temps, mais vous aurez du mal à les séparer du HTML quand ils sont pêle-mêle .
  •      De même, si vous avez des fichiers sonores, les applets Java, ou tout autre contenu multimédia add-ons, utiliser des répertoires distincts pour chaque type de contenu pour garder les choses en ordre.

ASTUCE: Une fois que vous décidez sur votre structure de répertoire et les noms de fichiers, de ne pas les modifier, sauf si vous avez une très bonne raison!

Décider de la structure de répertoires de votre site au début, lorsque vous commencez à travailler sur elle; il est beaucoup plus facile de développer et maintenir un site à partir d’une structure sensible que d’essayer de changer la structure d’un site après qu’il a déjà évolué au hasard. Et si vous changez les noms de fichiers et de répertoires après le site a déjà été en place pendant un certain temps, vous allez vous casser des signets, des liens, et des moteurs de recherche les entrées qui ont été faites à des parties de votre site autre que la page d’accueil principale. Alors, venez avec des noms sensibles dès le début, et essayer d’éviter les modifier par la suite, sauf si absolument nécessaire. Même un changement “trivial” comme changer tous vos fichiers .html à .htm ou vice-versa va briser des liens, donc l’éviter!

Remarque: Les .html et .htm sont des extensions communes pour les documents HTML. .html est généralement considérée comme l’extension plus “propre”, debout pour le document nom de format “HyperText Markup Language”, mais .htm est entré en usage au début de l’histoire du Web pour le plaisir de développeurs utilisant des systèmes d’exploitation comme MS-DOS ou Windows 3.1 qui était limitée à des extensions de trois lettres. Aujourd’hui, avec quelques personnes utilisant ces systèmes d’exploitation sur Internet, et avec des programmes FTP modernes supportant une option pour ajouter la lettre supplémentaire à la fin des noms de fichiers lors du chargement, il ya quelques bonnes raisons d’utiliser la prolongation plus courte, et certaines personnes pensent que les URL look “ringard” avec l’extension courte. Certains outils de création, en particulier ceux créés par Microsoft, toujours par défaut à cette extension, donc beaucoup de sites l’utilisent même si le système des développeurs n’a pas la limitation qui a conduit à lui. En fait, l’une des superstitions communes dans le nommage des fichiers est que les noms devraient être limités à 8 lettres plus une extension de 3 lettre; ce n’est plus le cas pour la grande majorité des systèmes d’usage courant, et même les systèmes qui sont encore limitées de cette manière avoir aucun problème à consulter les sites Internet avec des noms d’URL ne respectant pas cette limitation.

Voici aussi bon que n’importe quel lieu pour vous rappeler que, sur les serveurs UNIX (qui est ce que une grande partie des sites Web utilisent), les noms de fichiers sont sensibles à la casse. Un nom en majuscules comme INDEX.HTML est différent d’un en minuscules comme index.html, et ils sont tous deux différents de chacune des possibilités mixtes comme index.html et index.HTML. Ainsi, lorsque vous créez de nouveaux fichiers et répertoires dans un site Web, être attentif si vous les nommer en majuscules ou minuscules, et être cohérent. Tous les liens vers un fichier donné devront s’entendre dans le cas de la façon dont le fichier est sur ​​le serveur. Sauf qu’il ya une bonne raison de faire autrement, vous devriez utiliser toutes les lettres minuscules dans vos noms; C’est généralement la manière dont les utilisateurs sont utilisées pour entrer les URL. (Même si votre serveur est un, comme Windows NT, qui n’utilise pas les noms de fichiers sensibles à la casse, vous devriez toujours être en cohérence au cas où dans vos liens, puisque les versions différentes de cas sont des URL différentes, même si elles récupèrent le même fichier, et sera mis en cache séparément par l’espace de navigateur et la mémoire des déchets et le temps de téléchargement.)
Fichiers Index du défaut

ASTUCE: Utilisez le fichier d’index par défaut sensiblement de simplifier l’URL de votre site. Faites de même pour les sous-répertoires, de simplifier les URL de vos sous-sites.

Presque tous les serveurs Web ont un fichier par défaut, généralement index.html, mais parfois default.html, welcome.html ou default.htm, qui seront chargés automatiquement quand un nom de répertoire est utilisé comme URL. Vous pouvez profiter de cela pour faire de votre URL plus courte et plus élégant prospectifs. De nombreux utilisateurs ne savent pas et utilisent des URL comme:

http://www.someplace.net/~msmith/marysmith.html

Si Marie nommé sa page principale index.html, elle serait en mesure de donner son URL comme:

http://www.someplace.net/~msmith/

Certaines personnes de cette demi-droite, et donnent leur URL comme:

http://www.someplace.net/~msmith/index.html

Ils ont utilisé le droit nom de fichier, mais ne se rendent pas compte qu’ils n’ont pas eu à réellement saisir ce nom. Le nom du répertoire seul suffit, est plus facile à taper, et semble plus agréable. (Voir les notes ci-dessous sur l’enchaînement de nouveau à votre page d’accueil.)

Mettez un fichier d’index par défaut dans chaque répertoire, même les répertoires qui n’ont pas réellement besoin d’un (par exemple, le répertoire de votre graphique). Si vous ne le faites pas, un utilisateur qui saisit le nom du répertoire comme URL obtenir une liste brute de répertoire, et vous pouvez avoir les fichiers que vous préférez utilisateurs aléatoires pas voir (comme les pages qui sont encore en cours de construction). Un fichier d’index “factice” empêche une telle espionnage.
Final Slash en chemins d’accès

CONSEIL: Ne laissez pas la barre oblique de fermeture de nom-répertoire URL!

Toujours inclure la barre oblique finale (/) à la fin d’une URL qui se termine dans un nom de répertoire. Si vous utilisez:

http://www.someplace.net/~msmith

(sans la barre oblique), le navigateur va d’abord essayer de récupérer un fichier plutôt que d’un répertoire, et uniquement lorsque le serveur se rend compte que ~ msmith est un nom de répertoire il dire au navigateur d’ajouter la barre oblique et essayez à nouveau. Cela prend un tour supplémentaire de communication entre le navigateur et le serveur, ce qui ralentit la récupération. En outre, le navigateur ne sait pas à l’avance que l’adresse sans le slash va à la même page que celle avec elle, afin de ne pas montrer le lien dans la “liaison visité” couleur si l’utilisateur a déjà allé là-bas, et ne seront pas profiter d’une copie précédemment mis en cache de la page qui peut exister.

Pire encore, il ya quelques navigateurs anciens (certains versions de Mosaic, par exemple) qui ne gèrent pas ce type de redirection correctement. Ils peuvent tirer vers le haut la bonne page Web sans le slash, mais ils ont ensuite échouer à gérer les liens relatifs de la page correctement. Un lien vers stuff.html partir de l’URL http://www.someplace.net/~msmith/ devrait finir par aller à http://www.someplace.net/~msmith/stuff.html, mais si la barre est omis et le logiciel de navigation n’est pas assez intelligent pour ajouter une fois qu’il est redirigé par le serveur, il pense que c’est vraiment un niveau de répertoire supérieur dans l’arborescence, et analyser l’URL relative comme http://www.someplace.net/stuff. html. Ce sera alors provoquer une erreur 404 Not Found, et l’utilisateur ne saura pas pourquoi.

Si vous utilisez le <BASE HREF = “…”> pour spécifier une URL de base pour votre site, il est encore plus important d’inclure la barre oblique; il ne fonctionnera pas sans elle, que le navigateur va analyser les références relatives à l’aide du répertoire d’un niveau plus élevé que celui que vous vouliez.

Un site très important dont les créateurs pas tenir compte de mon avis sur les barres obliques est la publication officielle du gouvernement sur le rapport Starr Ken sur les relations du président Clinton stagiaire Monica Lewinsky. En raison de battage actualité-média, ce rapport (affichés sur plusieurs sites officiels du gouvernement, le 11 Septembre 1998, et peu de temps après sur les différents sites du secteur privé ainsi) ont obtenu une partie du trafic Internet le plus lourd jamais, ce qui provoque les serveurs pour être si surchargés dans les premières heures du rapport était que la plupart des gens ne pouvaient pas se connecter. Malheureusement, le gouvernement a ajouté à ce problème en utilisant des versions des URL de ces sites qui n’ont pas le slash partout où ils publicité ou liés aux sites, ainsi veiller à ce que chaque accès du site aurait un plus transaction de serveur que ce qui serait nécessaire si l’barre a été utilisé. Avec le niveau élevé de trafic sur le site avait à l’époque, ce qui a probablement ajouté de longs retards pour les accès de nombreuses personnes.
Une autre raison d’utiliser des barres obliques fermeture …

Quand les URLs se faire publier dans les médias imprimés tels que des journaux, des magazines et des bulletins d’information, ils sont souvent placées dans deux phrases avec des périodes à la fin. Certains lecteurs (en particulier ceux qui sont novices sur le Web et inconscients de ce que les personnages sont généralement dans les URL dans quel ordre) sera pense que la période est partie de l’URL et tapez dans leurs navigateurs. Si l’URL se termine par une barre oblique, l’ajout d’une période sur elle sera traitée par la plupart des serveurs comme une référence à la “single-point” répertoire symbolique-lien qui pointe sur le répertoire courant. Cela fera apparaître la même page que l’utilisateur aurait reçu sans la période supplémentaire (mais avec une URL légèrement inélégante). Sans la barre oblique de fermeture, en ajoutant une période amène à être ajouté au nom du fichier demandé, produisant habituellement une erreur 404 Not Found.
Une note finale sur des barres …

Ayant dit tout cela, je ferais mieux de vous rappeler de ne pas “surcorriger” en ajoutant des barres à des URL qui ne sont pas censés les avoir. Si l’URL fait référence à un fichier plutôt qu’un répertoire, il ne devrait pas être un slash à la fin. Donc, ne tapez pas “http://www.someplace.net/~msmith/stuff.html/”!
Lier Retour Accueil

CONSEIL: La page d’accueil est (généralement) nommé index.html, mais ne pas créer un lien vers ce nom de fichier!

Lors de la liaison vers votre page d’accueil principale d’autres pages de votre site, utilisez <A HREF=”./”> lieu de <A HREF=”index.html”>. Ce “point-barre” syntaxe provoque l’indice de la présente répertoire pour être chargé sous la même syntaxe de l’URL que l’utilisateur utilisé pour accéder au site en premier lieu (nom du répertoire seul), tandis que la seconde syntaxe envoie l’utilisateur vers l’URL avec un “index.html” inutile qui lui est annexé, qui le navigateur ne sera pas comprendre, c’est la même page et donc pas montrer le lien dans le “visité” la couleur ou utiliser des copies mises en cache. Si les liens de l’utilisateur ou signets la page, ils vont finir par se propageant votre moins: élégant URL “index.html” à la place du nom de répertoire propre. (Certains éditeurs de type WYSIWYG comme Microsoft Front Page refusent de vous laisser faire des liens comme je le recommande, même en changeant saisies manuellement “./” liens de “index.html” sur vous. C’est l’une des raisons pour lesquelles je déteste ces éditeurs, et utiliser uniquement les éditeurs de texte brut pour faire ma propre édition de page.)

Remarque: En règle générale, vous devez être cohérent et lien à chacune de vos pages avec une seule URL “canonique” par page, de sorte que les “visités” couleur de lien et le navigateur caches fonctionnent correctement. Mes notes sur un lien vers l’index par défaut et toujours en utilisant la fermeture des barres obliques dans les liens de l’annuaire sont deux exemples de cette; autres cas incluent des sites qui sont accessibles par l’intermédiaire de plusieurs noms de domaine ou d’hôte:  http://www.yoursite.com/ et http://yoursite.com/  pourrait à la fois travail, mais vous devez en choisir un comme moyen standard de lien vers votre site au lieu de les mélanger. Certaines personnes lient volontairement à de multiples variantes de leur adresse comme un moyen d’obtenir des moteurs de recherche à indexer plusieurs fois, mais qui me frappe comme une autre forme de “spamdexing“, et c’est ennuyeux comme un utilisateur de vent avec beaucoup de copies de la même page apparaître dans les résultats de recherche.

Aussi, si vous utilisez le même graphique en plusieurs endroits, assurez-vous d’utiliser la même copie de celui-ci, à la URL, de sorte que les navigateurs peuvent utiliser la copie précédemment mis en cache de celui-ci au lieu de recharger à chaque fois.

Vous pouvez utiliser les fichiers d’index dans chaque sous-répertoire si vous avez plusieurs répertoires, Marie peut faire sous-sites sur ses passe-temps de la philatélie et chats

http://www.someplace.net/~msmith/stamps/
http://www.someplace.net/~msmith/cats/

Dans une telle structure, les menus principaux des “timbres” et “chats” sous-sites seront les fichiers index.html de ces répertoires respectifs, et il peut y avoir un nombre illimité d’autres fichiers dans chacun des répertoires. Mais ne confondez pas la structure en plaçant le menu principal ailleurs; J’ai vu des sites qui utilisent “stamps.html” dans le répertoire parent comme le menu principal de la “timbres” sous-site, le reste des fichiers dans les “timbres /” sous-répertoire. Cette démarche illogique sépare le menu sous-site de ses fichiers associés, donc je ne sais pas ce que le développeur pensait quand il ou elle l’a fait.

Si vous mettez l’index principal de la sous-site dans le répertoire approprié, mais ne nommez pas comme l’index par défaut, vous vous retrouvez avec des URL “redondants” comme:

http://www.someplace.net/~msmith/stamps/stamps.html

J’aime à appeler ces URL “Foo-foo-slash” URL, car ils sont de la forme foo / foo.html (où “foo” est l’un des noms de la communauté de “ordinateur de geek” favoris “de variables arbitraires», ce qui représente une chaîne de caractères). URL redondants sont légèrement stupide, et sont plus longues que l’URL que vous auriez pu avoir l’aide de fichiers par défaut et en citant l’URL par le nom du répertoire seul. J’ai même vu des URL triply- ou quadruplement redondants sur des sites qui semblent sortir de leur façon d’utiliser les arborescences de répertoires trop profondes et éviter d’utiliser les indices de défaut, produire des monstruosités comme:

http://www.foocorp.com/foocorp/foo/corp/foocorp.html

Probablement, le développeur n’était tout simplement pas les idées claires lors de la planification des noms de fichiers et de répertoires dans un tel site. Vous pouvez faire mieux!

NOTE: Je pensais que quand je suis venu avec le “FooCorp” exemple ci-dessus que c’était, une URL exagérée artificiel utilisé pour l’effet, et que je n’étais pas susceptible de fonctionner dans un si mauvais dans le monde réel … mais j’ai trouvé que l’adresse de mlb.com du site de la Major League Baseball redirige vers cette atrocité:

http://mlb.mlb.com/NASApp/mlb/mlb/homepage/mlb_homepage.jsp

Lors de la liaison vers le répertoire parent, utiliser HREF = “../” (deux points et un slash); lors de la liaison à un “frère” utilisation du répertoire HREF = “../ chats /”; lier à l’index d’un sous-répertoire de l’espèce, utiliser le nom sans points ou des barres obliques avant comme HREF = “timbres /”. Pour aller jusqu’à deux niveaux pour un “grand-parent” utilisation du répertoire HREF = “../../”

Une chose à noter: Si vous faites les liens de la façon dont je recommande ici, ils ne fonctionneront pas lorsque vous parcourez vos pages Web sur votre disque dur, depuis votre disque dur n’a pas de nom de fichier “par défaut” comme un index de répertoire. Vous verrez le répertoire cru lorsque vous suivez un tel lien. Mais êtes-vous le développement de votre site Web pour faire bonne figure sur votre disque dur ou sur le serveur Web de destination? Sauf si vous créez un site pour distribuer sur disquette ou CD-ROM pour exécuter dans des environnements non-réseau, le but de votre développement est de rendre le travail du site et sur ​​le serveur, de sorte que vous devez mettre en place avec un peu de maladresse lorsque vous ‘re tester sur votre propre machine avant de le télécharger. Lorsque vous suivez un lien et un répertoire première monte, ce n’est pas une erreur; il suffit de cliquer sur “index.html” et continuer, avec la conscience que ce “problème” va disparaître une fois que vous mettez le site sur le serveur où il appartient. Si vous avez besoin d’une version du site qui s’exécute correctement sur un disque dur ou une disquette, il ya des programmes disponibles pour exporter un site Web sur un disque en mode exécutable, qui changent automatiquement tous les liens vers les noms de fichiers valides plutôt que des noms de répertoire. Teleport Pro et WebSnake sont deux de ces programmes, disponibles par le biais TUCOWS.

Links

 

Comments are closed.