Bir web sitesinin kodunda bulunan robots.txt isimli dosya, robotlara
yaptıkları indeksleme çalışmalarında o sitenin tamamını veya belirli bir
bölümünü indekslememesini ( göz ardı etmesini) talep eder. Örneğin, web
sitenizde arama motorunda çıkmasını istemediğiniz mahrem bilgiler
olabiliceği gibi ya da sitenizdeki belirli bir içeriğin arama
motorlarında çıkmasının sitenin bütününü yanlış tanıtacağı ya da yanlış
anlaşılmalara yol açabiliceği durumlarda olabilmektedir. Bu gibi
durumlar dosyanın kullanım amaçlarından bazı örneklerdir.
Birçok alt-domain'i bulunan web siteleri için , her bir alt-domain kendine ait bir robots.txt dosyasına sahip olmalıdır. Örneğin ;
example.com domain'i kendine ait bir robots.txt dosyasına sahipse, fakat a.example.com altında bu dosya yok ise, arama motoru robotları olmayan siteyi arama sayfalarında tarama yaptıysa, listeleyecektir.
Yeni bir metin belgesi açalım ismini Robots.txt yapalım. Robots.txt dosyamız içersinde iki farklı değişkenimiz olacak. Bunlar ve anlamları şöyledir:
Disallow: /wp-content/
Disallow: /trackback/
Disallow: /wp-admin/
Disallow: /archives/
Disallow: /index.php
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.css$
Disallow: */feed/
Disallow: */trackback/
User-agent: Googlebot-Image
Disallow: /wp-includes/
User-agent: ia_archiver
Disallow: /
User-agent: duggmirror
Disallow: /
Birçok alt-domain'i bulunan web siteleri için , her bir alt-domain kendine ait bir robots.txt dosyasına sahip olmalıdır. Örneğin ;
example.com domain'i kendine ait bir robots.txt dosyasına sahipse, fakat a.example.com altında bu dosya yok ise, arama motoru robotları olmayan siteyi arama sayfalarında tarama yaptıysa, listeleyecektir.
Yeni bir metin belgesi açalım ismini Robots.txt yapalım. Robots.txt dosyamız içersinde iki farklı değişkenimiz olacak. Bunlar ve anlamları şöyledir:
- Bütün robotların, site üzerindeki bütün dosyaları tarayabileceğine izin veren örnek; " * " yıldız işareti istisnasız tüm robotları indeksleme yapabileceğini gösterir.
User-agent: * Disallow:
- Bütün robotların, site üzerindeki hiçbir dosyayı taramamasının istendiği örnek;
User-agent: * Disallow: /
- Bütün robotlar, site üzerindeki aşağıdaki 4 klasörün içeriğini indekslememeli;
User-agent: * Disallow: /cgi-bin/ Disallow: /images/ Disallow: /tmp/ Disallow: /private/
- İsmi verilen robot, site üzerindeki ismi verilen klasörün içeriğini indekslememeli;
User-agent: BadBot # 'BadBot' kelimesi ilgili botun adı ile değiştirilir. Disallow: /private/
- Bütün robotlar, site üzerindeki aşağıdaki dosyayı indekslememeli; O klasördeki diğer bütün dosyalar ve sayfalar taratılır.
User-agent: * Disallow: /directory/file.html
- Kod içinde yorum yazılan örnekler;
# Yorumlar "#" işaretinden sonra bir satır başında ya da bir komuttan sonra kullanılabilir. User-agent: * # bütün botları kapsasın Disallow: / # bütün botları uzak tutsun
User-agent: Googlebot
Disallow: /wp-content/
Disallow: /trackback/
Disallow: /wp-admin/
Disallow: /archives/
Disallow: /index.php
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.css$
Disallow: */feed/
Disallow: */trackback/
User-agent: Googlebot-Image
Disallow: /wp-includes/
User-agent: ia_archiver
Disallow: /
User-agent: duggmirror
Disallow: /
İlgili Aramalar:robots.txt,robots.txt ayarları,blogger robots.txt ayarları,wordpress robots.txt ayarları
Sitenizi beğendim. İlgili aramalar kutusunun kodunu aşağıdaki adresten bana gönderebilirseniz sevinirim.
YanıtlaSilwww.ecmain.blogspot.com/p/iletisim.html
İlgili aramalar eklentisini konu olarak açtım.İnceleyebilirisiniz...
YanıtlaSil