Ad Widget

Mengenal robots.txt pada blog wordpress

Robots.txt atau dikenal sebagai Robots Exclusion Protocol atau robots.txt protokol, adalah konvensi untuk mencegah bekerjasama web crawler dan robot web lain dalam mengakses semua atau bagian dari website yang dapat dilihat secara publik. Robot sering digunakan oleh mesin pencari untuk mengkategorikan dan mengarsipkan situs web, atau oleh webmaster untuk mengoreksi kode sumber. Standar ini berbeda, tetapi dapat digunakan bersama dengan, Peta Situs, dan inklusi robot standar untuk website. [sumber robots.txt ]

kesimpulan:

"robots.txt"Robots.txt adalah sebuah file text yang berisi perintah-perintah yg menginstruksikan robot-robot search engine apakah suatu URL sebuah domain bisa dijelajahi dan di index atau tidak kedalam servernya.

Untuk membuat robots.txt sangatlah mudah.

Caranya buat file baru namanya robots.txt pada notepad.

isikan dengan kode ini:

# All Bots
User-agent: *
Disallow: /cgi-bin
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-content/
Disallow: /wp-login.php
Disallow: /readme.html
Disallow: /license.txt
Disallow: /search/
Disallow: */trackback/
Disallow: /*?
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$
Disallow: /*.gz$
Disallow: /*.wmv$
Disallow: /*.cgi$
Disallow: /*.xhtml$
Disallow: /*rurl=*
Allow: /sitemap.xml.gz$
Allow: /wp-content/uploads/
atau dengan format seperti ini:
User-agent: *
Allow: /
User-agent: *
Disallow: /search/
Disallow: /tag/
Disallow: /cgi-bin/
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-content/plugins/
Disallow: /wp-content/cache/
Disallow: /wp-content/themes/
Disallow: /wp-login.php
Disallow: /wp-register.php

Disallow diatas artinya URL/Directory pada domain tsb tidak boleh dijelajahi atau di index oleh search engine. Kalo Allow berarti diijinkan untuk di index.

Kemudin save file tersebut.

Lalu upload file robots.txt tersebut ke root direktory hosting domain anda public_html atau public_html/situsanda.com

Untuk mengecek keberhasilannya file bisa diakses di http://www.situsaanda.com/robots.txt

nah sebenarnya banyak kegunaan anda menambahkan kode robots.txt  tersebut pada hosting domain anda salah satunya adalah mengurangi server crash akibat intensitas tinggi traffic dari bot, menghindari suspend hosting dari provider, dan tentu saja mengurangi meningkatkan kualitas halaman blog anda di mata search engine, karena anda mengurangi penjelajahan index yang tidak perlu di web anda. Baca juga google crawl rate

Bahkan jika sangat perlu anda menambahkan kode berikut pada robots.txt

“Crawl-delay directive—>Several major crawlers support a Crawl-delay parameter, set to the number of seconds to wait between successive requests to the same server:”

User-agent: *
Crawl-delay: 10

 

Nah untuk pengguna wordpress anda bisa juga menggunakan plugin:

KB robots Txt

atau

iRobots.txt SEO

Plugin ini secara otomatis akan membuat sendiri file robots.txt  di root domain kita. Cara mengeceknya sama bisa via cpanel lihat di public-html  atau di www.situsaanda.com/robots.txt

About the Author: admin

Kangdadang earned his Diploma degree from dr Otten Academy of Nursing, Bandung in 2002. 2010 He joined the accounting graduate program In economics faculty at The University of Kepulauan Riau. He received his Master of Science degree in Human Resource in 2013 from The University of Batam. While his work at local government, Kang Dadang also interest on IM, today he manage many blog and owner of Pesonaweb.com

You might like

3 Comments

Leave a Reply

Your email address will not be published. Required fields are marked *

%d bloggers like this: