Fail robots.txt adalah fail teks yang sangat mudah. Fungsi utamanya adalah untuk mengelakkan beberapa perayap mesin pencari seperti Google merangkak dan mengindeks kandungan di laman web untuk SEO. Jika anda tidak pasti sama ada laman web anda atau laman web pelanggan anda mempunyai fail robots.txt, mudah untuk memeriksa: hanya taip example.com/robots.txt. Anda akan mendapati sama ada halaman ralat atau halaman format biasa.
Ada cara yang berbeza untuk membuat fail robots.txt. Anda boleh menciptanya dari anda: Sistem Pengurusan Kandungan, Komputer selepas itu anda memuat naiknya melalui pelayan web anda, Manual membina dan memuat naik ke Webserver.
Fail pertama yang dilihat oleh bot enjin carian adalah fail teks robot, jika tidak dijumpai, maka terdapat kebarangkalian yang tinggi bahawa crawler tidak akan mengindeks semua halaman laman web anda. Fail kecil ini boleh diubah kemudian apabila anda menambah lebih banyak halaman dengan sedikit arahan, tetapi pastikan anda tidak menambah halaman induk ke arahan tidak membenarkan. Google berjalan dengan anggaran merangkak; anggaran ini berdasarkan had imbasan.
Peta laman adalah penting untuk semua laman web kerana ia mengandungi maklumat yang berguna untuk enjin carian. Peta laman memberitahu bot seberapa kerap anda mengemas kini laman web anda, kandungan apa yang disediakan oleh laman web anda. Tujuan utamanya adalah untuk memberitahu mesin pencari semua halaman di laman web anda yang perlu dirayapi, sementara fail teks robotik adalah untuk robot carian. Ia memberitahu crawler halaman mana untuk merangkak dan yang tidak. Peta laman diperlukan untuk laman web anda diindeks, tetapi txt robot tidak (jika anda tidak mempunyai halaman yang tidak perlu diindeks).