فایل robots.txt یک سند .txt است که حاوی دستورالعمل هایی برای فهرست کردن یک سایت خاص برای ربات های جستجو است. به موتورهای جستجو می گوید که کدام صفحات از یک منبع وب باید ایندکس شوند و کدام صفحات نباید ایندکس شوند. ربات جستجو که به سایت شما آمده است، اول از همه سعی می کند robots.txt را پیدا کند. اگر ربات فایل را پیدا نکرد، یا اگر اشتباه کامپایل شده باشد، ربات به صلاحدید خود سایت را بررسی می کند. این فابل در سئو سایت و ایندکس بسیار تاثیر گذار است.
نمایه سازی یک سایت جدید ممکن است زمان زیادی طول بکشد. بنابراین، مدیر وب سایت باید مراقب ایجاد فایل robots.txt صحیح به موقع باشد.
این فایل حاوی متن ساده است که حداقل از دو خط تشکیل شده است. تعداد دقیق کلمات بر اساس نیاز افراد به ممنوع کردن یا اجازه خزیدن در صفحات خاص تعیین می شود. هر خط از فایل یک دستور در قالب یک دستورالعمل است. این بخش، دسته یا صفحه خاصی را توصیف می کند. هر بخش از یک خط جدید شروع می شود. Robots.txt در هر زمانی ویرایش می شود که نیاز به بستن موارد تکراری، داده های شخصی، قراردادهای کاربر یا صفحات جدید از فهرست باشد. برای انجام این کار، از طریق مدیر فایل بارگیری می شود و در رایانه ویرایش می شود. پس از ایجاد تغییرات، robots.txt به روز شده باید دوباره در سرور آپلود شود و در پیوند yoursite.ua/robots.txt بررسی شود ، جایی که yoursite.ua نام سایت است.
این فایل همچنین می تواند ایجاد شود تا نمایه سازی همه صفحات سایت را به طور همزمان ممنوع یا مجاز کند. همچنین می توان از آن برای مخفی کردن بخش های منابع برای ربات های مختلف استفاده کرد. اگر دستورالعمل های تجویز شده برای همه ربات ها اعمال شود، علامت "*" در انتهای خط اول قرار می گیرد.
بیشتر بخوانید
اگر میخواهید فایل robots.txt را پیدا کنید، آن را در ریشه سایت خود، جایی که همه پوشهها و فایلهای وبلاگ شما در آن قرار دارند، پیدا خواهید کرد. برای دسترسی به آن، می توانید از پروتکل انتقال فایل FTP با یک برنامه انتقال فایل مانند FileZilla استفاده کنید. برای بررسی اینکه آیا فایل robots.txt در سایت شما وجود دارد یا خیر، مسیر فایل را مانند این در نوار آدرس مرورگر تایپ کنید: http://www.my-site.com/robots.txt.
اگر فایل robots.txt در ریشه سایت شما باشد، نمایش داده می شود و به روبات ها اجازه می دهد تا دستورالعمل های موجود در آن را دنبال کنند. اگر فایل robots.txt وجود نداشته باشد خطای 404 نمایش داده می شود و ربات ها در نظر میگیرند که محتوای ممنوعه ای وجود ندارد. وب سایت فقط یک فایل ربات دارد و نام آن باید با حروف کوچک (robots.txt) صحیح باشد.
برای ایجاد فایل robots.txt سایت خود، باید بتوانید به ریشه سایت خود دسترسی داشته باشید. فایل robots.txt به صورت دستی تولید می شود یا به طور پیش فرض توسط اکثر سیستم های مدیریت محتوا مانند WordPress در هنگام نصب تولید می شود. همچنین امکان ایجاد پروفایل خود برای ربات ها با استفاده از ابزار آنلاین وجود دارد.
برای ایجاد فایل robots.txt به صورت دستی می توانید از هر ویرایشگر متنی ساده ای مانند Notepad ++ یا Sublime txt استفاده کنید و باید دقت کنید که دستورالعمل ها را به درستی بنویسید و دستورالعمل ها را فردی کنید تا در هر خط یکی باشند و خطوط خالی نگذارید.. سپس فایل متنی را در قسمت Name robots.txt بدون خطا ذخیره کنید و سپس از طریق FTP در روت سایت خود آپلود کنید.
فایل robots.txt به رباتهای مختلف میگوید که چه چیزی باید و چه چیزی نباید در وبسایت شما بخزند. برای این کار از مجموعه ای از دستورات استفاده می کند. سه تا از این دستورات که اغلب استفاده خواهید کرد عبارتند از User-Agent، Allow Disallow.
اگر میخواهید از این فایل استفاده کنید ولی تخصصی در این زمینه ندارید. ب تر است به شرکت طراحی سایت زر کیا مراجعه کنید. زیرا زر کیا یکی از بهترین و معتبر ترین شرکت های ایرانی می باشد که در این زمینه مشغول به فعالیت می باشد.
از نظر سئو ، robots.txt به شما اجازه می دهد :
برای آزمایش فایل robots.txt سایت خود، تنها کاری که باید انجام دهید این است که یک وب سایت ایجاد کنید و آن را در کنسول جستجوی گوگل احراز هویت کنید.