1. این پایگاه به ثبت ستاد ساماندهی وزارت فرهنگ و ارشاد اسلامی ایران رسیده است.

    مهمان عزیز سپاس بابت بازدید شما از تالار گفتگوی دهه هفتادی ها.

    عضویت در انجمن رایگان بوده و برای عموم باز میباشد . با صرف 30 ثانیه یکی از اعضای دهه هفتادی ها شوید .

تاثیر متون تکراری بر عملکرد موتورهای جستجوگر

شروع موضوع توسط saeid-ha ‏Aug 15, 2013 در انجمن برنامه نویسی و طراحی سایت

  1. saeid-ha

    saeid-ha belong to autumn !...

    3,098
    11,982
    1,894
    Google موتورهای جستجوگر نظیر گوگل و یاهو همه روزه میلیاردها صفحه را بر روی اینترنت رصد میکنند. طریقه کار این موتورها بگونه ای است که آنها متون نوشته شده روی وب سایت ها را از داخل کدهای HTML بیرون می آورند و درون دیتابیس مرکزی خود قرار میدهند. این کار وظیفه Crawler های موتورهای جستجوگر میباشد. آنچه این موتورها عاشق آن هستند متونی تازه و نو میباشد تا خوراک Crawler مهیا شود. بدلیل وجود بیش از 100 میلیون سایت اینترنتی که هریک حاوی صدها و شاید هزاران صفحه باشند، وظیفه سنگینی بر دوش این موتورهای جستجوگر قرار دارد. آنها میبایست آمار تمام سایت ها، تعداد صفحات آن، آدرس صفحات و متون داخل آن را بر روی دیتابیس خود نگهداری، بایگانی و مدیریت کنند. با یک حساب سرانگشتی بر تعداد کل صفحات ممکن بر روی اینترنت، شاید بتوان حق داد که چرا گوگل مدتی طول میکشد تا متون بروز شده ما را جستجو کند. گوگل سریع ترین موتور جستجوگر شناخته شده در جهان میباشد و الگوریتمهای آنها همواره در حال دگرگونی و پیشرفت میباشد. آیا متون تکراری تاثیری در عملکرد گوگل دارند؟ و حال سوال اصلی: آیا متون تکراری تاثیری در عملکرد گوگل دارند؟ آیا چنانچه متونی را از سایت دیگری کپی برداریم، گوگل متوجه موضوع میشود و رتبه سایت ما تحت تاثیر قرار میگیرد؟ بله. گوگل براحتی میتواند بفهمد که آیا متن شما کامل از جایی کپی برداری شده است و یا آنکه متن شما مثلا 60 درصد کپی از مثلا 3 سایت میباشد. این ها موتورهای جستجوگر میباشند و وظیفه آنها نیز جستجو میباشد. چنانچه پارگرافی از یک نوشته را درون باکس جستجوی گوگل قرار دهید و دگمه جستجو را فشار دهید، لیستی از سایت های مشابه نشان داده خواهد شد. رتبه وب سایت شما طبق آخرین تحقیقات میتواند بشدت تحت تاثیر چنین شرایطی قرار گیرد. موتورهای جستجوگر از متون تکراری خوششان نمی آید به بیان دیگر آنها به دنبال مطالب جدید و نو هستند تا مطالب قدیمی و تکراری. دلیل آن می تواند ساده باشد. آنها وقت کافی و فضای کافی برای اهمییت دادن و سر زدن به سایت هایی با مطالب تکراری را ندارند. ضمن آنکه مطالب تکراری میتواند موجب هدر رفتن فضای دیتابیس موتورهای جستجوگر نیز شود. چه کسی از چه کسی کپی کرده است؟ سوالی که می ماند آنست که چه کسی از چه کسی کپی کرده است؟ چطور میتوان فهمید صاحب اصلی اثر کدام وب سایت میباشد؟ این سوالی است که پاسخ به آن کمی مشکل است. بنابر مشاهدات اینطور بنظر میرسد که هرچه قدمت متون قرار گرفته در دیتابیس موتورهای جستجوگر بالاتر باشد آن سایت صاحب اصلی اثر شناخته میشود. ولی به هرحال سخنی رسمی در این خصوص از سوی مدیران شرکت گوگل ارائه نشده است.
     
    Mehdi 3 و BahAr_b از این پست تشکر کرده اند.