الگوریتم موتورهای جستجو و مدل های ساخت و راه اندازی جستجوگرها
پیج رنک چگونه محاسبه می شود ؟ برای محاسبه پی آر یک صفحه ، تمامی لینکهایی که به آن صفحه بر میگردند مورد محاسبه قرار می گیرند. و این هم لینکهایی که از داخل سایت به آن متصل میشوند را در بر می گیرد و هم لینکهای خارجی. PR(A) = (1-d) + d(PR(t1)/C(t1) + ... + PR(tn)/C(tn)) این تساوی است که طی آن پی آر یک صفحه محاسبه می شود. این الگوریتم پی آر است که هنگام راه اندازی ابتدایی پی آر انتشار یافت. و احتمال اینکه گوگل نیز از مشابه همین فرمول استفاده کند وجود دارد ولی آنها راجع به الگوریتم هایشان صحبتی نمی کنند و ما اطلاع دقیقی از آن نداریم ولی این مسئله مهمی نیست زیرا که این الگوریتم به اندازه کافی خوب می باشد. در این تساوی 't1 - tn' صفحاتی هستند که به صفحه A لینک شده اند و ‘C’ تعداد لینکهای بیرونی که یک صفحه دارد و در نهایت ‘d’ فاکتور اشباع شدن است که معمولا آنرا 0.85 در نظر می گیریم. |
|
ادامه مطالب ...
|
|
|
شباهتها : ایندو الگوریتم هر دو الگوریتم هایی هستند که بر اساس یک پرسش و یا Query عمل می کنند. Query ها در هر دوی آنها را می توان بروی یک نمودار همسایگی رسم کرد. هر دوی آنها از پروسه زمانبر و تکراری جهت انجام محاسبات و بدست آوردن درجه اهمیت یک سایت استفاده می کنند. برای اطلاع بیشتر از این نوع محاسبات مقاله پیج رنک را مطالعه کنید. تفاوتها : پیج رنک مستقل از پرسش یا query می باشد. در هیتس رابطه اجباری بین خوشه های اطلاعاتی و وب سایتها بر قرار می شود. پیج رنک بر پایه بر پایه وزن هر لینک و نرمالیزاسیون آنها کار می کند و مجموعه هایی از صفحه های داخلی مرتبط را می یابد در صورتی که هیتس لیستی از صفحاتی که مرتبط به پرسش هستند جمع آوری می کند. پیج رنک یک بردار رتبه بندی محاسبه می کند. |
|
|
پیج رنک ( برین و پیج ، سال 1998 ) توضیح مفصل و باز کردن این الگوریتم را از دیدگاه بهینه سازی و مارکتینگ در اینجا مقتنم نمی دانم. ولی لازم است که در انجا راجع به پیج رنک صحبت کنیم چرا که نشان می دهد همیشه لازم نیست رتبه بندی بر اساس وزن لغات بکار رفته در متن باشد ، بلکه می تواند بر اساس وزن و ارزش لینکها و پیوندها نیز باشذ. اولین باری این الگوریتم ظاهر شد و دنیای بهینه سازس صفحات وب را عوض کرد ، با بهره گرفتن از طبیعت اجتماعی و متعحد وب و ساختار متصل لینکها توانست به دنیای وب بصورت یک وب واحد نگاه کرده و موقعیت هر صفحه تنها را ارزش گذاری کند. رتبه بندی صفحات که طی این قانون PR نام گرفته است از لحاظ عددی مقداریست بین صفر و یک که گوگل آنرا در نرم افزار خود ععدی بین یک تا ده نشان میدهد ، زیرا که تمامی لینکها در یک ماتریس جای داده می شود. حال آنچه مسلم است اینکه دنیای وب دیگر محیطی اجتماعی نیست و لینک دادن سایتی به سایت دیگر با هزاران حساب و کتاب انجام میشود و این به واسطه همین PR است که خود نابودی خود را در آینده رقم زده است.
|
|
در این سری مقالات سعی بر اینست که بطور کلی و تخصصی راجع به الگوریتم پی آر گوگل و اهمیت آن از لحاظ بهینه سازی و بازاریابی موتورهای جستجو صحبت کنیم و تکنیک های لازم جهت بهبود سایتها را در اختیار خوانندگان قرار دهیم. پی آر یک متغیر عددی است که نشان می دهد یک سایت در دنیای اینترنت از چه اهمیتی برخوردار است. گوگل این اهمیت را از طریق لینک ها تشخیص می دهد و وقتی یک سایت به سایت دیگری لینک می شود، از لحاظ گوگل بدین معنی است که آن سایت یک رای به سایت دیگر داده است. هرگاه رای های زیادی از طریق سایتهای دیگر به یک سایت می رسد این بدین معنی است که آن سایت از اهمیت بالاتری برخوردار است. همچنین سایت رای دهنده اهمیت رایش به اهمیت خودش بستگی دارد بدین معنی که هرچه اهمیت بالاتری داشته باشد ، رای های آن نیز پر اهمیت تر است. گوگل اهمیت صفحات وب را از روی همین رای ها و اهمیت آنها حساب می کند. پی آر روشی است که گوگل به واسطه آن اهمیت صفحات وب را تا یین میکند. این امر از این لحاظ برای گوگل مهم است زیرا که بواسطه این اهمیتو رای ، گوگل رتبه بندی صفحات وب را تایین میکند و صفحه ای که رتبه پی آر بالاتری دارد از صفحه همتای خود رتبه بالاتری خواهد داشت و این به خاطر پی آر است. در حالی که این تنها فاکتور رتبه بندی نیست ولی جزو فاکتورهای مهم موتور جستجوی گوگل است و اخیرا تمام موتورهای جستجو به نوعی از این فاکتور پراکندگی برای رتبه بندی های خود استفاده می کنند. در اینجا باید خاطر نشان کنم که همه لینکهایی که به یک سایت بر میگردد، توسط گوگل به حساب نمی آید و فقط تعداد محدودی از آنها را به شمار می آورد. در حال حاضر گوگل اکثر لینکهایی را که از مزرعه لینکهای شناخته شده می آید فیلتر می کند. مزرعه لینکها سایتهایی هستند که فقط لینک در خود نگه داری می کنند و خاصیت مثبتی در اینترنت ندارند و چون این عمل ماهیت اهمیت سایتها را برهم می زند ، گوگل آنها را فیلتر می کند. بعضی از این لینکها حتی می تواند منجر به جریمه شدن سایت شما در گوگل شود. گوگل می داند که صاحبان سایت نمی توانند لینکهایی را که به آنها می شود کنترل کنند ولی می توانند اینکه به چه سایتی لینک شوند را کنترل کنند ، پس خیلی دقت کنید به چه سایتهایی لینک می دهید. |
|
قانون بردفرد که در سال 1934پای به عرصه جستجو گزارد در مورد شواهدی از جستجو در پروندهای کتابخانه ای صحبت میکند که میتوان توسط آنها تعداد نتایج و پروندههای مرتبط را تخمین زد. برای روشن شدن بیشتر این نحوه یافتن و مرتب کردن پروندها ، مثالی میاوریم تا مطلب باز شود. برای مثال اگر شما 5 نتیجه دارید که برای شما از درجه اهمیت برخوردار است و در این 5 وب سایت 12 پرونده برای شما مهم است و مورد نظر شما در مطلب خاصی است. حال اگر شما بخواهید 12 پرونده یا صفحه دیگر را که مطلبی مرتبط داشته باشند بدست آورید ، شما باید 10 سایت را مطالعه و مورد بررسی قرار دهید. پس نتیجه گیری میشود که در قانون بردفرد ما با یک ترکیب مضاعف کننده 5/10روبرو هستیم. هر بار که شما بخواهید 12 صفحه مرتبط دیگر داشته باشید باید 10 سایت دیگر وجود داشته باشد. پس این بصورت تساعدی بالا رفته و در نهایت به ارقام 5 ، 10، 20 ، ... میرسد. البته در جستجو داخل نتایج موتور های جستجو ، کمتر پیش میآید کسی انقدر عمیق جستجو کند. |
|
|