تاریخچه و معرفی الگوریتم کافئین

۱ بازديد
 

الگوریتم کافئین گوگل در ۱۰ آگوست ۲۰۰۹ به‌صورت آزمایشی معرفی شد و در ژوئن ۲۰۱۰ به‌طور کامل در تمام مراکز داده و زبان‌ها اجرا شد. این به‌روزرسانی پاسخی به رشد سریع وب و افزایش تنوع محتوا، از جمله ویدئوها، تصاویر، اخبار، و به‌روزرسانی‌های لحظه‌ای بود. قبل از کافئین، سیستم ایندکسینگ گوگل به‌صورت دسته‌ای (batch) عمل می‌کرد، به این معنا که صفحات وب در گروه‌های بزرگ خزیده، پردازش، و سپس به ایندکس اضافه می‌شدند. این روش باعث تاخیر در نمایش محتوای جدید در نتایج جستجو می‌شد، به‌ویژه برای وب‌سایت‌هایی که محتوای پویا تولید می‌کردند.

 

با معرفی الگوریتم کافئین، گوگل سیستم ایندکسینگ خود را به یک مدل نزدیک به لحظه‌ای (near real-time) تغییر داد. این تغییر به گوگل اجازه داد تا صفحات وب را بلافاصله پس از خزیدن پردازش و به ایندکس اضافه کند، که نتیجه آن ارائه نتایج جستجوی ۵۰٪ تازه‌تر بود. این به‌روزرسانی به‌ویژه برای وب‌سایت‌های خبری، وبلاگ‌ها، و شبکه‌های اجتماعی که محتوای جدید را به‌سرعت منتشر می‌کنند، اهمیت زیادی داشت.

 

تاریخچه و معرفی الگوریتم کافئین

 

چگونگی کارکرد الگوریتم کافئین

برای درک بهتر الگوریتم کافئین، ابتدا باید نحوه عملکرد سیستم ایندکسینگ گوگل را بررسی کنیم. وقتی کاربری در گوگل جستجو می‌کند، نتایج از ایندکس گوگل استخراج می‌شوند، نه مستقیماً از وب زنده. ایندکس گوگل مانند فهرست یک کتاب عمل می‌کند که اطلاعات صفحات وب را ذخیره کرده و به گوگل کمک می‌کند تا محتوای مرتبط را سریع پیدا کند.

 

سیستم ایندکسینگ قدیمی

قبل از کافئین، گوگل از یک سیستم ایندکسینگ لایه‌ای استفاده می‌کرد. در این سیستم، گوگل صفحات وب را در دسته‌های بزرگ خزیده، سپس آن‌ها را پردازش می‌کرد (مانند استخراج متن، تحلیل لینک‌ها، و تعیین موضوعات)، و در نهایت به ایندکس اضافه می‌کرد. این فرآیند دسته‌ای باعث می‌شد که محتوای جدید گاهی چند روز یا حتی چند هفته طول بکشد تا در نتایج جستجو ظاهر شود. برای مثال، اگر یک وبلاگ مقاله‌ای درباره یک رویداد جدید منتشر می‌کرد، ممکن بود کاربران تا چند روز آن را در نتایج جستجو نبینند.

 

تغییرات با کافئین

 

الگوریتم کافئین این فرآیند را متحول کرد. با این به‌روزرسانی، گوگل سیستم ایندکسینگ خود را به یک مدل خط لوله‌ای (pipelined) تغییر داد. در این مدل، هر صفحه وب به‌محض خزیدن توسط گوگل‌ بات (Googlebot) پردازش شده و به ایندکس اضافه می‌شود. این تغییر به گوگل اجازه داد تا محتوای جدید را تقریباً به‌صورت لحظه‌ای در نتایج جستجو نمایش دهد. برای مثال، اگر یک وب‌سایت خبری مقاله‌ای درباره یک زلزله منتشر کند، کافئین می‌تواند آن را در عرض چند ثانیه ایندکس کرده و در نتایج جستجو نمایش دهد.

 

این سیستم جدید همچنین توانایی گوگل را برای مدیریت حجم عظیم و تنوع محتوای وب، از جمله ویدئوها، تصاویر، و پست‌های شبکه‌های اجتماعی، بهبود بخشید. به گفته گوگل، کافئین بزرگ‌ترین مجموعه محتوای وب را در آن زمان ارائه کرد و نتایج جستجو را تا ۵۰٪ تازه‌تر کرد.

تا كنون نظري ثبت نشده است
ارسال نظر آزاد است، اما اگر قبلا در مونوبلاگ ثبت نام کرده اید می توانید ابتدا وارد شوید.