الگوریتم کافئین گوگل در ۱۰ آگوست ۲۰۰۹ بهصورت آزمایشی معرفی شد و در ژوئن ۲۰۱۰ بهطور کامل در تمام مراکز داده و زبانها اجرا شد. این بهروزرسانی پاسخی به رشد سریع وب و افزایش تنوع محتوا، از جمله ویدئوها، تصاویر، اخبار، و بهروزرسانیهای لحظهای بود. قبل از کافئین، سیستم ایندکسینگ گوگل بهصورت دستهای (batch) عمل میکرد، به این معنا که صفحات وب در گروههای بزرگ خزیده، پردازش، و سپس به ایندکس اضافه میشدند. این روش باعث تاخیر در نمایش محتوای جدید در نتایج جستجو میشد، بهویژه برای وبسایتهایی که محتوای پویا تولید میکردند.
با معرفی الگوریتم کافئین، گوگل سیستم ایندکسینگ خود را به یک مدل نزدیک به لحظهای (near real-time) تغییر داد. این تغییر به گوگل اجازه داد تا صفحات وب را بلافاصله پس از خزیدن پردازش و به ایندکس اضافه کند، که نتیجه آن ارائه نتایج جستجوی ۵۰٪ تازهتر بود. این بهروزرسانی بهویژه برای وبسایتهای خبری، وبلاگها، و شبکههای اجتماعی که محتوای جدید را بهسرعت منتشر میکنند، اهمیت زیادی داشت.
تاریخچه و معرفی الگوریتم کافئین
چگونگی کارکرد الگوریتم کافئین
برای درک بهتر الگوریتم کافئین، ابتدا باید نحوه عملکرد سیستم ایندکسینگ گوگل را بررسی کنیم. وقتی کاربری در گوگل جستجو میکند، نتایج از ایندکس گوگل استخراج میشوند، نه مستقیماً از وب زنده. ایندکس گوگل مانند فهرست یک کتاب عمل میکند که اطلاعات صفحات وب را ذخیره کرده و به گوگل کمک میکند تا محتوای مرتبط را سریع پیدا کند.
سیستم ایندکسینگ قدیمی
قبل از کافئین، گوگل از یک سیستم ایندکسینگ لایهای استفاده میکرد. در این سیستم، گوگل صفحات وب را در دستههای بزرگ خزیده، سپس آنها را پردازش میکرد (مانند استخراج متن، تحلیل لینکها، و تعیین موضوعات)، و در نهایت به ایندکس اضافه میکرد. این فرآیند دستهای باعث میشد که محتوای جدید گاهی چند روز یا حتی چند هفته طول بکشد تا در نتایج جستجو ظاهر شود. برای مثال، اگر یک وبلاگ مقالهای درباره یک رویداد جدید منتشر میکرد، ممکن بود کاربران تا چند روز آن را در نتایج جستجو نبینند.
تغییرات با کافئین
الگوریتم کافئین این فرآیند را متحول کرد. با این بهروزرسانی، گوگل سیستم ایندکسینگ خود را به یک مدل خط لولهای (pipelined) تغییر داد. در این مدل، هر صفحه وب بهمحض خزیدن توسط گوگل بات (Googlebot) پردازش شده و به ایندکس اضافه میشود. این تغییر به گوگل اجازه داد تا محتوای جدید را تقریباً بهصورت لحظهای در نتایج جستجو نمایش دهد. برای مثال، اگر یک وبسایت خبری مقالهای درباره یک زلزله منتشر کند، کافئین میتواند آن را در عرض چند ثانیه ایندکس کرده و در نتایج جستجو نمایش دهد.
این سیستم جدید همچنین توانایی گوگل را برای مدیریت حجم عظیم و تنوع محتوای وب، از جمله ویدئوها، تصاویر، و پستهای شبکههای اجتماعی، بهبود بخشید. به گفته گوگل، کافئین بزرگترین مجموعه محتوای وب را در آن زمان ارائه کرد و نتایج جستجو را تا ۵۰٪ تازهتر کرد.
- ۰ ۰
- ۰ نظر