24.11.2011

גוגל פנדה - סיבות ותוצאות

בהמשך לכתבה של "כלכליסט" על השפעת עדכוני "פנדה" על תוצאות החיפוש של גוגל ברחבי העולם, הנה כמה תובנות נוספות על "פנדה", השינוי שהשפיע על אתרי-תוכן גדולים ברשת.
ראשית, הסבר למתחילים: "פנדה" הוא שם-קוד פנימי של גוגל, לשורה ארוכה של שיפורים רציניים בשיטת הדירוג של מנוע החיפוש "גוגל", בגרסתו האמריקנית, בגרסאות האנגליות שלו, ובכל שאר הגרסאות הלאומיות שלו בשנה האחרונה. מטרת השיפורים היא להבחין בין תוכן איכותי, עשיר ומקורי - ובין תוכן רדוד, דל ומועתק (או משוכתב) באינטרנט.

אז למה דווקא הכינוי "פנדה"? כי אחד המהנדסים הבולטים בפרויקט הוא מדען הודי בשם נאבניט פנדה (Navneet Panda), בעל תואר דוקטור במדעי המחשב, ושהמייל שלו בגוגל הוא panda@google.com.

תחילתו של "פנדה" בסוף 2010: גוגל סבלה מגל ארוך של פרסומים שליליים בעיתונות האמריקנית, על איכות החיפוש המתדרדרת שלה. מקור גל הפרסומים אינו ברור, וייתכן שהוא תוצאה של מאמץ יחסי-ציבור יזום מצידו של המתחרה היחיד, מנוע החיפוש "בינג" של מיקרוסופט (שהפסיד למעלה מ-5 מיליארד דולר עד היום, בגלל התחרות הקשה מול גוגל).

שני מהנדסי גוגל, מאט קאטס ועמית סינגאל, הסבירו בדיעבד, ש"פנדה" הוא למעשה תיקון של המצב שנוצר בעקבות מהלך "קפאין". מה קרה ב"קפאין"? ב-2010 שיפרה גוגל את מהירות ותדירות הסריקה שלה. במילים פשוטות: כיום, גוגל יכול לסרוק הרבה יותר דפים, בהרבה פחות זמן. זה אומר שגוגל יכול להציג בתוצאות החיפוש שלו תוכן חדש לגמרי, דהיינו דפים שנכתבו והועלו לרשת דקות ספורות לפני שהופיעו בתוצאות החיפוש של גוגל.

השיפור האיכותי והכמותי הגדול של "קפאין", שהוא למעשה שידרוג תשתיות החיפוש היסודיות של גוגל, הגדיל בצורה משמעותית את מאגר הדפים הסרוקים (האינדקס) של גוגל, ואיפשר לתכנים חדשים להופיע במיקומים גבוהים, במהירות רבה.

אחת התוצאות הבלתי-צפויות של "קפאין": השידרוג החדשני הזה "הציף" את האינדקס של גוגל בתכנים רדודים, המתעדכנים בקצב מהיר, ושאינם נחוצים בהכרח למרבית הקוראים. אינספור מאמרים בעלי תוכן כמעט זהה, שנכתבו על ידי כותבים אלמוניים וזולים במדינות העולם השלישי (הודו, פיליפינים וכו'), קיבלו דירוגים יפים, מהר מדי.

"קפאין" גם איפשר לתוכן מועתק, מה שמכונה "סקרייפרים" (Scrapers), דהיינו "תוכן המגורד מאתרים אחרים", לחדור בזריזות רבה מדי לאינדקס הקדוש. מישהו היה צריך לעשות משהו, ומהר. ניקוי האינדקס מתוכן גרוע, דומה לפעולה רפואית של הצלת המערכת החיסונית מפני חיידק טורף.

בינואר 2011 הבטיחה גוגל שתעשה מאמץ להתמודד עם הביקורת. ב-24 לפברואר 2011 היא הכריזה על הפעלת השינוי, שהשפיע לדבריהם על כ-12% מן החיפושים בארה"ב. באפריל התרחב "פנדה" אל כל החיפושים באנגלית (ברחבי העולם), ובאוגוסט הוא הגיע לישראל ולמדינות אחרות, בשפות שאינן אנגלית. בין לבין, נרשמו לפחות כ-7 עדכוני "פנדה" מובחנים ושונים, מפברואר ועד לאחרונה.

כדי להבין מדוע התדרדרה איכות החיפוש של גוגל עד פברואר 2011, צריך להבין את ההשפעה של גוגל על אתרי התוכן. מצד אחד, גוגל רוצה תוצאות חיפוש איכותיות. מצד שני, גוגל רוצה להרוויח כסף מפרסום מודעות "אדסנס", המתאימות את עצמן לתוכן המאמר. קיים ניגוד אינטרסים מובנה בין השניים: אם גוגל תפסול אתרים שמפעילים את מערכת הפרסום האוטומטית שלה, הכנסותיה ייפגעו, ומחיר המניה שלה יירד דרמטית.

עד "פנדה", גוגל היתה מוכנה לחיות עם העובדה שאתרי-תוכן זבליים, המכונים "חוות-תוכן" (Content Farms) הציפו את הרשת בתוכן בינוני, מועתק, משוכתב, תמציתי, חוזר על עצמו ובלתי מועיל. הסיבה: אתרי התוכן הללו פירנסו היטב את קופת המזומנים התופחת של גוגל, שהוא לא רק מנוע חיפוש מעולה, אלא חברה ציבורית תחרותית ואכזרית, הנסחרת בנאסד"ק והמחוייבת לספק תשואה משמעותית למשקיעים שלה.

יש דבר אחד שמעניין את וול-סטריט: רווחיות. ככל שגוגל מציגה יותר פרסומות, הרווחיות שלה גדלה. אבל יש סוף לכל סיפור, וגוגל נאלצה להפסיד כסף רב, רק כדי להציל את איכות תוצאות החיפוש שלה. ובמילים אחרות: "פנדה" בעצם הכריח את גוגל להעיף החוצה את כל אתרי התוכן הבינוניים, אלו שמכילים כמויות אדירות של דפים בנושאים מגוונים, ושאינם מועילים בהרבה למשתמש הממוצע.

במילים "להעיף החוצה" אין הכוונה, בהכרח, למחיקה מוחלטת של האתרים ה"דלים" מן האינדקס של גוגל. הכוונה היא להוריד את המיקום שלהם בתוצאות החיפוש, בצורה דרמטית ומורגשת. אתרים רבים, שבנו מודל הכנסות קבוע על סמך תנועה מגוגל, נאלצו לשנות את המודל או להיכחד.

הנפגעים העיקריים של "גוגל פנדה":
  • אתרי תוכן המוניים ברמה נמוכה
  • אתרי תוכן גולשים (UGC)
  • אתרי מאמרים בחינם, ללא מעקב של עורכים
  • אתרי ספאם (תוכן פיקטיבי)
  • אתרים המעתיקים תכנים של אחרים (סקרייפרים)
  • אתרים המייצרים תכנים משוכתבים
  • אתרי סינדיקציה (מאמרים הנרכשים ממו"ל לאומי מוביל, לפרסום מקומי נוסף)
הבדיקות של גוגל לאחר "פנדה" הוכיחו כי שביעות הרצון של משתמשי גוגל עלתה בעקבות השינוי. לגוגל יש לא-מעט חיישנים המאפשרים להם להצליב מידע על התנהגות גולשים במנוע החיפוש. בשורה התחתונה, היתה התאמה כמעט מובהקת בין התכנים שמרבית המשתמשים ביקשו לחסום, ובין התכנים שנחסמו בפועל, ובצורה אוטומטית, באמצעות שיפורי "פנדה".

הלקח המרכזי של "פנדה", בהקשר של בעלי אתרים, הוא לחזור למבחני איכות. הפקה סיטונאית של תכנים רדודים כבר לא תביא בהכרח למיקומים רצויים. קצב עדכון האינדקס של גוגל מבטיח שרק התכנים המקוריים ביותר ימשיכו לככב. כל אתר שמפיק תכנים קצרים בנושאים פופולריים, ובקצב "חשוד", ייכנס לרשימה השחורה של גוגל. ומכיוון שכמויות התוכן באינטרנט גדלות והולכות מדי חודש, "פנדה" ייאלץ להשתפר, להתחזק ולהתעדכן שוב ושוב.

הוסף רשומת תגובה
כל הזכויות שמורות לבלוג חופש החיפוש 2007-2012