2.3.2014

גוגל הוא ארכי-מגה-סקרייפר

בסוף פברואר 2014 הודיעה גוגל על דו"ח חדש לבעלי אתרים, "סקרייפר ריפורט" (Scraper Report), שנועד לדווח על מעתיקני-תכנים שמקבלים תוצאות טובות יותר מבעלי התוכן המקורי שהועתק. ואז קרה הבלתי-צפוי: גוגל נתפסה עם המכנסיים למטה, בביצוע "סקרייפינג" על ויקיפדיה

מאט קאטס, ראש צוות המאבק ב'ווב-ספאם' של גוגל, יצא עם יוזמה יפה - לעזור לבעלי אתרים ומו"לים להילחם במעתיקנים מקצוענים - "סקרייפרים" (מלשון 'גירוד'), באמצעות דו"ח חדש. המטרה היתה פשוטה: להודיע לגוגל על מצב שבו המעתיקן זוכה לדירוג גבוה יותר בתוצאות החיפוש, על חשבון המפרסם המקורי שלמעשה נפגע פעמיים: א) התוכן שלו מועתק; ב) המעתיקן זוכה בתנועה על חשבונו.


אלא שמר דן ברקר, מקדם אתרים בריטי ואישיות פופולרית במיוחד ב'טוויטר', הצליח להביך את גוגל בעזרת צילום-מסך מבריק:


הטוויט של ברקר, שזכה לעשרות אלפי שיתופים, אמר כך: "מאט קאטס, אני חושב שזיהיתי אחד. שים לב לדמיון בין הטקסט בתוכן". 

ברקר הוכיח בצורה פשוטה שגוגל עצמה היא למעשה מעתיקנית ("סקרייפר") שעוברת על חוקי גוגל, שהיא עצמה ניסחה, ושהתוצא היא פגיעה במפרסם התוכן המקורי. איך? כאשר אדם מחפש בגוגל "מהו אתר סקרייפר" באנגלית, התוצאה הראשונה מגיעה ישירות מגוגל, שהעתיק תוכן של ויקיפדיה, האנציקלופדיה החופשית והחינמית שכולנו אוהבים ומעריכים.

המבוכה של גוגל היתה משולשת: ראשית, תוצאות החיפוש שלו למעשה יוצרות שיכפול מיותר, שאינו תורם דבר למשתמשים. שנית, ברור לחלוטין שגוגל מעתיק תכנים מ'ויקיפדיה' כדי להקדים אותה בתוצאות. ושלישית - גוגל עושה בדיוק את הדבר שהיא עצמה מגנה ונלחמת נגדו: סקרייפינג.


דוגמה: כיצד לחתוך אננס

זה אולי נשמע מטופש, אבל כל מי שתוהה איך לחתוך אננס, יראה איך גוגל מעתיק תוכן במקום לעזור למי שטרח להפיקו. הטקסט המועתק למעשה מייתר את הצורך להיכנס לתוצאת חיפוש כלשהי. כך גוגל נהנה ממצב שבו הוא מספק את התשובה בעצמו, במקום לשמש מנוע חיפוש אמיתי:

איך לחתוך אננס - גוגל מציג את ההוראות המועתקות במקום הראשון

גוגל יטען שהוא מספק שירות - בפועל זו העתקה אוטומטית, בדיוק כמו אתרים של "סקרייפינג". גוגל מרוויח משתמשים מרוצים, אבל האתרים שמספקים את התוכן הזה, מגלים בסופו של יום, שהם למעשה עובדים בשביל גוגל, ומפסידים תנועה חשובה.

גוגל מעמיד פנים כאילו ההעתקה היא למעשה ציטוט - ויעידו על כך שלוש הנקודות שהוא טורח להוסיף בכל שורה - אבל בפועל, מדובר בהעתקה בקנה-מידה אדיר, ולמטרות רווח כלכלי.


היסטוריה של העתקה

מלחמת גוגל-ויקיפדיה, שגרמה לאנציקלופדיה ירידה של כ-20% בתנועה במהלך 2013, כפי שניתן לראות מן הדו"חות של ויקיפדיה עצמה, היא חלק ממהלך רחב של גוגל, שמטרתו להפוך את מנוע החיפוש לספק-תכנים בפני עצמו. לגוגל נמאס לספק תוצאות חיפוש לבעלי אתרים, והוא מפעיל את כוחו האדיר כדי "לגרד" תכנים מהרשת, לסדר אותם ולהציג אותם כ"תשובות". גוגל קורא לזה "גרף ידע" (Knowledge Graph), כשחלק מן הגרף הוא "חיפוש ישויות" (Entity Search).

ההסכם המקורי בין גוגל והאינטרנט היה אמור להיות פשוט: גוגל סורק ומעתיק את האינטרנט בשביל לשרת את קהילת האתרים ברשת, ולא בשביל לשרת את עצמו. בשנים האחרונות, כך מתברר, גוגל עסוק בעיקר בהגדלת כוחו ורווחיו, לעתים על חשבון יצרני התוכן ברשת. ויקיפדיה, בהיותה אחד השחקנים הגדולים והחשובים בתחום זה, היא רק ארגון ללא מטרות רווח; לעומתה, גוגל "גירד" את המאגר שלה אך ורק כדי להרוויח.

מהנדסי גוגל יטענו ש"גירוד" תכנים הוא למעשה "שירות" (זה לא באג, זה פיצ'ר). כאשר התכנים של ויקיפדיה מוצגים מיד בתוצאות, ובצורה תמציתית, אנחנו חוסכים למשתמשים שלנו הרבה זמן, יגידו האורקלים של גוגל באמונה שלמה. הבעיה היא, שלא בטוח שהעניין עובר את המבחן המשפטי הפשוט - העתקה היא העתקה היא העתקה, לא משנה מי עושה אותה. ואפילו אם מותר להעתיק מ'ויקיפדיה' באופן חופשי - זה לא ראוי שגוגל ירוויח על חשבונה. 

ויקיפדיה יודעת שגוגל שואב ממנה תכנים בלי להתבייש. היא יודעת שכל "שאיבה" כזו פוגעת בהכנסות של האנציקלופדיה החשובה והגדולה בהיסטוריה, מתרומות גולשים בכל רחבי העולם. מנהלי ויקיפדיה הבינו שגוגל לא יכולה לחסל אותה, אלא רק להחליש אותה. אבל ויקיפדיה גם יודעת שגוגל מזרים אליה כמויות עצומות של תנועה, והיחסים בין הענקים הללו הפכו מזמן סימביוטיים. וזו בדיוק ההתלבטות של שאר בעלי האתרים ברשת כיום, לפני שהם לוחצים על ההדק ויורים באבא-גוגל.

הציוץ של דן ברקר הוא לגמרי כמו הילד שצעק "המלך עירום", רק ב-2014: כאשר גוגל עושה "סקרייפינג" זה למעשה "שיפור השירות לגולשינו היקרים", אך כאשר אחרים ברשת עושים זאת, זו "פגיעה באיכות החיפוש". לגוגל יש היסטוריה ארוכה של התכתשות עם ספקי תוכן, שמצאו עצמם מחוץ לתוצאות החיפוש בעקבות עדכונים שנועדו לשפר את מיקום שירותי התוכן של גוגל עצמה.

האם רק בתי המשפט ירסנו את גוגל מלהמשיך לעשות 'הלבנת סקרייפינג', או שגוגל פשוט ינגוס עוד ועוד בתכנים שהוא סורק, עד שיבלע את כל הרשת לתוכו? 

אין תגובות:

כל הזכויות שמורות לבלוג חופש החיפוש 2007-2012