21.7.2009

יוני כהנא נגד גוגל: סיכוייה של תביעה ייצוגית


"כלכליסט" יצא ב-13/7/09 בכותרת ענקית: ייצוגית נגד גוגל - גבתה יותר מ-100 מליון שקל שלא כדין.

הכתבה הועברה במהירות בין כל העוסקים בתחום, ויצרה גל סקרנות: האמנם יאשר בית המשפט המחוזי בתל-אביב תובענה ייצוגית נגד גוגל, על סכום כה גדול, ועל גבייה שלא-כדין? לדעתי, לתביעה אין סיכוי של ממש.

במשפט אחד: התביעה טוענת שגוגל מחייבת את לקוחות אדוורדס (AdWords) על כמות קליקים גבוהה ממה שסיפקה בפועל. זאת, כיוון שאם משתמש אחד הקליק פעמיים על אותה המודעה, המפרסם מחויב על שני קליקים נפרדים.

התביעה נשענת על ההבדל בין נתוני גוגל אנליטיקס ובין גוגל אדוורדס, נושא מעניין שכבר תועד בהרחבה.

מעיון בבקשה לאישור תביעה ייצוגית, שהוגשה מטעם יוני כהנא על ידי עו"ד אורן אוזן, נראה שהתובע לא העמיק מספיק בנושא, ולכן החמיץ כמה נקודות מרכזיות, שיפורטו בהמשך:

1) ככלל, מדידת קליקים וגולשים באינטרנט איננה מדע מדויק, וקשה מאוד להגיע לנתונים אבסולוטיים.

2) יש הבדל מהותי בין אדוורדס ובין אנליטיקס, ולכן הפער בשיטות המדידה והנתונים עצמם מובן מאליו.

3) כדי להוכיח חיוב-יתר או הונאת הקלקות (Click Fraud), יש צורך במומחים חיצוניים וכלים טכנולוגיים מורכבים, המוכיחים כי גוגל חייבה לקוח על קליקים מלאכותיים, מזוייפים או בלתי סבירים.

4) תביעה ייצוגית אינה הכלי המשפטי הנכון כדי לטפל במקרה הזה, כיוון שלכל חשבון פרסום בגוגל יש "סיפור" שונה.


אנליטיקה באינטרנט - לא מדע מדויק
זהו אולי החוק החשוב ביותר שהתביעה של יוני כהנא מסרבת להפנים. תוכנות סטטיסטיקה שונות מתבססות על שיטות שונות לחישוב נתונים, מבקרים, מסלולי גלישה וכדומה. אין אמת אחת - יש טכנולוגיות מוגבלות.

גוגל אנליטיקס היא שירות מבוסס-קוקיז (Cookies) שמעבד נתונים באופן חיצוני. תוכנות אחרות (מבוססות כתובת IP בתוספת יוזר אייג'נט) "יושבות" על הנתונים בתוך האתר, ויוצרות קבצי 'לוג' (Log) לניתוח הנתונים.

שיטת המדידה משפיעה על התוצאות, ומכיוון שלגולשים שונים יש כתובות IP שונות, חומרה שונה, תוכנה שונה והגדרות שונות, קשה מאוד להגיע למצב שבו כל משתמש נמדד בהצלחה מלאה. לכל אורך הדרך יש החמצות, איבודי-נתונים, מבקרים אנונימיים, בעיות נגישות, תקלות טכניות ואפילו שגיאות הטמעה חמורות.

לכן, כאשר יוני כהנא תובע את גוגל על כך שגוגל אנליטיקס מדווחת על כמות מבקרים (או ביקורים? לא ברור) שונה מזו שמחוייבת בכסף על ידי גוגל אדוורדס, הוא מתעלם מן העובדה שמדובר בשתי מערכות שונות למדידת תנועה והקלקות. יותר מכך: התובע משווה את אנליטיקס ואדוורדס לתוכנת הסטטיסטיקה הפנימית שלו, כאילו קבצי ה"לוג" הפרטיים שלו מהווים אמת אובייקטיבית שאי אפשר להפריכה (ולא זה המצב).


אנליטיקס ואדוורדס - לא אותו דבר
מי שרוצה לקרוא מעט חומר באנגלית, יכול לקרוא את ההסבר הפשוט הבא מתוך התמיכה של גוגל אנליטיקס:

1) ראשית, טרמינולוגיה: "קליקים" של אדוורדס ו"ביקורים" (Visits) של אנליטיקס זה לא אותו דבר. אם אותו משתמש ביקר פעמיים בטווח-זמן קצר, הדבר נחשב בגדר אותו "יוזר סשן" (User Session) מבחינת אנליטיקס. אבל מבחינת חיוב כספי באדוורדס, המפרסם צריך לשלם על שני קליקים, מפני שה"לקוח" שלו למעשה "השתמש" פעמיים במודעה של המפרסם, בזמנים שונים ולמטרות שונות.

2) אדוורדס מפעילה מערכת לבקרת קליקים לא חוקיים, לפיה קליקים שחוזרים על עצמם בצורה 'חשודה' אינם מופיעים בדו"חות הסופיים; קיים אפילו מרכז משאבים לאיכות תנועת מודעות בשפה העברית. זאת לעומת גוגל אנליטיקס, שידווח על כל דף נצפה, ייחודי (יוניק) או לא ייחודי, אפילו אם מדובר בתנועה מפוקפקת ומלאכותית - הסקריפט "עיוור" למניפולציות, קליק-בוטים, התקפות האקרים וכדומה.

3) כיבוי מקרי של "תיוג אוטומטי" ("אוטו-טאגינג", ובאנגלית "Auto-Tagging") עשוי להוביל לכך שקליקים שהגיעו דרך אדוורדס, ייספרו בתור תנועה טבעית (אורגנית) של גוגל, שאינה בתשלום. זו תופעה נפוצה שלא זכתה להתייחסות מפורטת בבקשה להכרה בתביעה כייצוגית.

4) כשלונות בהטמעה: לא בטוח שכל דפי האתר כוללים בתוכם את הקוד של גוגל אנליטיקס. במקרה שכזה (והוא נפוץ מאוד), מספיק שאחד העמודים באתר אינו כולל את הסקריפט של אנליטיקס, ואז נוצר פער בנתונים בין אדוורדס ובין אנליטיקס. מנסיוני, זה קורה ליותר מדי אתרים, סטטיים ודינמיים כאחד.

5) גוגל אנליטיקס "מחמיץ" משתמשים שהחליטו לנטרל ג'אווה-סקריפט, עוגיות (קוקיז) או תמונות. זה קורה הרבה, וזו תופעה ידועה. לעומת זאת, גוגל אדוורדס ידווח על המשתמשים הללו בתור קליקים מוחשיים.

6) אנליטיקס לפעמים לא מספיק לפעול: הקוד של גוגל אנליטיקס ממוקם, ברוב המקרים, בסוף הדף; זוהי ההמלצה של גוגל עצמם, והסיבה להמלצה זו - אנליטיקס לא רוצים להיות אחראים לכך שאם יש אצלם תקלה, שאר הדף לא יעלה. לכן, מכיוון שאנליטיקס הוא האחרון להיטען, אם מדובר בדף אינטרנט "כבד", עם הרבה קוד דינמי, יעברו מספר שניות עד שאנליטיקס יופעל ויספור את המבקר - אם בכלל. אך אם המבקר יחליט לעבור דף (או לצאת מן האתר) לפני שאנליטיקס הופעל, אדוורדס ידווח על הקליק ויחייב את המפרסם, בעוד אנליטיקס לא ידווח על המבקר כלל.


הונאת קליקים - עסק למומחים
בארה"ב קיימות חברות המתמחות בבקרת הונאת קליקים. החברות הללו מפעילות תוכנות מיוחדות, אוספות ראיות ברמה משפטית, מצליבות נתונים ומגישות בקשות מסודרות אל חברות החיפוש כמו גוגל, יאהו ומיקרוסופט. כאשר חברה חיצונית פותחת בחקירה בלתי-תלוייה בעקבות פניית לקוח, יש לטענותיה משקל גדול יותר. לכן, תועדו מספר מקרים שבהם נאלצו מנועי החיפוש לסגת ולשתף פעולה עם החברות הללו, כאשר עמדו בפני חקירות מקיפות ומקצועיות.

בתביעה של יוני כהנא, לעומת זאת, אין חוות דעת של מומחה הונאת קליקים. התביעה מתבססת על שיקול דעתו הבלעדי של התובע, בסכום זניח (260 ש"ח), בלי שנערכה בדיקה מקיפה של צד שלישי. ללא תמיכה של מומחה חיצוני, טענותיו של התובע נחלשות בצורה משמעותית, ואפשר לראות בהן תלונה קטנונית של לקוח שאינו בקיא בפרטים הטכניים.


תביעה ייצוגית - לא הכלי הנכון
כדי להוכיח שיש צידוק לקבלת תביעה כייצוגית, יש להראות כי הפגיעה בשאר לקוחות החברה הינה דומה, אם לא זהה. אחרת, אין אפשרות לתת סעד אחיד ומשותף לכלל התובעים הפוטנציאליים.

הדוגמה הקלאסית היא מוצר מזון מקולקל מסדרת ייצור מוגדרת, או אריזת מוצר שהוקטנה בצורה מכוונת על ידי היצרן תוך גביית מחיר זהה (או גבוה יותר). במילים פשוטות, כאשר מדובר במוצר תעשייתי זהה, קל להוכיח כי הפגיעה בשאר הלקוחות היא דומה עד למצב של זהות אינטרסים בין כל הלקוחות.

לרוע מזלו של יוני כהנא ותובעים אחרים, פרסום ב"גוגל" אינו מוצר תעשייתי אחיד. גם החוזה שנחתם עם הלקוח כפוף לנתונים טכנולוגיים רבים ומשתנים, שרובם קשים לאיתור, קשים להוכחה וקשים להפרכה.

במקרה של יוני כהנא, קשה מאוד להוכיח דמיון (קל וחומר - זהות) בין המקרה הפרטי שלו ובין תופעות דומות בחשבונות פרסום של לקוחות גוגל ישראל לאורך השנים. מרבית המפרסמים אינם מדווחים על פערי-דיווח בין גוגל אנליטיקס ובין גוגל אדוורדס, בעיקר מפני שהם מבינים שמדובר בשיטות מדידה שונות. כמו כן, המפרסמים אינם מתבססים על גוגל אנליטיקס בתור "הפוסק האחרון" כשהם באים לבדוק אם חויבו על קליקים אמיתיים.

יותר מכך: אפילו אם יוני כהנא חושב שהפער בין הקליקים שעליהם חויב ובין הקליקים שקיבל בפועל הינו פער של 20%, הרי שאין שום הוכחה, ולו קלושה, כי אכן קיים פער של 20% בקרב לקוחות דומים של גוגל ישראל. ההיפך הוא הנכון: סביר להניח שהמקרה של התובע הוא ייחודי. הסיבות לכך פורטו למעלה: אופי האתר שלו, מיקום הקוד של גוגל אנליטיקס בדפים, ההתנהגות הספציפית של הלקוחות במסע הפרסום שלו, תוכנת הסטטיסטיקה בה הוא משתמש בנפרד מאנליטיקס (שאוספת קבצי 'לוג'), וכו'.

האם גוגל "אשמה" בחיוב-יתר של מפרסמיה? התביעה של יוני כהנא למעשה אינה עוסקת בכך. טענתו של התובע היא שגוגל אנליטיקס מודד תנועה בצורה אחרת בהשוואה לגוגל אדוורדס. זוהי לא טענה של חיוב-יתר, אלא טענה של לקוח מבולבל. מכיוון שגוגל כבר הבהירה את הנקודה הזו בצורה הישירה והכנה ביותר, הקייס כולו נופל.


סיכום
  • קטנים מאוד סיכויי התביעה של יוני כהנא להתקבל כייצוגית
  • הונאת קליקים היא תופעה קשה להוכחה, במיוחד בבית המשפט
  • גוגל כבר הסבירה היטב ללקוחותיה את ההבדל בין קליק אדוורדס ובין ביקור ב'אנליטיקס'
  • אין חשש שגוגל תחזיר 100 מליון ש"ח למפרסמיה בשנים האחרונות
  • לאף תוכנת סטטיסטיקה אין מונופול על האמת האבסולוטית
  • אם גולש הקליק יותר מפעם אחת על אותה מודעה, אין זה אומר בהכרח שיש לזכות את המפרסם

התביעה: ת"א 1773/09 יוני כהנא נ' Google;
הבקשות להכרה בתביעה כייצוגית: בש"א 14118/09, 14120/09.
טרם הוגש כתב הגנה בזמן פרסום פוסט זה.


עוד באותו עניין:


14.7.2009

דפדפן גוגל כרום יודע מה עשיתם באינטרנט

יש הרבה סיבות טובות למה לא להשתמש בדפדפן "גוגל כרום", אבל אם פרטיות בעבודה ובבית היא נושא חשוב עבורכם, אין ספק ש"כרום" עלול לגרום לכם נזק בלתי-הפיך.

גוגל כרום מתעקש לתעד את כל היסטוריית החיפוש והגלישה שלכם, ולא מאפשר להגדיר מראש מצב שבו היסטוריית הגלישה לא תתועד בקפדנות, דקה אחרי דקה. הבעיה העיקרית היא, ש"כרום" מציג את היסטוריית הגלישה בצורה שמאוד מקלה על משתמש חיצוני לבצע בה חיפושים לפי מילות מפתח, לעיין בה לפי ימים, ואפילו לזהות חיפושים ספציפיים בגוגל.

במילים אחרות, גוגל הפך את היסטוריית החיפוש והגלישה האישית שלכם, למאגר נתונים נגיש מאוד. בעזרת מאגר זה אפשר לחטט בעבר שלכם, כמו מנוע חיפוש היסטורי פרטי. ספק רב אם זה מה שאתם רוצים.

כך זה נראה אם תקלידו קונטרול+H במהלך גלישה ב"כרום",
או תקלידו בשדה הכתובת את הביטוי הבא:
chrome://history

בתמונה: היסטוריית גלישה בדפדפן גוגל כרום
הדפדפן מתעד כל חיפוש וכל אתר, ומאפשר חיפוש פנימי במידע


מחיקת היסטוריית גלישה: זה אפשרי, אבל רק בדיעבד. לוחצים על אייקון ה"מברג" (Tools), בוחרים "אפשרויות" (Options), בוחרים את סימניית "דברים אישיים" (Personal Stuff), ותחת הכותרת "נתוני גלישה" לוחצים על כפתור "נקה נתוני גלישה...". קופץ חלון ובו האופציות הבאות:
  • הסר היסטוריית גלישה
  • הסר את היסטוריית ההורדות
  • רוקן את הקבצים השמורים
  • מחק קבצי cookie
  • הסר ססמאות שמורות
  • הסר נתוני טופס שמורים
ניתן לבחור טווח תאריכים "הכל" מתוך תיבת הבחירה (אופציות נוספות: אתמול, השבוע האחרון או ארבעת השבועות האחרונים). בסוף לוחצים "הסר נתוני גלישה" וזה אמור למחוק את הכל. אבל רק בדיעבד. אי אפשר לנטרל את כל העסק מראש, וגוגל ימשיך לאסוף את הנתונים ללא הפרעה.

ארכיון ההורדות של גוגל כרום (בכתובת הדפדפן המקומית: chrome://downloads), מאפשר מחיקה של כל ההורדות בפעולה אחת קצרה ("נקה הכל"), אבל גם הוא אינו מאפשר אי-שמירה מראש של הורדות. גם כאן יש פגיעה רצינית בפרטיות של הגולש: כל קובץ שהוריד זמין לעיון היסטורי, מחולק לפי ימים וניתן לאיתור מהיר.

אצל המתחרים יש פרטיות

שני הדפדפנים המתחרים (אקספלורר, פיירפוקס) מאפשרים לכל משתמש להגדיר אם הוא בכלל רוצה שהדפדפן ישמור את היסטוריית הגלישה שלו. בשניהם ניתן להגדיר "אפס ימים" (אף פעם) לשמירת היסטוריית גלישה. חברת מיקרוסופט וגם ארגון מוזילה מבינים כיום מדוע זה חשוב למחוק היסטוריית גלישה לצמיתות.

דפדפן "כרום" של גוגל רגיש הרבה פחות לפרטיות המשתמשים שלו. הוא מכריח את המשתמש למחוק ידנית את הנתונים בסוף כל יום, או לעבור יום-יום במדור ההיסטוריה ולמחוק אותם אחד-אחד - משימה מעייפת וטורדנית, שאף אחד לא מסוגל להתמודד איתה. לא רק שזה לא נוח, אלא שזה לא מונע את התיעוד בזמן-אמת.


גלישה בסתר? לא מעשי

גם שימוש במצב "אינקוגניטו" (Incognito Mode), שתורגם לעברית כ"גלישה בסתר", לא עוזר: הוא אמנם לא מתעד את הגלישה והחיפושים, אבל צריך לזכור להשתמש בו כל פעם שפותחים לשונית חדשה: זה קשה מאוד, כמעט בלתי אפשרי למעשה.

אם עובד בחברה כלשהי משתמש ב"כרום" לצרכי עבודה שוטפת, הבוס שלו יוכל לדעת כל מה שהעובד חיפש, ומעבר לכך - הבוס יוכל לדעת באילו אתרים מבקר העובד שלו. אם העובד מחפש מידע על מחלה מסוימת, הבוס שלו יכול לנצל זאת לרעה. אם העובדת מחפשת מידע על הריון ולידה, הבוס יוכל לדעת שהיא מתכננת להיכנס להריון ולפטר אותה. אם העובד נכנס לאתר חיפוש עבודה, הבוס יוכל לדעת שהעובד רוצה לעזוב.

החיטוט המטריד בהרגלי החיפוש והגלישה של המשתמש יכול להתבצע בצורה קלה מאוד, מפורטת ומדויקת, לפי תאריכים ותוך הכללת מונח החיפוש המדויק בכותרת כל פריט. כל מה שהבוס צריך לעשות זה להיכנס למחשב של העובד, להפעיל את כרום, להקליד קונטרול+H או להקליד בתיבת הכתובת את הביטוי chrome://history ומאותו הרגע הוא נחשף לכל החיפושים והסודות, שלא לדבר על כל אתר שהגולש היה בו.

כך הופך "גוגל כרום" לסוכן ריגול יעיל של מעסיקים, שותפים למשרד, בני זוג חשדניים וכל מי שמעוניין במידע רגיש על הרגלי הגלישה והחיפוש של משתמשים. והכי גרוע: ל"גוגל" יש גישה חופשית לכל המידע האישי הזה, מה שהופך אותה לסוכנות ביון תאגידית בעלת כוח שלא יתואר.


חשופים כל הזמן
ההבדל בין היסטוריית החיפושים והגלישה של "כרום" ובין היסטוריית האינטרנט של גוגל הוא פשוט: ב'כרום' כולם חשופים כל הזמן. בגוגל, צריך להיות מחובר לחשבון גוגל כדי לחשוף פרטים, ותמיד אפשר למנוע מצב של תיעוד היסטוריית אינטרנט, שזה המצב המועדף מבחינת כל האוכלוסיה, כמעט בלי יוצאים מן הכלל.

גוגל מפרסמת את "כרום" בתור דפדפן שאחד משלושת יתרונותיו הבולטים הוא "גלישה פרטית", לכאורה: "פתח חלון גלישה בסתר כשאינך מעוניין לשמור את היסטוריית הגלישה שלך", כותבים בגוגל כדי לשכנע את המשתמשים להוריד את המתחרה של אקספלורר ופיירפוקס. אך הניסוח האמיתי של הפרסומת היה צריך להיות: "פתח חלון גלישה בסתר כשאינך מעוניין שחברת גוגל בקליפורניה תדע הכל, אבל פשוט הכל, על מה שאתה מחפש ועושה באינטרנט".

לסיכום, אם מנהלי פרויקט "גוגל כרום" רוצים לתת תחושת ביטחון לגולשים, הם חייבים לאפשר ניטרול של היסטוריית הגלישה. מיקרוסופט למדה את זה בדרך הקשה (תביעות-ענק), ומוזילה למדה את זה בדרך הקלה (לא להתנהג כמו מיקרוסופט). מנהלי "גוגל כרום" חייבים לסתום את הפירצה הזאת בהקדם האפשרי, אחרת גוגל תהיה חשופה לתביעות-ענק על פגיעה חמורה בפרטיות הגולשים.

12.7.2009

הפתעות בגוגל אנליטיקס

לפעמים חיפוש מפתיע אחד ב"גוגל", יכול להפוך את גוגל אנליטיקס (שירות סטטיסטיקות לאתרים) למשהו שונה לגמרי. במסגרת ניתוח של אתר פיננסי בישראל, שעוסק בין השאר בקופות גמל, הופיעו הכניסות הבאות לאתר באמצעות החיפושים הגוגליים הבאים:



ההפתעה מופיעה בשורה הרביעית ("סקס עם גמל").

איך זה קורה? מישהו מחפש את מה שהוא מחפש (כנראה משעמם שם, בנגב, בחודשי הקיץ), ואז הוא נכנס בטעות לאתר פיננסי שמציע קופות גמל ללקוחות שונים. אין קשר בין קופת גמל ובין בעל-חיים שנקרא גמל, אבל בעיני גוגל כנראה יש רלוונטיות כלשהי.

אני עובד עם גוגל אנליטיקס כבר כמה שנים, אבל זה ללא ספק אחד הרגעים היותר-מבדרים שהיו לי עם השירות.

יש לכם משהו דומה בדו"חות? שלחו תגובה או מייל.

22.6.2009

גוגל אנליטיקס זרק את פלשתין לתוך הים

גוגל אנליטיקס היא תוכנה סטטיסטית לאתרי אינטרנט. דרכה ניתן להבין מהיכן מגיעים גולשים לאתר שלך. נכון להיום, גוגל יודע למפות למעלה מ-160 מדינות ברחבי העולם, כולל ישראל כמובן.

השטחים הפלשתיניים (שנקראים בגוגל אנליטיקס: Palestinian Territory) מופיעים ברשימת המדינות כרגיל:


אבל על המפה, בפועל, הם נראים כמו ים (כחול, ריק, בלי תושבים ובלי ערים):


לחיצה על מדינות "לגיטימיות" כגון מצרים, ירדן או לבנון אפשרית, בין השאר מפני שהן "צהובות".
השטחים הפלשתינאים, לעומת זאת, מיוחדים בכך שהם "כחולים" (דהיינו - ים), ואי אפשר להקליק עליהם.
כאשר מנסים לקבל מידע מפורט על "השטח הפלשתינאי", מקבלים מסך ריק לחלוטין בצבע תכלת:


הפלשתינאים לא שותקים לנוכח הסיפור הזה. באתר של פלשתינאי בשם קאת'ר סאלאם הוא מעלה את השאלה המתבקשת, והיא: האם גוגל דחף את פלשתין אל תוך הים?

וכך כותב סאלאם על פלשתין בגוגל אנליטיקס, בתרגום מאנגלית לעברית:
"להיזרק אל תוך המים, ולהיראות כמו שני אגמים גדולים - זה עלבון אדיר כלפי העם שלי....הטעות הזאת עלולה לגרום לציבור להאמין שפלשתין, והאוכלוסיה הפלשתינית המונה ארבעה מליון בני-אדם, אינם קיימים, ושאין להם זכות קיום".

סאלאם אף תוהה על קיומה של תיאוריית קונספירציה:
"האם יש מערכת יחסים בין גוגל, ישראל וארגונים ציוניים שונים, שמקדמים ומצדיקים את רצח-העם כנגד פלשתין?"

בפורום העזרה של גוגל אנליטיקס העלה אחד המשתמשים את התהייה לאן נעלמה פלשתין, ומדוע היא ריקה, ממש כמו הים. הוא לא קיבל תשובה.

זה בוודאי לא עוזר לפלשתינאים לדעת שכאשר מחפשים palestine ב"גוגל מפות" (Google Maps), מקבלים מפה של ישוב אמריקני בטקסס בעל שם דומה. לא קלה היא דרכם.

גם את היהודים שבינינו זה אמור לעניין: אם אזור "יהודה ושומרון" הוא ים כחול וריק, מה זה אומר על ערים ויישובים גדולים מעבר לקו הירוק כמו אריאל, גושי התנחלויות "מבוססים", התנחלויות מבודדות ומאחזים קטנים? בעיני גוגל אנליטיקס, הם יכולים להמשיך לטבוע.


16.6.2009

לידתם של הקישורים הממומנים: 1998


מתי נולדו הקישורים הממומנים?
רבים עדיין מאמינים שהיה זה גוגל אשר המציא את השיטה, באמצעות השקת מערכת "אדוורדז" בתחילת שנות האלפיים. זהו עדיין אחד המיתוסים הרווחים (והשגויים) בנוגע למהפכנותו של גוגל ומודל הפרסום שממנו הוא שואב 99% מהכנסותיו, המכונה בקיצור PPC - תשלום לפי קליק.


15.6.2009

מנועים ממותגים: אותן תוצאות, תגובה שונה

מסתבר שגם במנועי חיפוש - מותג חזק משפיע על שיקול הדעת של המשתמשים; זו אחת הסיבות המרכזיות מדוע מיקרוסופט השיקו את "בינג" (bing) לאחרונה


מחקר שהתפרסם במאי 2007 בסן-חוזה, קליפורניה, בדק את תגובותיהם של 32 נחקרים, שבפניהם הוצגו אותן תוצאות חיפוש - תחת מיתוג שונה (גוגל, יאהו, אם-אס-אן). במילים פשוטות, המחקר ניסה לבדוק אם אנשים נותנים למותג החיפוש (הלוגו הקטן בפינה) להשפיע על שיקול דעתם האובייקטיבי ביחס לאיכות התוצאות שהם מקבלים ברשת.


התוצאות מפתיעות: למותג החיפוש יש השפעה מובהקת על שיקול הדעת שלנו.


הנחקרים נתנו ציונים שונים לאותן תוצאות חיפוש, עם הבדל של למעלה מ-25% בדירוג הרלוונטיות, בין המנוע ה"טוב" ביותר לבין המנוע ה"גרוע" ביותר. נזכיר שוב: התוצאות היו אותן תוצאות, ורק שם המנוע השתנה. 


החוקרים המציאו מנוע חיפוש פיקטיבי תחת המותג AI2RS, שתיפקד כקבוצת ביקורת, וגם קיבל את הציונים הגרועים ביותר. יאהו קיבל את הציון הטוב ביותר. גוגל זכה במקום השני, במקום השלישי - MSN של מיקרוסופט. המקום הרביעי, כאמור, היה שמור לקבוצת הביקורת: המותג הפיקטיבי.


מסקנת החוקרים היתה, שלמיתוג יש השפעה חזקה על שיקול הדעת של המשתמשים. המותג "יאהו", ככל הנראה, נחשב ידידותי וחיובי במיוחד. הוא גם ותיק יותר ברשת, בהשוואה לגוגל. במפתיע, אלוף החיפוש (גוגל) הגיע שני אחרי יאהו, וזאת למרות שהנחקרים סיפרו שהוא המנוע הפופולרי ביותר בעיניהם. המותג של מיקרוסופט, ולא במפתיע, ממשיך לסבול קשות מהתחרות עם המותגים האחרים.




מעניין לציין, שהחוקרים לא התייחסו לנקודה חשובה במסקנותיהם: היכרות קודמת של המשתמשים עם מותגים אחרים. ככל הנראה, הגולשים למדו לקבל את התוצאות של יאהו ושל גוגל כטובות, אך בלי להבחין בהבדל גדול ביניהם. מבחינתם, שני המותגים הללו טובים. יש להם רגשות קצת פחות חיוביים כלפי גוגל, בהשוואה ליאהו, אבל אולי זה קורה בגלל שהם משתמשים יותר בגוגל, ולכן מכירים טוב יותר את חולשותיו בתור מנוע חיפוש. 


אם היו הגולשים משתמשים יותר ביאהו, אולי היו מתוודעים למגבלות הרלוונטיות שלו, ואז מפעילים כלפיו יותר מנגנוני ביקורת. באותה מידה, הנסיון הרע שיש לרוב המשתמשים עם התוצאות של MSN גרם להם "לקטול" אותו גם כאשר היה זהה לשאר. במציאות, יש לא מעט אנשים שהשתמשו בעבר ב-MSN אבל החליטו שהוא פחות טוב מגוגל - ולכן עברו לגוגל, נשארו עם גוגל ולא מוכנים לחזור למותג אחר. 


מעניין היה גם להכליל במחקר את המותג Ask.com, שהיה פעם מזוהה עם משרת חביב בשם ג'יבס (Ask Jeeves). המותג הזה שמר על ערכו, בין השאר בגלל ההזדהות החזקה של הגולשים עם דמותו האנושית, ה"שירותית" והאמינה של המשרת הבריטי המעונב. זהו אחד ממותגי החיפוש החזקים בעולם, למרות שהוא מחזיק בנתח שוק קטן בארה"ב. חבל שהוא לא נכנס למחקר הזה.


לכן, אולי לא בהכרח מדובר כאן במיתוג כגורם "מעוור" או "מטמטם", אלא בהיכרות מוקדמת עם מותג, המשפיעה על שיקול הדעת של המשתמש וגורמת לו להיות מוטה. כמו קורבן שנכווה בעבר בידי מנוע בעייתי, אנחנו ממשיכים להירתע מאותו מנוע, גם כאשר הוא משתפר ומציג תוצאות דומות מאוד לאלו של מתחריו הישירים.


המחקר הזה עשוי גם לרמוז, שחיים בלי גוגל הם חיים סבירים, מבחינה סובייקטיבית. אם משרדי גוגל היו מתפוצצים מחר בבוקר, רחמנא ליצלן, היינו עוברים להשתמש ביאהו, ובסופו של דבר גם מסתדרים עם מה שיש. לעומת זאת, אם משרדי גוגל ומשרדי יאהו היו מתפוצצים באותו בוקר (רחמנא ליצלן כפול 2), היינו מקטרים על התוצאות של "לייב.קום" (MSN), וכנראה בצדק, כי הוא היה מונופול.

השיעבוד המנטלי שלנו למותגים מסחריים היה נושא ספרה של נעמי קליין, "נו לוגו" (no logo), שפורסם ב-2000 והיה לרב-מכר. בגלל עלויות כניסה גבוהות מאוד לענף החיפוש, כיום אין ספק שהתחרות בענף היא מוגבלת ביותר. עם זאת, ברור לשלושת הענקים בתחום (גוגל, בינג-יאהו) שאם אחד מהם יקרוס, לא יהיו חסרים יזמים שינצלו את הואקום כדי להקים מנועי חיפוש חדשים.


בינג = בינינו, יותר נחמד גוגל

BingBut It's Not Google

המחקר שגילה עד כמה מנועי חיפוש הם למעשה "מותגים אופנתיים", כנראה נקרא היטב במשרדי מיקרוסופט, שכן ביוני 2009 הושק מנוע החיפוש החדש "בינג", תוך נסיון להתרחק ככל האפשר מן המותג האפור והמשעמם "מיקרוסופט", או "msn" ואפילו לא "לייב" (live) המאוס.


מנוע "בינג" (בכתובת Bing.com) ממותג כצעיר, מגניב ומנותק לחלוטין ממערכת 'חלונות', תאגיד תוכנה מרדמונד, וכל דבר שקשור לביל גייטס, סטיב באלמר וחבר מרעיו. המלחמה היא על האסוציאציה של הגולש, ועל הזכרונות הרעים שיש לו ממוצרי תוכנה מונופוליסיטיים כגון ויסטה, XP, מסכים כחולים, מחירים מופקעים ומאבקים משפטיים נוראיים באירופה ובארה"ב.


"בינג" לא מציג תוצאות חיפוש יותר טובות מ"גוגל". אין לו אף פיצ'ר מנצח, או יתרון תחרותי שמישהו יכול לשים עליו את היד ולספר לחברים. "בינג" בוודאי לא יכול לפגוע בצורה משמעותית במותג הבינלאומי המצליח "גוגל", שזוכה לנאמנות עיוורת מצד רוב משתמשי העולם. אבל לפחות הוא לא מזוהה עם חברה שלילית ושנואה כמו מיקרוסופט.





שם המחקר: The Effect of Brand Awareness on the Evaluation of Search Engine Results

שמות החוקרים: ברנרד יאנסן, מימי זאנג, יינג זאנג



ועל כך אמר המשורר:
"וואו! איזה אבסורד,
אותו מקרר וגישה כל כך שונה"

השיר "וואו" | ביצוע: ג'ירפות | מילים ולחן: גלעד כהנא, יאיר קז


הורדת המחקר בפורמט PDF

[פורסם במקור ב-01/07/2007]

דירוג בלוגים במנועי חיפוש

פטנט שהוגש בארה"ב בתאריך 13/9/05 ופורסם ב-15/3/07 חושף, ככל הנראה, כמה מן הפרמטרים המרכזיים בדירוג של בלוגים במנועי חיפוש בינלאומיים.

הפטנט הוגש על ידי מהנדסים ומפתחים מטעם גוגל, אך שמה של החברה לא מוזכר בגוף הטקסט. סביר להניח שלפחות חלק מן הממציאים עבדו בחברת בלוגר (שנרכשה ע"י גוגל), וסייעו לפתח את חיפוש הבלוגים של גוגל.

אז מה אומר, למעשה הפטנט? שיש דברים "טובים" המצביעים על איכות גבוהה של בלוג, לעומת דברים "רעים" המצביעים על איכות מפוקפקת, ספאם או סתם העתקה מיותרת, המבוצעת לעתים ע"י מחשב למטרות שאינן רלוונטיות.


פרמטרים חיוביים: בלוג אהוב ע"י מנועי חיפוש

  • הבלוג מקושר מתוך "בלוגרולים", מערכות קישורים של בלוגים אל בלוגים אחרים
  • הבלוג מקושר מתוך הודעות דוא"ל (ג'ימייל, בשליטת גוגל, למשל)
  • הבלוג מקושר מתוך הודעות פורומים או בצ'אט ("מדברים" עליך)
  • הבלוג משתמש ב"תגים" (Tags) כדי למיין פוסטים ע"פ נושאים (מעיד על אינטליגנציה אנושית, משהו שאין לרובוטים של ספאם)
  • הבלוג מקושר מאתרים רבים ואיכותיים ברחבי הרשת (מקביל למדד פייג'ראנק של גוגל)
  • כמות הנרשמים אל ה"פיד" (RSS וכד') של בלוג כלשהו (באמצעות גוגל רידר, למשל, או טכנוראטי המפורסם)
  • ניתוח זרם הקליקים ("קליק-סטרים") אל בלוג כלשהו מתוך תוצאות החיפוש של מנוע מסוים (האם אנשים מעדיפים להקליק על בלוג מסוים דווקא, האם הם חוזרים אחורה לדף התוצאות, כמה זמן הם נשארים בבלוג וכו')


פרמטרים שליליים: בלוג שנוא ע"י מנועי חיפוש

  • פוסטים בבלוג מתפרסמים בשעות קבועות, או בתדירות צפויה-מדי (פוסט-בוט)
  • קיים הבדל בין התוכן המצוי בבלוג ובין התוכן המצוי ב"פיד" של הבלוג (מרמה/הונאה)
  • תוכן מועתק - היחס בין התוכן המקורי של הבלוג ובין תוכן המועתק ממקורות אחרים
  • שימוש במילות מפתח "חשודות" המופיעות דרך-קבע בבלוגים זבליים (גלולות שקשורות בצנעת הפרט, הלוואות מכל מיני סוגים וכל הג'אז הספאמי הזה)
  • פוסטים בעלי גודל זהה, או בעל דפוסי-גודל דומים (שוב - תוכנות ספאם מקצועיות)
  • קישורים קבועים לאתר אחד ויחיד (כך לא מתנהגים יצורי-אנוש)
  • כמות גדולה במיוחד של מודעות ובאנרים (כמו אתרי אדסנס חסרי משמעות)
  • מיקום הפרסומות בגוף התוכן (הפרסומת היא התוכן, למעשה)


מחשבות, הסתייגויות ומסקנות

חשוב לזכור שכל פטנט, אפילו אם פורסם כחוק, אינו מצביע על שימוש-בפועל של מגיש הפטנט. יכול להיות שגוגל הגישה פטנט ב-2005 אך יישמה רק חלק קטן ממנו במנוע חיפוש הבלוגים שלה. ג'ייסון גולדמן, למשל, אחד מכותבי הפטנט, שימש מנהל מוצר ב"בלוגר", אבל כבר עזב את גוגל באמצע 2006.

כמו כן, סביר להניח שמנועי חיפוש בלוגים משתמשים בפרמטרים נוספים שאותם הם אינם ששים לחשוף במסגרת הפטנטים הפומביים שאותם הם מפרסמים. דברים רבים קרו בעולם מאז ספטמבר 2005, ובגוגל -- כמו הבלוגוספירה עצמה -- רצים קדימה בקצב מהיר ביותר.

למרות שיש כמה הפתעות קטנות בשיטת דירוג הבלוגים המוצגת בפטנט זה (כמו למשל - קריאת דוא"ל של משתמשים כדי לקבוע דירוג בתוצאות חיפוש -- הסיוט הרטוב של כל פרנואיד), נראה שעיקר מטרת הפטנט היא להגן על מנועי חיפוש מפני ספאמרים מקצועיים.

ניכר מן הפטנט לדירוג בלוגים במנועי חיפוש שהבלוגים הטובים-באמת, אלו שתורמים תוכן איכותי לאינטרנט, זוכים לסיקור חיובי באמצעי התקשורת, לרמת קישוריות גבוהה בקרב בלוגרים אחרים, ובאופן כללי זוכים לתהודה קהילתית רחבה ומקיפה: גם בפורומים, גם בדוא"ל, גם בתוך פוסטים של אחרים.

בלוגים, מעצם טבעם, פגיעים לניצול זדוני מטעם תוכנות לייצור תוכן מועתק, אוטומטי או מזובל. לכן פיתחו מנועי החיפוש מנגנוני הגנה ("נוגדני ספאם-בלוג", אם תרצו) כדי להפריד בין הזיבלי, הסתמי, האיכותי והמצטיין. מעניין שדווקא מחשבים הם אלו שמחליטים בשבילנו היום מה זה "אנושי" ומה זה "ממוחשב".

בפועל, גוגל ודומיו מפתחים מחשבים "חכמים מבני-אדם" שמנסים לזהות את דפוסי ההתנהגות של מחשבים "קצת פחות חכמים", במה שנראה כמו מירוץ חימוש אינסופי בין מתכנתים שונים מכל העולם, שעובדים קשה יותר ככל שמבטיחים להם עתיד כלכלי טוב יותר. במירוץ הזה, הספאמרים נוחלים לא מעט נצחונות, כיוון שהם פשוט רבים יותר מן המהנדסים של מנועי החיפוש.


גוגל - שחקן מרכזי בתחום הבלוגים

בעיקר בגלל פלטפורמת "בלוגר" (Blogger.com) שאותה רכש ומפעיל כיום, גוגל משפיע על הבלוגספירה בצורה עקיפה. בלוגרים המשתמשים ברשת 'בלוגר' זוכים ליחס מועדף ב"גוגל", כיוון שהפוסטים שלהם מופיעים בתוצאות החיפוש של גוגל תוך דקות ספורות, לכל היותר תוך שעות ספורות. גוגל גם תמך בלוקליזציה (בינאום = תרגום לשפות כל העולם) של מערכת "בלוגר", המאפשרת לכל בלוגר בעולם להתחבר אליה.

בזכות סינדיקציה חכמה (RSS או ATOM), גוגל יכול לסרוק בלוגים במהירות-שיא, ולהציג פוסטים רעננים עבור אנשים המחפשים נושאים חמים במיוחד. אם גוגל הוא מוציא-לאור (מו"ל) של בלוגים, הרי שרשת "בלוגר" מדורגת גבוה יותר ממה שמגיע לה. ל"גוגל" יש אינטרס חזק בהרחבת רשת הבלוגים שלו: חלק ניכר מן הבלוגים משתמשים במערכת "אדסנס", המזרימה סכומי כסף ניכרים חזרה אל "גוגל".

הנוכחות של אבא-גוגל על בנו הקטן "בלוגר" משפיעה גם על דירוג בלוגים במנועי חיפוש שאינם גוגל. זאת למה? כיוון שאם בלוג מסוים מקבל תנועה רבה דרך גוגל, הוא זוכה בקישורים רבים יותר - וכך מנועי חיפוש אחרים "מבינים" שהוא איכותי יותר.

[פורסם במקור ב-22/03/07 ועודכן שוב]


14.6.2009

קישורים ערמומיים: שימוש ב"נופולו", לינק-ספאם והגנה על טוהר הרשת

גוגל היא חיה שנושמת קישורים. בלי קישורים אין לה זכות קיום. לכן זה לא היה מפתיע במיוחד כאשר ב-2005 החלה גוגל החלה לתמוך, לעודד ולטפח את התוספת "רל = נופולו" (rel=noflollow) בשביל קישורים שאינם נמצאים בשליטתם של בעלי אתרים.

מי צריך "נופולו" ומה זה אומר בכלל?

  • "נופולו" הוא תג מסוג "רל" שאותו אפשר להוסיף לכל קישור
  • קישור עם נופולו הוא קישור "מוחלש" ביותר, בעיני מנועי חיפוש
  • נופולו אומר למנועי החיפוש "זה קישור שאני לא ממליץ לסמוך עליו"
  • מנועי חיפוש יקראו את הקישור, ימשיכו הלאה אל העמוד המקושר - אך לא יעניקו לו ערך משמעותי
  • אתר המקושר דרך נופולו לא ירוויח שיפור רציני כלשהו בציון שלו (פייג'ראנק)
  • הטקסט המופיע בגוף הקישור ("אנקור טקסט") לא ישפיע על מיקומי האתר המקושר בצורה רצינית
  • למעשה, קישור מסוגו נופולו הוא כמעט כמו "פתק לבן" בקלפי של מנועי החיפוש
  • המטרה המרכזית של נופולו היא למנוע "קישורי זבל" ('לינק ספאם') בבלוגים, ספרי אורחים, פורומים ובמות ציבוריות באינטרנט המאפשרות לכל משתמש להוסיף לינקים עם טקסט כדי לקדם אתרים בצורות מפוקפקות

איך זה נראה?

קישור עם נופולו נראה כך:

מבחינת המשתמש הממוצע, נופולו הוא קישור רגיל לחלוטין. הדפדפנים לא מזהירים את המשתמש שמדובר בקישור שמנועי החיפוש לא יתייחסו אליו ברצינות.

הקישור הזה, למשל, כולל בתוכו נופולו, בעוד הקישור הזה אינו כולל נופולו. אין הבדל נראה-לעין.

כדי לזהות קישור מסוג nofollow, צריך לעשות "צפה במקור" (View Source) ולחפש בגוף הקוד את הביטוי nofollow. חשוב לא להתבלבל עם תג המטא "רובוטס" (robots) שיכול לקבל ערך מסוג 'נופולו', שאומר לעכבישי החיפוש אם לסרוק את העמוד כולו או לא. "נופולו" המופיע ב"רובוטוס" אכן מונע סריקה של כל הקישורים המופיעים בעמוד החסום, בעוד "רל=נופולו" אינו מונע ממנועי חיפוש להמשיך הלאה אל העמוד המקושר.

כך ש"נופולו" מסוג "רל" הוא ממש לא "נופולו" במובן הפשוט של המילה, אלא יותר נכון לקרוא לו "נו-ווליו" (novalue), במובן שהוא לא מעניק ערך 'קידומי' לעמוד המקושר. מהנדס גוגל, מאט קאטס, כתב מאמר על השינויים שעבר נופולו עם השנים, ומה הוא ממליץ לבעלי אתרים לעשות איתו.

מסתבר ש"גוגל" התייחסו ל"נופולו" כאל לינק מנוטרל, לכל דבר ועניין. עם הזמן הם גילו שהרבה מאוד אתרים 'חסמו' לעצמם דפים רבים בעזרת קישורי נופולו. זה גרם לבעיה עבור גוגל, שמצא את עצמו מאבד דפים חשובים שהוא חייב לסרוק עבור המשתמשים שלו. לכן גוגל ביצע שינוי ב'נופולו' והפך אותו ל"קישור מוחלש".

החל מ-2008, "נופולו" אינו חוסם את הגישה לדפים ברשת ממנועי חיפוש. "נופולו" בעיני גוגל הוא רק "סינגל" (אות) שהקישור אינו חזק כמו קישור רגיל. אפשר לקרוא לו "קישור מסויג", "קישור ספקני", "קישור חלש" או "קישור מוחלש", כאמור.

"רל=נופולו" אינו תג במובן המסורתי של המילה, כי הוא לא עומד בזכות עצמו. הוא "מסונף" אל תג הקישור (a href) ונשען על כוחו כפלטפורמה חשובה לקידום אתרים.


השלכות נופולו על קישוריות פנימית וחיצונית ברשת

עד לא מזמן, התרגלנו שכל קישור באינטרנט הוא למעשה "הצבעה בעד" אתר מסוים או עמוד מסוים מתוך אתר גדול. "נופולו" משנה את התמונה, בכך שהוא מכריח אותנו לבדוק האם הקישור הוא אמיתי (דהיינו, כזה שמנועי החיפוש מתייחסים אליו ברצינות) או שהוא למעשה 'מוחלש' בעיני מנועי החיפוש.

כי אמנם כל הקישורים שווים ברשת, אבל יש כאלה ששווים המון (מאתרים חשובים), שווים פחות (מאתרים לא חשובים), ושווים הרבה פחות (נופולו).

מכיוון שהפיתוח של "רל=נופולו" לא הגיע מהקונסורציום של האינטרנט (W3C), אלא דווקא מ"גוגל" שרצתה להגן על הבלוגים שלה, מפתחים רבים עדיין לא יודעים שהוא בכלל קיים. מנועי החיפוש משתמשים ב"נופולו" כדי לנטרל ספאמרים, ולא כדי להפוך את האינטרנט למקום נוח יותר לניווט. מבחינתם, "נופולו" הוא כלי לבקרת איכות משופרת, לא תג חיוני לכל בעל אתר. הוא בוודאי לא ימנע מ"גוגל" לסרוק קישורי "נופולו".

להופעתו המחתרתית של "נופולו" באינטרנט יש השלכות רבות. אם בעל אתר משתמש ב"נופולו" בתוך האתר שלו, כאמצעי ניווט פנימי (קישוריות פנימית), אין לכך השפעות רבות על האקולוגיה האינטרנטית, מערכות יחסים בין אתרים, או הפוליטיקה הסבוכה של הרשת. אבל כאשר נופולו הופך מטבע עובר לסוחר, מתעוררות כמה בעיות ושאלות.

כל מי שעוסק דרך-קבע בעבודת החלפת קישורים (Link Exchange) או בניית קישורים (Link Building) עם אתרים אחרים, צריך לבדוק בשבע עיניים שאתרים אחרים לא מפעילים "נופולו" בצורה ערמומית נגדו. אם האתר שלך מקשר אל אתר אחר, ובתמורה האתר האחר מקשר גם אלייך (קישור דו-סיטרי), הרי שאם הצד השני משתמש ב"נופולו" נגדך, אתה למעשה מקשר אליו בצורה שהיא כמעט (חשוב לזכור: כמעט) חד-סיטרית.

מי מרוויח במקרה זה? האתר המקושר. מי מפסיד? אתה, כי לא הרווחת קישור "אמיתי" אליך.

טריק אופייני למחליפי קישורים יהיה להוסיף לינק במצב "נקי", בלי "נופולו" - וכעבור שבוע-שבועיים להוסיף "נופולו" בלי ידיעת הצד השני. חובבי תורת המשחקים יוכלו לבנות לעצמם נוסחאות של "תרחישי נופולו", שבהם ניתן יהיה לחשב-מראש את האינטרסים של שני הצדדים לנטרל איש את רעהו - והמלחמות יכולות להיות אינסופיות.


מתי כדאי להשתמש ב"רל=נופולו"

  • כאשר מעוניינים לתת קישור החוצה, אבל לא בטוחים לגבי איכות האתר המקושר
  • אם הקישור אינו מתאים לנושא הכללי של האתר, והוא מהווה חריג
  • במקרה בו מפעילים יישום פתוח (בלוג, ספר אורחים, פורום) שיכול להיפגע מ'לינק-ספאם'
  • בדפי קישורים גדולים ועמוסים, אפשר לתת 'נופולו' לקישורים החשובים-פחות כדי למקד מנועי חיפוש
  • אם נתתם קישור כ"טובה אישית" לחבר/שותף, בלי שום קשר לקידום במנועי חיפוש
  • כאשר האתר המקושר נחשב בעייתי או מפוקפק בעיני מנועי חיפוש, ויש חשש לפגיעה בכם
  • אם הקישור מיועד אך ורק למשתמש הסופי, ולא לציבור הרחב המחפש ברשת
  • אם אתם חרדים לגורל ה"פייג'-ראנק" (PageRank) של האתר שלכם בגוגל


ביקורת על נופולו

הפער בין הכוונות הטובות בלידת נופולו ובין המציאות כיום בשטח, כנראה כבר אינו כה קטן.

באתר נונופולו, המתנגד בצורה מפורשת ל'נופולו', מופיעות הנקודות הבאות:

  • נופולו לא באמת עוצר ספאמרים מלזהם בלוגים דרך טוקבקים / 'קומנטס' (הערות)
  • השם 'נופולו' מבלבל, מכיוון שבפועל מנועי חיפוש כן הולכים אחרי קישורי נופולו (אך לא נותנים להם ערך)
  • נופולו פוגע ביחסים בין אתרים ברשת
  • נופולו אינו שימושי עבור בני-אדם, אלא רק למנועי חיפוש
  • שימוש קבוצתי ומאורגן ב'נופולו' יכול לפגוע באתרים מסוימים בלי ידיעתם
  • נופולו אינו מבחין כלל בין משתמשים טהורי-כוונות ובין ספאמרים נכלוליים (מבחינתו, כל הקישורים פסולים, בלי קשר לאיכותם האמיתית)
  • נופולו מתעלם מחשיבותן של הערות ותגובות לכל יישום תוכן ברשת
  • נופולו מפלה לרעה בלוגים (הוא מופיע שם באופן אוטומטי) לעומת אתרי-ספאם
  • נופולו מונע מן הרשת להיות רשת אמיתית (מקושרת), ויוצר נתיבים חד-סיטריים
  • נופולו פוגע ביישום הממשי של חופש הביטוי
  • נופולו התפתח "במחשכים", בקרב קומץ חברות חיפוש, בלי דיון ציבורי פתוח
  • נופולו מאפשר לאתרים לסחור ב"פייג'ראנק" (שליטה באפקטיביות של הקישורים)
  • נופולו נולד בגלל פייג'ראנק של גוגל (השפעתם של קישורים על מיקומים בתוצאות חיפוש), ולכן גוגל צריכה לטפל ב"פייג'ראנק" ולא להמציא תגים שפוגעים בכלל האוכלוסיה
לכך יש להוסיף חיסרון מהותי נוסף: מרבית מפתחי האתרים עדיין אינם מודעים לקיומו של "nofollow", ולכן הם מפחדים לתת לגולשי אינטרנט את האפשרות להוסיף לינקים בעצמם (במסגרת טוקבקים, פורומים וכיוצ"ב).

כפועל יוצא של בורות זו, בעל האתר הממוצע לא יכול להוסיף את התג בכוחות עצמו, מכיוון שרוב מערכות ניהול התוכן הקיימות אינן תומכות בו כלל. יוצא שגם עבור המשתמש המתוחכם וגם המשתמש הפשוט - נגישותו של "נופולו" מוגבלת ביותר.

ויקיפדיה אימצה את נופולו עבור כל הקישורים החיצוניים באנציקלופדיה המקוונת, בכל השפות האפשריות.

לדפדפן מוזילה יש תוסף (אד-און) שמאפשר, בין השאר, להדגיש קישורים עם נופולו. קוראים לו סרץ' סטטוס, והוא מיועד לאנשי-אינטרנט שעוסקים באופן ממוקד במנועי חיפוש. בין השאר יש לו גם מדד פייג'ראנק, אלקסה, צפיפות מילות מפתח ושלל פיצ'רים נוספים שעשויים לעזור לאיש ה-SEO הממוצע.

צילום-מסך של קישורי נופולו דרך סרץ' סטטוס מופיע להלן:

קישורי נופולו - ממוסגרים בוורוד ע"י תוסף סרץ' סטטוס של מוזילה

ויקיפדיה משתמשת ב"נופולו" לכל הקישורים החיצוניים

מסתבר שניתן לנטרל נופולו (לפחות בבלוגים של וורדפרס), אבל רק מעטים ישתמשו בפיצ'ר הזה.

חשוב לציין שלא רק גוגל תומך עכשיו ב"נופולו", אלא גם השניים הגדולים האחרים: יאהו ו'אם-אס-אן'. ואם הגדולים אימצו את נופולו בהתלהבות, יש סיכוי סביר שהוא ישרוד שנים רבות. האם נופולו הוא טוב ליהודים או רע ליהודים? אם הוא יפחית את תופעת ה"לינק-ספאם" בבלוגים, מה טוב. אם הוא ידכא את הספאמרים מלזהם את האינטרנט, זה יהיה מבורך.

עם זאת, לא כולם ספאמרים, וצריך להקפיד על כך ש"נופולו" לא ישבש את כללי האתיקה הטבעיים ברשת. חשוב במיוחד לא לפגוע במשתמשים שיכולים לתרום קישורים חיוניים להתפתחות הבריאה של האינטרנט.

השאלה היא -- אם קישור הוא לא באמת קישור, מי יכול לדעת זאת במבט בלתי-מזוין? האופי ה'שקוף' של נופולו יכול להפוך אנשים לחשדנים, פרנואידים או ציניים. יש כאן "אפקט מצנן" שיוכל להשפיע על רצונם הטוב של בעלי אתרים לקשר זה לזה. עכשיו יש לנו קישורים סוג א' וקישורים סוג ב', ורוב בעלי האתרים לא ישמחו לגלות זאת בדיעבד. ייקח זמן רב עד שנוכל להעריך, אם בכלל, אם נופולו הביא יותר תועלת מנזק.




[פורסם במקור ב-16/11/2006, בבלוג הישן; עבר עדכון בחודש אפריל 2010]

1.6.2009

תוצאות חיפוש מסוכנות: שומרי מסך, משחקים ועבודה מהבית


דו"ח 2009 של מקאפי, חברת טכנולוגיות אבטחה מקליפורניה, הוא כתב-אישום חריף נגד מנועי החיפוש הגדולים: תוצאות החיפוש שאתם מקבלים מ"גוגל" ועמיתיו מסוכנות למחשב שלכם, חשבון הבנק והפרטיות שלכם

הדו"ח של מקאפי (McAfee) בדק כ-2,600 מילות חיפוש בחמשת מנועי החיפוש הגדולים: גוגל, אמריקה אונליין (AOL), יאהו, לייב (של מיקרוסופט, כיום "בינג") ו"אסק" (או אסק ג'יבס, בחלק מן המדינות). על כל ביטוי נבדקו חמשת העמודים הראשונים של התוצאות, ובסה"כ ניתחה החברה כ-413,000 כתובות אתרים ייחודיות. ניתן להוריד את הדו"ח בפורמט PDF כאן.

המסקנות בקיצור:
1) תוצאות של אתרי ליריקה (מילים של שירים, או "ליריקס" בלעז) הם בין המסוכנות ביותר ברשת (26% סיכון)
2) המילה "חינם" מבטיחה סכנה לכל הנעזרים במנועי חיפוש כדי לקבל מוצרים ושירותים ללא תשלום (21% סיכון)
3) חיפושים נפוצים על הורדות מוסיקה פיראטית, צ'יטים של משחקים (ומשחקים חינם), שומרי מסך ושמות של אתרים מפורסמים - מסוכנים ביותר למחפשים
4) חיפוש "עבודה מהבית", מסתבר, מוביל גולשים רבים מאוד לזרועותיהם של נוכלים מתוחכמים
5) עברייני-רשת מגלים, מנתחים, צופים מראש, חוקרים ומשתמשים במילות חיפוש אקטואליות (סלבריטאים חדשים, אירועי ספורט ואופנות זמניות) ומפציצים את מנועי החיפוש בתכנים זדוניים שכל מטרתם היא השתלת תוכנות זדוניות וסוסים טרויאנים על מחשבים רבים ככל האפשר
6) אי אפשר לסמוך על מנועי החיפוש שיסננו את התוצאות, ולכן יש צורך בתוכנות אבטחה מיוחדות כדי להתגונן


ניתוח הדו"ח
הממצאים של מקאפי, בחלקם, אינם חדשים: כבר ב-2006 הופיע דו"ח שהראה עד כמה תוצאות חיפוש יכולות להיות מסוכנות. המצב לא השתפר כלל, ולמעשה החמיר: כיום, העבריינים עובדים מהר יותר כדי לנצל מגמות חולפות, לעשות רווח גדול בזמן קצר, ואז להיעלם מן הרשת. לכן הם מנצלים אירועים קצרים ורבי-ביקוש כגון אולימפיאדה, כוכבים שנכנסו לכותרות העיתונים לאחרונה, ולא רק עובדים סביב מלכודות קלאסיות כגון "שומרי מסך" (Screensavers).

הלקח מן הדו"ח של 2009 הוא שלא מספיק להיזהר מפני תוכנות חינמיות, שומרי מסך מחייכים או אתרים שמציעים ליריקה ללא תמורה. ביקורת על הדו"ח שפורסמה ע"י מומחה אבטחה ב-ZDnet טוענת כי המצב גרוע בהרבה ממה שנראה - העבריינים השתלטו על מאות אלפי מילות חיפוש פופולריות, ולכן הרשימה של מקאפי אינה ממצה כלל. מעבר לכך, מרבית מקרי ההונאה והפריצה מתרחשים דווקא באתרים אמינים וידועים, שאותם מנועי החיפוש אינם רוצים כלל לחסום, כדי לא לאכזב את המשתמשים שלהם.

במקרים רבים משתמשים האקרים, המבצעים פרויקטים גדולים של פריצה ומירמה, בשיטות כמו השתלת SQL באתרים בלתי-מוגנים. מסתבר ששיטה זו, המכונה באנגלית SQL Injection, פגעה בכמות גדולה מאוד של אתרים בכל העולם, כולל ישראל. כל מי שיגיע לאתרים הללו דרך תוצאות חיפוש, ייפול קורבן בלי להוריד תוכנה, בלי להבין מה קרה, ובלי לדעת כיצד לפתור את הליקוי.

גוגל, יאהו ומיקרוסופט לא ממהרים לספר לצרכנים שלהם שתוצאות החיפוש שלהם מסוכנות. חיפוש תמים של ילד קטן על וובקינז (Webkinz) עלול להסתיים במחשב פרוץ, נזק כספי וסיוע בלתי-מודע לביצוע מעשים פליליים חמורים. ברוב תוצאות החיפוש אין שום אזהרה, לא גרפית ולא טקסטואלית, על כך שאתר כלשהו נחשב מסוכן בעיני תוכנות אבטחה כגון "סייט-אדבייזור" (SiteAdvisor) של מקאפי.

רק במאי 2008 החל מנוע החיפוש של יאהו להשתמש בשירות סרץ'-סקן (SearchScan) שאותו אכן מספקת מקאפי. השירות של יאהו אמור להזהיר את המחפשים מפני תוצאות מסוכנות במיוחד. עם זאת, התוצאות המסוכנות אינן מסוננות החוצה, אפשר להשתמש בהן, ואין כל אופציה לחסום או להסיר אותן מראש.

לעומת יאהו, ההודעה של גוגל "אתר זה עלול להזיק למחשב שלך" היא נדירה, ולעתים רבות גם שגויה. גוגל אכן חוסם אתרים שעלו ברשימה השחורה שלו, אבל 99% מן האתרים אינם זוכים להיכנס לתוכה.

רבים כבר שמעו על "רוגלות" (Spyware), תוכנות שעוקבות אחרי הגולש ושולפות מידע אינטימי. רבים אחרים מכירים כבר את ה"אדוורים" (Adware), תוכנות שמקפיצות פרסומות במהלך גלישה. גם אתרי "דיוג" ("פישינג", ובאנגלית: Phishing) ידועים לחלק ניכר מן הגולשים, בעיקר כאשר הם מתחזים לאתרים מפורסמים כגון פייפאל, איביי, אמזון וכדומה. כל אלו מושתלים במחשבים של משתמשים גם דרך תוצאות חיפוש זדוניות.

רק מיעוט מכיר את ה"קי-לוגרים" (Key-loggers), תוכנות שעוקבות אחרי תנועות המקלדת והעכבר של הגולש, ומשיגות סיסמאות ומספרי כרטיסי אשראי. אך הרבה פחות מוכרות הן תוכנות מסוג "פוחדות" (Scareware), שמטרתן להפחיד את הגולש ולגרום לו להאמין שהמחשב שלו נגוע בוירוס בדיוני; הגולש ההיסטרי מקבל "המלצה" לקנות תוכנה פיקטיבית כלשהו תמורת תשלום מופקע. אתרים רבים המופיעים בתוצאות החיפוש של גוגל דואגים להשתיל "הפחדות" שכאלה למחשב שלכם.


ביקורת ופתרונות
אפשר תמיד לטעון שדווקא חברות כמו מקאפי עסוקות בהפצת "פוחדות" משלהן, כדוגמת "סייט-אדבייזור" המפורסמת והפופולרית שלה. מצד שני, האיומים שעליה מצביעה מקאפי הם אמיתיים לגמרי. משתמשים בלתי-מנוסים מבצעים חיפושים בלי לחשוב על הסיכון הכרוך בגלישה באתרים מפוקפקים. רוב המשתמשים במנועי חיפוש כמו גוגל סומכים על טוהר תוצאות החיפוש בצורה עיוורת, כמעט ילדותית. המצב הזה חייב להיפסק, כמובן, כיוון שהנושא מורכב מאוד מבחינה טכנולוגית, והציבור רחוק מאוד מלהבינו.

הבעיה האמיתית היא שלמנועי חיפוש גדולים אין אינטרס חזק בחסימת אתרים מזיקים. ברוב המקרים, הגולשים ירצו להיכנס לאתרים האהובים עליהם, גם אם מדובר במפגע-אבטחה דיגיטלי שעלול לגרום למחשב שלהם להפוך ל"עבד" (slave) של כמה "בוטים" המנוהלים על ידי כנופיות האקרים. במקרים אחרים, הגולשים יפגינו אדישות מפחידה כלפי כל אזהרה או המלצה להימנע משיטוט באתרי ליריקה, עבודה מהבית, צ'יטים, שומרי מסך, הורדות פיראטיות ומשחקים חינם. אין ספק שקהל-היעד הפגיע ביותר הוא ילדים: אין להם מושג קלוש עד כמה העולם שבחוץ יכול להיות קטלני, והם מאמינים לכל פרסומת שהם רואים ברשת.

הפתרון המתבקש הוא שיתוף פעולה רציני הרבה יותר בין מנועי החיפוש הגדולים, חברות טכנולוגיות אבטחה ורשויות החוק הרלוונטיות (FBI, אינטרפול ומקבילותיה בעולם) שאמורות להגן על הציבור הרחב, ובעיקר על השכבות החלשות: ילדים וילדות, משפחות בעלות השכלה נמוכה, קבוצות עניות שנזקי-מחשב עלולות למוטט אותן, קשישים וטכנופובים למיניהם. חובה לציין כי חלק ניכר מן הקורבנות כלל לא יודע שנגרם לו נזק, ושהמחשב שלו נפל קורבן לתרמית.

גוגל או יאהו רחוקות מאוד מלהיות מומחיות-אבטחה. המבחנים שמשתמש בהם "גוגל" כיום, למשל, כדי לסנן אתרים מזיקים לא נחשבים מהימנים, והדו"ח של מקאפי מוכיח כי הם נכשלו. התוצאה היא חברות חיפוש למעשה הפקירו את הציבור בידיהן של רשתות נוכלים. מישהו חייב לרסן ולהגביל את מנועי החיפוש, ולדרוש מהם מבחני אבטחה מחמירים הרבה יותר - תוך תשלום מחיר מצידם בגין אובדן פוטנציאלי של תנועה, מפרסמים ומזומנים.



פוסטים קודמים באותו עניין:

25.5.2009

נפסלת: המכתב שאנחנו לא רוצים לקבל מגוגל


From: Google Search Quality
To: contact@your-site-name-here.co.il ; info@your-site-name-here.co.il ; support@your-site-name-here.co.il ; webmaster@your-site-name-here.co.il ; your-site-name-here@bezeqint.net
Sent: Wednesday, May 20, 2009 2:39 PM
Subject: הסרה מהאינדקס של Google

בעלים או מנהל אתר your-site-name-here.co.il יקרים,

כאשר הוספנו את דפי האינטרנט שלך לאינדקס, זיהינו שכמה מהדפים שלך משתמשים בטכניקות שאינן עומדות בהנחיות האיכות שלנו אשר ניתן למצוא כאן: http://www.google.com/support/webmasters/bin/answer.py?answer=35769&hl=iw.

במפורש, זיהינו מילוי של מילות מפתח באתר שלך. לדוגמה, ב- http://www.your-site-name-here.co.il/page-name.php
מצאנו:

[הערת הבלוג: "מילוי של מילות מפתח" הוא תרגום עברי גרוע של הביטוי המקובל Keyword Stuffing. משמעות הביטוי: הצפה של אתר באוסף מילות מפתח ארוך ומייגע, שלא נועד לקוראים אנושיים אלא למנועי חיפוש. במייל של גוגל מופיעה כאן רשימה של מילות מפתח ארוכה בתוך פסקה צפופה אחת. מטרתה, כאמור, היא לפתות את גוגל על ידי תוכן המיועד אך ורק עבורו, ולא עבור הגולשים באתר; דוגמה: "מנוע חיפוש מנועי חיפוש מנועים חיפושים גוגל וואלה" וכדומה.]

לקבלת מידע נוסף על מילוי של מילות מפתח, בקר בכתובת http://www.google.com/support/webmasters/bin/answer.py?answer=66358&hl=iw

כדי לשמור על איכות מנוע החיפוש שלנו, דפים מתוך your-site-name-here.co.il יוסרו באופן זמני מתוצאות החיפוש שלנו למשך 30 ימים לפחות.

אנו מעדיפים להשאיר את הדפים שלך באינדקס של Google. אם תרצה שבקשתך תישקל מחדש, תקן או הסר את כל הדפים (לא בהכרח מוגבל לדוגמאות שסופקו) שאינם עומדים בהנחיות האיכות שלנו. לאחר ביצוע שינויים מסוג זה, בקר בכתובת https://www.google.com/webmasters/tools/reconsideration?hl= iw כדי לקבל מידע נוסף ולשלוח את האתר שלך לצורך בדיקה מחדש.

בכבוד רב, צוות איכות החיפוש של Google

הערה: אם יש לך חשבון ב-Webmaster Tools של Google, תוכל לאמת את אמינות ההודעה על ידי התחברות לאתר https://www.google.com/webmasters/tools/siteoverview?hl=iw וכניסה למרכז ההודעות.



עד כאן המכתב של גוגל, כפי שנשלח באמת לבעל אתר מסוים, ב-20 למאי (שמו ופרטיו שמורים במערכת).

מה עושים אם גוגל פסל אותך
1) ראשית, בלי פאניקה
2) בדוק מה לא עשית בסדר
3) בדוק שוב אם אין עוד משהו ש"שכחת" לבדוק
4) הסר במהירות האפשרית את כל הקוד שגוגל חושד בו
5) בדוק אם לא נותרה אף סיבה לפסול אותך שוב
6) היכנס ל"גוגל וובמסטר טולז" והגש בקשה מסודרת ל"שקילה מחדש"
7) המתן בסבלנות לפחות שבועיים (לפעמים גוגל מחזיר מהר)
8) המתן בסבלנות חודש ימים (זאת התקופה המקובלת)
9) המתן בסבלנות חודש וחצי (ובדוק שוב אם הסרת את כל מה שצריך להסיר)
10) המתן בסבלנות חודשיים לכל היותר
11) עבר יותר מדי זמן? שלח מייל למערך התמיכה המקוון של גוגל (הם לא יענו לך)
12) אם עברו למעלה מ-3 חודשים, כנראה שלא הסרת את הקוד הבעייתי מן האתר
13) חזרת לאינדקס של גוגל, בסופו של דבר? תגיד תודה ואל תעשה זאת שוב

הדרך הטובה ביותר לברר אם חזרת לאינדקס היא להריץ חיפוש על האופרטור ":site" ואחריו כתובת האתר שלך.
לדוגמה: "site:name-of-site.co.il". אם גוגל הסיר את האתר שלך מן האינדקס, אף תוצאה לא תופיע. אם גוגל החזיר אותך, יופיעו מספר דפים מן האתר שלך בתוצאות.

במקרים רבים, גוגל פוסל אתרים ומסיר אותם מן האינדקס ללא הודעה מוקדמת. במקרים אחרים, ההודעה פשוט לא מגיעה ליעדה מסיבות טכניות (כתובות דוא"ל שאינן עובדות כשורה, או מגיעות לתיקיית הספאם). קרו מקרים שבהם הודעת הסרה רשמית של גוגל הגיעה ליעדה אך אף אחד לא התייחס אליה ברצינות.

נפסלתם ע"י גוגל?
הגיע לכם מכתב דומה מ"גוגל" בלי סיבה טובה?
יש לכם סיפור "הסרה" מעניין?
הוסיפו תגובה.



23.5.2009

חיפוש באתר ynet: כישלון בלתי נחוץ

ynet הוא האתר הפופולרי ביותר בישראל אחרי "גוגל" ו"וואלה", אבל החיפוש הפנימי בתכנים שלו גרוע מאוד, עד כדי כך שרוב הגולשים פשוט מוותרים מראש; כיצד הצליח הפורטל של ידיעות אחרונות לירות לעצמו בשתי הרגליים רק בשביל להגיד שהוא לא משתמש ב"גוגל"

רצח רבין
כדי להדגים עמד כמה החיפוש הפנימי בכתבות של ynet הוא כושל, נתחיל בדוגמה קלאסית: חיפוש פשוט אחר המונח הפוליטי הבסיסי "רצח רבין" הביא בתוצאה הראשונה של החיפוש הפנימי ב-ynet מאמר על יום ירושלים. במקום השני: מאמר על יחסה של הציונות הדתית למדינה. במקום השלישי: מאמר העוסק בהשפעת הטלוויזיה על הנוער. בשלב זה מתייאש המחפש הממוצע, ועובר ל"גוגל".

חיפוש כתבות ב-ynet על "רצח רבין"

גוגל סורק היטב את ynet: יש לו במאגר בערך 8 וחצי מליון דפים שמורים. חיפוש "רצח רבין" בגוגל תוך צמצום התוצאות ל-ynet מביא תוצאות רלוונטיות ברמת מובהקות גבוהה: במקום הראשון מופיע "סרטון רצח רבין כפי שטרם נראה", במקום השני הערך "רצח רבין" מתוך אנציקלופדיית ynet; ובמקום השלישי - "רצח רבין היה הצונאמי שלנו", ראיון עם משפחת עמיר בעקבות עשור לרצח.

מדוע בחר אתר מכובד, פופולרי ועשיר כמו ynet לשבש לעצמו את החיפוש הפנימי באתר? התשובה: שימוש בחברה ישראלית ושמה קולריטי (Collarity). מנוע החיפוש הפנימי הנוכחי סורק את ynet בתדירות גבוהה מאוד, והדגש בתוצאות החיפוש הוא על "טריות" (Freshness) התוצאות, לאו דווקא הרלוונטיות שלהן. אמנם שליפת הכתבות נעשית בטווח של כ-30 דקות (חפשו "ynet" בכתבות ynet ותבינו את ההגיון), אבל אם מחפשים ביטויים כדי לקבל סידור משמעותי יותר של תוצאות, מתעוררות בעיות קשות.

באופן בלתי-מפתיע בעליל, זכתה קולריטי בכתבה מפרגנת במיוחד ב-ynet ("המתחרה הישראלית של גוגל"), תוך גילוי נאות כי מדובר גם במנוע החיפוש הפנימי החדש של ynet. מייסד החברה הוא "אמיל איסמלון, פיזיקאי, מורה למדיטציה". אם ל"קולריטי" יש יכולות חיפוש מרשימות, הן ללא ספק אינן באות לידי ביטוי באתר-הדגל של "ידיעות אחרונות", בוודאי לא בתצורתן הנוכחית.


ההתנתקות מן ההגיון
חיפוש המונח הפוליטי המפורסם "ההתנתקות" מוכיח שנכון לעכשיו, התוצאות של קולריטי פשוט לא עומדות בשום מבחן איכות בסיסי. התוצאה הראשונה: "המכבש של אובמה - טוב ליהודים?"; התוצאה השנייה: "תמיד אפשר להאשים את היהודים" (עוד מאמר על אובמה); התוצאה השלישית: "בשיא על ההתנתקות: לולא הכיפה, הכעס היה קטן". רק התוצאה השלישית קשורה איכשהו לחיפוש עצמו, אבל היא רחוקה מלהתאים לחיפוש כללי שכזה. במקום השישי, קשה להאמין, הכותרת הבאה: "שר התקשורת יטפל בקנסות היציאה של הסלולר" (ציון אפס בתבונה מלאכותית).

ב"גוגל" יודעים את העבודה: חיפוש "ההתנתקות" באתר ynet תוך שימוש במנוע החיפוש מס' 1 בעולם מביא, כצפוי, את התוצאות הנכונות: במקום הראשון - הערך "תוכנית ההתנתקות" מתוך האנציקלופדיה של ynet; במקום השני - מוסף מיוחד של ynet תחת הכותרת "ימי התנתקות"; במקום השלישי - "ההתנתקות בכנסת". גוגל קלע למטרה בכל עשר התוצאות של העמוד הראשון.


משה קצב - האיש והחיפוש
חיפוש "משה קצב" במנוע חיפוש הכתבות הסהרורי של ynet מביא בתוצאה הראשונה את הכותרת "ליגת העל: אשדוד חזרה מווינטר עם 0:0 מול הכח". בשלב זה, כל מחפש עם גזע מוח פעיל היה מרים ידיים. לרוע מזלו, התוצאה השנייה היתה דווקא סבירה איכשהו: "משפט קצב: מה נדע על הדיונים בתיק?" (קצת ממוקד מדי במשפט ולא באיש, אבל בכיוון). התוצאה השלישית: "קצב בבית המשפט: פה זה כבר לא משפט שדה". דווקא הכתבה המתאימה ביותר ממוקמת במקום הרביעי: "הכל אודות קצב: מא' ועד א'". באופן מוזר, הרוב המוחץ של התוצאות הוא מתאריך 14/5/09.

גוגל, לעומת זאת, יודע יותר טוב מ-ynet מה צריך להציג בשלושת התוצאות הראשונות על "משה קצב": במקום הראשון - הכותרת "נשיא המדינה משה קצב יואשם באונס". במקום השני: "קצב: חבל התלייה שלי - חבל ההצלה של מזוז". במקום השלישי: "ישראל נגד משה קצב: הוגש כתב האישום". בשאר התוצאות מופיעה גם האנציקלופדיה של ynet ואף ה"וידאופדיה" של "רשת" בשיתוף ynet.


דודו טופז - אין תוצאות רלוונטיות ב-ynet
מספר ימים לאחר התפוצצות פרשת דודו טופז, עודכן פוסט זה כדי לבדוק איך ynet מחפש כתבות על טופז.
תוצאות החיפוש היו מחפירות, גם בקנה-המידה של ynet עד כה. וזאת למה?
ראשית, יש רק שש תוצאות. שנית, מנוע החיפוש הפנימי של ynet התהדר ברמת עדכניות גבוהה, אך ברור לגמרי שכל הפרשה האחרונה חמקה ממנו לגמרי (תאריך הבדיקה: 3/6/09):
1) היכן לפרסם (כתבה על פרסום באתר ynet בלי קשר לכלום)
2) הוראות קבע לחג האהבה (ועל זה אמרו ח"זל: מה לעזאזל?)
3) מציצים: הקשר הישראלי (אוי לא)
4) רועי צ'יקי ארד: עכשיו הספר (לא יאומן)
5) הסלברטיז כבר לא למכירה (מה ציפיתם?)
6) עשרים ל-CNN: זמין אבל שטוח (תוצאה שישית ואחרונה)

זה סוף תוצאות החיפוש של כתבות ynet על דודו טופז.
מסרבים להאמין? יש לנו צילום-מסך להוכיח את זה.

באופן הפוך לגמרי, התוצאות של גוגל על דודו טופז ב-ynet הן לא פחות ממושלמות:
1) השופט על דודו טופז: הוא ראש הפירמידה, היוזם
2) אחרי שעות של חקירה: דודו טופז בתא המעצר
3) שכנו של טופז הודה: הוא הזמין את התקיפות
4) אחיו של טופז לאחר ההודאה: "הוא יצא גבר-גבר"
5) נהנה מהחיים ומזריק: דודו טופז על הסוכרת שלו - בריאות
6) עורכי דין מעריכים: טופז לא יבלה שנים רבות בכלא
7) דודו טופז ביקש לקיים הדיון בהארכת מעצרו בשיחת וידיאו
8) דודו טופז הודה בחקירתו שהזמין את תקיפת בכירי התקשורת
9) תקיפת אנשי התקשורת: דודו טופז נעצר וייחקר
10) מנכ"ל קשת שהותקף על פרשת טופז: "יש הקלה" - תרבות ובידור

ועל זה נאמר: מנוע חיפוש יקר, כתוב לעצמך מכתב פיטורים, ותן לבוס שלך לחתום עליו.


מעריב - מצא את המתחרים
חיפוש המילה "מעריב" דווקא באתר ynet הוא סוג של פרובוקציה, שלא לומר - כפירה. ועדיין, התוצאות גרועות בכל קנה מידה: בתוצאה הראשונה כתבה של הסופרת יהודית שמר; בתוצאה השניה - ""התפטרו העורכים הראשיים של מעריב" (למה זה לא ראשון?). ובמקום השלישי: "עורכי מעריב התפטרו מתפקידם" (שוב, הפעם בצורת מבזק). שאר התוצאות מתחת לכל ביקורת: "תעשיית השקר: חבילת אליבי לכל נואף" (לא קשור); "קניידלך בשקית גוצ'י" (אין קשר); "למה לא לחלק קונדומים לבני נוער, למשל?" (ביקורת על מעריב לנוער - לא מה שרצינו); "פרויקט טינופת" (קשר אפסי לחיפוש); ביקורת על הספר "רוסיה של פוטין" (מה קורה פה?), והשיא: "פרס ישראל לפסל מיכה אולמן". בעל הבית השתגע, ולכן בלית ברירה נבדוק את גוגל.

גוגל, כהרגלו בקודש, הרבה יותר מדויק בחיפוש המילה "מעריב" באתר ynet: ראשית הוא מציג את ההתפטרות של עורכי מעריב מ-11 מאי 2009. שנית, הוא מספק את הערך "מעריב" מתוך אנציקלופדיית ynet. שלישית, הוא מציג ידיעה נוספת על התפטרות העורכים (חבל, אבל נסלח לאור ההמשך); רביעית, ידיעה חשובה על "ירידה במכירות ועלייה בהפסד התפעולי" של מעריב; חמישית, "קבוצת מעריב מקצצת 15% משכר העובדים". וכך שאר התוצאות, כולן רלוונטיות: מכירת הד ארצי של מעריב, בכיר במעריב שהטריד מינית, מעריב מתנצל בפני אוהדי מכבי ת"א, מעריב מציג 8 מליון שקלים הפסד תפעולי ברבעון, ועו"ד שמאיים לתבוע את מעריב.


חיפוש גוגל ב-ynet
בואו נראה כיצד חברת "קולריטי", המספקת את תוצאות חיפוש הכתבות ב-ynet, מתמודדת עם חיפוש על מנוע החיפוש הרציני ביותר כיום. כצפוי, לאור המקרים הקודמים היא נכשלת באופן מחפיר.

במקום הראשון - כתבה חדשה אך מנותקת מכל הקשר, עם הכותרת "אנשי דת באינדונזיה: לא לפלרטט ב-Facebook". במקום השני - "טמקאסט: שוורצנגר, ספרים ו-WiMax" (אכזבה, ייאוש, בזבוז של זמן). במקום השלישי: "לרגל יום הפורנו: מתקפה ב-YouTube".

עקב תקלה טכנית, הוחדרה תוצאה רלוונטית דווקא למקום הרביעי ("גרמניה מעכבת צילומי רחובות ע"י גוגל"), ולכן תוקנה השגיאה באמצעות תוצאה חמישית מופרכת ("10 אתרים לקולנוענים"), תוצאה שישית הזויה ("נשיא בר-אילן: פחד הרבנים מהאקדמיה - מנוון"), תוצאה שביעית מטורפת ("מובי דיק - הפולמוס"), תוצאה שמינית שגויה ("מנוע החיפוש Kumo של מיקרוסופט מתקרב"), תוצאה תשיעית נוראית ("Facebook עם OpenID: זהות אחת ברשת") ותוצאה עשירית בלתי נסבלת ("Wolfram Alpha חושף את משמעות החיים"). סיכום: כישלון.

חזרה לשפיות: חיפוש המילה "גוגל" ב"גוגל" תוך צמצום התוצאות לאתר ynet בלבד מגלה כי העולם חזר למסלולו התקין, ואפשר לנשום לרווחה. התוצאה הראשונה היא הכותרת "גוגל מציגה חיפוש ממוקד יותר" (כמה נכון, וכמה טראגי כאשר זה מופיע ב-ynet דווקא); התוצאה השניה "גרמניה מעכבת צילומי רחובות ע"י גוגל"; השלישית: "ארה"ב: פשרה בין גוגל להוצאות הספרים"; הרביעית: "חיפוש זה לא רק גוגל" (נכון, אבל גוגל שולט); החמישית: "מחפשים אתכם? גוגל רוצה לעזור בתוצאות"; השישית: "מנכ"ל גוגל: אמשיך לכהן בדירקטוריון אפל". וגם שאר ארבע התוצאות האחרונות בעמוד הראשון של גוגל רלוונטיות לחלוטין.


הישרדות השוואתית

חיפוש "הישרדות" במנוע החיפוש הפנימי של ynet מביא במקום הראשון כתבה רלוונטית על אריק אלפר ("אופס, הגזמתי"), אבל במקום השני מגיח במפתיע הקאמבק של אילנית (ממש כך - "הסרט של אילנית"), ובמקום השלישי כתבת כדורגל סתמית ("לשירר יש חסינות, אבל האם ניוקאסל תשרוד?"). בין שאר התוצאות הבעייתיות-מאוד של ynet אפשר לראות כתבה על הבזים האדומים בישראל ("בין הגגות: המלחמה על הבז האדום"), עוד כתבת כדורגל ("הולנד: דה חראפשחאפ העפילה לגמר הפלייאוף"), כתבה כלכלית-יזמית ("בוא עלה איתי לגג: חממת יזמות חברתית-עסקית") ואפילו כתבה על משחק מחשב (""Killing Floor - משחק זומבים מעורר אימה"). סיכום התוצאות: בזיון.

ב"גוגל", לעומת זאת, חיפוש על "הישרדות" ב-ynet מביא 9 תוצאות רלוונטיות לחלוטין ורק תוצאה אחת שאינה קשורה ("הישרדות, עזה 2009: החיים במחנה האוהלים"). בניגוד לתוצאות של ynet, גוגל הבין שמדובר בסדרת טלוויזיה, ושלף ב-90% מן המקרים את התוכן הנכון.


זה לא צירוף מקרים
כדי להגדיל את המדגם הסטטיסטי של הבדיקה, התגייסה כל מערכת "חופש החיפוש" (אני בלבד) לבדיקת איכות התוצאות, ובשורה ארוכה של חיפושים על מונחים שונים בתכלית חזרו התוצאות על עצמן: איכות נמוכה מאוד בחיפוש הכתבות הפנימי של ynet, בהשוואה לאיכות גבוהה מאוד של גוגל כאשר הוא מצומצם לאתר ynet בלבד ע"י האופרטור site:ynet.co.il ליד ביטוי החיפוש.

לא מאמינים? יש לכם כמה דקות פנויות? חפשו למשל "משרד התחבורה", "מבקר המדינה", "צהבת", "זיהום אוויר", "אריק שרון", "מלונות לונדון" ועוד.


ההפרדה ל"אתרים", "כתבות", "אנציקלופדיה", "פורומים" ו"קניות"
היו ימים שבהם הגולש טרח להפריד בין אתרים, כתבות, ערכים אנציקלופדיים, דיונים בפורומים או תכנים מסחריים של אתרי קניות. הימים הללו אמנם לא חלפו לגמרי, אבל המציאות שאותה מוביל גוגל בהחלט השתנתה. ב-ynet מבקשים מן הגולש להחליט מה הוא רוצה לקבל, כאשר בגוגל הוא כבר מקבל מגוון תוצאות שונות ממקורות שונים באופן מוגדר - גם אתרים, גם כתבות, גם ערכים אנציקלופדיים ולקסיקליים, גם דיונים חשובים בפורומים וגם תכנים מסחריים בהתאם לצורך.

על חיפוש האתרים של ynet אין מה להרחיב את הדיבור: מדובר בחיפוש מוגבל ביותר, באינדקס מיושן שלא מציע תוצאות סבירות בשפה האנגלית (אין שום תוצאות על הביטוי "history of smoking"), ואפילו לא בעברית (חיפוש המילה "פייסבוק" מביא תוצאה אחת בלבד - רחוק מלהשביע את הסקרנות). חיפוש באנציקלופדיה של ynet הוא מבוי סתום - כדי לצפות בערך המלא, יש לקנות מנוי (ויקיפדיה עדיין בחינם, יש לציין). החיפוש בפורומים של ynet איטי מאוד ("אנא המתן", מודיעים למחפש), ותוצאות החיפוש מוצגות בצורה מרושלת: בלי הופעה של מילת המפתח בתקציר, ובלי קריטריונים של איכות מלבד תאריך הופעת ההודעה.

אין הסבר אמיתי לשאלה מדוע בחר אתר מוצלח כמו ynet להקשות על ישראלים כה רבים את החיים, בעזרת חיפוש פנימי גרוע בתכנים האיכותיים שלו, חיפוש אתרים נכה, חיפוש קהילתי חלש, חיפוש אנציקלופדי חסר-תוחלת וחיפוש קניות שנמצא ב"גטו" משלו.


אז מה עושים?
הפתרון למצב המייאש
שנמצא בו ynet כיום, מבחינת החיפוש הפנימי באתר, הוא איחוד של כל תוצאות החיפוש לעמוד אחד ויחיד: במרכז עמוד התוצאות - חיפוש רלוונטי בתכנים של ynet בעזרת שימוש ב"גוגל" (תוך הצגת פרסומות של גוגל, או בעזרת מודל שיווקי אחר); מיד אחר כך - אתרים רלוונטיים ברשת רק בתור אופציה מוגבלת (בשביל לעשות חיפוש ברשת לא צריך את ynet, במיוחד לא בעולם שנשלט ע"י גוגל); שילוב ערכים אנציקלופדיים של ynet בצורה סמלית ומצומצמת בלבד (כי זה בתשלום); ולסיום - תוצאות חיפוש קהילתיות ומסחריות במינון נמוך, ורק כאשר הן מועילות באמת לגולש (סינון חכם שידרוש עבודה רצינית מצד כל הצדדים המתכננים).

התימחור של גוגל, בכל מה שנוגע לחיפוש פנימי באתרים וללא פרסומות (Google Site Search) מדבר על 2,000 דולר לשנה עבור אתר בגודל 100,00 עמודים או פחות. אתרים גדולים יותר מקבלים הצעות מחיר אישיות על בסיס פניה אישית לצוות המכירות הבינ"ל של גוגל. מכיוון ש-ynet הוא אתר תוכן ענק בהיקף של כ-10 מליון דפים, ויש לו חשיבות אסטרטגית עבור "גוגל ישראל", המחיר ש-ynet יצטרך לשלם לא חייב להיות גדול מדי.



[עודכן שוב ב-3/6/09 בעקבות פרשת דודו טופז]

12.5.2009

בדיקת אמת בפרסום בעזרת מנועי חיפוש

בדיקה זריזה באמצעות שלושה מנועי חיפוש (144, גוגל ו-TinEye) מאפשרת להפריך קמפיין פרסום פיננסי באינטרנט תוך דקות ספורות - תופעה שתאגידים חייבים להפנים כדי לשרוד בעידן חופש החיפוש

במהלך גלישה ב"וואלה חדשות", אחד מן האתרים הפופולריים ביותר בארץ, ניתן להיתקל בקמפיין לחברת מסחר במט"ח המציג שלושה גברים מרשימים-למראה: רובי ליבנה (31) מנתניה; אוריאל גנות (42) ממודיעין; הראל גפן (54) מבנימינה. הקמפיין נשען על הדמויות המחייכות הללו, בשלושה עשורים מובחנים-היטב, ומשלושה יישובים באיזורים שונים (הצפון, המרכז ואיזור י-ם) כדי להעביר את המסר "כך הרווחתי מעליית הדולר".

כאן נכנסים לתמונה שלושה מנועי חיפוש פשוטים: 144 לחיפוש מספרי טלפון, גוגל לחיפוש שמות, ומנוע נוסף (TinEye) לאיתור תמונות. השתמשנו גם בפייסבוק, אבל רק בסוף התהליך.

בדיקה קצרה מעלה כי אין בישראל אנשים כאלו. ואם הם אכן קיימים, אין להם מספר טלפון כלשהו, סלולרי או נייח - ואין להם כל נוכחות ברשת, אפילו לא מינימלית. כמו כן, הם מעולם לא הזדהו בשמם באף אתר, פורום, בלוג או זירה פיננסית כלשהי - ולכן הקמפיין הפרסומי הוא למעשה "טבילת האש" הציבורית הראשונה שלהם בישראל. כמו כן גילינו כי תמונתו של לפחות אחד מהם - מזויפת ("תמונת סטוק" בז'רגון העיתונות והפרסום).

כך זה נראה בקמפיין:

לפי אתר 144 (בכתובת b144.co.il) אין "אוריאל גנות" באף מקום בארץ, בוודאי לא בעיר מודיעין.
לא רק בזק, הוט, סלקום, אורנג', פלאפון או מירס - גם "גוגל" לא שמע עליו מעולם:

אולי זה סתם מקרה.
בואו ננסה את השני ברשימה, מר "רובי ליבנה" מן העיר נתניה.


רובי ליבנה הצעיר (31) נראה כמו משקיע רציני, חטוב ומטופח. אבל גם הוא נעדר לחלוטין מרשימת האנשים של 144, לא רק בנתניה הקטנה אלא בכל רחבי מדינת ישראל. ניסינו גם "ראובן ליבנה", אבל אין אחד כזה בנתניה. ניסינו גם "רובי לבנה" או "ראובן לבנה", ואין מושיע. כך שמר ליבנה כנראה לא משתמש במכשיר טלפון, או נזהר במגע עם הציבור הרחב, שלא לומר ציבור המשקיעים.
גם ב"גוגל" לא התגלו עקבותיו הדיגיטליים של מר ליבנה המוצלח:


איפה
מצאנו את התמונה של "רובי ליבנה"
טיפ שקיבלנו מאחד הקוראים הוביל למנוע חיפוש תמונות מיוחד ושמו TinEye המאפשר לערוך "חיפוש הפוך" ברשת - מעלים תמונה כלשהי לאתר והמנוע מאתר אותה ברשת על ידי השוואת מאפיינים דומים. כך, על ידי העלאת פניו הנאים של "רובי ליבנה", ניתן היה למצוא את התמונה "איש עסקים שמח" באתר אייסטוק-פוטו מוכנה למכירה, עבור כל מפרסם. ובמילים פשוטות: "רובי ליבנה" הוא תמונה קנויה של דוגמן פרסום בחו"ל.

תמונתו של מר "רובי ליבנה"
למכירה בדף מתוך אתר iStockPhoto המשמש פרסומאים


סיכום ביניים:
עד כה לא הצלחנו למצוא 2 מתוך 3 המשתתפים בקמפיין,
וגילינו שתמונתו של אחד מהם - מזויפת בוודאות מוחלטת.

עכשיו הגיע תורו של בכיר המשקיעים, מר הראל גפן, בן 54 מן העיר בנימינה.


התוצאה: אין "הראל גפן" באתר 144. אפילו לא אחד, באף יישוב ישראלי.
אפשר היה לצפות מאדם בן 54, שצבר קילומטרז' כלשהו בציבוריות הישראלית, שלפחות יחזיק מכשיר טלפון אחד לרפואה, או לפחות פקס. במיוחד כאשר הוא "בוחן הצעות להשקעה" על בסיס קבוע.
כמצופה, המשתתף השלישי בקמפיין גם לא הטביע את חותמו המינימלי באינטרנט, כי גוגל לא מכיר אותו:

ב-4 התוצאות של גוגל על החיפוש "הראל גפן" לא מופיע אדם העונה לשם זה.

ליתר ביטחון, ביצעתי חיפוש על שלושת ה"אישים" הללו באתר פייסבוק. אין זכר לאף אחד מהם - לא באנגלית, וגם לא בעברית. על חיפוש שמות ב"פייסבוק" כבר דיברנו כאן בעבר.

אז מה הסיכוי ש-3 מתוך 3 משתתפים בקמפיין הם אנשים ש-144, גוגל או פייסבוק לא שמעו עליהם? קרוב מאוד לאפס, במיוחד אם מדובר באנשי עסקים רציניים, בגילאים 40-50 לחייהם.

ב-23 לאוגוסט הבחנתי כי התווסף כיתוב "אותיות קטנות" בתחתית הפרסום, בזו הלשון:
"העדויות בפרסום זה מבוססות על סיפורים אמיתיים של לקוחות XXXXX [שם המפרסם נמחק כדי למנוע פרסומת בחינם; א.ב.] , כדי לשמור על חיסיון הלקוחות ולהגן על מידע מסחרי, שונו שמות הלקוחות והפרטים המזהים שלהם".

במילים אחרות - לפניכם "סיפורים אמיתיים" של אנשים מפוברקים, ואפילו המפרסם עצמו מודה בכך. ומי יאמין כי הסיפורים אמיתיים, אם האנשים עצמם מפוברקים (כולל התמונות)?

כדי להוסיף נוק-אאוט לסיום, הנה עוד כיתוב "אותיות קטנות" שלמעשה אומר הכל: "מסחר ממונף בשווקים פיננסים כרוך בנטילת סיכונים משמעותיים ועלול להוביל לאובדן ההשקעה". במילים אחרות: אנחנו מוכרים לכם סיפורים של אנשים מפוברקים בתחום שבו אנשים מפסידים את כל כספם, רק מכיוון שהם מאמינים לסיפורים של אנשים מפוברקים, עם תמונות מפוברקות, מיקומים גיאוגרפיים מפוברקים ובלי גילוי נאות ("אותיות קטנות" אינן גילוי נאות).


מוסר ההשכל


1) מנועי חיפוש יכולים לגלות אם מנסים לעבוד עליכם באמצעות זהות בדויה ותמונה מזויפת.
2) אמת בפרסום היא תופעה נדירה, אבל כיום קל הרבה יותר לגלות עד כמה היא נדירה.
3) קמפיין שניתן להפריכו בקלות הוא קמפיין מסוכן - ולצרכנים יש כלי-הפרכה חזקים מאי-פעם.
4) אם הראל גפן, אוריאל גנות או רובי ליבנה אכן חיים ונושמים - נשמח לשמוע מהם או מנציגיהם עלי-אדמות.


רבותי, ההיסטוריה חוזרת
כמה חודשים לאחר פרסום פוסט זה, התגלה מקרה כמעט-זהה של חשיפת אי-אמת בפרסום:

כל הזכויות שמורות לבלוג חופש החיפוש 2007-2012