גוגל רוצה לסרוק מספרי טלפון מ"דפי זהב"; לגוגל לא איכפת אם אף אחד לא ייכנס לאתר דפי זהב; מה עושה דפי זהב בתגובה? מסתירה ממנו את מספרי הטלפון של לקוחותיה; מה זה אומר עלינו ועל מנועי חיפוש?
חיפשתם מספר טלפון של עסק באינטרנט. תוצאת החיפוש הראשונה הגיעה מ"דפי זהב". אתם כבר רגילים לכך שמנועי חיפוש כמו גוגל מציגים כבר בדף תוצאות החיפוש את תקציר התוכן הרלוונטי (באנגלית: "סניפט" - Snippet) מן הדף. במקרה הזה, אתם רק רוצים את מספר הטלפון. "דפי זהב" יודעים את זה, ומסתירים מכל תוכנת סריקה והעתקה, כולל "גוגל", את המספר.
איך זה נעשה? במקרה של "דפי זהב", הם משתמשים בפונקציה שנכתבה בשפת "פרל" (Perl) שלוקחת מספר טלפון מתוך מאגר נתונים, וממירה אותו לקובץ גרפי מסוג "גיף" (gif). התוצאה היא מספר טלפון שהוא למעשה תמונה, שאותה גוגל מתקשה לקרוא - נכון ל-2009. וככה זה נראה:
בתמונה: הרשומה של העסק "דפי זהב" באתר d.co.il
שימו לב: שני מספרי הטלפון אינם טקסט, אלא תמונה
(03-7532222, 1-800-200400)
לא רק גוגל מעתיקן
מלבד גוגל, יש להרבה גורמים "טפיליים" אינטרס לסרוק, "לקצור" ולהעתיק את מאגר הנתונים העסקי הזה. ספאמרים שרוצים למכור שמות ומספרי טלפון, גורמים שיווקיים ועסקיים שרוצים לעשות כסף מבתי עסק - כולם רודפים אחרי הנתונים של "דפי זהב"; קשה לסווג את גוגל בתור טפיל דיגיטילי קלאסי, או "הרווסטר" (Harvester), אבל הוא יעשה את כל המאמצים כדי לקחת לעצמו את כל המידע החיוני באינטרנט.
גוגל שונא כשמסתירים ממנו מידע. הוא מבהיר לבעלי אתרים שצריך להשתמש בטקסט ולא בתמונה כדי להציג תוכן חשוב. מצד שני, דפי זהב שונאים את זה כאשר גוגל "מצטט" את מספרי הטלפון של העסקים הרשומים באתר שלהם, ומונע מן הגולשים להקליק פנימה אל התוכן והפרסומות המקיפות אותו. למה ש"דפי זהב" יהיו העבדים של גוגל? אחרי הכל, הקליק מגיע להם ביושר - הם אלו שהשיגו את המידע. גוגל רק "רוכב" על העבודה שלהם.
גוגל יודע שהוא צריך אתרים כמו "דפי זהב" כדי לשרת את הלקוחות והמפרסמים שלו. במקרה של "דפי זהב", מדובר באתר ענק שמתוכו גוגל סרק לפחות 14 מליון (!) דפים שונים. מנוע החיפוש הפופולרי צריך את הנתונים של מדריך העסקים כמו חמצן למוח, וגם ההיפך נכון לגמרי - "דפי זהב" מקבלים המון תנועה חשובה מ"גוגל", כי יותר קל לחפש ב"גוגל" שאליו אנחנו רגילים, מאשר לחפש בתוך "דפי זהב", אתר פחות נגיש ומהיר.
אבל אם כבר להסתיר את הטלפון, למה לא להסתיר גם את הפקס?
בתמונה שלעיל אפשר להבחין (אם מביטים היטב) שהגופן של מספרי הטלפון והפקס קצת שונה. זה בגלל שהפקס נותר טקסט, בעוד מספר הטלפון הפך תמונה. ההגיון של דפי זהב ברור בכל מה שנוגע למספר הטלפון (להסתיר כדי שהגולשים יקליקו וייכנסו לאתר). אבל למה לא להסתיר גם את הפקס?
בואו נסתיר הכל
מן הסתם, חלק ניכר מן הגולשים ירצה לדעת מה מספר הפקס של העסק. כדאי להחביא גם מהם את השדה הזה, ולהכריח אותם להקליק פנימה (בואו לבקר!). רק רגע - ומה עם הכתובת? גוגל לא צריך לחשוף את הכתובת של העסק בפני הגולשים התמימים, ובכך לשדוד את הקליק מ"דפי זהב" המסכנים. לפי אותו הגיון אנוכי, "דפי זהב" יעשו בשכל אם יהפכו לתמונה את כל שדות הנתונים האפשריים, כולל המיקוד, כתובת האתר וכתובת הדוא"ל.
ל"דפי זהב" יש אינטרס נוסף להסתיר את מספר הטלפון האמיתי של בתי העסק: היא רוצה להרוויח כסף על כל שיחה בעזרת הצגת מספר 'מירס' (057) שמזרים לה הכנסות על חשבון המתקשרים, וגם מאפשר לה לבצע בקרה מדויקת על כמות השיחות הנכנסות דרך האתר. תחקיר TheMarker חשף את התרגיל, שחוקיותו מוטלת בספק.
ניגוד האינטרסים בין דפי זהב לגוגל ברור יותר בשלב הזה. אם דפי זהב ימשיכו לחסום יותר ויותר שדות נתונים בפני האתר החזק והמשפיע ביותר באינטרנט - גוגל יתחיל לחשוב שאין שם מידע חשוב, ויוריד אותם למיקום נמוך יותר בתוצאות החיפוש שלו. זוהי לא תוצאה רצויה בעיני "דפי זהב", ולכן היא נזהרת מאוד במשחק המסוכן שהיא נכנסה אליו, בלית-ברירה - כדי לשרוד בענף ולהרוויח כסף.
נכון לעכשיו, המילה "טלפון" מופיעה בכל עמוד עסק של דפי זהב, וגוגל יודע שלא רחוק משם (בשדה הפקס) מופיע משהו שנראה ממש כמו מספר טלפון אמיתי. כך שבמצב הנוכחי, דפי זהב מצליחים "להתל" (בתום-לב, כמובן) בגוגל שיחשוב כי הפקס הוא מספר הטלפון המבוקש. חבל שגוגל הביא את דפי זהב למצב שבו הם צריכים להתל בו כך.
אבל המשחק לא נגמר כאן. אם הגולש מחפש את הטלפון של עסק כלשהו, ובתוצאות החיפוש של גוגל מופיעה המילה "טלפון" כשלצידה מספר כלשהו (במקרה הזה - רק פקס) - האם היא לא מטעה את הגולש? הרי משתמשי גוגל לא יקליקו פנימה אל אתר דפי זהב; הם יסתפקו במספר המופיע בתוצאות החיפוש - וישמעו צפצוף ארוך ומעצבן. אז האם דפי זהב הרוויחה או לא?
בתגובה לפוסט זה, צוין בצדק שאנשים עם מוגבלויות (עיוורים וכד') סובלים מן ההחלטה להפוך את מספרי הטלפון של דפי זהב לתמונות. מבחינתם, דפי זהב מתעלמת מקיומם של החלשים ביותר - אלו שאין להם חלופה נגישה אחרת. אם "דפי זהב" היה אתר ממשלתי, היה אפשר לתבוע אותו על אפליה אסורה. עמותות כמו "נגישות ישראל" נלחמות בהחלטות שנויות-במחלוקת כמו זו של דפי זהב, ולעתים מנצחות במאבקיהן.
גם בזק עושים את זה ב-144
לא רק דפי זהב מסתירה טלפונים: גם אתר 144 של בזק משתמש באותה טכניקה של הגנה-עצמית, אלא שהוא דורש לחיצה על כל מספר כדי לקבל את התמונה שלו. עד לפני כמה חודשים, הלחיצה היתה מניבה מספר טלפון טקסטואלי, אך כעת גם הוא (כמו בדפי זהב) הפך לקובץ תמונה.
במילים פשוטות - אם מנסים לסמן את מספר הטלפון באתר 144 עם העכבר ולהעתיקו למקום אחר, הדבר בלתי אפשרי מבחינה טכנית. רק חבל שבכך "בזק" למעשה אומרים לעיוורים בישראל: לא תוכלו לקרוא את מספרי הטלפון של חברת התקשורת הלאומית, משיקולים עסקיים צרים שלנו.
כדי להתגונן מפני גורמים "עוינים" הלוחצים על מספר גדול של מספרי טלפון, משתמש אתר 144 של בזק במנגנון אבטחה המכונה קפצ'ה (Captcha) כדי למנוע מגורמים חיצוניים להעתיק את מספרי הטלפון היקרים-מפז שלו. יש להקיש קוד המשלב מספרים ואותיות כדי לחסום משתמשים עיוורים - גם אם הם בני-אדם; ואין חלופה עבור מוגבלים.
לכן, כאשר לוחצים על מספרי טלפון רבים ב-144, קופץ חלון עם ההערה הבאה: "חלונית זו נועדה למנוע שימוש בכל רובוט, תולעת, מנוע אחזור וחיפוש מידע, או כל כלי אוטומטי או ידני אחר אשר מתוכנן לאנדקס, לאחזר ולאתר מידע באתר". במילים אחרות: בזק אומרת לגוגל שהוא לא יוכל לקבל את מספרי הטלפון של תושבי ישראל.
יום יבוא - גוגל יפקח עיניים
יום אחד גוגל יוכל לקרוא תמונות טקסט כאלו בלי שום בעיה, ואז הוא יעקוף את הטריק של דפי זהב. בינתיים הוא מתנהג יפה ומעמיד פנים שהוא עיוור (זה נכון, חלקית). זה לא יכול להימשך לנצח, מבחינתו של גוגל - הוא חייב לדעת מה קורה בכל דף ברשת, אחרת הוא הופך משותק בכל איברי גופו, כאשר מסביבו חבורת אצנים אולימפיים, המכשילים אותו בכל הזדמנות אפשרית.
השאלה היא: האם מותר לגוגל לקחת תמונה, שמראש לא אמורה להיות טקסט חי ונושם, ולהמיר אותה לפי שיקול דעתו הבלעדי? האם מותר לגוגל "לגנוב תנועה" מאתרים -- שרק מנסים לענות על שאילתות של גולשים ולהעניק להם שירות תמורת תנועה/פרסום -- רק בגלל שהוא מונופול חיפוש דורסני?
גוגל צריך לדעת למצוא את האיזון המדויק בין השירות שהוא אמור להעניק לגולשים, ובין הגבול שבעלי אתרים מוכנים לתת לו. אבל ריקוד הטנגו של החשיפה וההסתרה בין שני הצדדים יימשך במלוא העוז גם בעתיד.
[פורסם גם ב-TheMarker IT, באישור הכותב]
חיפשתם מספר טלפון של עסק באינטרנט. תוצאת החיפוש הראשונה הגיעה מ"דפי זהב". אתם כבר רגילים לכך שמנועי חיפוש כמו גוגל מציגים כבר בדף תוצאות החיפוש את תקציר התוכן הרלוונטי (באנגלית: "סניפט" - Snippet) מן הדף. במקרה הזה, אתם רק רוצים את מספר הטלפון. "דפי זהב" יודעים את זה, ומסתירים מכל תוכנת סריקה והעתקה, כולל "גוגל", את המספר.
איך זה נעשה? במקרה של "דפי זהב", הם משתמשים בפונקציה שנכתבה בשפת "פרל" (Perl) שלוקחת מספר טלפון מתוך מאגר נתונים, וממירה אותו לקובץ גרפי מסוג "גיף" (gif). התוצאה היא מספר טלפון שהוא למעשה תמונה, שאותה גוגל מתקשה לקרוא - נכון ל-2009. וככה זה נראה:
בתמונה: הרשומה של העסק "דפי זהב" באתר d.co.il
שימו לב: שני מספרי הטלפון אינם טקסט, אלא תמונה
(03-7532222, 1-800-200400)
לא רק גוגל מעתיקן
מלבד גוגל, יש להרבה גורמים "טפיליים" אינטרס לסרוק, "לקצור" ולהעתיק את מאגר הנתונים העסקי הזה. ספאמרים שרוצים למכור שמות ומספרי טלפון, גורמים שיווקיים ועסקיים שרוצים לעשות כסף מבתי עסק - כולם רודפים אחרי הנתונים של "דפי זהב"; קשה לסווג את גוגל בתור טפיל דיגיטילי קלאסי, או "הרווסטר" (Harvester), אבל הוא יעשה את כל המאמצים כדי לקחת לעצמו את כל המידע החיוני באינטרנט.
גוגל שונא כשמסתירים ממנו מידע. הוא מבהיר לבעלי אתרים שצריך להשתמש בטקסט ולא בתמונה כדי להציג תוכן חשוב. מצד שני, דפי זהב שונאים את זה כאשר גוגל "מצטט" את מספרי הטלפון של העסקים הרשומים באתר שלהם, ומונע מן הגולשים להקליק פנימה אל התוכן והפרסומות המקיפות אותו. למה ש"דפי זהב" יהיו העבדים של גוגל? אחרי הכל, הקליק מגיע להם ביושר - הם אלו שהשיגו את המידע. גוגל רק "רוכב" על העבודה שלהם.
גוגל יודע שהוא צריך אתרים כמו "דפי זהב" כדי לשרת את הלקוחות והמפרסמים שלו. במקרה של "דפי זהב", מדובר באתר ענק שמתוכו גוגל סרק לפחות 14 מליון (!) דפים שונים. מנוע החיפוש הפופולרי צריך את הנתונים של מדריך העסקים כמו חמצן למוח, וגם ההיפך נכון לגמרי - "דפי זהב" מקבלים המון תנועה חשובה מ"גוגל", כי יותר קל לחפש ב"גוגל" שאליו אנחנו רגילים, מאשר לחפש בתוך "דפי זהב", אתר פחות נגיש ומהיר.
אבל אם כבר להסתיר את הטלפון, למה לא להסתיר גם את הפקס?
בתמונה שלעיל אפשר להבחין (אם מביטים היטב) שהגופן של מספרי הטלפון והפקס קצת שונה. זה בגלל שהפקס נותר טקסט, בעוד מספר הטלפון הפך תמונה. ההגיון של דפי זהב ברור בכל מה שנוגע למספר הטלפון (להסתיר כדי שהגולשים יקליקו וייכנסו לאתר). אבל למה לא להסתיר גם את הפקס?
בואו נסתיר הכל
מן הסתם, חלק ניכר מן הגולשים ירצה לדעת מה מספר הפקס של העסק. כדאי להחביא גם מהם את השדה הזה, ולהכריח אותם להקליק פנימה (בואו לבקר!). רק רגע - ומה עם הכתובת? גוגל לא צריך לחשוף את הכתובת של העסק בפני הגולשים התמימים, ובכך לשדוד את הקליק מ"דפי זהב" המסכנים. לפי אותו הגיון אנוכי, "דפי זהב" יעשו בשכל אם יהפכו לתמונה את כל שדות הנתונים האפשריים, כולל המיקוד, כתובת האתר וכתובת הדוא"ל.
ל"דפי זהב" יש אינטרס נוסף להסתיר את מספר הטלפון האמיתי של בתי העסק: היא רוצה להרוויח כסף על כל שיחה בעזרת הצגת מספר 'מירס' (057) שמזרים לה הכנסות על חשבון המתקשרים, וגם מאפשר לה לבצע בקרה מדויקת על כמות השיחות הנכנסות דרך האתר. תחקיר TheMarker חשף את התרגיל, שחוקיותו מוטלת בספק.
ניגוד האינטרסים בין דפי זהב לגוגל ברור יותר בשלב הזה. אם דפי זהב ימשיכו לחסום יותר ויותר שדות נתונים בפני האתר החזק והמשפיע ביותר באינטרנט - גוגל יתחיל לחשוב שאין שם מידע חשוב, ויוריד אותם למיקום נמוך יותר בתוצאות החיפוש שלו. זוהי לא תוצאה רצויה בעיני "דפי זהב", ולכן היא נזהרת מאוד במשחק המסוכן שהיא נכנסה אליו, בלית-ברירה - כדי לשרוד בענף ולהרוויח כסף.
נכון לעכשיו, המילה "טלפון" מופיעה בכל עמוד עסק של דפי זהב, וגוגל יודע שלא רחוק משם (בשדה הפקס) מופיע משהו שנראה ממש כמו מספר טלפון אמיתי. כך שבמצב הנוכחי, דפי זהב מצליחים "להתל" (בתום-לב, כמובן) בגוגל שיחשוב כי הפקס הוא מספר הטלפון המבוקש. חבל שגוגל הביא את דפי זהב למצב שבו הם צריכים להתל בו כך.
אבל המשחק לא נגמר כאן. אם הגולש מחפש את הטלפון של עסק כלשהו, ובתוצאות החיפוש של גוגל מופיעה המילה "טלפון" כשלצידה מספר כלשהו (במקרה הזה - רק פקס) - האם היא לא מטעה את הגולש? הרי משתמשי גוגל לא יקליקו פנימה אל אתר דפי זהב; הם יסתפקו במספר המופיע בתוצאות החיפוש - וישמעו צפצוף ארוך ומעצבן. אז האם דפי זהב הרוויחה או לא?
בתגובה לפוסט זה, צוין בצדק שאנשים עם מוגבלויות (עיוורים וכד') סובלים מן ההחלטה להפוך את מספרי הטלפון של דפי זהב לתמונות. מבחינתם, דפי זהב מתעלמת מקיומם של החלשים ביותר - אלו שאין להם חלופה נגישה אחרת. אם "דפי זהב" היה אתר ממשלתי, היה אפשר לתבוע אותו על אפליה אסורה. עמותות כמו "נגישות ישראל" נלחמות בהחלטות שנויות-במחלוקת כמו זו של דפי זהב, ולעתים מנצחות במאבקיהן.
גם בזק עושים את זה ב-144
לא רק דפי זהב מסתירה טלפונים: גם אתר 144 של בזק משתמש באותה טכניקה של הגנה-עצמית, אלא שהוא דורש לחיצה על כל מספר כדי לקבל את התמונה שלו. עד לפני כמה חודשים, הלחיצה היתה מניבה מספר טלפון טקסטואלי, אך כעת גם הוא (כמו בדפי זהב) הפך לקובץ תמונה.
במילים פשוטות - אם מנסים לסמן את מספר הטלפון באתר 144 עם העכבר ולהעתיקו למקום אחר, הדבר בלתי אפשרי מבחינה טכנית. רק חבל שבכך "בזק" למעשה אומרים לעיוורים בישראל: לא תוכלו לקרוא את מספרי הטלפון של חברת התקשורת הלאומית, משיקולים עסקיים צרים שלנו.
כדי להתגונן מפני גורמים "עוינים" הלוחצים על מספר גדול של מספרי טלפון, משתמש אתר 144 של בזק במנגנון אבטחה המכונה קפצ'ה (Captcha) כדי למנוע מגורמים חיצוניים להעתיק את מספרי הטלפון היקרים-מפז שלו. יש להקיש קוד המשלב מספרים ואותיות כדי לחסום משתמשים עיוורים - גם אם הם בני-אדם; ואין חלופה עבור מוגבלים.
לכן, כאשר לוחצים על מספרי טלפון רבים ב-144, קופץ חלון עם ההערה הבאה: "חלונית זו נועדה למנוע שימוש בכל רובוט, תולעת, מנוע אחזור וחיפוש מידע, או כל כלי אוטומטי או ידני אחר אשר מתוכנן לאנדקס, לאחזר ולאתר מידע באתר". במילים אחרות: בזק אומרת לגוגל שהוא לא יוכל לקבל את מספרי הטלפון של תושבי ישראל.
יום יבוא - גוגל יפקח עיניים
יום אחד גוגל יוכל לקרוא תמונות טקסט כאלו בלי שום בעיה, ואז הוא יעקוף את הטריק של דפי זהב. בינתיים הוא מתנהג יפה ומעמיד פנים שהוא עיוור (זה נכון, חלקית). זה לא יכול להימשך לנצח, מבחינתו של גוגל - הוא חייב לדעת מה קורה בכל דף ברשת, אחרת הוא הופך משותק בכל איברי גופו, כאשר מסביבו חבורת אצנים אולימפיים, המכשילים אותו בכל הזדמנות אפשרית.
השאלה היא: האם מותר לגוגל לקחת תמונה, שמראש לא אמורה להיות טקסט חי ונושם, ולהמיר אותה לפי שיקול דעתו הבלעדי? האם מותר לגוגל "לגנוב תנועה" מאתרים -- שרק מנסים לענות על שאילתות של גולשים ולהעניק להם שירות תמורת תנועה/פרסום -- רק בגלל שהוא מונופול חיפוש דורסני?
גוגל צריך לדעת למצוא את האיזון המדויק בין השירות שהוא אמור להעניק לגולשים, ובין הגבול שבעלי אתרים מוכנים לתת לו. אבל ריקוד הטנגו של החשיפה וההסתרה בין שני הצדדים יימשך במלוא העוז גם בעתיד.
[פורסם גם ב-TheMarker IT, באישור הכותב]
5 תגובות:
ואפרופו עיוורים, שיטות נגד קציר של מספרי טלפון (לאו דווקא על ידי גוגל), גם שמופעלות על ידי אתר 144 , מאוד פוגעות בכל מי שמשתמש בתוכנות נגישות לעיוורים (תוכנות שמקריאות את המסך), כי הן לא יכולות לקרוא קבצי gif. כלומר, המדיניות של דפי זהב וכו' פוגעת גם בבעלי מוגבלויות שלא יכולים אחרת (ולא ראיתי שם אפשרות שהמכונה תקריא את המספר בקול, כמו שיש במקרא של CAPTCHA
לא בטוח שזה נגד גוגל. יכול להיות שזה נגד כל מיני offline readers שיכולים לסרוק את כל האתר של דפי זהב בשביל ליצור העתק של כל הDB של דפי זהב ולהשתמש בו או להפיץ אותו.
ממש לא בטוח שזה נגד גוגל. לפני כמה חודשים דווקא דפי זהב לקחו נתונים רבים מאתר 144, דבר שהוליד תביעה (שנדחתה). סביר להניח שדפי זהב, על מנת להתגונן מתרגיל דומה, הכניסו את המנגנון הזה לאתר שלהם.
לפי דעתי מדובר בעוול ובטיפשות שרק מנכ"לים של חברות כאלו מסוגלים להם. גם אם נתעלם מהפגיעה החמורה בשימושיות, הרי זו גם פגיעה חמורה בבעל העסק שדפי זהב הוסיפו עוד קליק מיותר בינו לבין בין הלקוח הפוטנציאלי שרוצה את הטלפון שלו. במקום להחצין את העובדה שבתוצאות המקוצרות של דפי זהב יש את הטלפון של בית העסק - דבר מבורך מבחינה שיווקית, מחליטים ללכת שם נגד הלקוח. דבר שמאד מאד מאפיין את ההבנה המוגבלת והחלקית של מנכ"לים של חברות גדולות בטכנולוגיה. ואולי זו הסיבה העיקרית שחברות כאלו לרוב לא מצליחות לספק שירות ראוי ללקוחות שלהן.
אגב, קל מאד לעשות harvest של הטלפון גם עם המנגנון הפרימיטיבי הזה. אם יהיה לי זמן בעתיד הקרוב, אני גם אסביר כיצד לעקוף אותו בקלות יתרה. דווקא בגלל הפגיעה בבעלי מוגבלויות.
קודם כל רשומה מרתקת וגם למדתי מהתגובות. סליחה על הסטיה מהנושא, אבל האם מה שכתבת אומר שאתרי פלאש גם הם פוגעים באנשים עם מוגבלויות?
בתגובה לשאלה:
"סליחה על הסטיה מהנושא, אבל האם מה שכתבת אומר שאתרי פלאש גם הם פוגעים באנשים עם מוגבלויות?"
התשובה שלי:
כן, בהחלט - אתרי פלאש הם פשע כנגד האנושות המוגבלת, ומייסדי "מקרומדיה" יעמדו לדין בבית המשפט לנגישות בינלאומית בעיר האג.
וברצינות: אתרי פלאש הם הדבר הכי לא-נגיש שיש.
הוסף רשומת תגובה