26.12.2007

תוכן מועתק: מנועי חיפוש שונאים אותו - וגם יודעים להעניש


הרבה בעלי אתרים בישראל (וברחבי העולם) נוהגים להעתיק תכנים ממקורות אחרים כדי למשוך גולשים וכדי להתמקם גבוה במנועי חיפוש. זו, לכאורה, הדרך המהירה והנוחה ליצור אתר מלא בתוכן, למכור פרסום (באנרים, אדסנס וכו'). אז איפה כאן הבעיה?

אז זהו - שמנועי החיפוש למדו את הטריק הזה, ופיתחו שיטות מתוחכמות כדי לעלות עליו.

תוכן מועתק, בעיני מנועי חיפוש, הוא תוכן מיותר. אפשר לקרוא לו "עודף תוכן", ויש לו נטיה לפגוע באיכות תוצאות החיפוש בצורה מובהקת. גולשים שונאים להיתקל באותו תוכן כאשר הם מחפשים מגוון אתרים שונים באותו נושא.


מילת המפתח כאן היא Redundancy ("עודפות" או "יתירות"). מחשבים מזהים נתונים זהים בקלות רבה, ויודעים לטפל בתופעות כאלו במהירות מפחידה. תוכנות הכיווץ שאנחנו מכירים (ZIP או RAR) הם כלים שיודעים לזהות חזרה מיותרת על נתונים, לתייג כל נתון חוזר כ"מספר", וכך הם עוזרים להקטין באופן משמעותי את גודל הקובץ.


מבחינת בעלי אתרים ברשת, חשוב להדגיש כמה נקודות מרכזיות:

  • אל תעתיקו תכנים המופיעים באתרים מרכזיים וחשובים - המוניטין שלהם יביא את מנועי החיפוש להבין שהם המקוריים, ולא אתם.

  • אל תחשבו מראש שתכנים מועתקים, תהיה איכותם גבוהה ככל שתהייה, יביאו אתכם לתוצאות טובות במנועי החיפוש - אם מנוע החיפוש איתר את המקור המוסמך, לא תוכלו לעקוף אותו.

  • תכנים בלתי-נגישים שהועתקו מאתרים שלא נסרקו על ידי מנועי חיפוש, אינם מועתקים בעיני מנועי החיפוש; לכן ומבחינתם, התוכן שהעתקם הוא מקורי לגמרי (ייתכן שבעל האתר שממנו העתקתם יחשוב אחרת ויתבע אתכם).

  • אם נגזר עליכם להשתמש בתוכן מועתק מעצם טבעו (תיאור מוצר, למשל), נסו לערוך שיכתוב שיטחי כדי לגרום למנועי החיפוש להבין שמדובר בטקסט שונה.

  • אם אותם עמודים מקבלים כתובת שונה (מכל סיבה שהיא, כולל פרמטרים דינמיים), נסו להימנע ממצב זה על ידי ביטול כל מרכיב בכתובת העמוד שיכול ליצור כפילות מיותרת.

  • אל תשתמשו באותם תכנים בשביל אתרי-מראה, אתרים מקבילים, אתרים של שותפים, אתרים של רשתות-מפיצים, ו/או אתרים מסונפים (אלא אם כן חסמתם את כל השיכפולים בפני ה"רובוטס" של מנועי החיפוש).
  • סינדיקציה: אם אתם מפיצים תכנים לאתרים רבים, יש לקחת בחשבון שמנועי החיפוש עלולים לחשוב שהאתר שלכם הוא זה שהעתיק מן השאר, ולא להיפך (לא נורא, העיקר שמקשרים אליכם - קישורים חיצוניים הם זהב טהור); יש להתעקש על מודל "תוכן תמורת לינק" - כך אתם מאותתים למנועי החיפוש שהאתר שלכם הוא יצרן התוכן, ולא האתר המפיץ את התוכן שלכם. כל מי שמשתמש בתוכן שלכם בלי לתת לכם לינק בתמורה - מפר את תנאי הסינדיקציה שלכם (דוגמה: אתר articles.co.il).

  • אם תוכן כלשהו נכנס לארכיון ולכן אינו נגיש עוד - יש סיכוי סביר שהעתקת התוכן הזה לאתר אחר לא תיצור את הרושם שהוא הועתק (גם כאן יש בעיות של זכויות יוצרים)

  • גרסאות להדפסה של כתבות ומאמרים הן למעשה תוכן משוכפל, למרות שהן מעוצבות קצת אחרת בשביל להתאים למדפסת. אפשר לחסום אותן בעזרת הוספת משתנה מיוחד בקובץ "רובוטוס-טקסט" שלכם.

  • דפים ריקים מתוכן: באתרים דינמיים רבים (חנויות, קטלוגים וכד') נוצר מצב של עמודים ריקים מתוכן, כאשר מוצר או שירות מסוימים פשוט אינם זמינים לתקופה מסוימת. כדי למנוע מצב זה, יש לבצע בקרה שוטפת אחרי עמודים ריקים שכאלה, ולמחוק אותם באופן זמני עד לעדכון הבא.

  • כתבות שירדו לארכיון: אם עיתון מקוון בחר להעביר את הכתבות הישנות שלו אל הארכיון, ולא להציג אותן ברשת, העתקה של תכנים ארכיוניים אלו יכולה להיחשב "תוכן מקורי", לכאורה; אך כאן יש שתי בעיות: א) אם אתם יכולים להעתיק, אז כל אחד אחר יכול להעתיק - ואז שוב תמצאו את עצמכם במאבק אבוד-מראש; ב) עיתונים נוטים לתקוף מהר את כל מי שמעתיק את התכנים הארכיוניים שלהם, והסיבה לכך פשוטה: הם גובים כסף תמורת התכנים הללו. לכן לא כדאי להסתבך גם עם תכנים ארכיוניים, במרבית המקרים.


  • אם העתיקו מכם: לא צריך לדאוג יותר מדי, במיוחד כאשר מדובר באתר בעל איכות כללית נמוכה, אתר חדש ברשת או אתר מפוקפק מעצם טבעו, שאין בו הרבה מבקרים. "סקרייפרים" (Scrapers) נענשים בסופו של דבר, או פשוט לא מקבלים מיקומים ריאליים. בכל מקרה, תמיד אפשר לשלוח מכתב מאיים של עו"ד.


תכנים מועתקים במיוחד

באינטרנט קל להיתקל שוב ושוב בתכנים מועתקים כמו:

  • כתבות מגזין
  • חדשות
  • ערכי אנציקלופדיה (כמו ויקיפדיה)
  • מסמכים משפטיים
  • תמונות
  • מילוני מונחים
  • מתכונים
  • מידע רפואי
  • נאומים היסטוריים
  • ציטוטים ופתגמים
  • בדיחות
  • ספרים קלאסיים
  • קטעי וידאו קצרים
  • הודעות לעיתונות


דופ-פילטרים, מסנני העתקה וכל הג'אז הזה

בשפתם של העוסקים בתחום, ה"דופ-פילטר" (Dup-filter) הוא הרובוט שאמור לאתר כפילויות ולחסל אותן במהירות. זהו "דופ" מלשון "דופליקט" (Duplicate), שהוא למעשה שיכפול או העתק. הפילטרים הללו הם חלק קטן מתוך בקרת האיכות הקפדנית של מנועי החיפוש המובילים, ובלעדיהם יתנפח מאגר העמודים הסרוקים של מנוע החיפוש באינספור כפילויות מיותרות של תוכן איכותי.

דופ-פילטר אופייני יבדוק מבנה של פסקאות, שימוש במילות מפתח, אורך של עמוד, אופי קידוד דומה, שימוש בכותרות זהות עבור תוכן דומה, טקסט של לינקים ("אנקור-טקסט" / "עוגן-טקסט") -- ובסופו של דבר יערוך השוואה כמותית ואיכותית שתקבע מי המקור, מי מעתיק, מי יישאר באינדקס ומי יחוסל. במקרים מסוימים, גם המעתיקן ייסרק ויופיע בתוצאות, אבל לא יקבל מיקום גבוה -- כמובן בהשוואה לעמוד שנחשב ל"מקורי".

דופ-פילטרים נוטים להסתמך על קישורים כמדד מרכזי בקביעת "מי המקור הסמכותי" לעומת "מי המעתיקן הקטן והמסכן". אם רוב האתרים ברשת מפנים לכתבה חשובה של מגזין ידוע, ורק קומץ מפנים לכתבה מועתקת של מגזין נידח -- הרי שה"דופ-פילטר" יקבע שהמקור הוא המגזין הידוע, וזאת למרות שהתוכן עצמו הוא זהה כמעט לחלוטין. לא רק כמות הקישורים קובעת, אלא איכותם -- מקורות סמכותיים נוטים לקשר אל מקורות סמכותיים אחרים, ולא להתייחס למעתיקנים.


אבל כל כך קל להעתיק...

אין ספק שהעתקת תכנים, במיוחד באינטרנט, היא פיתוי שקשה לעמוד בפניו. כל כך לבצע "קופי-פייסט", עד שרבים מן האתרים ברשת אינם מצליחים להתאפק. כבר נתקלתי במקרים שבהם אתר כלשהו העתיק מאות מאמרים של עיתונים בעלי מוניטין, ולא הבין מדוע הגולשים אינם נוהרים אל האתר שלו (רמז: הם יכלו למצוא את התוכן בגרסתו המקורית בלי שום בעיה).

בטווח הקצר, העתקה של תכנים טובים עשויה להיחשב טקטיקה יעילה (אם אף אחד לא תובע אתכם). אך ככל שעובר הזמן, מנועי החיפוש רק הולכים ומשכללים את טכניקות ההגנה שלהם מול תכנים מועתקים, משוכפלים, מיותרים ולעתים אף עברייניים.

תוכן מקורי הוא בעל-חיים שנמצא בסכנת הכחדה מתמדת. תמיד יכול לבוא "טורף מעתיקן" שירצה להעתיקו, ובכך לסכן את שני הצדדים: התוכן המקורי עשוי להיחשב מועתק (למרות שהיה שם קודם), והאתר המעתיק יכול לחטוף עונש (אם מנוע החיפוש פועל בחוכמה).

לעתים רבות, תוכן מועתק אינו מתגלה על ידי יוצרו, והמעתיק יכול להנות מן ההעתקה לאורך תקופה ארוכה. בינתיים, המעתיק יכול להנות מחשיפה מוגברת לפרסומות, תנועה מוגברת באתר ואף רווחים כתוצאה ממכירת מוצרים ושירותים. פנייה לערכאות משפטיות עשויה להימשך שנים, אם בכלל ניתן לעשות זאת מבחינה טכנית (אם המעתיקן נמצא במדינה אחרת - קשה מאוד לתבוע).

אם האתר המקורי נותן קישור לאתר המעתיק, כפי שקורה לעתים בין אתרים שותפים או אתרי סינדיקציה, מנועי החיפוש עלולים לחשוד שקיים שיתוף פעולה "זדוני" בין שני האתרים. במקרה שכזה, מנוע החיפוש יכול להעניש את האתר המקשר (לאתר המועתק) באמצעות הסרה מן האינדקס. זה מה שקרה, ככל הנראה, בפרשת אולג'ובס, כאשר גוגל גילה כי אולג'ובס העלתה קישור אל גרסה משוכפלת של אתר אולג'ובס באתר אחר (yad2). בעיני גוגל, אולג'ובס היתה מודעת לשיכפול האסור, ואף ניסתה לעודד את השיכפול. לכן נענשה.


סייט-סקרייפרים ("גורדי-אתרים" או "גורפי-אתרים") הם דוגמה מכוערת במיוחד להעתקה אוטומטית, רובוטית וסיטונאית של תכנים מבוקשים במיוחד. התופעה בולטת במיוחד בארה"ב, שם קיימות תוכנות זדוניות שכל מטרתן היא "לגנוב" תכנים פופולריים, ליצור אתרים פיקטיביים, למלא אותם בפרסומות טקסטואליות ולהרוויח כספים. יש כאלה שטוענים שמנועי חיפוש הם למעשה ה"סקרייפרים" המובילים, אבל לרוב מדובר באתרים 'חשאיים' שאינם מסייעים כלל לאתרים המועתקים.

טכניקה יעילה להגנה ארוכת-טווח על תוכן מקורי היא הטבעת סימנים מזהים בגוף הטקסט. אם ברצונכם להגן על התוכן שלכם מפני מעתיקנים, הקפידו לנסחו כך שכל מעתיקן ייאלץ לשכתב אותו בצורה מקיפה, או שהתוכן יפורק לחלקים קטנים כך שיהיה קשה להרכיבו-מחדש לעמוד אחד ארוך. שילוב אלמנטים אישיים, מוכווני-זהות (שמות, סגנון, תאריכים, מותגים), לאורך הטקסט, גם הוא מקשה על עבודתם של מעתיקנים אנושיים או רובוטיים.


החטא ועונשו

כאמור, תכנים מועתקים לרוב "נענשים" בכך שהם מקבלים 'ציון נמוך' בעיני רוב מנועי החיפוש. כאשר גולשים מחפשים אחרי תכנים המופיעים בעמוד המועתק, האתר שנחשב 'מעתיקן' לא מופיע בתוצאות הראשונות, ואת רוב התנועה מקבלים האתרים הסמכותיים.

במקרים אחרים, מתקיימות תופעות מקבילות:

  • אתרים 'מעתיקנים' מצליחים להערים על מנועי החיפוש, וליצור את הרושם שהם-הם המקור הסמכותי -- ובכך הם אפילו "עוקפים בסיבוב" את האתרים שיצרו את התוכן
  • 'מעתיקנים סדרתיים' נענשים בצורה החמורה ביותר - הם נמחקים מן האינדקס ולא מופיעים באף תוצאת חיפוש, אפילו אם העתיקו תכנים נדירים במיוחד
  • אתרים מקוריים נענשים במקרים נדירים שבהם הם שיתפו פעולה עם ההעתקה, ועודדו אותה


האם מותר להעתיק תכנים של אתר מפורסם ולתת לינק בתור קרדיט?

מבחינה משפטית, התשובה היא לא. חד וחלק. חוק זכויות יוצרים אוסר זאת, במיוחד כאשר מדובר בהעתקה שמטרתה היא הפקת רווח כלכלי, או כל טובת הנאה מסחרית אחרת.

בפועל, אתרים רבים ברשת נוהגים לעשות זאת - מתוך ידיעה שהאתרים המקוריים יגרפו רווח כפול: א) הם קיבלו קישור חיצוני שרק יגביר את המוניטין שלהם; ב) בכל מקרה האתרים המקוריים יופיעו ראשונים בתוצאות החיפוש, ולא המעתיקנים. המודל הזה עובד טוב עבור ה'מקוריים', ולכן הם אינם נוטים לרדוף אחרי 'מעתיקנים' שהוסיפו 'קישור עמוק' היישר אל העמוד המקורי.


גן עדן להיסטוריונים

נדמה שההעתקה הלגיטימית היחידה היא זו שמעבירה טקסט "קלאסי" -- טקסט שפגה הגנת זכויות היוצרים עליו, כיוון שעברו לפחות 70 שנה מאז שהסתיימו חייו של יוצרו המקורי. טקסט כזה מעולם לא הופיע באינטרנט - ופורסם לראשונה באתר בעל מוניטין מינימלי, שאותו מכירים מנועי החיפוש.

העתקה שכזאת נחשבת, לפחות באינטרנט, כ"הקמה לתחייה" של תוכן בעל משמעות שעד כה לא הופיע ברשת העולמית. "גאולה" של טקסטים עתיקים אינה סובלת מבעיות של זכויות יוצרים, ומוסיפה אל מאגר הידע האנושי. היסטוריונים אולי יאהבו להציל טקסטים ישנים מן השיכחה, ואף יהנו מן העובדה שמנועי החיפוש יתלהבו ממנו, אבל מסתבר שרוב הגולשים מעדיפים תוכן רענן, חדשני, עדכני ורלוונטי לחיינו המודרניים.

עוד בנושא:

איך לטפל במקרה של תוכן מועתק

12.12.2007

גוגל הסיר והחזיר את אולג'ובס לתוצאות החיפוש


פורטל הדרושים "אולג'ובס" (Alljobs.co.il) נעלם מן האינדקס של גוגל, והוחזר אליו בהדרגה תוך מספר ימים. על פי כלי בעלי האתרים של גוגל, אף דף מן האתר לא הופיע במאגר של גוגל ב-11 לדצמבר. עם זאת, אתר אולג'ובס שנעלם מתוצאות החיפוש, הוחזר אליו בסופו של דבר, ו-190 אלף דפי התוכן שלו שבו לאינדקס בפועל.

סיבה אפשרית למצב שהגיע אליו אולג'ובס: חשד ל"ספאם" בהקשר של אופטימיזציה למנועי חיפוש (Over-SEO). הליקוי המרכזי: שיכפול תוכן האתר, במסגרת שותפות עם פורטל yad2. ברגע שאולג'ובס הוסיפו קישור אל אתר-המראה (Mirror-Site) שלהם ב-yad2, גוגל חשד שמדובר בנסיון לבצע קידום אסור.

עובדה: לאחר שאולג'ובס עצמו חזר לאינדקס של גוגל, הדפים המשוכפלים של אולג'ובס באתר yad2 כבר אינם מאונדקסים בגוגל. מקור באולג'ובס מסר כי החברה ידעה על הסיכון שנטלה כאשר שיכפלה את התוכן של אולג'ובס באתר yad2, אך כל עוד לא נענשה ע"י גוגל, האמינה כי התועלת מצדיקה את הסיכון. הטעות של אולג'ובס היתה מתן קישורים לתוכן המשוכפל: גוגל הבין מכך שאולג'ובס עצמו מודע לשיכפול, מעודד אותו ומפיק ממנו תועלת בצורה שאינה לגיטימית בעיניו.

ניקח לדוגמה את אתר "הארץ": אם תכני העיתון משוכפלים ללא ידיעת העיתון (וללא עידודו הפעיל) באתר אחר, גוגל יעניש את האתר המשכפל ולא את "הארץ". אך אם "הארץ" יוסיף קישורים אל האתר המשכפל, יש בכך כדי להראות על העובדה ש"הארץ" מודע לשיכפול, מעודד אותו ואולי אף מפיק תועלת מן השיכפול האסור. גוגל, ככל הנראה, פיתח נוסחת ענישה (סוג של "חקיקה" בצורת קוד) שבודקת את מערכת היחסים בין האתר המשכפל והמשוכפל. אולג'ובס ספג עונש מפני שענה על התנאים של הנוסחה החדשה.



במילים פשוטות: גוגל העניש את אולג'ובס בגלל חשד ל"עודף קידום אתרים", ובמשך תקופה מוגבלת הוא מנע ממנו להיות מוצג בתוצאות החיפוש של המנוע המוביל בישראל (ובעולם). מבחינה מעשית, מדובר ב"כרטיס אדום" שהוציא השופט גוגל לשחקן שהפר את הקווים המנחים של תאגיד החיפוש המתוחכם בעולם. זה אומר שלתקופה קצרה, אפילו מי שחיפש את כתובת האתר (alljobs.co.il) לא מצא את האתר בתוצאות החיפוש של גוגל.





כאשר מנוע חיפוש משוכלל כמו גוגל חושד שאתר מסוים מנסה לעוות את תוצאות החיפוש ע"י קישוריות מלאכותיות בהיקף תעשייתי או שיכפול תכנים אסור, הוא עשוי להסיר את האתר החשוד מתוצאות החיפוש לתקופת זמן בלתי מוגדרת. זה אכן היה המצב, נכון לאמצע דצמבר 2007: אולג'ובס, אתר דרושים פופולרי שבעבר הופיע במיקומים גבוהים על חיפושים כמו "דרושים", "חיפוש עבודה" או "משרות", התפוגג ואיבד את מעמדו, עד שהוחזר לתוצאות ע"י גוגל בעקבות סדרת טלפונים ופניות של אנשי אולג'ובס, דרך אנשי גוגל ישראל, אל גוגל אירלנד.



במנועים אחרים כדוגמת וואלה, אם-אס-אן (לייב.קום) או יאהו, המצב של אולג'ובס היה ונשאר תקין לחלוטין. לאתר אולג'ובס יש כ-80 אלף עמודי תוכן סרוקים בשניים מן המנועים הללו, וכ-5,000 עמודים סרוקים ב"לייב.קום". שלושת המנועים החשובים ביותר אחרי גוגל, חשוב לציין, לא מחקו את אולג'ובס מן האינדקס שלהם. ב"וואלה", למשל, אולג'ובס מופיע ראשון במילה הנחשקת מכולן: "דרושים". רק גוגל נקט בפעולה ברורה -- אם כי זמנית -- כנגד אולג'ובס, והחליט כי הוא אינו ראוי להופיע בתוצאות החיפוש שלו.



לחצו להגדלה: מצב האינדקס של אולג'ובס בגוגל - הודעה מפורשת כי אף עמוד מן האתר לא מופיע במנוע החיפוש

תאריך ההודעה: 12 דצמבר 2007


חשוב להדגיש כי אין במעשיו של גוגל כדי להצביע בהכרח על מעשים בלתי-כשרים מצד אולג'ובס או חברת קידום האתרים שאותה שכר כדי לשפר את מיקומו במנועי החיפוש. כמו כן, גוגל רשאי להסיר כל אתר מתוצאות החיפוש שלו לפי שיקול דעתו הבלעדי, אם הדבר נעשה לטובת הגולשים ובתום-לב. כמו כן יש לציין כי חברות גדולות ומפורסמות בהרבה מאולג'ובס, כמו במוו (BMW) בפברואר 2006, הסתבכו בפרשות דומות (אפילו הבי-בי-סי כינה את המחיקה "עונש מוות") בגלל קידום אתרים נלהב-מדי.

מחיקת אתר מן התוצאות של גוגל היא תופעה נפוצה, שגרתית, כמעט בנאלית. אתרים רבים ברשת מצאו את עצמם, יום בהיר אחד, במצב של "כרטיס אדום", מחוץ למגרש המשחקים של החיפוש. במקרים שכאלה ניתן לנסות ולתקן את הנזק על ידי הסרת קישורים מלאכותיים ותוכן משוכפל, ובקשה להיכלל-מחדש באינדקס של גוגל. זה עשוי לקחת מספר ימים עד מספר חודשים, אבל כמעט כל אתר יכול "לחזור בתשובה" ולקבל הזדמנות שנייה להופיע בתוצאות החיפוש.


כתב האינטרנט של ynet, אהוד קינן, עשה פולו-אפ לסיפור של גוגל ואולג'ובס. הוא השיג את תגובתה של חברת אולג'ובס, שמצידה טענה כי מדובר באי-הבנה, וכי העניין נמצא בטיפול מצד גוגל. מתגובתה של אולג'ובס ניתן להבין כי החברה מודעת לבעיה, וכי היא מנסה לפתור אותה; גוגל העולמית אישרה (באנגלית) ל-ynet כי alljobs הורד מתוצאות החיפוש, אך לא היתה מוכנה למסור פרטים נוספים מעבר לכך. חשוב לציין כי הבעיה נפתרה, בסופו של דבר, ואולג'ובס הוחזר לתוצאות (והשיכפול של yad2 הוסר מן האינדקס, בהתאמה).


פוסט זה, שפירסם ראשון את סיפור ההסרה של אולג'ובס, עודכן שוב ב-14, ה-15 וה-16 לדצמבר כדי לדווח על חזרתו של אולג'ובס לתוצאות החיפוש של גוגל. במציאות המהירה של מנועי החיפוש המודרניים, שינויים גדולים באינדקס מתרחשים לעתים תוך שעות ספורות, או ימים מעטים. לכן שונתה גם הכותרת מ"גוגל ואולג'ובס כבר לא" אל הכותרת העדכנית, המתארת בצורה מדויקת את הסיפור: גוגל הסיר והחזיר את אולג'ובס לתוצאות החיפוש.


הבלוג של מגזין מנועי החיפוש Search Engine Watch, בעריכת קווין הייסלר, פרסם גם הוא כתבה על פרשת אולג'ובס, ומתח ביקורת על כותב פוסט זה בעניין ההערכה לגבי כמות קישורים חיצוניים מוגזמת של אולג'ובס ברשת. הביקורת של הייסלר נכתבה על סמך הנוסח האנגלי של הפולו-אפ ב-ynet, ולא על סמך קריאת בלוג זה, שנכתב בעברית - השפה שאותה הייסלר כמובן לא יודע לקרוא.


אז מה צריך לומר על הפוסט של בלוג SEW? ראשית, בסופו של דבר נמצאה הסיבה האמיתית להסרת אולג'ובס מגוגל: מתן קישור מאולג'ובס אל תוכן כפול באתר יד-שנייה (yad2). שנית, ההערכה המצוטטת בכתבה של אלי פלבלום, כאילו אולג'ובס פשוט שכרו חברת קידום אתרים חדשה שנתנה להם עצות ספאמיות (למשל, דפים מסוג doorway) - הינה מופרכת לחלוטין מבחינה עובדתית, ואף מטילה רפש באולג'ובס שלא לצורך. נראה כאילו מר הייסלר ציטט הערכה שגויה לחלוטין כדי להפריך הערכה אחרת, שנראתה בעיניו שגויה. הלקח הוא: כולם עושים שגיאות באינטרנט - גם גוגל, גם אולג'ובס, גם הבלוג הזה וגם הבלוג של מגזין בינלאומי מוביל.


את הסיפור על alljobs הביא למערכת מר קובי גנוסר (תודה!).


9.12.2007

איפה גוגל אירן, גוגל סוריה, גוגל צפון-קוריאה?

מלמעלה למטה - הדגלים של אירן, צפון קוריאה, סוריה

"מדינות ציר הרשע", כפי שהן נקראות ע"י ג'ורג' בוש, הן כפי הנראה גם מדינות ציר הרשע של גוגל, מנוע החיפוש הגדול והחזק בהיסטוריה. אין הסבר אחר לעובדה שנכון לסוף 2007, אין לנו גוגל אירן, או גוגל סוריה, או גוגל צפון קוריאה. "גוגל עירק" נוספה באפריל 2011.


ברשימת השפות והמדינות של גוגל מופיעות מדינות איזוטריות רבות, כאלו שלא תבקרו בהן לעולם: גוגל מיקרונזיה חי וקיים; גוגל איי קוק פועל במרץ; גוגל סעודיה אינו מוזנח; גוגל מזרח טימור משרת את הטימורים היטב. אבל משום מה, 23 מליוני אזרחים צפון-קוריאנים לא זוכים להתייחסות מצד גוגל, בעוד הדרום-קוריאנים קיבלו כבר את הגוגל שלהם. 

רק באפריל 2011 הואילה בטובה גוגל העולמית להכליל את תוניסיה ברשימת המדינות שלה (google.tn).

27 מליון עירקים נאלצו לחכות עד הודעתה של גוגל, באפריל 2011, לפיה פתחה סוף-סוף את גוגל עירק (google.iq) לגולשיה של המדינה שהותקפה פעמיים על ידי ארה"ב.

איזו סיבה יש לגוגל לפתח את גוגל פרסית, מנוע חיפוש בשפה אותה דוברים 70 מליון איראנים, ובאותה נשימה לבחור שלא לאכלס את הדומיין google.ir שעליו נאבקה גוגל בשנת 2005 (וזכתה)?

זה לא שגוגל מזניחה ישויות ערביות זעירות ביותר, כגון הרשות הפלשתינאית שגבולותיה עדיין אינם ברורים. באוגוסט 2009 הושק גוגל השטחים הפלשתינאים (שימו לב: זה לא "גוגל פלשתין"). השקה זו רק הדגישה את היעדרותן של מדינות חשובות בהרבה.

אפשר לפתח בקלות מגוון רחב של תיאוריות קונספירציה סביב הבחירה של גוגל ("אל תהיו רשעים") שלא לאפשר לאזרחי
סוריה לחפש בגוגל משלהם. אז בסדר, הממשלה הסורית תומכת בחיזבאללה, אבל 20 מליון סורים הם שוק שאפשר לוותר עליו? אם גוגל יודע לקרוא יידיש או זולו, מה הבעיה לתמוך רשמית בשפה הלאומית של סוריה - ערבית, בשם אללה?



בעמוד השפות והמדינות של גוגל מצויין כי "אם אתה לא רואה את השפה שלך כאן, אתה מוזמן לעזור לגוגל ליצור אותה ע"י התנדבות להיות מתורגמן". האופציה הזאת לא קיימת למשתמשים שאינם רואים את המדינה שלהם מיוצגת בגוגל. אף סורי, עירקי, צפון-קוריאני או איראני לא יכולים להתנדב כדי ליצור את האתרים הנעדרים הבאים: גוגל אירן, גוגל סוריה, גוגל צפון-קוריאה. אבל האזרחים הללו לא אשמים שהשלטון שלהם הוא דיקטטורי, אלים ובדלני.


ייתכן שמדינות עוינות כמו אלו בהנהגת בשאר אסד, אחמדי-ניג'אד או קים ג'ונג-איל, חוסמות לעתים את הגישה לחלק מן השירותים והקישורים של גוגל. ייתכן שהן אפילו מטרפדות בצורה אקטיבית את הספיידרים של גוגל, ומסרבות לאנדקס את אתרי הממשל והצבא שלהן במנוע החיפוש הכל-כך-אמריקני הזה. זו עדיין לא סיבה להימנע מלהקים מנוע חיפוש בכל מדינה בעולם, בלי אפלייה כלשהי, במסגרת המוטו השחוק של גוגל "לארגן את המידע בעולם ולהפוך אותו לזמין".


נקודת-אור אחת אפשר לראות בסיפור הזה: קובה, אחת ממדינות ציר הרשע ע"פ בוש, לא זוכה להתעלמות מחפירה כמו שלוש עמיתותיה לרשימה השחורה. גוגל קובה נושם עצמונית - ואולי זה סימן שאם גוגל רוצים, גוגל עושים. אחרי הכל, כמה מאיתנו באמת יודעים או זוכרים שקובה בכלל נכללה באותה קטגוריה מופרכת, של ציר הרשע הבדיוני?

כל הזכויות שמורות לבלוג חופש החיפוש 2007-2012