21.8.2007

איך לרמות מנועי חיפוש בקלי-קלות

האנשים הטובים באתר אורגיל חממות כנראה מאוד להוטים להופיע במקום טוב במנועי החיפוש. הלהט שלהם מובן, והתוצאה בהתאם. ראשית - כך נראה אתר האינטרנט של החברה לעין הבלתי-מאומנת:

במבט ראשון, האתר נראה תמים למראה. סתם עוד אתר של חברת חממות, נכון?

אז זהו, שלא.

בוני האתר השתמשו בטריק הכי ישן בספר: טקסט לבן על רקע לבן. עיניים אנושיות לא רואות את זה, אבל מנועי החיפוש - בהחלט כן. איך זה נראה? הנה מה שגוגל "רואה":

הקישורים המופיעים "בחשאי" מובילים לעמודים פיקטיביים, שכל מטרתם היא להאכיל את מנועי החיפוש בטקסט מפוצץ במילות מפתח, קישורים לעמודים פיקטיביים נוספים - מה שמכונה בעגה המקצועית "עמודי-דורוויי" (Doorway pages). במקרה שלנו, רובם מובילים באופן אוטומטי חזרה לעמוד הראשי, מה שמוכיח שהם לא מיועדים לבני-אדם (רק לרובוטים של מנועים).


האם מנועי החיפוש אכלו את הפתיון הזה? בהחלט. גוגל סרק 370 עמודים לפחות, רובם פיקטיביים. יאהו אכל 235 עמודים בלי מלח, רובם פיקטיביים. הגדיל לעשות מנוע MSN העולמי, שבלהיטותו לבלוע טקסטים על חממות הצליח לעכל 985 עמודים - רובם תוכן-זבל למנועי חיפוש ("ספאמדקס") (Spamdex).


אז מדוע להשתמש במילה קשה כמו "רמאות" בכותרת הפוסט הזה? ראשית, פעילות קידום האתרים של אורגיל אינה מעידה בהכרח על טיב שירותיה העסקיים. בהחלט ייתכן שמדובר בחברה טהורת-כוונות, שנפלה בפח של מקדם אתרים מסוג "כובע שחור" (חסר-אתיקה). העובדה שאתר אורגיל מקודם בצורה בלתי-לגיטימית אינה אומרת שלקוחות אורגיל אינם מרוצים משירותיה בתחום החממות. אבל גם אי אפשר להתכחש לעובדה שכל מנועי החיפוש מאוד ברורים בהתנגדות החד-משמעית שלהם לטריקים כגון טקסט חבוי או לינקים חבויים.


מצד שני, אנחנו מתקרבים לסיום שנת 2006 - ומייאש לגלות שמנועי החיפוש עדיין לא מספיק מתוחכמים מכדי להתמודד בהצלחה עם ספאם פרימיטיבי שכזה. חוויית המשתמש של המבקרים באתר אורגיל דרך מנועי חיפוש "בולעי-ספאם" היא מפוקפקת למדי (הם נכנסים לעמוד בלתי-מובן שמפנה אותם מיד חזרה לעמוד הראשי), אבל גם מחלקות האנטי-ספאם של מנועי החיפוש כנראה לא עובדות שעות נוספות על טיפול נקודתי במקרים שכאלה - במיוחד אם מדובר באתרים ישראליים קטנים. אך בסופו של יום, מישהו צריך להגן על הגולשים מפני מקדמי אתרים שמאכילים את כולנו הרבה קש דיגיטלי. מהנדסי גוגל, למשל, תמיד מנסים לפתור בעיות כאלה דרך שיפוץ חכם של הנוסחאות הכלליות שלהם (שיכלול אלגוריתמי), אבל לפעמים כנראה שאין ברירה אלא לטפל נקודתית באתרים סוררים - זה נקרא שירות לציבור.


אז איך הם עשו את זה? במקרה של אורגיל, זה היה פשוט מאוד. במקום להשתמש בשיטה העתיקה של "פונט: לבן" על רקע לבן (דהיינו, רקע שלא הגדירו את צבעו), הם השתמשו בטריק אחר, לא פחות מושמץ: גליונות עיצוב (CSS).
לכן קובץ ה-CSS של אורגיל הוא קצר מאוד:



מה הקוד הזה אומר? גליון העיצוב הקצרצר הזה למעשה מודיע לדפדפן המודרני כך: "כל פעם שאתה שומע את מילת הקוד 'אוף', 'אוף-לינק' או 'חממות מסחריות', פשוט תהפוך את הטקסט או הקישור לצבע לבן - דהיינו שקוף".


קובץ גליון העיצוב הוא חיצוני לקוד של העמוד עצמו, כך שמבחינת מנועי החיפוש, ייתכן שהעיצוב הזה לגיטימי לגמרי - קשה להם להחליט. בקוד של עמוד התוכן לא מופיעה המילה "לבן" בשום צורה, כך שקל להטעות את מנועי החיפוש ולגרום להם לחשוב שמדובר בתוכן שקיים פיזית. מבחינה טכנית, הטריק הזה כבר ידוע ומוכר לכל מנהלי מנועי החיפוש - אך הם פשוט לא מצאו את הדרך לפתור את הבעיה.


אם אתם עדיין לא מאמינים למה שכתוב כאן, פשוט היכנסו לעמוד הבית של אורגיל, יש לסמן את כל הטקסט (ctrl+a) ולגלול עד למטה כדי לראות את הטקסט החבוי נחשף לאור-יום.


אורגיל לא לבד - הנה גם אולביז

יש אתר המכנה עצמו אולביז, ועוסק ב"קידום עסקים במנועי חיפוש". עמוד הבית שלו נראה, לעיניים האנושיות, כך:

לעומת זאת, הקוד האמיתי של אולביז עמוס מאוד בקישורים סמויים מן העין.

לכן, זה מה שמנוע החיפוש גוגל רואה כאשר הוא סורק את האתר בעיניים הרובוטיות שלו:

אולביז משתמש באותה טקטיקה של אורגיל - השתלת קוד סמוי מן העין, כדי לקדם קישורים ומילות מפתח במנועי החיפוש. שניהם - גם אורגיל וגם אולביז - ככל הנראה יודעים היטב מה מנועי החיפוש שונאים, אבל הם מוכנים לקחת את הסיכון (הסרה מן האינדקס של גוגל וחבריו) בשביל לעשות כסף קל באינטרנט. זה לא פלילי - זה פשוט עובד להם יפה, ואנשים מוכנים לשלם להם כסף כדי למשוך גולשים בעזרת ההתחכמות הזאת.


שיטת "מצליח" לא רואה לטווח הארוך. כל עוד זה עובד, ומנועי החיפוש נרדמים בשמירה - הם נהנים, בלי לחשוב על השלכות רחבות מדי. אם יום אחד מישהו בעמק הסיליקון יעלה על התרגיל שלהם - מכונת הכסף הישראלית הקטנה הזאת תפסיק לעבוד לזמן-מה, עד שימצאו טריק מתוחכם קצת יותר מהחבאת תכנים וקישורים.


כדי למנוע קבלת מכתבים מעורכי-דין משועממים על פגיעה בשם טוב וכו', חשוב במיוחד להדגיש שזוהי זכותם המלאה של הצרכנים הפוטנציאלים והגולשים האקראיים לדעת אילו בעלי אתרים משתמשים בטכניקות בלתי-לגיטימיות לקדם את עצמם במנועי חיפוש. זוהי גם זכות הגולשים לדעת אילו חברות מעסיקות מומחים טכניים שכל תפקידם הוא להטעות בכוונה את מנועי החיפוש, להפיק מאות עמודים פיקטיביים, ליצור חווית גלישה גרועה ומבלבלת, ובסופו של יום גם להעמיד פנים שבאתר יש תוכן מסוים, כאשר בפועל התוכן הזה אינו קיים כלל.


הנה שלושה ציטוטים של מנועי החיפוש המובילים בעולם כיום:

  • You should use only text and links that are visible to users
  • (תרגום: "יש להשתמש אך ורק בטקסט ובקישורים שהם נראים לעין המשתמשים")

(מתוך דף המידע של מנוע MSN העולמי)

  • Avoid hidden text or hidden links
  • (תרגום: "הימנעו מטקסט סמוי או קישורים סמויים")

(מתוך הוראות גוגל למנהלי אתרים)

  • What Yahoo! Considers Unwanted:...The use of text that is hidden from the user
  • (תרגום: "יאהו רואה כבלתי-רצוי את השימוש בטקסט שהוא חבוי מן המשתמש")

(מתוך עמוד הספאם של מנוע החיפוש יאהו!)


אז...האם כדאי לרמות את מנועי החיפוש?

התשובה מורכבת למדי. מעבר לעובדה שהסיכון להימחק ממנועי החיפוש (כעונש זמני של מספר חודשים) תמיד קיים בהסתברות נמוכה, זה גם עניין של אופי, אתיקה ואמון הדדי. יש בעלי עסקים חובבי-סיכון שירצו לקדם את עצמם בכל מחיר כדי להגביר את הרווחיות של הרבעון הקרוב, ומקדמי אתרים רק ישרתו את מטרותיהם העסקיות בלי להתעסק בענייני מצפון סבוכים. לעומת זאת, יש מקדמי אתרים שאינם מודיעים ללקוחותיהם מראש שהם משתמשים בטכניקות בעייתיות ומסוכנות - וזה כבר מתכון לצרות.


אם מקדם אתרים משתמש ב"ספאם" מול מנועי החיפוש, אך מיידע מראש את הלקוח על הסיכון הכרוך בכך - אפשר לומר שזה "כשר אבל מסריח". מבחינת יחסי ספק-לקוח יש כאן מעגל סגור של אמון הדדי, למרות ריח קל של נכלוליות באוויר. יש לקוחות רבים שמנסים להעמיד פנים שהם לא מודעים לכך שהתרמית אכן מתבצעת על ידי גוף שלישי (מקדם אתרים חיצוני), ועסוקים בהתנהגות המכונה 'עצימת עיניים'.



במקרים רבים מבקשים עסקים גדולים להימנע מקידום 'מסוכן', כי אינם רוצים להימחק ממנועי החיפוש אפילו לא לשבוע אחד (מנהלי שיווק צעירים מאוד מפחדים מן הבוס העצבני שלהם). ויש לקוחות - תאמינו או לא - שהאופי ההגון שלהם מכתיב להם להגיד 'לא' לכל נסיון של הטעייה.


בצד השני של המתרס, מנועי החיפוש עסוקים מעל לראש במלחמה סיזיפית מול שיטות מתוחכמות של מקדמי אתרים שכאלה. במירוץ החימוש הזה יש לא מעט נפגעים, חלקם תמימים - חלקם בכלל לא. למנועי החיפוש יש את הזכות המלאה "להעניש" את המקדמים הסוררים בעזרת הסרה זמנית מתוצאות החיפוש, כי המאגר שייך להם, ולהם בלבד.


אבל אם נשים בצד את תאגידי החיפוש הגדולים ואת בעלי העסקים שרוצים להופיע בעמוד הראשון בכל מחיר, אסור לשכוח את הגולשים עצמם - הלקוחות האמיתיים של בעלי האתרים ומנועי החיפוש: אנחנו שונאים ספאם בכל צורה שהיא, אנחנו שונאים להרגיש פראיירים, אנחנו מתעבים רמאים וירטואליים, ולנו יש את הזכות המלאה לדעת על מה שקורה סביבנו, לדווח למנועים על ספאמדקסרים למיניהם, ואף לכתוב על כך מאמרים צרכניים כמו זה שסיימתם עכשיו.


הוסף רשומת תגובה
כל הזכויות שמורות לבלוג חופש החיפוש 2007-2012