1.7.2008

האם מנועי חיפוש סורקים פלאש? כן ולא

עד לפני זמן לא רב, מנועי חיפוש לא היו מסוגלים לקרוא פלאש (Adobe Flash), קבצי גרפיקה וקטורית מבית היוצר של אדובי (לשעבר מקרומדיה), המקודדים בפורמט swf. הרבה חומר נכתב על הנושא הזה; פלאשיסטים התווכחו עם מומחי קידום אתרים; נוצרה אי-בהירות גדולה בנושא, והבעיה לא נפתרה לחלוטין עד היום.


לאחרונה השתנתה המציאות מעט, כאשר חברת אדובי החלה בפרויקט חדש בשיתוף מנועי החיפוש הגדולים (גוגל, יאהו ושות') לשיפור נגישות התכנים המקודדים בפלאש, דהיינו הטקסטים המופלאשים. לפי ההודעה של אדובי, גוגל כבר מסוגל לקרוא כמה עשרות מליוני קבצי פלאש ברשת.

האם זה אומר שכל בעיות ה"פלאש" נפתרו, ומעתה אפשר להשתמש בו בחופשיות? ממש לא.
ראשית, לגוגל יש עדיין בעיות קשות עם פלאש בשפות דו-כיווניות, כמו עברית וערבית:



"בשלב זה אנו לא יכולים להוסיף לאינדקס את התוכן של שפות דו-כיווניות (לדוגמה, עברית או ערבית) של קובצי Flash"



זה מה שגוגל אמרו עד לא מזמן:

תבנית Flash היא מטבעה אמצעי חזותי, שעלול לגרום ל-Googlebot לבעיות. שלא בדומה לסורקים אחרים, Googlebot יכול לקרוא קובצי Flash מסוימים ולחלץ מתוכם את הטקסט והקישורים, אך ללא המבנה וההקשר. נוסף לכך, המעצבים בתוכנת Flash כוללים לעיתים קרובות תוכן גרפי ומאחר ש-Google אינה מבחינה בטקסט שנמצא בתוך גרפיקה, היא עלולה לדלג על מילות מפתח חשובות. במילים אחרות, גם אם אנו מסוגלים לסרוק תוכן Flash, וגם אם תוכן זה נמצא באינדקס שלנו, ייתכן שחסרים בו חלקי טקסט, תוכן או קישורים.

וזה מה שהם אמרו פעם, לפני השידרוגים האחרונים מבית אדובי:

"כן, גוגל מאנדקס דפים המשתמשים בפלאש של מקרומדיה. עם זאת, הזחלנים שלנו עלולים להיתקל בבעיות באינדוקס [מיפתוח; א.ב.] עמודי פלאש...אם פלאש מונע ממך לראות את כל האתר שלך בדפדפן טקסטואלי, אז עכבישים [ספיידרים = תוכנות סריקת אתרים; א.ב.] של מנועי חיפוש עלולים להתקשות בסריקת האתר שלך. כדאי לך לשקול ליצור עותקי html של דפי הפלאש הללו".




הבעיה המרכזית של קבצי פלאש היא נכות בכל מה שנוגע ל"דיפלינקינג" (קישורים עמוקים). במילים אחרות, גם אם גוגל מסוגל לסרוק את התכנים שנמצאים בתוך הפלאש, הוא עדיין לא מסוגל ליצור עמודים נפרדים לכל "קטע", "דף" או "אירוע פלאש" (flash event).

המבנה של מצגות פלאש עדיין שונה באופן מהותי מהדרך שבה בנויים קבצי הטמל רגילים, ולכן המשתמשים עשויים להתבלבל, להתעצבן ולהאשים דווקא את גוגל כאשר ייתקלו בעמודים שבהם התוכן שמופיע בתוצאת החיפוש אינו התוכן שאותו יראו כאשר יקליקו על התוצאה הפלאשית ויפעילו את מצגת הפלאש מההתחלה. זו המשמעות של היעדר קישורים עמוקים: אי אפשר להגיע ישירות לתוכן הפנימי, וחייבים לעבור דרך עמוד הבית.

דוגמה: אתה מחפש ביטוי מסוים בגוגל. קובץ פלאש מסוים מכיל את הביטוי הזה, והוא אכן מצוטט באחת התוצאות. אתה מקליק על התוצאה, אבל מגיע לעמוד הראשי של מצגת הפלאש (כך היא בנויה - מעמוד פתיחה). בעמוד הראשי לא מופיע הביטוי שחיפשת (רק באחד מהעמודים הפנימיים של המצגת). אתה, המשתמש, מאשים את גוגל בהיותו מנוע חיפוש גרוע.

אפשר להניח כי מהנדסי גוגל כבר יודעים שתוצאות חיפוש עם קבצי פלאש יוצרים חוויית משתמש גרועה, שעשויה להתנקם בגוגל ולפגוע במוניטין שלו בתור מנוע חיפוש שמחזיר אך ורק תוצאות רלוונטיות. כאשר מדובר בכמה עשרות מליונים של קבצים שעשוים ליצור בעיות, לגוגל אין אינטרס חזק להציג דפי פלאש במקומות גבוהים בתוצאות החיפוש.

לכן יש להניח כי קבצי פלאש יישארו מוקצים, מגונים ונחותים בקרב מנועי חיפוש גם בשנים הקרובות.


אז מה גוגל ממליץ היום


  • פלאש בעברית? לא כדאי - גוגל לא יידע לקרוא כמו שצריך
  • נסה להשתמש בקבצי פלאש רק כאשר הם נחוצים (אנימציה, אילוסטרציה, איורים)
  • יש ליצור גרסאות מקבילות של תוכן html במקביל לעמודי פלאש (עבודה כפולה, למעשה)
  • כדאי לחסום גישה לעמודי פלאש אם יש גרסה טקסטואלית מקבילה
  • שורה תחתונה: אם אתה רוצה להסתבך עם גוגל, אתה מוזמן להשתמש בפלאש



ב-30 ליוני 2008 פורסם פוסט בבלוג הוובמסטרים הרשמי של גוגל שעוסק באינדוקס פלאש. הפוסט הזה לא השתנה עד לפחות יוני 2011.

עבור קוראי העברית שבינינו, גוגל הטילה שם "פצצה קטנה": מסתבר שלגוגל יש בעיות עם אינדוקס שפות דו-כיווניות, כמו עברית וערבית. או בניסוח המקורי באנגלית:

While we are able to index Flash in almost all of the languages found on the web, currently there are difficulties with Flash content written in bidirectional languages. Until this is fixed, we will be unable to index Hebrew language or Arabic language content from Flash files.

בעיה נוספת שהוזכרה באותו פוסט היא ג'אווה-סקריפט: אם הפלאש נטען דרך ג'אווה-סקריפט, גוגל לא יוכל לגלות את הפלאש ולכן לא יאנדקס אותו. כמו כן, אם הפלאש טוען קבצים חיצוניים מכל סוג שהוא (הטמל, אקסמל, סוואף), הכל יאונדקס (אם בכלל) רק בנפרד.


גוגל עדיין יותר טובים מיאהו או אם-אס-אן

למרות מדיניות הערפל הטכנולוגי של גוגל ("אנחנו לא אומרים שאנחנו לא מסוגלים בכלל, אבל אנחנו גם לא אומרים שאנחנו מסוגלים לעשות הכל"), הם לפחות מתייחסים לנושא בעמוד מיוחד בתוך מדור העזרה השימושי-מאוד שלהם. המתחרים שלהם נוקטים בגישה אחרת: התעלמות מוחלטת.



לאחר שיטוט ארוך ואינספור חיפושים במדורי העזרה של יאהו ושל אם-אס-אן העולמי (גם תחת המותג החדש, לייב.קום), לא מצאתי שום התייחסות, לא עקיפה ולא ישירה, לנושא הכאוב של סריקת תכני פלאש (או יותר נכון: אי-סריקה).




מדור העזרה של לייב.קום (msn) תורגם לעברית באופן חלקי בלבד, מה שמוביל למצב של אינספור עמודי שגיאה (מה שטרם תורגם לעברית הופך להודעת שגיאה). 




מדור העזרה של יאהו חיפוש אינו מקיף מספיק, ומשאיר הרבה שאלות ללא מענה. אפשר היה לצפות מיאהו, פורטל ותיק עם נסיון רב בשירות לקוחות טקסטואלי, לעשות הרבה יותר כדי לענות על כל שאלות הלקוחות. המצב עגום: שני המתחרים היחידים של גוגל בתחום מנועי החיפוש, כאמור, נחותים ממנו בנוגע לשאלת ה"פלאש - קוראים או לא?".




אז מה עדיף - לא לספק את המידע (יאהו+לייב), או לספק אותו בצורה מעורפלת ודו-משמעית (גוגל)? שאלה קשה. קלישאה ידועה היא שלפעמים עדיף לשתוק ולהיחשב טיפש מאשר לפתוח את הפה ולהוכיח שזה נכון. מה שבטוח: מנוע החיפוש גוגל מודה, גם היום, שהוא עדיין לא מסתדר כמו שצריך עם תכני פלאש, למרות שהוא מסוגל לקרוא אותם באופן חלקי.


ההמלצה הרשמית לכל מעצב אתר, בונה אתר או לקוח שהולך לבנות אתר ורוצה לראות את עצמו מככב בתוצאות החיפוש של גוגל, וואלה, לייב וכל שאר המנועים, היא חד-משמעית: "פלאש = לא ולא; הטמל = בהחלט".





נספח - תוכנות וכלי-עזר



לאחר פרסום הפוסט הזה ב-2007, טען אחד המגיבים כי מנועי חיפוש יכולים לאנדקס פלאש, בתנאי שמשתמשים בתוכנת Search Engine SDK , ערכת תוכנות פיתוח למנועי חיפוש של מפתחי הפלאש. על פי אתר אדובי, לתוכנה יש יישום חדש המוציא את הטקסט והלינקים מתוך הפלאש, אל תוך קובץ שאותו ניתן לפרסם במקביל לפלאש.



הטענה לפיה עצם קיומו של ה-SDK למנועי חיפוש מוכיח כי מנועי חיפוש יכולים לקרוא פלאש, יש הגיון הפוך: זה כמו לטעון שאם קונים מכונית רגילה ומוסיפים לה זוג כנפיים ומנוע סילון אופציונלי, אז היא יכולה לטוס (ולפיכך מכוניות יכולות לטוס). אך הפלאש עצמו, כפי שרוב מעצבי הפלאש משתמשים בו, הוא כאמור, הוא עדיין לא קריא במובן שבו דפי אינטרנט טקסטואליים הם קריאים. העובדה שקיימת תוכנת-עזר איזוטרית שמסוגלת להמיר את הפלאש לטקסט רגיל עם לינקים, היא למעשה רק הוכחה נוספת לאי-קריאותו המהותית של הפלאש, בעיני מנועי חיפוש.



המציאות בשטח היא עדיין זו:

  • העדכון האחרון של אדובי אינו משנה את המציאות באופן מהותי: פלאש ומנועי חיפוש אינם חברים טובים
  • הרוב המוחלט של מפתחי פלאש אינם משתמשים בשום כלי-עזר שימיר את ה-SWF שלהם אל שום פורמט קריא אחר.
  • מרבית מעצבי הפלאש אינם יודעים שכלי-עזר כמו swf2html כלל קיימים
  • שימוש בכלי-עזר כמו swf2html הוא מסורבל, לא אינטואיטיבי ודורש עבודה כפולה
  • עצם העובדה שקבצי פלאש דורשים המרה לטקסט ולינקים, במקביל לקובץ ה-SWF המקורי, מעידה על הכישלון הבסיסי של הפורמט עצמו, בעיקר ברמת הניווט הפנימי והקישוריות החיצונית
  • אין שום סיכוי שמעצבי פלאש מקצועיים, העומדים תחת מגבלות חמורות של זמן וכסף, ישקיעו משאבים נוספים ביצירת חלופות טקסטואליות לעיצובים שלהם, בעיקר כאשר הם לא יודעים על קיומה של החלופה מלכתחילה
  • הדרישה להשתמש בממירי-פלאש במקביל לפלאש, דומה לדרישה ליצור תמליל טקסטואלי של כל סרטון וידאו המועלה לרשת, במקביל לסרטון עצמו; בשני המקרים זה פשוט לא קורה בשטח, למרות כל הכוונות הטובות וההצהרות הבומבסטיות
  • במקום להשתמש בממירי-פלאש כדי ליצור טקסט ולינקים, עדיף ליצור טקסט ולינקים מלכתחילה, ולהשתמש בפלאש בצמצום רב, וגם זאת רק בשביל אנימציות נטולות-טקסט



לסיכום הדיון הארוך הזה, אפשר לומר כך: מנועי חיפוש מודרנים יודעים לקרוא פלאש באופן חלקי, ולא מסוגלים להפריד בין חלקיו השונים. יצירת גרסאות מקבילות (גם פלאש וגם html) היא עבודה כפולה, מפרכת ולא יעילה. פלאש מצטיין באנימציות, אבל לא כפלטפורמה לתכנים טקסטואליים, לקישורים ולממשקי משתמש עממיים. מי שרוצה להסתמך על מנועי חיפוש בתור אמצעי שיווקי באינטרנט, מוטב שיתרחק מפלאש כמו מאש.

הוסף רשומת תגובה
כל הזכויות שמורות לבלוג חופש החיפוש 2007-2012