9.9.2009

פרופיל גוגל בעברית - מבול של טעויות

חבל שעמוד פרופיל גוגל בעברית ועמוד למה להשתמש בגוגל הכילו אוסף טעויות, חלקן משעשעות, חלקן רציניות ביותר. מיד לאחר פרסום פוסט זה, נמחקו עמודים אלה מהרשת ע"י גוגל, לאחר נוכחות פיזית של כ-7 שנים לפחות

הנה הטעויות לפי הסדר, כפי שפורסמו לפני שנמחקו:

"באמצעות גישה ליותר מ-1.3 מיליארד דפי אינטרנט..."
לא נכון: גוגל דיווח ב-2008 שהמספר כבר עבר את הטריליון (1,000 מיליארדים).

"היום, מערכת "גוגל" מגיבה ליותר מ-100 מיליון שאילתות חיפוש מדי יום"
לא נכון: כבר ב-2008 היה המספר האמיתי קרוב לפי 2.5 (למעלה מ-250 מליון) מן הנתון הזה.

"שני סטודנטים לפילוסופיה מסטנפורד, לארי פייג' וסרגיי ברין"
לא נכון: לא פילוסופיה, אלא מדעי המחשב. לא סטודנטים, אלא דוקטורנטים.

"PageRank מבצע מדידה אובייקטיבית של חשיבות דפי אינטרנט"
לא נכון: גוגל הודתה כי פייג'ראנק משקף את הדעות והאמונות של מהנדסי גוגל.

"גוגל בנוי כך שאף אדם לא יכול לרכוש מקום גבוה בתוצאות החיפוש או לשנות את התוצאות כלל וכלל"
לא נכון: גוגל משתמשת היום בניסוח אחר (באנגלית) - "אנחנו לא מוכרים מיקומים בתוצאות החיפוש עצמן, או מאפשרים לאנשים לשלם עבור מיקום גבוה יותר בתוצאות אלו"

"חיפוש בגולל הוא החיפוש האובייקטיבי ביותר"
לא נכון: למנוע קוראים גוגל, לא גולל.

"צוות הניהול"
לא נכון: הקישור שבור.

"אומיד קורדסטני, סגן נשיא, פיתוח עסקי ומכירות"
לא נכון: יועץ בכיר עבור המנכ"ל והמייסדים

"ווין רוזינג, סגן נשיא הנדסה"
לא נכון: לא קיים בהנהלת גוגל כעת.

"סינדי מק'קאפרי, סגן נשיא, תקשורת"
לא נכון: לא קיימת בהנהלת גוגל כעת.

"ג'ון בראדי, סגן נשיא, שירותי חיפוש"
לא נכון: א) לא ג'ון אלא ג'ואן; ב) לא קיימת בהנהלת גוגל כעת.

"טים ארמסטרונג, סגן נשיא, מכירת פרסומות"
לא נכון: לא קיים בהנהלת גוגל כעת.

"אורס הולזל, בחור גוגל"
לא נכון: א) לא הולזל אלא הולצל; ב) אין כזה דבר 'בחור גוגל'; ג) תפקידו הנוכחי: סמנכ"ל בכיר, תפעול - וגם נושא בתואר "Google Fellow" (עמית גוגל)

"קרייג סילברסטיין, מנהל טכנולוגיה"
לא נכון: לא קיים בהנהלת גוגל כעת.

"מילטון סירוטה, אחיינית המתמטיקאי אדוארד קסנר"
לא נכון: אחיין, לא אחיינית.

"השימוש של החברה במילה משקף את משימתה של החברה לארגן כמות עצומה של אינפורמציה ברשת ובעולם"
לא נכון: בגרסה האנגלית של העמוד, החברה מצטנעת ומוכנה לארגן את המידע ברשת בלבד, ולא בעולם כולו.



למה להשתמש בגוגל
גם בעמוד עברי זה נפלו מספר טעויות מביכות לא פחות. אפשר גם להשוות אותו למקור, שגם הוא ירד מהרשת.
טוב שקיים ארכיון האינטרנט, השומר עותקים של דפים שנמחקו מהרשת.

"לב-לבה של התוכנה שלנו הוא דירוג העמוד (פייג'ראנק - PageRank (TM)), מערכת לדירוג אתרי אינטרנט"
לא נכון: פייג'ראנק מודדת דפי אינטרנט, לא אתרי אינטרנט.

"כעי"
לא נכון: בעמוד מופיע הביטוי "כעי" בתור מילה אחת ויחידה, שלה מוקדשת פסקה נפרדת. זוהי טעות מעניינת ונדירה במיוחד באתרי גוגל.

"השיטות האוטומטיות והסבוכות של גוגל מקשות מאד על טיפול של אנשים בתוצאות שלנו"
לא נכון: לא 'סבוכות' אלא מורכבות. לא 'טיפול' אלא שיבוש.

"אין אפשרות לרכוש פייג'ראנק גבוה יותר"
לא נכון: יש אפשרות, אבל לא דרך גוגל.

"לא תיקיה ערוכה ומוגבלת או רשימה של תוצאות שנמכרו למרבה במחיר, אבל שיטה מתחשבת"
לא נכון: תיקיה? אולי מדובר על מדריך. "אבל שיטה מתחשבת"? כנראה ש"אלא שיטה מתחשבת".

"האינדקס של גוגל...הוא הראשון מסוגו הוא מסמל"
לא נכון: לגוגל אין כסף לשכור מגיהים בשביל לתקן את "הוא מסמל" ל"המסמל"?

"גוגל מחזיר רק דפים שכוללים את התנאים שהכנסת"
לא נכון: אף אחד לא מכניס "תנאים" למנוע חיפוש, אלא רק ביטויים או מילות חיפוש.

"אלא שגוגל גם מנתח את הקירבה תוצאות אלו בדף"
לא נכון: דרוש אדם שיודע לכתוב ולקרוא עברית בגוגל.

"כגיבוי למקרה שהסרבר של האתר נופל זמנית"
לא נכון: סרבר הוא למעשה שרת אינטרנט, והוא לא נופל זמנית אלא הופך בלתי-פעיל זמנית.


מיד לאחר פרסום פוסט זה, הוסרו שני העמודים מאתר גוגל ישראל.
למרבה המזל, עותקים מאותם עמודים "מחוקים" אלו קיימים עדיין בארכיון האינטרנט:
1) למה להשתמש בגוגל
2) פרופיל גוגל
שורה תחתונה:
מביך ביותר, או אם להשתמש ברמת התרגום המוצגת בעמודים אלו - "מביך המון".
רק גוגל טרנסלייט עושה עבודה פחות טובה.


2.9.2009

מישהו מקשר אליך?

יש לך אתר? יפה.
האם מישהו ברשת קישר אליו, ואתה לא יודע? סביר להניח שכן.
לכן יש כלים שאמורים לתת לך את המידע הזה.

החל מפברואר 2007, גוגל וובמסטר טולז מספק לבעלי אתרים כלי חשוב לקידום אתרים: קישורים לאתר שלך.

גוגל אינו היחיד שמספק כלי לאיתור קישורים חיצוניים עבור בעלי אתרים, דרך "כלי מנהלי האתרים" (תרגום של Google Webmaster Tools). גם יאהו סייט אקספלורר מאפשר תשובה סבירה לשאלה "מי מקשר אליך", אבל לשני הכלים הללו, המכונים בלשון המקצועית "באק-לינק טולז" (Backlink Tools) יש מגבלות מהותיות.

הכלי של גוגל לא מספק מיפוי מלא ומדויק של כל הקישורים לאתר מסוים ברשת. גוגל הודו בכך כבר בהתחלה, והמצב לא השתפר בצורה משמעותית עד היום. גם לאחר אימות אתר, המאגר מספק מידע חלקי על קישורים חיצוניים לדומיין מסוים, ולעתים מחמיץ קישורים שמופיעים בכל חיפוש פשוט על כתובת האתר ברשת.


בתמונה: כלי הקישורים של גוגל


ידוע שהאופרטור ":link" כבר מזמן לא מספק תמונה אמינה על הקישורים לאתר מסוים, אבל גם הכלי הרשמי של גוגל נותן תמונה מעוותת על מצב הקישורים, ולפעמים לא מספק אפילו קישור אחד לרפואה ("לא ידוע לנו על קישורים לאתר שלך", זה נוסח ההודעה בעברית).

כמות זה לא איכות
הכלל הזה תופס גם על קישורים חיצוניים: גם אם ידוע לך על מספר רב של קישורים חיצוניים לאתר שלך, עדיין קשה מאוד להעריך את איכותם הפרטנית והכללית. במילים אחרות, גוגל נותן לך את הנתונים הבסיסיים, אבל לא מספק את המידע המשמעותי שכולנו רוצים לדעת - מהם הקישורים שבאמת משפיעים על מיקום האתר שלי בתוצאות החיפוש של גוגל.

ניתן לומר שתדירות סריקת הדפים (מתי קישור מסוים נסרק לאחרונה) יכולה להצביע, אם לא לרמז, על איכותו וחשיבותו של קישור מסוים. אין ספק שיש משמעות לכך שדף נסרק בתדירות גבוהה, לעומת דף אחר שנסרק בתדירות נמוכה מאוד - אך קשה להבדיל בין שני דפים בעלי תדירות סריקה גבוהה (אחד יכול להיות איכותי ברמת פייג'ראנק 7, למשל, בעוד השני יכול להיות רק 5), ועוד יותר קשה להבדיל בין שני דפים בעלי תדירות סריקה בינונית.

חשוב לדעת שניתוח קישורים חיצוניים (מי מקשר אליי?) היה הכוח המניע מאחורי פיתוח גוגל בשנות התשעים, כאשר לארי פייג' וסרגיי ברין היו דוקטורנטים באוני' סטנפורד. מבנה האינטרנט לא איפשר לבעלי אתרים לדעת מי מקשר אליהם, והמידע יקר-הערך הזה הפך להיות הבסיס מאחורי הדרך שבה עובד גוגל: ניתוח מעמיק ומקיף של מערך הקישורים ברשת.


הכלי של יאהו

המתחרה הפומבי של גוגל בתחום זה הוא הכלי יאהו סייט אקספלורר. כלי זה מאפשר לקבל כמות מוגבלת של קישורים חיצוניים לכל אתר ברשת, בלי דרישת הוכחת בעלות (אימות שהאתר בבעלותך, על ידי העלאת קובץ לספריית השורש של האתר).

אם משווים את הכלי של יאהו לזה של גוגל, מיד מבינים שיש יתרון גדול לזה של יאהו: ניתן לקבל בעזרתו מידע יקר-ערך על קישורים של מתחרים, ולמעשה על כל אתר. העובדה שאין דרישת אימות כדי לקבל מיפוי קישורים חיצוניים (ולו חלקי), מאפשרת לכל אדם להשתמש בכלי ולבצע "ריגול תעשייתי" באופן יעיל ומהיר.

הבעיה הבסיסית של יאהו סייט אקספלורר, למרות שהוא עובד יפה, היא מגבלת הכמות: ניתן לייצא רק 1000 קישורים אל תוכנת אקסל (קובץ csv). זוהי מגבלה חמורה על בעלי אתרים פופולריים. המגבלה מובנת אם מדובר בבדיקה של אתרים בלתי-מאומתים (עומס על מערכת יאהו), אבל המגבלה אינה ברורה כאשר בעל אתר מבצע אימות מלא של בעלותו על האתר, ועדיין מקבל רק 1000 קישורים בקובץ מיוצא.


כלים נוספים
ברשת קיימים כלים רבים ה"מתעלקים" על הכלים של גוגל ויאהו, ומציעים ניתוח "באק-לינקס" מהיר ונוח. קחו למשל את בקלינק ווטש - רק מכניסים דומיין ומקבלים טבלה זריזה על המקום. כך גם הכלי של iwebtool והכלי של דיגיטל פוינט.

יש גם כלים מקוריים, שמנסים למפות את מערך הקישורים ברשת ולהציע שירות מקורי ומיוחד, כמו הכלי של מג'סטיק. הוא מאפשר לקבל תמונת מצב ממצה ומוחשית של מצב הקישורים החיצוניים באתר שלך, ותמורת תשלום סמלי - גם של המתחרים שלך.

ניתוח קישורים דורש כוח מיחשוב רציני, תשתית חומרה יקרה ומומחיות טכנית שקשה לצבור בזמן קצר. מנועי החיפוש הגדולים מטפלים בנושא בצורה טובה מאוד, אבל אין להם מונופול על סריקת הרשת. התחום עדיין נמצא בחיתוליו, למרות הדומיננטיות של גוגל בשוק מנועי החיפוש, וכלים לניתוח קישורים עשויים להמשיך ולצוץ בשנים הקרובות על ידי גופים עצמאיים שימצאו פתרונות חומרה ותוכנה מקוריים לסריקה יעילה של קישורים ברשת.



כל הזכויות שמורות לבלוג חופש החיפוש 2007-2012