תגית: SEO

ההכרזה שגוגל יתחיל לאנדקס קבצי פלאש היא לכל הפחות לא מדויקת

רעידת האדמה הקלה שנרשמה אתמול במרכזי מעקב סייסמולוגיים ברחבי העולם המערבי היתה כתוצאה של אורגזמה בו זמנית של מליוני אנשי שיווק שקראו את ההודעה של אדובי על כך שגוגל ויהאו יתחילו לאנדקס את התוכן הכלול בflash באתרים והאמינו שבכך הונחתה מכה קשה על כל האנשים בעלי חוש אסטטי, ששימושיות חשובה להם, ושנקודת השכנוע היחידה שהיתה להם כלפי אנשי השיווק נגד הכללת התועבה הנקראת פלאש באתרים היתה "פלאש לא מאונדקס במנועי חיפוש". לדעתי העתיד צופן להם אכזבה בתחום הזה.

ראשית, למנועי החיפוש לא היתה שום בעיה לאנדקס את הפלאש כבר היום. הפורמט בו קבצי הפלאש נכתבים ידוע לכל מי שמוכן להתחייב לא ליצור נגן פלאש מתחרה, תנאי שלמנועי החיפוש לא היתה אמורה להיות שום בעיה איתו.

הבעיה של פלאש אינה הפורמט, אלא העובדה שפלאש מכיל מידע שאינו בהכרח טקסטואלי, אלא מעין תסריט של פעולות ותגובות המיצרות תוכן. מה שאדובי נתנה לגוגל ויהאו אינו הפורמט של הקבצים, אלא תוכנה המריצה את כל אפשרויות הקלט על קובץ הפלאש ומיצרת את כל המידע הטקסטואלי האגור בו. בעזרת התוכנה הזו מנוע החיפוש מקבל את כל הטקסט והקישורים האפשריים הנמצאים בפלאש ויכול להתחשב בהם באלגוריתמי הדירוג שלו.

בזאת אולי נפתרה בעית האינדוקס, אבל היא חושפת את בעיות הנגישות של פלאש מתוצאות חיפוש. בעוד שלכל דף HTML ברשת יש כתובת יחודית ומנוע החיפוש מפנה לכתובות הרלבנטיות לחיפוש, לתסריטים הפנימיים של הפלאש אין כתובות יחודיות ולכן מנוע החיפוש תמיד יפנה רק למסך הכניסה של הפלאש והמשתמש יצטרך למצוא את המידע בעצמו… אם היתה פונקציונליות סבירה לחיפוש פנימי בפלאש זה אולי אפילו היה סביר, אבל אין. הבעיה הזו כנראה ניתנת לפיתרון על ידי שימוש בכתובות שונות של אותו דף HTML בכדי להגיע לאזורים שונים של הפלאש, אבל להבדיל מהחשיפה לחיפוש שלא מצריכה שום מאמץ מצד מפתח האתר, הפיתרון הזה ידרוש שינויים בפלאש של 99.99% מהאתרים.

בעיני ההכרזה הזו נראית כירית הפתיחה בקרב הנואש שאדובי תנהל להשרדותו של הכלי הזה. הפלאש מאוים ממספר צדדים:

  • טכנולוגית הsilverlight שעקרונית דומה לפלאש אבל בגלל שהיא בנויה על טכנולוגיה של .net סביר להניח שלאנשים שמפתחים אתרים עם ASP ויתר טכנולוגיות ה.NET יהיה הרבה יותר טבעי לפתח מולטימדיה עם אותה טכנולוגיה בסיסית.
  • שילוב של גרפיקה דינמית ווקטורית בדפדפנים. שועל האש 3, ספארי ואופרה תומכים ברכיב לא סטנדרטי הנקרא canvas המאפשר בעזרת ממשק תוכנה לצייר צורות באופן דינמי. בנוסף שועל האש ואופרה תומכים במידה מסוימת לפחות בסטנדרט הSVG המאפשר יצירת גרפיקה וקטורית בצורה דומה לHTML.
  • הכללת יכולות מולטימדיה (מוזיקה ווידאו) בסטנדרט המתגבש של HTML5. אני מניח שהסיבה העיקרית שאנשים בכלל טורחים להתקין פלאש היא בשביל לשמוע מוזיקה ולצפות ביוטיוב, בלי הסיבה הזו מי כבר יתקין פלאש…

ולמרות שזה ברור לכולם שזו התנהגות לא נכונה, גוגל עדיין מפנה לרסס בתוצאות חיפוש…

למרות שהאתר של החבר שלי, שהוא מתכן השקיה במקצועו, משרת עד עכשיו את מטרתו ונותן יחס לא רע בין תמורה להשקעה, החלטתי לבדוק הבוקר מספר מונחי חיפוש שהיה רצוי שהוא יופיע בהם במקומות סבירים בתוצאות החיפוש. למרבה ההפתעה, עבור אחד המונחים תוצאות החיפוש הפנו לרסס של האתר במקום לאתר עצמו, למרות שצירוף המילים הופיע באחד מהמאמרים, וזו ממש לא התנהגות נחמדה כלפי הגולש האקראי שלא יצליח לזהות לבד שהוא לא נמצא בדף המכיל זבל, אלא בדף רסס שממנו כדאי לגלוש לאתר.

כבר בחיפוש הראשון אחרי הסבר לתופעה הגעתי לאתר שהפנה אותי להודעה רשמית של גוגל שאומרת שגוגל לא יציג תוצאות חיפוש ברסס כחלק מתוצאות החיפוש הכלליות. האם זה אחד מהמקרים הקלאסיים שבהם לאנשי שיווק נוח להבטיח דברים שלמתכנתים קשה לישם?

מאחר שבין אם זה באג או תכונה, ההתנהגות הזו ממש לא לענין לפחות במה שקשור לאתר הזה, החלטתי לנסות למצוא פיתרון להוריד את הרסס מתוצאות החיפוש. נראה שהדרך הפשוטה ביותר היא להגיד למנועי החיפוש לא לאנדקס את הרסס. הבעיה עם הפיתרון הזה היא שהרסס לא יופיע גם בתוצאות החיפוש בblog search ומאחר שהblog search משמש את וורדפרס למציאת קישורים נכנסים לאתר, הפיתרון יחבל בפונקציונליות הזו. כמובן שהבעיה הזו לא ממש חשובה בהקשר של האתר הזה, אבל החלטתי לנסות למצוא פיתרון טיפה יותר כללי.

השאלה המרכזית היא איך גוגל מחליט מתי רסס הוא רסס ומתי הוא לפחות באופן פוטנציאלי דף רגיל. נכון לכרגע הנחת העבודה שלי היא שקישורים לרסס מהסוג <"link rel="alternate" type="application/rss+xml" title= "RSS 2.0> מזהים לגוגל רסס, בעוד שקישורים רגילים כמו <"a href="http://marksw.com/wordpress/?feed=rss2> מזוהים כדפים קישורים לדפים רגילים, וכל מה שצריך לעשות זה למנוע מגוגל להתיחס אליהם ככאלו.

אחרי חיפוש מהיר בתקני הרשת לא מצאתי דרך תקנית להגדיר שקישור "רגיל" מוביל לרסס ולכן האפשרות היחידה שנשארה פתוחה היא הוספת rel="nofollow" לקישורים האלו בתקוה שגם אם גוגל ימשיך להתחשב בדפי הרסס בתוצאות החיפוש, הPR שלהם יהיה נמוך ותהיה עדיפות להצגת הדפים מהאתר. עכשיו צריך לתת לזה קצת זמן בכדי לגלות אם זה עוזר…..