מקור 27.2.2002
עידכון אחרון 24.9.2003

עברית באינטרנט - מדריך מעשי / יובל רבינוביץ

למפתח אתרים בעברית באינטרנט יש קשיים שאינם קיימים אצל אנשים שאינם צריכים לקחת בחשבון כיווניות מתחלפת וגופנים בלתי נפוצים.

גולשים עבריים נאלצים להתמודד עם מלים המופיעות הפוך ושורות שסופן מופיע לפני תחילתן. גם סרגל הגלילה מופיע לעתים בצד ימין של המסך ולעתים בצד שמאל, ללא אחידות.

יש לכך מספר גורמים. הכרתם יכולה לסייע להימנע מתופעות כאלה. עם זאת, כל זמן שקיימים מסכים בגדלים שונים בשילוב עם דפדפנים ישנים, תמיד צפויות בעיות. יש להניח שבשנתיים הקרובות יתרחש יישור קו של תקני תצוגה מימין לשמאל, והבעיות תיעלמנה בהדרגה.

נפתח בכך שה-HTML הרשמי, כפי שהוגדר על ידי w3c.org תומך בכיווניות מתחלפת. עם זאת, כל הדפדפנים התעלמו בתחילה מדרישת ה-w3c ולא הטמיעו את הפונקציות המתאימות. מיקרוסופט היו הראשונים שתמכו בתצוגות עברית שונות, פונקציה שהופיעה במלואה בנטסקייפ רק בגירסה 6.1, דבר שנתן למיקרוסופט מקדמה של שנתיים וחצי בשוק הישראלי.

קיימות שתי דרכים להצגת טקסט מימין לשמאל. השיטה הפשוטה, הפועלת על כל דפדפן באשר הוא, היא להפוך את הטקסט באתר, כך שהדפדפן יקבל את כל האותיות בשורה משמאל לימין, בסדר הפוך. התוצאה המתקבלת היא טקסט שיכול להיקרא בצורה הנכונה מימין לשמאל. הדבר מחייב את האתר לקבוע היכן תישבר כל שורה.

לדוגמא: נניח שאתה רוצה להציג את הטקסט: "שלום רב שובך ציפורה נחמדת". דפדפן שאינו מודע לכיווניות, צריך לקבל את הטקסט: תדמחנ הרופיצ ךבוש בר םולש. הוא יציג אותו משמאל לימין, ותתקבל התוצאה הרצויה. אבל אם חלון התצוגה צר ומאפשר רק שלוש מלים בשורה, תתקבל התוצאה הבאה:

ציפורה נחמדת
שלום רב שובך


דפדפן המודע לכיווניות, אמור לקבל את המחרוזת "שלום רב שובך ציפורה נחמדת" ולדעת היכן לשבור את השורה בצורה נכונה. כאמור, רק דפדפנים חדשים תומכים באפשרות זו.

כיצד להציג את הטקסט שלך: הפוך, כך שכל דפדפן יציג אותו נכון במחיר של שבירת שורות לא נכונה מדי פעם, או ישר, כך שיוצג ללא דופי, אך רק על ידי דפדפנים חדשים?

הצורה הראשונה נקראת "עברית ויזואלית" והשניה "עברית לוגית". קל יותר ליצור דפים בעברית לוגית. ניתן לכתוב את הטקסט העברי בכל מעבד תמלילים, ואפילו בפנקס הרשימות "notepad" של חלונות. מצד שני - רק דפדפנים חדשים יכולים לקרוא אותה.

האפשרויות הקיימות:

  • צור מכל מסמך שני עותקים. האחד בעברית לוגית והשני בעברית ויזואלית. שמור את שניהם באינטרנט וכוון את הגולש לקבל את המסמך המתאים לו.
  • כתוב בעברית לוגית בלבד. המחיר הוא שחלק מהגולשים (כ-5% בזמן כתיבת שורות אלו) לא יוכל לגלוש באתרך.
  • הודעות קצרות וחשובות במיוחד אתה יכול להמיר לקובץ גרפי. הדפדפן מתייחס אליו כאל תמונה, ויציג אותה כפי שהיא על המסך. אם המסך צר מדי, הגולש יצטרך לגלול אותו כדי לראות את ההודעה על כל חלקיה. בקובץ זה אין שבירת שורות, והגולש אינו יכול להעתיק את הטקסט בכלי חיתוך והדבקה.
  • בשום אופן אינני ממליץ כיום לכתוב אתרים שלמים בעברית ויזואלית. עם הופעתם של מכשירי תצוגה זעירים לאינטרנט והשתכללות הדפדפנים, לא ניתן להניח שום גודל מסך אצל הגולש, אבל ניתן להניח שהוא משתמש בדפדפן מודרני. לכן השימוש בעברית הויזואלית הולך ונעלם.

זיהוי עברית על ידי הדפדפן:
הגולש יכול להתאים ידנית את סוג העברית שהדפדפן מראה. עם זאת, תכנון נכון של מסמכים יביא לזיהוי אוטומטי נכון של סוג העברית על ידי הדפדפן. הצורך של הגולש לבצע מעשי לוליינות למיניהם כדי לקרוא את המסמך באתר מצביע על תיכנון רשלני ולא מקצועי של האתר.
הדפדפן מזהה את השפה והכיוון על ידי הצהרת meta מתאימה בראש המסמך, כפי שיפורט להלן.

כתיבת עברית לוגית:
בקטע ראש המסמך (זה שבין <head> ל-<head/>) עליך להכניס את השורה:

<meta http-equiv="Content-Type" content="text/html; charset=windows-1255">

את שאר המסמך כתוב בצורה חופשית.

כתיבת עברית ויזואלית:
בקטע ראש המסמך (זה שבין <head> ל-<head/>) עליך להכניס את השורה:

<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-8">

את שאר המסמך עליך לכתוב באותיות הפוכות. הקל ביותר הוא לכתוב את הטקסט בצורה רגילה, ללא קודים של HTML, ולאחר מכן להמירו לטקסט הפוך בעזרת אחד מהופכי הטקסט החופשיים הקיימים באינטרנט (Ctrl-cc, HebTML, EasyHEB ואחרים). דאג שהשורות שלך תהיינה קצרות, לא יותר מ-30 תוים בשורה.

שיקולים תיאורטיים בבחירת charset:
תכונת charset בהוראת meta מבטאת את מערך התוים הגרפי שיש להשתמש בו. היא מציינת את דף הקוד שממנו נלקחים המרכיבים הגרפיים של השפה, כך שהדפדפן יודע מאיזו שפה לקחת את התוים המוצגים. מהבחינה הזו אין הבדל בין דף הקוד iso-8859-8, דף הקוד windows-1255, או דף הקוד utf-8.

עם זאת, קידודי windows-1255 ו-utf-8 מכילים גם מידע על כיווניות. בקידוד iso-8859-8 מוצגים כל התוים באותו כיוון. אם אין שום הצהרה על כיווניות, מופיעות כל האותיות משמאל לימין: הלטינית בצורה נכונה, והעברית בצורה המכונה אצלנו 'ויזואלית'.

אם יש הצהרה על כל המסמך או על חלקו כבעל כיווניות rtl, מופיעים התוים מימין לשמאל, דבר ההופך את הלטינית/אנגלית (אנגלית 'ויזואלית'?).

בקידודי windows-1255,utf-8 מוצגים התוים העבריים מימין לשמאל והלטיניים משמאל לימין. כל מה שנותר לכותב המסמך לעשות הוא לוודא הצמדה לכיוון הנכון (הצמדת הטקסט לימין או לשמאל).

למי שכותב ב-notepad, שמירת ברירת המחדל היא ב-ANSI. קובץ שנשמר כ-ANSI לא יכול להיות מוצג כ-utf. לכן עבודה במערכת windows מביאה לכך ששמירה בקידוד windows-1255 היא הנוחה ביותר לשימוש.

הטיפול בסרגל הגלילה (scroll bar):
משום מה החליטה מיקרוסופט שמסמכים הנכתבים מימין לשמאל זקוקים לסרגל גלילה משמאל, ומסמכים הנכתבים משמאל לימין צריכים סרגל גלילה מימין. מסמכים הנכתבים בעברית לוגית מוצגים, לפיכך, כאשר סרגל הגלילה נמצא אצלם בצד ההפוך של המסך ביחס לכל מסמך אחר (למשל - באנגלית או בעברית ויזואלית). אל תסבך את הגולשים שלך. דאג לכך שסרגל הגלילה יהיה תמיד מימין למסמך. לכן אל תגדיר את כיווניות המסמך בתג html אלא בתג div:

הצורה הלא נכונה:
<html dir="rtl">
<head></head>
<body>
     מסמך
</body>
</html>


הצורה הנכונה:
<html>
<head></head>
<body>
  <div dir="rtl" align="right">
     מסמך
  </div>
</body>
</html>

זהו. אני מקווה שמדריך זה תרם משהו לתיכנון האתרים העבריים ברשת.

©Yuval Rabinovich 2002,2003