Znaki diaktryczne w Unicode
Strona zakodowana w standardzie UTF-8
Przeglądarki wersji od 4.0 umożliwiają wyświetlenie - na tej samej stronie - tekstu ze znakami diaktrycznymi w wielu językach i zakodowanymi w standardzie Unicode.
Ą ą Ć ć Ę ę Ł ł Ń ń Ó ó Ś ś Ź ź Ż ż
Ą ą Ć ć Ę ę Ł ł Ń ń Ó ó Ś ś Ź ź Ż ż
Polskie znaki (w górnym rzędzie) wywołane są znacznikami zastąpionymi (w dolnym rzędzie) numerami kodu (używane również w przykładach i tekście). Wszystkie znaki diaktryczne powinny prawidłowo wyglądać w przeglądarkach dla systemów Windows i Unix, ale w MacOS niewidoczna będzie cyrylica (?).
Testy
Strony z przykładami Unicode testowałem w przeglądarkach wersji od 4.0 dla MacOS, Unixa i Windows. Przeglądarki dwóch ostatnich platform pokazały poprawny rezultat. Natomiast w MacOS, zarówno Netscape 4.5 jak i Explorer 4.1 nie pokazały cyrylicy. Poza tym Explorer pokazał tylko część znaków w oknach otwieranych przy pomocy JavaScript. Skrypt ów działa bezbłędnie z inną zwartoscią.
Znaczniki standardu ISO 8859-1 pokazywane są prawidłowo w dokumencie z nagłówkiem <META ... charset=UTF-8"> czyli na stronie wywołującej standard Unicode przeglądarki.
Będę rad z przysłania opisów obserwacji nie zgadzających się z moimi lub je uzupełniające.
Znaki diaktryczne innych języków
Znaki zakodowane numerycznie zostaną pokazane prawidłowo również w innym standardzie (ISO 8859-2 i ISO 8859-2), ale tylko w Unicode możemy je zobaczyć na tej samej stronie razem ze znakami innych języków.
Svenska |
Å å Ö ö Ä ä [É é]
|
Ìslenzka |
Ð ð Þ þ Æ æ
|
Russian
|
А а
Б б
В в
Г г
Д д
Е е
Ж ж
З з
И и
Й й
К к
Л л
М м
Н н
О о
П п
Р р
С с
Т т
У у
Ф ф
Х х
Ц ц
Ч ч
Ш ш
Щ щ
Ъ ъ
Ы ы
Ь ь
Э э
Ю ю
Я я
|
Greek |
Α α
Β β
Γ γ
Δ δ
Ε ε
Ζ ζ
Η η
Θ θ
Ι ι
Κ κ
Λ λ
Μ μ
Ν ν
Ξ ξ
Ο ο
Π π
Ρ ρ
Σ σ
Τ τ
Υ υ
Φ φ
Χ χ
Ψ ψ
Ω ω
|
 |
Typografia
Stosując polecenie <FONT FACE="..."> nie uzyskamy zamierzonego efektu w różnych platformach i powstanie ryzyko, że znaki diaktryczne znikną w ogóle. Natomiast możliwe jest "bezpieczne" użycie fontu odmiennego od standardowego (domyślnego) w poleceniu <FONT FACE="Arial,Helvetica">.
Arial |
Ą ą Ć ć Ę ę Ł ł Ń ń Ó ó Ś ś Ź ź Ż ż |
Helvetica |
Ą ą Ć ć Ę ę Ł ł Ń ń Ó ó Ś ś Ź ź Ż ż |
Trebuchet MS |
Ą ą Ć ć Ę ę Ł ł Ń ń Ó ó Ś ś Ź ź Ż ż |
Palatino |
Ą ą Ć ć Ę ę Ł ł Ń ń Ó ó Ś ś Ź ź Ż ż |
Geneva PL |
Ą ą Ć ć Ę ę Ł ł Ń ń Ó ó Ś ś Ź ź Ż ż |
Verdana |
Ą ą Ć ć Ę ę Ł ł Ń ń Ó ó Ś ś Ź ź Ż ż |
 |
Używając obcych znaków diaktrycznych można stosować inny font niż standardowy, ale należy brać pod uwagę możliwości odbiorców. Aktualnie najnowsze wersje przeglądarek dla MacOS nie rozróżniaja rodzajów fontów i pokazuja tylko font standardowy.
Praktyka
Najprostszym sposobem skonstruowania strony www w Unicode jest skonwertowanie dokumentu HTML stworzonego w standardzie CP 1250 albo ISO 8859-2.
Podczas ewentualnego "ręcznego" wprowadzania poprawek odpowiednie znaczniki należy kopiować z przeglądarki i wklejać do edytora. Nie wiadomo dlaczego (?) identycznie wygladające znaczniki (złożone z połączenia dwóch znaków ASCII) po skopiowaniu lub przeniesieniu w inne miejsce edytora mogą zmienić wygląd w przeglądarce. Natomiast używanie znaków zapisanych numerycznie nie stworzy żadnych problemów.
Dla ułatwienia odwiedzającemu wybrania odpowiedniego standardu kodowania przeglądarki, nie należy zapomnieć o wpisaniu polecenia uruchamiającgo ów standard:
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=UTF-8">
Stworzenie dokumentu w Unicode możliwe jest przy pomocy Word 97. Do pisania różnymi językami potrzebne są właściwe sterowniki klawiatury, fonty lub programy. Jeśli ich brak, to odpowiednia wersja językowa systemu.
Narzędzia
Edytor tekstowy yudit-1.0 dla X Windows (freeware) zawiera narzędzia konwertujące do Unicode.
Edytor HTML WinCALIS (Windows) umożliwia tworzenie dokumentów HTML w standardzie Unicode.
W programie konwertującym Ogonki 97 (Windows - freeware) istnieje opcja konwersji z CP 1250 oraz ISO 8859-2 do UTF-8 i polskie znaki zamieniane są na znaczniki.
Profesjonalny edytor graficzny i tekstowy Adobe GoLive 4.0 (MacOS oraz Windows) posiada opcje zapamiętywania w różnych standardach, w tym i w Unicode.
MacOS zawiera Text Encoding Converter (TEC), z których korzystają m.in. Cyberdog, PowerMail, MS Outlook.
Źródłowe adresy
W3C
Unicode Consortium
Everson Gunn Teoranta
AGH lub SUNSITE - Polska Strona Ogonkowa
OGONS
Ogonki w Unikodzie
pl.comp.www FAQ
Polskie znaki diaktryczne w Unicode
HTML 4.0 |
NUMERY |
ZNACZNIKI |
Ą |
Ą |
 |
ą |
ą |
 |
Ć |
Ć |
 |
ć |
ć |
 |
Ę |
Ę |
 |
ę |
ę |
 |
Ł |
Ł |
 |
ł |
ł |
 |
Ń |
Ń |
 |
ń |
ń |
 |
Ó |
Ó |
 |
ó |
ó |
 |
Ś |
Ś |
 |
ś |
ś |
 |
Ź |
Ź |
 |
ź |
ź |
 |
Ż |
Ż |
 |
ż |
ż |
 |
HTML 4.0 |
NUMERY |
ZNACZNIKI |
|