A Unicode egy karakterkódolási rendszer, amely a világ összes írott nyelvének karaktereit le tudja írni. A Unicode rendszer szabványosítja ezeket a karaktereket, hogy a különböző számítógépes rendszerek és programok közötti átjárhatóság zökkenőmentes legyen.
A Unicode kódtábla hatalmas, több mint egymillió kódpontra terjed ki, és számos különböző karakterkészletet tartalmaz, beleértve a latin betűket, ideogrammokat, matematikai szimbólumokat, történelmi írásrendszereket, emojikat és még sok minden mást.
A Unicode karaktereket általában „U+” után következő hexadecimális számmal írják le. Például:
- A „U+0041” a latin „A” nagybetű.
- A „U+00E9” a kis „é” betű ékezettel.
- A „U+1F602” az „😂” (nevető arc könnyekkel) emoji.
A teljes Unicode kódtábla túl nagy ahhoz, hogy egyszerre bemutassam, de a Unicode Consortium weboldalán elérhető és böngészhető. A leggyakrabban használt karakterek a Basic Multilingual Plane (BMP) nevű szakaszban találhatók, ami a „U+0000” és „U+FFFF” közötti területet foglalja el.
arakter | Név | Unicode Kód | HTML Entitás |
---|---|---|---|
A | Latin nagybetű A | U+0041 | A vagy &A; |
a | Latin kisbetű a | U+0061 | a vagy &a; |
Á | Latin nagy A ékezettel | U+00C1 | Á vagy Á |
á | Latin kis a ékezettel | U+00E1 | á vagy á |
1 | Számjegy 1 | U+0031 | 1 |
@ | Kukac jel | U+0040 | @ vagy @ |
€ | Euro jel | U+20AC | € vagy € |
♥ | Szív szimbólum | U+2665 | ♥ vagy ♥ |
😊 | Mosolygó arc szemmel | U+1F60A | 😊 |
🚀 | Rakéta | U+1F680 | 🚀 |
Ez a táblázat csak egy kis részletet mutat be a rendelkezésre álló Unicode karakterekből. A Unicode standard rengeteg karaktert tartalmaz a világ számos különböző írásrendszeréből, szimbólumokból és emojikból.