program story

"라틴"에서 지원하는 언어와 Google 웹 글꼴의 글꼴에서 "라틴 확장"글리프?

inputbox 2020. 12. 9. 08:07
반응형

"라틴"에서 지원하는 언어와 Google 웹 글꼴의 글꼴에서 "라틴 확장"글리프?


Google 웹 글꼴 선택 문자 세트

Google Web Fonts의 일부 글꼴은 여러 "문자 집합"을 지원합니다. 문제는 내가 사용하는 웹 글꼴이 "라틴"글리프 만 제공하는 경우 글리프가 지원되지 않는 언어로 페이지를 번역하는 사용자는 엉망이 된 텍스트를 분명히 알아 차릴 것입니다.

내 웹 글꼴이 영어를 제외하고 세계에서 가장 인기있는 언어 (예 : 스페인어, 독일어, 프랑스어 등)를 지원하고 싶습니다.

이를 위해 "라틴어"와 "라틴어 확장"이 정확히 어떤 언어를 개별적으로 충족하는지 알고 싶습니다.

대답은 다음과 같을 것으로 예상합니다.

Latin Character Set & Supported Languages:

- ..........
- ..........
- ..........

Latin-Extended Character Set & Supported Languages:

- ..........
- ..........
- ..........

Google Web Fonts 문서 또는 인터넷 검색에서이 정보를 찾을 수 없습니다.


라틴어

일명 Unicode Latin1-Supplement (U + 0080 ~ U + 00FF)는 서유럽 언어 (프랑스어, 독일어, 스페인어, 아일랜드어, 아이슬란드 어, 스칸디나비아 국가의 언어 및 우연히도 목록에 언급 된 다른 언어를 언급했듯이)를 지원하기위한 것입니다. 아래; 영국 영어에는 일반적으로 사용되는 £ 기호가 누락되고 미국 영어는 표준 ASCII에서 지원됩니다.) ASCII (처음 127 자, 그 중 95자는 U + 0020에서 U + 007E까지의 문자 소)는 Basic Latin이라는 유니 코드의 첫 번째 블록으로 배치되었습니다. 이 블록은 "라틴"의 일부로 간주되며 라틴 기반 시스템에서 글꼴 이름을 올바르게 표시하기 위해 일반적으로 비 라틴 글꼴에서도 지원됩니다.

라틴어 확장

Latin Extended는 모든 공통 라틴어 텍스트를 지원해야하는 Latin-Extended-A (U + 0100 ~ U + 017F)를 실질적으로 차단하는 것을 의미 합니다. Latin1-Extended-B는 대부분 음성학 및 아프리카 라틴 문자에 대한 지원을 포함하지만 아래에 언급 된 루마니아어 및 아제르바이잔 어에 대한 3 개의 문자도 포함합니다 (확장 A의 문자로 대체 가능). 더 이국적인 C, D 및 E 확장 (총 252 자)이 있지만 일반적인 전자 텍스트에는 사용되지 않습니다.

이 블록을 사용하는 대부분의 언어는 "Latin"(Latin1-Supplement)의 문자도 사용하므로 "Latin-Extended"글꼴 에는 "Latin"문자의 상위 집합 포함 되어야 하지만 보장되지는 않습니다. 글꼴에 포함 된 문자가 많을수록 크기 (전체 BMP를 포함하는 글꼴은 10MB 이상으로 커질 수 있으며 웹 글꼴에는 적합하지 않습니다). 따라서 Latin-Extended-A 블록의 모든 문자가 Latin-Extended 범주 에 있어야하는 것은 아닙니다. 특히 매우 양식화 된 글꼴에서는 글꼴의 목적이나 작성자의 동기에 따라 다릅니다. 글꼴이 특정 언어를 지원하는지 확인하려면 아래 목록의 문자를 표시해보십시오.

언어 지원

아래 목록에서 나는 계산하지 않습니다.

  • 이중 음자 일반적으로 별도의 문자로 대체된다 (AE는 라틴 보충제 의해 지원됨)
  • 라틴어 대 라틴어 확장에 관한 질문이므로 비 라틴어 알파벳
  • 소수 민족 및 죽은 언어 (엘프 달어, 페로 어, 카슈 비아 어, 몬테네그로 어, 리 보니 아어, 라 딘어, 프리 울어 어,로만 시어, 사 미어, 어퍼 및 하어 소르 비아 어, 네이티브 인도 라틴어 알파벳)
  • ASCII 알파벳 (네덜란드어 또는 게 일어)에서 완벽하게 지원되는 ASCII 알파벳 (모든 공통 글꼴)
  • 최신 버전의 알파벳에 사용되지 않은 역사적인 문자 (예 : 이중 억음 악센트)

중요한 것이 누락되었거나 전자 통신에 소수 언어가 사용 된 경우 의견을 보내주십시오.

라틴어

  • 알바니아어 Ç, Ë
  • 카탈로니아 어 À, É, È, Í, Ï, Ó, Ò, Ú, Ü, Ç
  • Danish, Norwegian Æ, Å, Ø
  • Finnish Å, Ä, Ö, Š, Ž (last two from Extended-A rarely used, can use S, Z, then Latin1-Supplement is sufficient)
  • French Æ, Œ, Â, À, É, È, Ê, Ë, Ç, Î, Ï, Ô, Ù, Û, Ü, Ÿ, », « (rarely used Œ, Ÿ from Extended-A, the rest including ÿ in Latin1-supplement)
  • German Ä, Ö, Ü, ß
  • Icelandic Æ, Á, É, Í, Ó, Ö, Ú, Ý, Þ, Ð
  • Irish Á, É, Í, Ó, Ú
  • Sardinian Ç
  • Spanish and Galician Ñ, ¿, ¡
  • Swedish Å, Ä, Ö

Latin Extended

  • Azerbaijani Ç, Ğ, I (dotless lowercase), İ, Ö, Ş, Ü, Ə (last one from Extended-B is replacable by Ä, then same alphabet as Turkish)
  • Serbian, Bosnian and Croatian Ć, Č, Đ, Š, Ž
  • Czech Á, Č, Ď, Ě, É, Í, Ň, Ó, Ř, Š, Ť, Ú, Ů, Ý, Ž
  • English £, ¢
  • Estonian Ä, Ö, Õ, Ü, Š, Ž
  • Esperanto Ĉ, Ĝ, Ĥ, Ĵ, Ŝ, Ŭ
  • Hungarian Á, É, Í, Ó, Ö, Ő, Ú, Ü, Ű
  • Latvian Ā, Č, Ē, Ģ, Ķ, Ī, Ļ, Ņ, Ō, Ū, Ŗ, Š, Ž
  • Lithuaian Ą, Č, Ę, Ė, Š, Ų, Ū, Ž
  • Polish Ą, Ć, Ę, Ł, Ń, Ó, Ś, Ź, Ż
  • Portuguese Á, Â, Ã, À, Ç, É, Ê, Ó, Ô, Õ, Ú
  • Romanian Ă, Â, Î, Ș, Ț (last 2 are in Latin Extended B, can use Ş, Ţ from Extended A)
  • Slovak Ä, Á, Č, Ď, É, Í, Ĺ, Ľ, Ň, Ó, Ô, Ú, Š, Ŕ, Ť, Ý, Ž
  • Slovene Č, Š, Ž
  • Turkish Ç, Ğ, I (dotless lowercase), İ, Ö, Ş, Ü
  • Vietnamese Ă, Â, Đ, Ê, Ô, Ơ, Ư (first one and last two in Extended-B plus combining tones 0x300 and 0x301, see combining diacritical marks below, has a special category on google fonts)
  • Welsh Â, Ê, Î, Ô, Û, Ŵ, Ŷ

Combining diacritical marks

Alternatively, the font may support the Combining Diacritical Marks block: U+0300 to U+036F. For example, Ř can be typed either as U+0158 (aka precomposed character) or as R + U+030C. Program supporting Unicode should both display and treat the same as a standalone character, but if the program or font doesn't support repertoire, the combining diacritical mark might end up a bit misplaced, see this very detailed Unicode Q&A on this topic.

Other characters to consider

German Fraktur, still commonly used (i.e. on most street signs in Salzburg), contains several "s" variants that are not in Unicode, fonts can't display them as glyphs and map them as other characters (not a good idea). There are other exotic symbols that could be useful in electronic texts (when I was a child, I was taught "Ch" as a grapheme in Czech alphabet after "h". It is not in Unicode (similar Slovene Lj, Nj is in Unicode), and since electronic texts prevailed in Czech Republic in mid 90's, it is not emphasized anymore, yet in Czech locale "ch" sequence is still sorted after "h", more interesting info here).

Useful fonts with multilanguage support

You might want to customize some fonts (if their licence allows it) by Font Squirrel service or use them as backup. There are wide support free fonts to start with:

  • I really like nice looking Quivira open-type font with 11+k chars, 1.5 MB
  • many computers have Arial Unicode installed (part of MS Office, 50k+ chars, 22 MB)
  • there is a Noto project by Google which contain ALL but most recent unicode characters in serif, sans-serif and UI fonts nicely sorted by blocks support (1.1 GB)
  • as the last resort backup font, you may consider ugly looking Unifont (50+k chars, but only 11 MB and embedded devices friendly)

참고URL : https://stackoverflow.com/questions/14303677/languages-supported-by-latin-vs-latin-extended-glyphs-in-fonts-on-google-web

반응형