Цанцзе (письмо)

Метод ввода Цанцзе
Кодирование иероглифов 倉頡輸入法 («метод ввода Цанцзе») методом Цанцзе.Кодирование иероглифов 倉頡輸入法 («метод ввода Цанцзе») методом Цанцзе.
Китай
Традиционный китайский 倉頡輸入法
Упрощённый китайский 仓颉输入法
Значение метод ввода Цанцзе
Транскрипция
Путунхуа
Пиньинь Cāngjié Shūrùfǎ
Кириллизация цанцзе шужуфа
Уэйда — Джайлза Ts'ang1-chieh2 Shu1-ju4-fa3
йельская tsʰɔ́ːŋ kɪ̄t ɕȳː jɐ̀p fāːt
Гоюй ломацзы Tsang Jye Shuruhfaa
Миньские языки
Пэвэдзи (тайв.) Chhong-kiat Su-ji̍p-hoat
Юэ (кантонский)
Ютпхин Cong1 Kit3 Syu1 Jap6 Faat3
МФА (IPA) cang1jie2-shu1ru4fa3
Йельская романизация Chōng Kit Syūyahpfaat
Логотип Викисклада Медиафайлы на Викискладе

Цанцзе (кит. трад. 倉頡輸入法, упр. 仓颉输入法, пиньинь cāng jié shūrùfǎ, палл. цанцзе шужуфа) — структурный метод ввода китайских иероглифов, разработанный в 1976 году Чу Бонфу, один из способов ввода иероглифов с клавиатуры пишущей машины, компьютера и так далее.

В основе метода Цанцзе лежит простая геометрическая декомпозиция иероглифа, а не стандартный порядок написания черт и ключи Канси.[1]

Исторически способы ввода китайских иероглифов путём разложения на составные части появились ещё в конце XIX века для передачи китайских текстов по телеграфу и радио (аналог азбуки Морзе). Разработанный Чу Бонфу метод ввода китайских иероглифов назван в честь Цан Цзе (кит. трад. 倉頡, упр. 仓颉, пиньинь Cāng Jié, палл. Цан Цзе) — придворного историографа мифического императора Хуан Ди и легендарного создателя китайской письменности.

Раскладка клавиатуры, ключи (радикалы)

[править | править код]
Раскладка клавиатуры Cangjie

В структурном методе ввода китайских иероглифов «Цанцзе» базовые компоненты получили название «ключи» (или «радикалы»). При этом в стандартной раскладке клавиатуры используются от 25 до 26 клавиш: клавиши «X» и «Z» (либо только «X») кодируют иероглифы специальной группы 重 / 難 «Коллизия»/«Сложные», а остальные 24 кодируют определённые радикалы, которые поделены на группы и ассоциированы с буквами латинского алфавита[1]:

Группа Клавиша Радикал Примечание
Философская группа: A 日 — солнце Философская группа
состоит из 7 радикалов
(или иероглифических ключей),
ассоциированных с латинскими
буквами A—G
B 月 — луна
C 金 — золото
D 木 — лес
E 水 — вода
F 火 — огонь
G 土 — земля
Группа «черты»: H 竹 — бамбук
I 戈 — оружие
J 十 — десять
K 大 — большой
L 中 — центр
M 一 — один
N 弓 — лук
Группа «части тела»: O 人 — человек
P 心 — сердце
Q 手 — рука
R 口 — рот
Группа «формы»: S 尸 — мертвец
T 廿 — двадцать
U 山 — гора
V 女 — женщина
W 田 — поле
Y 卜 — гадать
Специальная группа*: X 難 — «Сложные» 難 — для ввода сложных радикалов.
Z 重 — «Коллизия» 重 — для разрешения коллизий
при декомпозиции иероглифа

*Для ввода иероглифов 重 / 難 специальной группы может использоваться только клавиша X: 重 / 難 «Коллизия»/«Сложные». Если для ввода иероглифов используются клавиши X и Z, то клавише X соответствует только иероглиф 難 — «Сложные».

Таблица радикалов — 24 основных ключа способны дать начало 87 новым иероглифам:

Таблица радикалов: красным обозначены основные иероглифические ключи (радикалы), а чёрным изображены вторичные (связанные с ними) иероглифы.

Приведенной выше таблицы радикалов достаточно для того, чтобы воспроизвести наиболее используемые китайские иероглифы.

Правила и исключения деления на радикалы при декомпозиции иероглифа

[править | править код]

Основополагающие принципы, заложенные в основу декомпозиции[1]:

  • Лаконичность — в том случае, когда возможно несколько вариантов декомпозиции иероглифа, следует выбирать наиболее короткий.
  • Полнота — в том случае, когда возможно несколько вариантов декомпозиции иероглифа с одинаковой длиной, следует выбирать тот, первый элемент декомпозиции которого является наиболее сложным.
  • Отображение части радикала:
    • Следует (по возможности) избегать использования более одного раза подряд одного и того же иероглифического ключа.
    • При разделении на части необходимо следить за тем, чтобы форма иероглифа не была «обрезана» по углам.
  • Пропуск кодов:
    • Частичный пропуск — в том случае, когда превышено допустимое количество кодов, используемых при декомпозиции иероглифа, лишние коды следует игнорировать.
    • Пропуск «вложенных» частей — если очертание или часть иероглифа, которая подлежит декомпозиции, «огорожена», то кодируется только огораживающая часть, при этом вложенная часть игнорируется.

Для правильного деления иероглифа на «радикалы» в ходе создания декомпозиции разработаны основные правила[1]:

  • Направление разбора: слева направо → сверху вниз → снаружи внутрь.
  • У иероглифов, которые состоят из соединённых частей, кодированию подлежат только 4 части: первая, вторая, третья и последняя.
  • Иероглифы, которые состоят из двух несоединённых частей (например, 你), необходимо разложить на соединённые части (на примере 你 — это 人 и 尔), затем — кодировать 1 и последний радикал первой части, а также 1, 2 и последний радикал второй части иероглифа.
  • Иероглифы, которые состоят из нескольких несоединённых частей (например, 謝), необходимо разложить на соединённые части (на примере 謝 — это 言, 身 и 寸), затем — кодировать первый и последний радикал первой части, первый и последний радикал второй части и последний радикал последней части иероглифа.

Исключения

[править | править код]

Некоторые начертания являются исключением из правил и всегда кодируются определённым образом. Лист исключений[1]:

Иероглиф Начертание декомпозиции в Цанцзе
Версия 2 (v2) Версия 3 (v3) Версия 5 (v5)
門 (дверь) 日 弓 (AN)
目 (сетка) 月 山 (BU)
鬼 (призрак) 竹 戈 (HI) 竹 戈 (HI) or HUI
几 (несколько) 竹 山 (HU) 竹 弓 (HN)
贏 (выиграть) 卜 口 月 月 弓 (YRBBN) 卜 弓 月 山 金 (YNBUC)
虍 (тигр [радикал]) 卜 心 (YP)
亡 on top of 口 (吂) 卜 口 (YR) 卜 女 口 (YVR)
隹 (короткохвостые) 人 土 (OG)
气 (газ [радикал]) 人 山 (OU) 人 弓 (ON) 人 一 弓 (OMN)
畿 minus the 田 女 戈 (VI)
鬥 (ведро) 中 弓 (LN)
阝(город) 弓 中 (NL)

Некоторые иероглифы не могут быть разобраны (по методу Цанцзе их вводят с помощью клавиши «Х» клавиатуры, маркированной иероглифом 難 — «Сложные»)[2].

Иероглиф Начертание декомпозиции в Цанцзе (v5)
臼 (ступка) HX
與 (с) HXYC
興 (син) HXBC
盥 (ванна) HXBT
姊 (сестра) VLXH
齊 (ци) YX
兼 (и) TXC
鹿 (олень) IXP
身 (тело) HXH
卍 (свастика) NX
黽 (холстомер) RXU
龜 (черепаха) NXU
廌 (единорог) IXF
慶 (цин) IXE
淵 (йон) ELXL
肅 (СУ) LX

Декомпозиция иероглифов: в соответствии с правилами иероглиф должен быть разделен на радикалы. При этом предпочтительнее использование различных радикалов, которые не пересекаются и не накладываются друг на друга:

Иероглиф
верно неверно верно неверно верно неверно верно неверно верно неверно верно неверно
Деление на
радикалы
⺌木 木丷 月凵 月一 丨冂大 大冂 十乂日 土丿日 十中肀亅 十口肀亅 勹乂乂 勹丿丿丶
Клавиши
клавиатуры
火木 木金 月山 月一 中月大 大月 十大日 土竹日 十中中弓 十口中弓 心大大 心竹竹戈
Демонстрация ввода китайских иероглифов методом Цанцзе версии 5 (англ. Cangjie, version 5)

Метод Цанцзе в своей эволюции дошёл до пятой версии. Тем не менее, наибольшее распространение получила третья версия, совместимая с операционной системой Microsoft Windows. В то же время Mac OS X поддерживает версию Цанцзе, которая является гибридом между версиями 3 и 5[1].

Игровые тренажёры

[править | править код]

Для тренировки навыков ввода радикалов китайских иероглифов структурным методом Цанцзе разработчики внедрили специальную флэш-игру, в которой предусмотрена возможность получения подсказки создания правильной декомпозиции иероглифа, а также необходимой клавиши для кодирования требуемого радикала на клавиатуре компьютера. Кроме того, предусмотрена возможность введения таблицы всех радикалов, которая способствует упрощению процесса обучения для некоторых пользователей[1].

Примечания

[править | править код]
  1. 1 2 3 4 5 6 7 ЦанЦзе (Cangjie) — способ ввода китайских иероглифов. shaoboke.blogspot.com. Дата обращения: 17 сентября 2016. Архивировано 17 сентября 2016 года.
  2. 倉頡取碼規則及方法. Дата обращения: 18 сентября 2016. Архивировано 1 января 2019 года.

Литература

[править | править код]
  • 李亮生『倉頡輸入一週通』. Taipei 2007, ISBN 957-717-846-4(кит.)
  • Ken Lunde: CJKV Information Processing. O’Reilly, Sebastopol (California) 2008, ISBN 978-0-596-51447-1(англ.)

Обучающие ресурсы

[править | править код]

Цанцзе клавиатура онлайн

[править | править код]
  • Chinese Character Database: With Word-formations Phonologically Disambiguated According to the Cantonese Dialect: База данных, охватывающая весь набор китайских иероглифов (5401 уровень 1 и уровень 2 7652 Ханзи), а также 7 дополнительных Этене Ханзи. В базе указан ввод кодов цанцзе для каждого иероглифа. Примечание: указанная база данных не содержит дополнительных символов набора (hkscs — 2001) Гонконг. (англ.)
  • Mingzhu generator (кит. (Тайвань)): Страница Бонг Чу Фу содержит исполняемый файл, исходный код и инструкцию Mingzhu (рус. Минчжу) — генератора кода Цанцзе, который работает в операционной системе MS Windows, а также в режиме «командная строка» (DOS PROMPT). Требуется наличие программного обеспечения Microsoft Macro Assembler и установка по ссылке.