Наверняка, среди пользователей Linux есть и знатоки японской культуры или просто имеющие дело с японским языком. В операционной системе Windows для этого есть все средства, но в Linux с этим немного по-сложнее.

В своё время, когда автор целиком и полностью отказался от Windows и установил себе Debian Etch (на тот момент дистрибутив был актуальным), по роду работы, возникла проблема с вводом и отображением японских символов при работе с текстами на японском языке. Благодаря Интернету, решение нашлось достаточно быстро и в этой статье будут описаны наиболее важные (на взгляд автора) вещи, которые пригодятся при работе с японскими текстами в операционной системе Debian Squeeze. С дистрибутива версии Debian Etch и выше, приёмы и методы работают успешно и, вполне возможно, в будущих релизах Debian всё будет работать также.

Статья ориентирована на пользователей, знающих как работать в командной строке и устанавливать пакеты.

Прежде чем приступить непосредственно к работам, поставим задачу: итак, по мнению автора, лучше всего, чтобы операционная система глобально была настроена и отображала тексты и меню на родном языке - русском, с применением английского. Читать тексты на японском можно и в такой конфигурации (при условии, что сами тексты сохранены в UTF-8), но ввод текста потребует активации особой системы ввода. Поэтому, хорошей идеей будет активация такой системы только когда действительно будет требоваться ввод японских слов, а в остальное время лучше использовать русско-английскую классическую систему ввода и переключения раскладок клавиатуры.
Не исключён вариант, что читатель этой статьи достаточно "продвинут" в освоении японского языка и предпочитает глобально погрузиться в японскую среду. В этом случае, перед установкой дистрибутива необходимо выбирать японский язык и японскую локаль. Тогда инсталлятор целиком изменит локализацию на японскую - все тексты, мануалы, меню и тд. будут на японском. Такой "брутальный" вариант "погружения в среду" в этой статье не рассматривается, ибо в процессе эксплуатации системы могут возникнуть разного рода вопросы, а перейти обратно на понятный язык уже будет проблематично. Выберем срединный путь: когда надо "японский" - он будет, а в остальное время будет русский и английский.

Подготовительные операции

Генерация новых локалей

Для начала установим и сконфигурируем необходимые локали. Посмотрим что уже установлено, а что нужно доустановить - открываем консоль и вводим:

 $ locale -a

Эта команда выводит список локалей, установленных в операционной системе. Список должен быть примерно таков:

 en_US.utf8
 ja_JP.utf8
 POSIX
 ru_RU.cp1251
 ru_RU.koi8r
 ru_RU.utf8
 russian

Локали en_US.utf8, ja_JP.utf8, ru_RU.utf8 - должны быть обязательно. Остальные - на усмотрение пользователя. Изучив список, выясняем какой нехватает и доустанавливаем её:

 # dpkg-reconfigure locales

Откроется мастер настройки локалей, где выбираем из списка нужные по именам:

Локали russian и POSIX в списках инсталлятора не будут - они присутствуют в системе изначально. Теперь устанавливаем локаль по умолчанию ru_RU.UTF-8 или en_US.UTF-8 - она будет использоваться по умолчанию в консоли и для всех приложений:

Заметьте, что по умолчанию выбирается локали именно с UTF-8, так как они являются универсальными и файлы, именованные в этой локали, будут читабельны даже на Windows- и Mac- -машинах.

После завершения процедуры, для принятия изменений в силу нужно либо перезагрузить машину, или завершить сеанс работы, а потом снова войти (залогиниться).

Установка шрифтов

Теперь необходимо установить шрифты для отображения японских иероглифов и знаков каны. Это можно сделать через Synaptic или в консоли:

 # apt-get install ttf-kochi-mincho ttf-sazanami-mincho

Кроме этих, пользователь может установить и другие шрифты с японскими знаками. В репозиториях Debian достаточно много пакетов с японскими шрифтами. Вот некоторые из них: ttf-nahazono, ttf-ipafont, ttf-kiloji, ttf-kochi-gothic, ttf-kouzan-mouhitsu, ttf-misaki, ttf-sawarabi-mincho, ttf-sawarabi-gothic

Методы ввода

Для ввода азиатских знаков обычно используются такие методы: слоговая азбука, словарь или распознавание картинки, нарисованной на планшете или мышкой.

Для варианта ввода японских знаков используется "годзюон" (азбука пятидесяти звуков).

Классический метод ввода - kinput2

Данный метод объединяет ввод при помощи слоговой азбуки + автоматической\полуавтоматической замены знака по словарю. Этот метод работает только на уровне иксов и приложений, запускаемых в иксах, при помощи клиент-серверного приложения kinput2. Дополнительно к этой программе можно установить программу-словарь для автозамены знаков.

Настроить метод можно как для графического окружения целиком, так и для какой-то отдельной программы. Ниже будет описан вариант настройки для отдельных программ. Суть такая: для каждого приложения, где требуется ввод на японском, создаётся скрипт запуска, который меняет окружение и "подключает" систему ввода к приложению. Таким образом, запустив тот же gedit, только в нём будет работать ввод по горячей клавише, когда как в остальных приложениях такого не будет. Хоть это и не всегда удобно, но порой система ввода не срабатывает и приходится перезагружать приложение - это, во всяком случае, сделать проще, нежели перезагружать графическое окружение целиком.

Для начала установим необходимые пакеты: kinput2 и canna с зависимостями:

 # apt-get install kinput2 kinput2-common canna canna-utils

canna - это демон (программа-сервер) и он запускается при загрузке системы. Если он по каким-то причинам не запустился, то словарь работать не будет.

Теперь определяемся, для каких приложений нужен ввод. Автор чаще всего использовал простой текстовый редактор типа gedit или mousepad. Созданная и откорректированная фраза в редакторе потом копировалась и вставлялась в браузер, почтовую программу или OpenOffice Writer. Без проблем можно привязать систему ввода и непосредственно к вышеперечисленным программам - здесь всё на усмотрение пользователя. Для примера будет рассмотрен вариант привязки системы ввода к редактору gedit.

Для начала создадим место, где будут храниться скрипты для запуска программ. Автор для этого создал каталог bin в своём профиле. Сделайте каталог любым удобным для вас способом. В консоли это будет так:

 $ cd ~
 $ mkdir bin
 $ cd bin

Автор, для удобства создавал скрипты с именами, начинающимися на jp. Например, gedit - jpgedit, oowriter - jpoowriter и тд. Пользователь сам выбирает имена как удобнее.

Теперь создаём сам скрипт запуска - это можно сделать в любом текстовом редакторе, а затем файл поместить в каталог bin в профиле (домашнем каталоге) и присвоить файлу права на выполнение. Текст срипта выглядит так:

#!/bin/bash
 
# export LC_ALL=ja_JP.utf8  # раскомментировать, для включения японской локализации для программы
export LC_ALL=ru_RU.utf8 # раскомментировать, для включения русской локализации для программы
 
# LANGUAGE=ja_JP.utf8  # раскомментировать, для того, чтобы интерфейс программы был на японском
LANGUAGE=ru_RU.utf8    # раскомментировать, для того, чтобы интерфейс программы был на русском
 
export LANGUAGE
export XMODIFIERS=@im=kinput2
kinput2 -xim -kinput -canna&gedit

В зависимости от того, какая строка заремарена, будет изменяться локализация (денежная единица, формат времени и тд) и язык интерфейса программы. Если в последней строке вместо 'gedit' поставить имя (имя исполняемого бинарника или скрипта) другой программы, то метод будет действовать для неё - таким образом и меняется привязка к программам.

Дать права на выполнение можно из консоли командой:

 $ chmod +x jpgedit

Теперь, когда всё готово, пробуем запустить gedit с привязанной системой ввода из консоли:

 $ jpgedit

Запустится ничем не примечательный gedit. Работа в нём не отличается от обычного редактора. Переключение между русской и английской раскладками работает как обычно. Для активации режима ввода нужно переключить раскладку на английскую и нажать комбинацию "Shift"+"Space". При этом, в нижнем левом углу окна появится иконка со знаком каны, который обозначает режим ввода - катакана\хирагана\ромадзи:

Далее пользователь вводит знаки слоговой азбуки. Если после ввода символа нужна другая интерпретация - нажимаем пробел и подключается словарь, который выводит варианты уже введённого слова либо катаканой, либо иероглифами. Выбрать тот или иной вариант можно клавишами курсора, передвигаясь по вариантам во всплывающем окне.

Для удобства можно создать лаунчер (ярлык) для запуска jpgedit на рабочем столе, либо запускать из консоли. Метод ввода работает только для данной программы и только при активной английской раскладке. Ввод слогов производится по фонетической системе Хэпбёрна.

Кто запускает иксы не автоматом, а через команду startx, для глобального применения метода ввода ко всем программам, запущенным в графическом окружении, следует в каталоге профиля пользователя создать файл .xinitrc (имя начинается с точки!) и в него вставить такие строки:

.xinitrc
# export LC_ALL=ja_JP.utf8  # раскомментировать, для включения японской локализации граф. окружения
export LC_ALL=ru_RU.utf8 # раскомментировать, для включения русской локализации граф. окружения
 
# LANGUAGE=ja_JP.utf8  # раскомментировать, для того, чтобы интерфейс всех программ был на японском
LANGUAGE=ru_RU.utf8    # раскомментировать, для того, чтобы интерфейс всех программ был на русском
 
export LANGUAGE
export XMODIFIERS=@im=kinput2
kinput2 -xim -kinput -canna &
exec gnome-session

Последняя строка указывает на запуск графического окружения Gnome. Если у вас работает другая среда, вместо gnome-session нужно поставить имя исполняемого бинарника или скрипта среды.

Автором не проверялась работа вышеописанных параметров для глобального изменения метода ввода для варианта запуска графического окружения через GDM (или KDM).

Метод ввода Anthy

Этот метод схож по работе с kinput2, более современен и универсален. Метод можно включать и отключать когда потребуется. Данная конфигурация проверена в Gnome 2.30.2 в Debian Squeeze. Графическая среда запускается из консоли через startx.

Сперва доустановим некоторые пакеты:

 # apt-get install anthy ibus ibus-anthy ibus-gtk kasumi

Теперь открываем в текстовом редакторе файл .bashrc - он находится в каталоге профиля. В начало файла вставляем такие строки:

 export GTK_IM_MODULE=ibus
 export XMODIFIERS=@im=ibus
 export QT_IM_MODULE=ibus

У автора, iBus не захотел корректно работать без этих строк. Далее приступаем к настройке - запускаем программу настройки iBus: "Система" --> "Параметры" --> "Параметры iBus". Откроется окно с приглашением iBus не запущен. Запустить?, на это отвечаем "Да". Потом возможно выйдёт приглашение о необходимости вписать строки в .bashrc, что мы уже сделали, и только после этого откроется окно настроек.

На вкладке "Основные", параметр "Включить или выключить", можно сменить комбинацию "Control"+"Space" для активации метода ввода, если данная комбинация уже занята каким-либо приложением. Автор оставил по умолчанию.

На вкладке "Метод ввода" нужно будет добавить "Anthy", для чего жмём на "Выберите метод ввода", пареходим на "Японский" --> "Anthy".

Далее нажимаем на "Добавить", после чего название появится в списке:

На вкладке "Дополнительно" можно поставить галочку на "Использовать один метод ввода для всех приложений".

На этом настройка закончена. Приступаем к работе.
1. Каждый раз при запуске графической среды, запуск iBus нужно будет делать вручную через "Система" --> "Параметры" --> "Параметры iBus" или настроить автозапуск через менеджер приложений в GNOME: "Система" --> "Параметры" --> "Запускаемые приложения".
Когда iBus активен, в трее (область уведомлений возле часов) будет отображаться такой значёк клавиатуры и шарика (выделено синим):

2. Перед вводом японских символов, необходимо активировать метод ввода через комбинацию "Control"+"Space". При этом значёк iBus в трее сменится на корону. Это означает что метод ввода активен. Через правую кнопку мыши можно вызвать меню для настройки метода:

Японские символы вводятся только в английской раскладке по фонетической системе Хэпбёрна. Если метод активен, в английской раскладке, по умолчанию вводятся именно японские символы, поэтому для работы со смешанным текстом: русский + английский + японский, для ввода английских символов нужно отключать метод. Другими словами, не отключая метод, можно вводить русские и японские символы простым переключением раскладки. Это может показаться неудобным, но со временем переключение происходит почти автоматически.

Также как и в варианте с kinput2, после начала ввода символом и нажатию на "Пробел", открывается окно с вариантами готовых слов.

Вспомогательные программы

Помимо отображения и ввода, любому человеку, изучающему японский язык, потребуются программы для: запоминания иероглифов, самотестирования и конечно же не обойтись без словарей!

Словарь иероглифов Yarxi

Словарь иероглифов Yarxi написан Вадимом Смоленским и многими волонтёрами, которые вносили данные в базу словаря. Версия для Debian\Ubuntu написана Севой Алексеевым. Словарь удобен системой поиска иероглифов по ключам и содержит массу статей и примеров. На официальном сайте есть версии для почти всех операционных систем. Для Debian и Ubuntu доступна версия в .deb-пакетах.

Установка в Debian:
1. Скачиваем deb-пакет со страницы http://www.susi.ru/yarxi/mac_linux.html и читаем комментарии по установке.

2. Устанавливаем дополнительные пакеты для работы словаря:

 # apt-get install libqt4-assistant libqt4-core libqt4-gui libqt4-test libqt4-network ttf-kochi-mincho ttf-sazanami-mincho 

3. Далее переходим в каталог, где был сохранён deb-пакет Yarxi и выполняем установку:

 # dpkg -i yarxi_1.0-1_i386.deb

Если при установке dpkg вывел сообщения о неустановленных пакетах - вычисляем зависимости и доустанавливаем требуемые.

Словарь Kiten

Англо-японский (японо-английский) словарь общего применения для KDE, но запустится и под другими окружениями. Имеется репозиториях Debian.

gWaei - оболочка для словарей

Графическая оболочка для словарей. После установки в Debian, надо подгрузить нужные для словари через настройки программы. Имеется словарь иероглифов и англо-японский словарь общего применения.

Словарь Gjiten

Словарь иероглифов и словарь общего применения для GNOME (будет работать и под другими окружениями). Есть возможность вводить иероглиф рисуя его мышкой (требуется доустановка пакета kanjipad).

granule - менеджер флешкарт

Программа для создания карт и тренировки запоминания.

KWordQuiz - менеджер флешкарт

Программа для создания карт и тренировки запоминания.

Anki - менеджер флешкарт

Программа для создания карт и тренировки запоминания. Доступна почти для всех платформ.

Другие программы

Стоит также упомянуть программы для Windows и MacOS:

Наименование Платформа Описание Возможность запуска под wine в Linux Доступность программы
jardic win русско-японский, японо-русский словарь общего применения проблемы со шрифтами платная
yarxi win\mac\nix версия одноимённого словаря иероглифов для Windows и MacOS не работает бесплатная
bkana win маленькая программка для запоминания годзюон с функцией тестирования отлично работает бесплатная (проект брошен)
DreamKana win маленькая программка для запоминания годзюон с функцией тестирования отлично работает бесплатная
popup-dictionary win продвинутый менеджер флешкарт есть некоторые проблемы с отображением шрифтов платная
Edict win оболочка для словарей нет данных нет данных
iKanji mac маленькая программка для запоминания годзюон и иероглифов с функцией тестирования нет данных платная
NJStar win\mac продвинутый текстовый процессор для работы с японскими\китайскими\корейскими текстами работает платная

Смотрите также

Печать/экспорт