Леонид Николаевич Сомс,
Кандидат физико-математических наук
Генеральный директор ОАО ЛИНУКС ИНК
Выступление на Семинаре по финно-угорским СМИ,
Эстония, Тарту, 23-25 мая 2008 г.
На мировом погосте
Из тьмы веков
Звучат лишь письмена
И. Бунин
Новые письмена
Какие же письмена прозвучат из наших веков? - Думаю, что электронные.
Мы живем в эпоху перелома информационных цивилизаций. Как и предыдущий перелом (гутенберговский), этот связан с технологическими достижениями. Ведь и до Гутенберга можно было тиражировать книги (что в Китае и делалось со священными текстами методами ксило- и литографии), революция состояла в том, что стало возможным тиражировать новости – именно для этого без наборного шрифта не обойтись. Наборный шрифт создал газеты, и уже потом появились радио, телевидение и прочие средства СМИ.
Сейчас - век Интернета. Возникший как средство обеспечить катастрофоустойчивость вычислительных комплексов в случае атомной бомбардировки путем создания территориально-распределенной сети, Интернет превратился в культурный феномен, буквально на глазах изменивший и продолжающий изменять все без исключения стороны человеческой жизни, начиная от получения справки в жилконторе до телемедицины до покупок через интернет до виртуальных исследовательских лабораторий до так называемых WIKI -текстов, где содержательную часть текстов (сейчас принято говорить – контент) создают сами пользователи. Процесс пошел! («10 февраля международный языковый комитет Википедии признал «Эрьзянскую Википедию» успешным проектом, юридически утвердив соответствие установленным для сетевых энциклопедий требованиям...» - цит. по «Эрьзяне получат Википедию на родном языке», Fenno-Ugria Infoleht, май 2008, №1 (40), с.8)
И на этом фоне....
...Друг человечества печально замечает
Везде невежества губительный позор.
А. Пушкин.
Бесписьменные народы XXI века
Берусь утверждать, что тот язык, который не будет иметь своего “электронного представления” - минимальный набор компонентов для такого представления я дальше приведу - не имеет шансов сохраниться как полноценное средство общения и будет вымыт из обихода. Произойдет лингвистическая оккупация народов и культур, лишенных естественных для XXI века средств письменности – назовем их новыми бесписьменными народами.
Здесь, как мне кажется, существуют две проблемы.
Первая – проблема лексикона.
В «исчезающих» языках зачастую просто отсутствуют слова для называния новых предметов и выражения понятий, отсутствовавших в обиходе носителей языка в пору его формирования. Такого языка достаточно для сборников народных сказок, старушки на таком языке поплачутся о печальных новых временах. Молодежи такой язык не очень нужен.
Конечно если язык продолжает использоваться «в жизни», он с этим справится (язык – открытая система!), как справляется, к примеру, русский, порождая новые слова (пресловутые «колхозы» и «комсомольцы»), заимствуя из других языков, преобразуя заимствования в соответствии с собственными нормами, прицепляя к чуждым корням свои приставки, суффиксы и флексии – число примеров бесконечно – кто скажет, что «интернетный веб-сайт» нерусское словосочетание (даже стилистические неправильности в этом сочетании легко увидеть)?
Вся загвоздка в том, чтобы язык использовался.
И здесь нужна мода на родной язык – в первую очередь среди молодежи.
Вы скажете – мода на родной язык – оксюморон? - нет!
Сейчас общепланетная мода на дурно знаемый американский диалект английского языка...(ах, этот Дима Билан, он такой душка!...)
Конечно, создание такой моды – это не дело инженеров в области программного обеспечения, чем занимается наша компания, а дело инженеров человеческих душ, к которым принадлежат собравшиеся в этом зале представители средств массовой информации.
Англичанин – мудрец, чтоб работе помочь,
Изобрел за машиной машину...
Народная песня “Дубинушка”
Великолепная пятерка
Вторая проблема – это создание технического инструментария, который позволит языку жить.
По нашему мнению, минимальный “джентльменский” набор технических средств, который позволит языку полноценно функционировать в электронном информационном пространстве, включает в себя:
1. Разработанное и стандартизованное графическое представление национальных шрифтов и соответствующих раскладок клавиатуры.
Проблемы здесь, применительно к финно-угорским языкам, есть – см. хотя бы заметку В. Николаева «Марийские буквы хотят в компьютер» в розданной нам сегодня газете Fenno-Ugria Infoleht, май 2008, №1 (40), с.7. Присутствующий здесь Андрей Чемышев может поделиться своими впечатлениями о разговорах с представителями корпорации Майкрософт.
2. Общедоступные электронные словари.
Это должны быть как толковые словари – решение проблемы «нехватки слов», о чем ранее сказано, - так и дву- и многоязычные. Вот огромное поле деятельности для лингвистов и языковедов. Что до общедоступности – здесь это почти синоним «распространяемые под открытыми лицензиями» - я далее об этом буду говорить.
3. Системы проверки правописания.
Здесь также большое поле для работы финно-угорских лингвистов. Дело в том, что существующие спелл-чекеры в своей концептуальной части используют идеи, развитые специалистами в языках (английском, в основном), чей грамматический строй кардинально отличается от финно-угорских языков (изолирующие языки против агглютинирующих), а также и славянских (флектирующих). Поэтому построение таких систем, использующих более адэкватный теоретический базис, весьма актуально.
Еще более важно использование такого базиса для создания двух следующих компонентов этого списка.
4. Создание систем автоматического перевода.
5. Создание поисковых систем, работающих на национальных языках.
Обилие и строгость законов на Руси всегда смягчалось неукоснительным их неисполнением
Крылатая фраза начала 19 века.
Отличный закон
По крайней мере, с точки зрения рассматриваемой проблемы «электронных письмен» - это Федеральный закон № 149-ФЗ от 27.07.2006 года “Об информации, информационных технологиях и защите информации”. В нем буквально сказано:
Статья 3. “Принципы правового регулирования информационных отношений”
“Правовое регулирование общественных отношений, осуществляемое настоящим Федеральным законом, основывпется на следующих принципах:
... 4) Равноправие языков народов Росийской Федерации при создании информационных систем и их эксплуатации»...
Статья 8. Право на доступ к информации.
«... 5). Государственные органы и органы местного самоуправления обязаны обеспечивать доступ к информации о своей деятельности на русском языке и государственном языке соответствующей республики в составе Российской Федерации в соответствии с федеральными законами, законом субъекта Российской Федерации и нормативными правовыми актами органов местного самоуправления. Лицо, желающее получить доступ к такой информации, не обязано обоснговывать необходимость её получения.»...
Статья 12. Государственное регулирование в сфере применения информационных технологий.
«... 2. Государственные органы Российской Федерации, органы государственной власти субъектов Российской Федерации, органы местного самоуправления в соответствии со своими полномочиями:
...2) создают информационные системы и обеспечивают доступ к содержащейся в них информации на русском языке и государственном языке соответствующей республики в составе Российской Федерации».
Извините за длинные цитаты, но дело того стоило.
Каково же фактическое состояние с «...созданием информационных систем на государственном языке соответствующей республики» ?
В Татарстане компания Майкрософт кое-что сделала (не в том, конечно объеме, как выше указано).
Сейчас при создании комплекта Базового Свободного Программного Обеспечения (БСПО) для образовательных учреждений Российской Федерации (работа ведется в рамках Национального Проекта «Образование») фонду Татарнамэ выделены из федерального бюджета средства для «татаризации» операционной системы, офисных программ, в работе этой предусмотрены электронные словари, средства проверки правописания.
Прошло в Интернете сообщение о каких-то начинаниях в Якутии.
О ситуации в финно-угорских республиках вы лучше моего знаете.
Похоже, что в целом в Российской Федерации дело обстоит неважно – усилия разрознены, единой принятой концепции выполнения Отличного Закона нет.
Поэтому я предлагаю нашему семинару обратиться к Конгрессу финно-угорских народов, который будет в Ханты-Мансийске этим летом, с предложением, чтобы Конгресс выступил перед Правительством Российской Федерации с ходатайством о подготовке и разворачивании в России Федеральной Программы создания компьютерного программного инструментария для обеспечения полноценного функционирования финно-угорских национальных языков в электронном информационном пространстве, включая как минимум:
- разработку и стандартизацию графического представления национальных шрифтов, раскладок клавиатуры
- создание общедоступных (распространяемых под открытыми лицензиями) электронных словарей (толковых и многоязычных)
- создание систем проверки правописания, основанных на передовых лингвистических концепциях
- создание поисковых систем, работающих на национальных языках
- создание систем автоматического перевода.
По делу, конечно, в России не только для финно-угорских народов такая программа нужна – но лиха беда начало, и если дело удастся сдвинуть с места, то и для других языков его будет делать легче, на основании удачных прецедентов. И не только в России – я вовсе не уверен, что скажем, для ливского языка, что в Латвии, реализованы эти пять обязательных компонент «национального компьютерного языка», перечисленные выше.
Куда ж нам плыть?
А. Пушкин
К свободе!
(Свобода - в самом общем смысле, наличие возможности выбора... (Из Википедии))
В заключение своего выступления хотел бы остановиться на важном моменте.
Конечно, локализация на «малые» языки базового программного обеспечения, позволяющего языку полноценно работать и жить, вместе с его народом, возможна применительно к самым различным платформам. Однако я уверен в том, что делать это следует именно с использованием Свободного Программного Обеспечения, СПО (часто используют англоязычный термин Open Source, «программы с открытым кодом»). Об СПО как феномене человеческой деятельности написано очень много (см., например, статью “Свободное программное обеспечение” в Википедии), так что вряд ли мне следует подробно здесь на этом останавливаться.
Замечу только одно: выбор СПО как базы для «национального компьютерного языка» естественен – именно в этой парадигме развития достигается свобода как для разработчиков, так и для пользователей.
И именно на основе свободного ПО компании, участвующие в разработке упомянутого выше БСПО для школ, проводят работы по «татаризации».
Кандидат физико-математических наук
Генеральный директор ОАО ЛИНУКС ИНК
Выступление на Семинаре по финно-угорским СМИ,
Эстония, Тарту, 23-25 мая 2008 г.
На мировом погосте
Из тьмы веков
Звучат лишь письмена
И. Бунин
Новые письмена
Какие же письмена прозвучат из наших веков? - Думаю, что электронные.
Мы живем в эпоху перелома информационных цивилизаций. Как и предыдущий перелом (гутенберговский), этот связан с технологическими достижениями. Ведь и до Гутенберга можно было тиражировать книги (что в Китае и делалось со священными текстами методами ксило- и литографии), революция состояла в том, что стало возможным тиражировать новости – именно для этого без наборного шрифта не обойтись. Наборный шрифт создал газеты, и уже потом появились радио, телевидение и прочие средства СМИ.
Сейчас - век Интернета. Возникший как средство обеспечить катастрофоустойчивость вычислительных комплексов в случае атомной бомбардировки путем создания территориально-распределенной сети, Интернет превратился в культурный феномен, буквально на глазах изменивший и продолжающий изменять все без исключения стороны человеческой жизни, начиная от получения справки в жилконторе до телемедицины до покупок через интернет до виртуальных исследовательских лабораторий до так называемых WIKI -текстов, где содержательную часть текстов (сейчас принято говорить – контент) создают сами пользователи. Процесс пошел! («10 февраля международный языковый комитет Википедии признал «Эрьзянскую Википедию» успешным проектом, юридически утвердив соответствие установленным для сетевых энциклопедий требованиям...» - цит. по «Эрьзяне получат Википедию на родном языке», Fenno-Ugria Infoleht, май 2008, №1 (40), с.8)
И на этом фоне....
...Друг человечества печально замечает
Везде невежества губительный позор.
А. Пушкин.
Бесписьменные народы XXI века
Берусь утверждать, что тот язык, который не будет иметь своего “электронного представления” - минимальный набор компонентов для такого представления я дальше приведу - не имеет шансов сохраниться как полноценное средство общения и будет вымыт из обихода. Произойдет лингвистическая оккупация народов и культур, лишенных естественных для XXI века средств письменности – назовем их новыми бесписьменными народами.
Здесь, как мне кажется, существуют две проблемы.
Первая – проблема лексикона.
В «исчезающих» языках зачастую просто отсутствуют слова для называния новых предметов и выражения понятий, отсутствовавших в обиходе носителей языка в пору его формирования. Такого языка достаточно для сборников народных сказок, старушки на таком языке поплачутся о печальных новых временах. Молодежи такой язык не очень нужен.
Конечно если язык продолжает использоваться «в жизни», он с этим справится (язык – открытая система!), как справляется, к примеру, русский, порождая новые слова (пресловутые «колхозы» и «комсомольцы»), заимствуя из других языков, преобразуя заимствования в соответствии с собственными нормами, прицепляя к чуждым корням свои приставки, суффиксы и флексии – число примеров бесконечно – кто скажет, что «интернетный веб-сайт» нерусское словосочетание (даже стилистические неправильности в этом сочетании легко увидеть)?
Вся загвоздка в том, чтобы язык использовался.
И здесь нужна мода на родной язык – в первую очередь среди молодежи.
Вы скажете – мода на родной язык – оксюморон? - нет!
Сейчас общепланетная мода на дурно знаемый американский диалект английского языка...(ах, этот Дима Билан, он такой душка!...)
Конечно, создание такой моды – это не дело инженеров в области программного обеспечения, чем занимается наша компания, а дело инженеров человеческих душ, к которым принадлежат собравшиеся в этом зале представители средств массовой информации.
Англичанин – мудрец, чтоб работе помочь,
Изобрел за машиной машину...
Народная песня “Дубинушка”
Великолепная пятерка
Вторая проблема – это создание технического инструментария, который позволит языку жить.
По нашему мнению, минимальный “джентльменский” набор технических средств, который позволит языку полноценно функционировать в электронном информационном пространстве, включает в себя:
1. Разработанное и стандартизованное графическое представление национальных шрифтов и соответствующих раскладок клавиатуры.
Проблемы здесь, применительно к финно-угорским языкам, есть – см. хотя бы заметку В. Николаева «Марийские буквы хотят в компьютер» в розданной нам сегодня газете Fenno-Ugria Infoleht, май 2008, №1 (40), с.7. Присутствующий здесь Андрей Чемышев может поделиться своими впечатлениями о разговорах с представителями корпорации Майкрософт.
2. Общедоступные электронные словари.
Это должны быть как толковые словари – решение проблемы «нехватки слов», о чем ранее сказано, - так и дву- и многоязычные. Вот огромное поле деятельности для лингвистов и языковедов. Что до общедоступности – здесь это почти синоним «распространяемые под открытыми лицензиями» - я далее об этом буду говорить.
3. Системы проверки правописания.
Здесь также большое поле для работы финно-угорских лингвистов. Дело в том, что существующие спелл-чекеры в своей концептуальной части используют идеи, развитые специалистами в языках (английском, в основном), чей грамматический строй кардинально отличается от финно-угорских языков (изолирующие языки против агглютинирующих), а также и славянских (флектирующих). Поэтому построение таких систем, использующих более адэкватный теоретический базис, весьма актуально.
Еще более важно использование такого базиса для создания двух следующих компонентов этого списка.
4. Создание систем автоматического перевода.
5. Создание поисковых систем, работающих на национальных языках.
Обилие и строгость законов на Руси всегда смягчалось неукоснительным их неисполнением
Крылатая фраза начала 19 века.
Отличный закон
По крайней мере, с точки зрения рассматриваемой проблемы «электронных письмен» - это Федеральный закон № 149-ФЗ от 27.07.2006 года “Об информации, информационных технологиях и защите информации”. В нем буквально сказано:
Статья 3. “Принципы правового регулирования информационных отношений”
“Правовое регулирование общественных отношений, осуществляемое настоящим Федеральным законом, основывпется на следующих принципах:
... 4) Равноправие языков народов Росийской Федерации при создании информационных систем и их эксплуатации»...
Статья 8. Право на доступ к информации.
«... 5). Государственные органы и органы местного самоуправления обязаны обеспечивать доступ к информации о своей деятельности на русском языке и государственном языке соответствующей республики в составе Российской Федерации в соответствии с федеральными законами, законом субъекта Российской Федерации и нормативными правовыми актами органов местного самоуправления. Лицо, желающее получить доступ к такой информации, не обязано обоснговывать необходимость её получения.»...
Статья 12. Государственное регулирование в сфере применения информационных технологий.
«... 2. Государственные органы Российской Федерации, органы государственной власти субъектов Российской Федерации, органы местного самоуправления в соответствии со своими полномочиями:
...2) создают информационные системы и обеспечивают доступ к содержащейся в них информации на русском языке и государственном языке соответствующей республики в составе Российской Федерации».
Извините за длинные цитаты, но дело того стоило.
Каково же фактическое состояние с «...созданием информационных систем на государственном языке соответствующей республики» ?
В Татарстане компания Майкрософт кое-что сделала (не в том, конечно объеме, как выше указано).
Сейчас при создании комплекта Базового Свободного Программного Обеспечения (БСПО) для образовательных учреждений Российской Федерации (работа ведется в рамках Национального Проекта «Образование») фонду Татарнамэ выделены из федерального бюджета средства для «татаризации» операционной системы, офисных программ, в работе этой предусмотрены электронные словари, средства проверки правописания.
Прошло в Интернете сообщение о каких-то начинаниях в Якутии.
О ситуации в финно-угорских республиках вы лучше моего знаете.
Похоже, что в целом в Российской Федерации дело обстоит неважно – усилия разрознены, единой принятой концепции выполнения Отличного Закона нет.
Поэтому я предлагаю нашему семинару обратиться к Конгрессу финно-угорских народов, который будет в Ханты-Мансийске этим летом, с предложением, чтобы Конгресс выступил перед Правительством Российской Федерации с ходатайством о подготовке и разворачивании в России Федеральной Программы создания компьютерного программного инструментария для обеспечения полноценного функционирования финно-угорских национальных языков в электронном информационном пространстве, включая как минимум:
- разработку и стандартизацию графического представления национальных шрифтов, раскладок клавиатуры
- создание общедоступных (распространяемых под открытыми лицензиями) электронных словарей (толковых и многоязычных)
- создание систем проверки правописания, основанных на передовых лингвистических концепциях
- создание поисковых систем, работающих на национальных языках
- создание систем автоматического перевода.
По делу, конечно, в России не только для финно-угорских народов такая программа нужна – но лиха беда начало, и если дело удастся сдвинуть с места, то и для других языков его будет делать легче, на основании удачных прецедентов. И не только в России – я вовсе не уверен, что скажем, для ливского языка, что в Латвии, реализованы эти пять обязательных компонент «национального компьютерного языка», перечисленные выше.
Куда ж нам плыть?
А. Пушкин
К свободе!
(Свобода - в самом общем смысле, наличие возможности выбора... (Из Википедии))
В заключение своего выступления хотел бы остановиться на важном моменте.
Конечно, локализация на «малые» языки базового программного обеспечения, позволяющего языку полноценно работать и жить, вместе с его народом, возможна применительно к самым различным платформам. Однако я уверен в том, что делать это следует именно с использованием Свободного Программного Обеспечения, СПО (часто используют англоязычный термин Open Source, «программы с открытым кодом»). Об СПО как феномене человеческой деятельности написано очень много (см., например, статью “Свободное программное обеспечение” в Википедии), так что вряд ли мне следует подробно здесь на этом останавливаться.
Замечу только одно: выбор СПО как базы для «национального компьютерного языка» естественен – именно в этой парадигме развития достигается свобода как для разработчиков, так и для пользователей.
И именно на основе свободного ПО компании, участвующие в разработке упомянутого выше БСПО для школ, проводят работы по «татаризации».