=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 16 окт 2000 10:43:00 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: просмотровая программа - повтор в KOI-8, издание второе, дополненное -------------------------------------------------------------------------------- >>Я тут задумался над еще одним вариантом. Есть куда более навороченный контрол, >>www.textcontrol.com >>У кого быстрый канал - не могли бы скачать и проверить серийники? >А чем RichText-то плох стал? Там реализовано много, на мой взгляд, полезных абстракций. По сути, это целый текстовый процессор не хуже Ворда в одном in-process контроле >Этот другой хорош только тем, что есть и в виде сишной библиотеки. А RichText разве недоступен в качестве сишного довеска к MFC? >Важнее пока вопрос со шрифтами. Мне кажется, лучше сделать все модульно. Чтобы можно было >осуществлять представление текста во всех существующих системах, аще есть файл с таблицей >соответствий. Ведь мы никак не можем придти к единому мнению по поводу кодировки. А жаль. Вне всякого сомнения, надо отделить интерфейс от логики Но все же, кто знает хоть что-нибудь относительно текущего состояния "Книжицы"? Зачем изобретать велосипед, когда можно добавить только "Книжице" понимание HIP? Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 16 окт 2000 10:11:23 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: просмотровая программа -------------------------------------------------------------------------------- ----- Original Message ----- From: A A G To: -=ORTHODOX-FONT=- Project Participants Sent: Monday, October 16, 2000 3:12 AM Subject: Re: просмотровая программа Я тут задумался над еще одним вариантом. Есть куда более навороченный контрол, www.textcontrol.com У кого быстрый канал - не могли бы скачать и проверить серийники? А чем RichText-то плох стал? Этот другой хорош только тем, что есть и в виде сишной библиотеки. Там реализовано много, на мой взгляд, полезных абстракций. А RichText разве недоступен в качестве сишного довеска к MFC? Важнее пока вопрос со шрифтами. Мне кажется, лучше сделать все модульно. Чтобы можно было осуществлять представление текста во всех существующих системах, аще есть файл с таблицей соответствий. Ведь мы никак не можем придти к единому мнению по поводу кодировки. А жаль. Вне всякого сомнения, надо отделить интерфейс от логики Но все же, кто знает хоть что-нибудь относительно текущего состояния "Книжицы"? Зачем изобретать велосипед, когда можно добавить только "Книжице" понимание HIP? =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 16 окт 2000 03:12:55 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: просмотровая программа -------------------------------------------------------------------------------- Я тут задумался над еще одним вариантом. Есть куда более навороченный контрол, www.textcontrol.com У кого быстрый канал - не могли бы скачать и проверить серийники? А чем RichText-то плох стал? Этот другой хорош только тем, что есть и в виде сишной библиотеки. Важнее пока вопрос со шрифтами. Мне кажется, лучше сделать все модульно. Чтобы можно было осуществлять представление текста во всех существующих системах, аще есть файл с таблицей соответствий. Ведь мы никак не можем придти к единому мнению по поводу кодировки. А жаль. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 16 окт 2000 02:35:23 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: просмотровая программа - повтор в KOI-8 -------------------------------------------------------------------------------- > > У кого быстрый канал - не могли бы скачать и проверить серийники? > Разумеется, для того, чтобы проверить их, у добровольца должна стоять хоть какая-нибудь среда программирования, создающая контейнеры ActiveX. Впрочем, наверняка подойдет и форма VBA из Офиса. Вызываете редактор макросов, говорите Insert - > UserForm и помещаете на форму предварительно инсталлированный контрол. Если серийники работают, по их введении наглые скринчики должны прекратить появляться. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 16 окт 2000 02:21:57 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Fw: просмотровая программа - повтор в KOI-8 -------------------------------------------------------------------------------- > > From: A A G [mailto:lux@bigfoot.com] > > > А чего нам этот Ворд сдался? Не у всякого он есть, плюс > > версии разные. Вот > > RichTextBox куда как более приемлемый вариант. Быстрее будет > > работать, опять > > же, чем OLE. > > М-ммммм.... А мне как-то казалось что все же естественнее пользоваться > тем, что уже есть и широко распространено? Это к нашей дискуссии с > Забавиным о сравнительных достоинствах зе Бата и МС аутглюка (експресса > и не експресса). При всех достоинствах первого он имел один большой > недостаток - не МС. :-) Поверь, Глебушка, что RichTextBox у тебя тоже есть. И тоже от Билла, как и Ворд. И, кстати, проблем с версиями должен породить меньше, чем Ворд - это факт. Я тут задумался над еще одним вариантом. Есть куда более навороченный контрол, www.textcontrol.com У кого быстрый канал - не могли бы скачать и проверить серийники? ------------------------------------------------ VB4free presents [ Program..............: TX Textcontrol 7.0 pro ] [ Location.............: www.textcontrol.com ] [ Licensed by..........: Uncle ] [ File Type............: OCX-Control ] [ Protection...........: Nag ] ЬЬЬЫ ЫЫ ЫЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬ ЫЫ ЬЬЬЬЬ Change name and company to: uncle@vb4free Key should now equal = FJ-44538 so version 1 serial = TXS0000020349 so version 2 serial = TP-0000037059 //new version ---------------------------------------------------------- ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 16 окт 2000 02:18:55 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" , Тема: Re: просмотровая программа -------------------------------------------------------------------------------- > > From: A A G [mailto:lux@bigfoot.com] > > > А чего нам этот Ворд сдался? Не у всякого он есть, плюс > > версии разные. Вот > > RichTextBox куда как более приемлемый вариант. Быстрее будет > > работать, опять > > же, чем OLE. > > М-ммммм.... А мне как-то казалось что все же естественнее пользоваться > тем, что уже есть и широко распространено? Это к нашей дискуссии с > Забавиным о сравнительных достоинствах зе Бата и МС аутглюка (експресса > и не експресса). При всех достоинствах первого он имел один большой > недостаток - не МС. :-) Поверь, Глебушка, что RichTextBox у тебя тоже есть. И тоже от Билла, как и Ворд. И, кстати, проблем с версиями должен породить меньше, чем Ворд - это факт. Я тут задумался над еще одним вариантом. Есть куда более навороченный контрол, www.textcontrol.com У кого быстрый канал - не могли бы скачать и проверить серийники? ------------------------------------------------ VB4free presents [ Program..............: TX Textcontrol 7.0 pro ] [ Location.............: www.textcontrol.com ] [ Licensed by..........: Uncle ] [ File Type............: OCX-Control ] [ Protection...........: Nag ] ЬЬЬЫ ЫЫ ЫЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬ ЫЫ ЬЬЬЬЬ Change name and company to: uncle@vb4free Key should now equal = FJ-44538 so version 1 serial = TXS0000020349 so version 2 serial = TP-0000037059 //new version ---------------------------------------------------------- =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 16 окт 2000 01:49:02 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RE: просмотровая программа -------------------------------------------------------------------------------- > From: A A G [mailto:lux@bigfoot.com] > А чего нам этот Ворд сдался? Не у всякого он есть, плюс > версии разные. Вот > RichTextBox куда как более приемлемый вариант. Быстрее будет > работать, опять > же, чем OLE. М-ммммм.... А мне как-то казалось что все же естественнее пользоваться тем, что уже есть и широко распространено? Это к нашей дискуссии с Забавиным о сравнительных достоинствах зе Бата и МС аутглюка (експресса и не експресса). При всех достоинствах первого он имел один большой недостаток - не МС. :-) ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 15 окт 2000 04:39:41 От: "ier. V." Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Замена Font|Red -> %<..%> в винворде -------------------------------------------------------------------------------- Sub MAIN ToolsOptionsEdit .SmartCutPaste = 0 EditFindFont .Color = 6 EditFind .Find = "" EditCut Insert "%<" EditPaste Insert "%>" ToolsOptionsEdit .SmartCutPaste = 1 End Sub Зациклите это, насколько потребуется. иер. Владимир ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 15 окт 2000 03:41:06 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Замена Font|Red -> %<..%> в винворде -------------------------------------------------------------------------------- Hi Спасибо. Lev Tikhonov wrote: > Заменить на: %<("искомый текст" - выбрать в меню)%> Этого я не знал. Пытался через регулярные выражения, \1, получался все время какой-то бред. Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 15 окт 2000 03:37:54 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Замена Font|Red -> %<..%> в винворде -------------------------------------------------------------------------------- ----- Original Message ----- From: "Alexander V. Voinov" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Sunday, October 15, 2000 3:01 AM Subject: Замена Font|Red -> %<..%> в винворде > Hi All, > > Помогите, пожалуйста, составить регулярное выражение для замены или > vb-макрос, который бы делал субж, т.е. несколько подряд идущих букв > красным цветом заменял бы на ту же самую последовательность, заключенную > в hipовские кавычки для киновари. > Tools -> Macros -> Записать. Называешь как-нибудь. Edit -> Find Что: Шрифт красный Заменить на: %<("искомый текст" - выбрать в меню)%> OK Жмешь на кнопочку остановки записи, залезаешь в редактор макросов и смотришь, что там записалось. Можешь потереть кучу свойств объекта Find, которые в данном случае не нужны и использовать записанное в любом контексте и с любыми модификациями. Если вдруг не получится - пиши, я все это проделаю за тебя. Но я в тебя верю ;-) ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 15 окт 2000 03:01:36 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Замена Font|Red -> %<..%> в винворде -------------------------------------------------------------------------------- Hi All, Помогите, пожалуйста, составить регулярное выражение для замены или vb-макрос, который бы делал субж, т.е. несколько подряд идущих букв красным цветом заменял бы на ту же самую последовательность, заключенную в hipовские кавычки для киновари. Спасибо Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 15 окт 2000 00:06:10 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: РТПУНПФТПЧБС РТПЗТБННБ -------------------------------------------------------------------------------- > > > б ЮЕЗП ОБН ЬФПФ чПТД УДБМУС? оЕ Х ЧУСЛПЗП ПО ЕУФШ, РМАУ ЧЕТУЙЙ ТБЪОЩЕ. > чПФ > > > RichTextBox ЛХДБ ЛБЛ ВПМЕЕ РТЙЕНМЕНЩК ЧБТЙБОФ. вЩУФТЕЕ ВХДЕФ ТБВПФБФШ, > > ПРСФШ > > > ЦЕ, ЮЕН OLE. > > > > дЩЛ ПО ФПЦЕ OLE ;-))) > > > > нОЕ ЛБЪБМПУШ, ЕУФШ ОЕЛПФПТБС ТБЪОЙГБ. ч МАВПН УМХЮБЕ, ПДОП ДЕМП РПДЗТХЪЙФШ > RichText.ocx ЙМЙ НПОУФТБ ФЙРБ чПТДБ. тБЪОЙГБ - Ч ФЙРЕ УЕТЧЕТБ. In-process ocx ЙМЙ out-of-process exe. ч ТБОФБКНЕ, РТЙ ЪБЗТХЦЕООПН Ч РБНСФШ УЕТЧЕТЕ, ОБ УПЧТЕНЕООЩИ ФБЮЛБИ ТБЪОЙГБ ЗМБЪПН ОЕ ЪБНЕФОБ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 14 окт 2000 23:49:24 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: просмотровая программа -------------------------------------------------------------------------------- Hi Lev Tikhonov wrote: > > Если нужны действительно кроссплатформные решения (включая win311), то > > тоже есть варианты. Например, wxWindows/wxPython. www.wxwindows.org. > > Что сие есть и кто еще пользует Вынь 311? Ты знаешь, пользуют, причем не только в России. И даже не только win311, но и дос. В моей прошлой фирме мы с трудом уговорили заказчика из Европы отказаться наконец от Pharlap'a и перейти на win32 (У них были проблемы с сетевым доступом из-под Pharlapa к нашей базе под Новеллом). wxWindows - библиотека классов на С++, по функциональности эквивалентная или превосходящая MFC. Под виндовз она использует native win32 sdk, под унихом - gtk или motif. Есть интерфейс к Питону. В ее комплекте есть html-окно и 'rich-edit'. Порт для win311 до сих пор поддерживается и находится в лучшем состоянии, чем порт для Мака ;-) Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 14 окт 2000 23:20:37 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: РТПУНПФТПЧБС РТПЗТБННБ -------------------------------------------------------------------------------- > > зМБЧОПЕ, ЮФП ФБЛПК previewer НПЦЕФ > ПФОПУЙФЕМШОП ВЩУФТП "ЧЩРТЩЗЙЧБФШ", ЛПЗДБ РПМШЪПЧБФЕМШ ЭЕМЛБЕФ РП ЖБКМХ > hip Ч explorere. вЩУФТЕЕ, ЮЕН ЧЙОЧПТД. уБЫБ, ФЩ ОЕ РПОЙНБЕЫШ УХФЙ OLE. чЙОЧПТД НПЦЕФ ВЩФШ ЪБРХЭЕО Ч ЖПОЕ Й ЧППВЭЕ ПЛОБ ОЕ ЙНЕФШ. еУМЙ ЕУФШ чЙОЧПТД-УЕТЧЕТ Ч РБНСФЙ, OLE-ПЛОБ Ч РТПЗТБННЕ-ЛМЙЕОФЕ ВХДХФ РПСЧМСФШУС РТБЛФЙЮЕУЛЙ УФПМШ ЦЕ ВЩУФТП, ЛБЛ Й RichEdit-ПЛПЫЛЙ. фПМШЛП ОБ РЕТЧПОБЮБФМШОЩК ЪБРХУЛ чПТДБ ХКДЕФ, ЛПОЕЮОП, ВПМШЫЕ ЧТЕНЕОЙ, ЮЕН ОБ ЧЩЪПЧ dll, УПДЕТЦБЭЕК RichEdit. > еУМЙ ОХЦОЩ ДЕКУФЧЙФЕМШОП ЛТПУУРМБФЖПТНОЩЕ ТЕЫЕОЙС (ЧЛМАЮБС win311), ФП > ФПЦЕ ЕУФШ ЧБТЙБОФЩ. оБРТЙНЕТ, wxWindows/wxPython. www.wxwindows.org. юФП УЙЕ ЕУФШ Й ЛФП ЕЭЕ РПМШЪХЕФ чЩОШ 311? ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 14 окт 2000 23:14:12 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: просмотровая программа -------------------------------------------------------------------------------- > > А чего нам этот Ворд сдался? Не у всякого он есть, плюс версии разные. Вот > > RichTextBox куда как более приемлемый вариант. Быстрее будет работать, > опять > > же, чем OLE. > > Дык он тоже OLE ;-))) > Мне казалось, есть некоторая разница. В любом случае, одно дело подгрузить RichText.ocx или монстра типа Ворда. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 14 окт 2000 23:03:01 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: РТПУНПФТПЧБС РТПЗТБННБ -------------------------------------------------------------------------------- > > ч чБУЙЛЕ, ЛУФБФЙ, ОБ ПУОПЧЕ RichTextBox-Б ФПЦЕ ЪБРТПУФП НПЦОП УМЕРЙФШ, Б > > НПЦОП Й ОБ ПУОПЧЕ чПТДБ ЛБЛ ole-УЕТЧЕТБ. > > > > б ЮЕЗП ОБН ЬФПФ чПТД УДБМУС? оЕ Х ЧУСЛПЗП ПО ЕУФШ, РМАУ ЧЕТУЙЙ ТБЪОЩЕ. чПФ > RichTextBox ЛХДБ ЛБЛ ВПМЕЕ РТЙЕНМЕНЩК ЧБТЙБОФ. вЩУФТЕЕ ВХДЕФ ТБВПФБФШ, ПРСФШ > ЦЕ, ЮЕН OLE. дЩЛ ПО ФПЦЕ OLE ;-))) лБЛПК ЫТЙЖФ МХЮЫЕ ЙУРПМШЪПЧБФШ? й ЮФП ОБУЮЕФ "лОЙЦЙГЩ"? ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 14 окт 2000 22:55:37 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RE: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- > From: Alexander V. Voinov [mailto:avv@quasar.ipa.nw.ru] > Для генерации и ТеХа и rtf (который можно втащить в ПМ) надо стать на > ступеньку выше над ними. Например, делать руками или визивигом > SGML файл > (SlavML - звучит?), который пропускать через предварительно > адаптированный opejade. Кто такое СГМЛ и в какой программе его делают? И что такое опеяде? ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 14 окт 2000 22:55:29 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: просмотровая программа -------------------------------------------------------------------------------- Hi Конечно, для такой задачи вся мощь винворда не нужна. Если речь идет о windows-only решении, то подойдет любая поделка вокруг RichTechEdit control. Хоть в Visual-Basic'е, хоть в другом языке, где есть доступ к этому управляющему элементу. Программа преобразует hip побуквенно под раскладку выбранного Ц.С. шрифта (Ирмологион, Ижица, Евангелие - можно даже выбирать из меню), и то, что получилось, отображает построчно - как в исходном hip-тексте. Команды разметки, входящие в стандарт hip'а, тоже, насколько я могу судить, могут более или менее прилично отображаться с помощью richtextedit. Главное, что такой previewer может относительно быстро "выпрыгивать", когда пользователь щелкает по файлу hip в explorere. Быстрее, чем винворд. Если нужны действительно кроссплатформные решения (включая win311), то тоже есть варианты. Например, wxWindows/wxPython. www.wxwindows.org. Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 14 окт 2000 23:36:19 От: "ier. V." Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Переносы в HIP -------------------------------------------------------------------------------- Приложу немного к дискуссии о переносах. У меня в свое время была некоторая идея о том, как можно реализовать переносы в HIP-тексте без больших силовых затрат по составлению таблиц переносов. Не знаю, насколько она пройдет. Суть в следующем. Каждое слово в HIP мы можем вполне однозначно перевести в "гражданку". После этого применяем к этому слову алгоритм для переносов современного русского языка. (Результат получается вполне сносный ;-)). А затем по получившемуся результату расставляем переносы в HIP-слове. Только следует отладить запрет расстановки переносов в непосредственной близости от титл и все! иер. Владимир. PS. И еще предложение для всех. Если тема дискуссии меняется, то соответственно давайте менять и темы писем, а не просто будем жать кнопку REPLY. А то совершенно невозможно ориентироваться в списке сообщений. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 14 окт 2000 23:12:05 От: "ier. V." Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- ----- Original Message ----- From: Mikhail Grinchuk To: -=ORTHODOX-FONT=- Project Participants Sent: Friday, October 13, 2000 7:17 PM Subject: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе > AG wrote: > > > > Но почему-то современные книги в целом смотрятся заметно хуже, > > > чем плоды ручного набора... > > > > Мне думается, дело просто в способе печати. Высокая печать смотрится куда > > как приятнее какого-нибудь оффсета. > > Так ведь и репринты (даже не самого высокого качества) приятны для глаза... Мне кажется, суть в следущем. С распространением компьютерной техники к верстке получили доступ дилетанты в этом деле :(. иер. Владимир. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 14 окт 2000 22:33:40 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: просмотровая программа -------------------------------------------------------------------------------- > В Васике, кстати, на основе RichTextBox-а тоже запросто можно слепить, а > можно и на основе Ворда как ole-сервера. > А чего нам этот Ворд сдался? Не у всякого он есть, плюс версии разные. Вот RichTextBox куда как более приемлемый вариант. Быстрее будет работать, опять же, чем OLE. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 14 окт 2000 22:17:40 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: РТПУНПФТПЧБС РТПЗТБННБ -------------------------------------------------------------------------------- ----- Original Message ----- From: "A A G" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Saturday, October 14, 2000 9:16 PM Subject: РТПУНПФТПЧБС РТПЗТБННБ > рПОЕНОПЗХ ОБЪТЕЧБЕФ ОЕПВИПДЙНПУФШ ДМС ИПТПЫЕК РТПУНПФТПЧПК РТПЗТБННЩ, > УПЧНЕУФЙНПК У HIP. чЙОЧПТД УПКДЕФ? юФПВЩ ЖБКМЩ НПЗМЙ ИТБОЙФШУС ОБ ДЙУЛЕ Ч HIP, Б ЬФБ > РТПЗТБННЩ ЙИ ОБ МЕФХ ЙЪПВТБЦБМБ "ФБЛ ЛБЛ ОБДП". "оБ МЕФХ" ОЕ РПМХЮЙФУС, Б ВХДХФ ДЧЕ НБЛТЩ - ЛПОЧЕТФЙТХАЭБС HIP Ч ХДПВПЪТЙНЩК ФЕЛУФ Й ОБЪБД. й ЮФПВЩ ВЩМБ ОЕЛБС УЙУФЕНБ > ЧТПДЕ ЬМЕЛФТПООПК ЛОЙЦОПК РПМЛЙ. тБЪХНЕЕФУС, У ЧПЪНПЦОПУФША РПЙУЛБ РП ЧУЕН > ЙНЕАЭЙНУС НПДХМСН. лФП ВЩ ЧЪСМУС? фПЦЕ НПЦОП УДЕМБФШ Ч чПТДЕ, ФПМШЛП ЧПФ... Б ЮФП ФБН У еТНПМБЕЧУЛПК "лОЙЦЙГЕК"? ч чБУЙЛЕ, ЛУФБФЙ, ОБ ПУОПЧЕ RichTextBox-Б ФПЦЕ ЪБРТПУФП НПЦОП УМЕРЙФШ, Б НПЦОП Й ОБ ПУОПЧЕ чПТДБ ЛБЛ ole-УЕТЧЕТБ. > бМЕЛУЕК > > дSаО\SЌLў7·яj)ЉЛ±к‰Зњк†‡ЖЫ ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 14 окт 2000 21:16:55 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: просмотровая программа -------------------------------------------------------------------------------- Понемногу назревает необходимость для хорошей просмотровой программы, совместимой с HIP. Чтобы файлы могли храниться на диске в HIP, а эта программы их на лету изображала "так как надо". И чтобы была некая система вроде электронной книжной полки. Разумеется, с возможностью поиска по всем имеющимся модулям. Кто бы взялся? Алексей =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 14 окт 2000 07:18:34 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- Hi Gleb Arkhangelsky wrote: > > Вообще-то наша задача -- имея HIP на входе, получить через ТеХ > > красивую > > распечатку. У народа имеется несколько разных ТеХов, в которых > > А насколько продукт сего процесса будет доступен для не отягощенных > желанием много думать над софтом (а следовательно, не склонных к теху) > пользователей? Как минимум - можно ли будет сделать из этой красивой > распечатки ПДФ, вставить ее в пижамкер, итп? Для генерации и ТеХа и rtf (который можно втащить в ПМ) надо стать на ступеньку выше над ними. Например, делать руками или визивигом SGML файл (SlavML - звучит?), который пропускать через предварительно адаптированный opejade. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 14 окт 2000 07:13:51 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- Hi All, Я вернулся из командировки, все прочитал, но отвечать буду частями, если будет чем. Очень много нового. Mikhail Grinchuk wrote: > > AG wrote: > > > > Но почему-то современные книги в целом смотрятся заметно хуже, > > > чем плоды ручного набора... > > > > Мне думается, дело просто в способе печати. Высокая печать смотрится куда > > как приятнее какого-нибудь оффсета. Не знаю, не знаю. После того, как я сам повозился со шрифтами и версткой, я стал замечать много недостатков в наборе старых книг. И буквы прыгают, и надстрочные знаки тоже ведут себя неизвестно как. Единства стиля тоже особенно не было. Кстати, я заметил, что очень часто надстрочные знаки прикладывались именно справа к соответствующей букве. Смутно припоминаю, что это и определило мое решение в Izhits'e - делать "надвиг" на предыдущую, а не последующую букву - это усиливало ощущение "как по-старому". С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 13 окт 2000 20:57:50 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RE: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- > From: grinchuk@lsil.com [mailto:grinchuk@lsil.com] > Вообще-то наша задача -- имея HIP на входе, получить через ТеХ > красивую > распечатку. У народа имеется несколько разных ТеХов, в которых А насколько продукт сего процесса будет доступен для не отягощенных желанием много думать над софтом (а следовательно, не склонных к теху) пользователей? Как минимум - можно ли будет сделать из этой красивой распечатки ПДФ, вставить ее в пижамкер, итп? ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 13 окт 2000 20:57:45 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RE: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- > From: vvv@video.uic.vsu.ru [mailto:vvv@video.uic.vsu.ru]On Behalf Of > Vladimir Volovich > возможно, дело не в наличии или отсутствии кернов, а в качестве > электронной версии некоторых шрифтов. > > сами по себе, керны по определению ухудшить результат не могут (при > правильном ими пользовании), а могут только улучшить, что видно > невооруженным глазом в некоторых случаях. А потом, могу предположить, что свое интегральное хорошее впечатление от старых текстов (в которое, пусть даже не осознанно, включается очень многое - вплоть до запаха бумаги или уважения к старине, которое переносится и на репринт) Алексей и Михаил пытаются объяснить причинами, лежащими на поверхности. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 13 окт 2000 20:57:38 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RE: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- > From: grinchuk@lsil.com [mailto:grinchuk@lsil.com] > Как ни странно, эти две задачи (расстановка переносов и "повышение > уровня" с упрощенного набора до полноценного) имеют больше общего, > чем различного. Ведь "возможный перенос" можно трактовать как Звучит убедительно. Тут говорилось о словаре переносов - так может быть лучше делать сразу такой словарь, в котором будет сидеть _вся_ необходимая информация о слове? Вплоть до его вариаций в зависимости от окружения? ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 13 окт 2000 17:37:52 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- "MG" == Mikhail Grinchuk writes: >> Мне думается, дело просто в способе печати. Высокая печать >> смотрится куда как приятнее какого-нибудь оффсета. MG> Так ведь и репринты (даже не самого высокого качества) приятны MG> для глаза... возможно, дело не в наличии или отсутствии кернов, а в качестве электронной версии некоторых шрифтов. сами по себе, керны по определению ухудшить результат не могут (при правильном ими пользовании), а могут только улучшить, что видно невооруженным глазом в некоторых случаях. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 13 окт 2000 17:14:58 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- "MG" == Mikhail Grinchuk writes: >> есть пакет TeX::Hyphen, написанный на perl, он как раз это и >> делает. MG> Надо будет поэкспериментировать. это пакет есть на CPAN (см www.cpan.org); его можно взять и здесь: ftp://ftp.vsu.ru/pub/CPAN/modules/by-module/TeX/TeX-Hyphen-0.101.tar.gz Best, v. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 13 окт 2000 17:17:16 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- AG wrote: > > Но почему-то современные книги в целом смотрятся заметно хуже, > > чем плоды ручного набора... > > Мне думается, дело просто в способе печати. Высокая печать смотрится куда > как приятнее какого-нибудь оффсета. Так ведь и репринты (даже не самого высокого качества) приятны для глаза... =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 13 окт 2000 16:57:11 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- > Но почему-то современные книги в целом смотрятся заметно хуже, > чем плоды ручного набора... > Мне думается, дело просто в способе печати. Высокая печать смотрится куда как приятнее какого-нибудь оффсета. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 13 окт 2000 15:29:02 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- Vladimir Volovich wrote: > MG> Кстати, а нет ли уже готовой отдельной программы по расстановке > MG> переносов по ТеХовскому алгоритму? Ее бы как раз имело смысл > MG> включить в комплект нашего софта -- ведь не только же с ТеХом > MG> подразумевается работа. Собственно, и написать нетрудно -- но > MG> вдруг уже сделано? > > есть пакет TeX::Hyphen, написанный на perl, он как раз это и делает. Надо будет поэкспериментировать. > но если будет словарь переносов, то гораздо правильней > при верстке TeX'ом сгенерировать таблицу переносов, а не использовать > внешний расстановщик переносов. А если не через ТеХ гонять -- только внешний годится. Хотя, собственно, никакого противоречия нет. Дано: текст А с переносами, текст B без оных. Оба, скажем, в Word'е. Надо: сделать текст C = B + переносы. Последовательность действий: А.DOC --(Word)--> А.RTF --(конвертор)--> A.HIP A.HIP --(извлечение слов, сортировка, удаление повторов)--> СЛОВНИК СЛОВНИК --(генерация ТеХовских образцов)--> ТАБЛИЦА B.DOC --(Word)--> B.RTF --(конвертор)--> B.HIP B.HIP + ТАБЛИЦА --(расстановщик переносов)--> C.HIP C.HIP --(конвертор)--> C.RTF --(Word)--> C.DOC > а в железных шрифтах по техническим причинам керны было трудно > набивать, поэтому их старались вообще по возможности не > использовать. теперь, при электронной верстке, керны существенно > улучшают внешний вид текстов. Но почему-то современные книги в целом смотрятся заметно хуже, чем плоды ручного набора... М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 13 окт 2000 14:03:41 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- "MG" == Mikhail Grinchuk writes: MG> Когда-то я из одного спелчеккера такой список извлекал. Было MG> порядка 2.000.000 словоформ. вот у меня вопрос -- из какого спеллчекера? как оттуда извлечь? может, есть готовый список? были ли там только словоформы, или еще с переносами? MG> Кстати, а нет ли уже готовой отдельной программы по расстановке MG> переносов по ТеХовскому алгоритму? Ее бы как раз имело смысл MG> включить в комплект нашего софта -- ведь не только же с ТеХом MG> подразумевается работа. Собственно, и написать нетрудно -- но MG> вдруг уже сделано? есть пакет TeX::Hyphen, написанный на perl, он как раз это и делает. MG> Вот! А для начала все равно словарь нужен! словарь в любом случае не помешает, -- он полезен и для spellchecker'а. но если будет словарь переносов, то гораздо правильней при верстке TeX'ом сгенерировать таблицу переносов, а не использовать внешний расстановщик переносов. MG> "Каноническая" литературная гарнитура кернов и вовсе не имеет. >> а нельзя ли узнать, что есть "Каноническая" литературная >> гарнитура? (гда она, и кто установил каноничность) MG> Собственно, это и есть первоначальная Antiqua. Железная MG> гарнитура, изготовленная некой немецкой фирмой по русскому заказу MG> году примерно в 1899-м. а в железных шрифтах по техническим причинам керны было трудно набивать, поэтому их старались вообще по возможности не использовать. теперь, при электронной верстке, керны существенно улучшают внешний вид текстов. Best, v. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 13 окт 2000 13:47:31 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- "MG" == Mikhail Grinchuk writes: MG> Тогда еще такой вопрос: доступны ли CWEB-исходники этих систем? >> да, конечно. все исходники в формате web, а не cweb (по сути >> pascal, в отличие от cweb, где исходники на C) имеются в составе, >> напр., teTeX (CTAN:systems/unix/teTeX) или MikTeX >> (CTAN:systems/win32/miktex). MG> Иначе говоря, недоступны. (Я именно про CWEB спрашивал.) ну, если на то пошло, то и исходники CWEB-исходники самого TeX тоже недоступны. и perl-исходники, TCL-исходники, python-исходники TeX тоже недоступны. доступны только WEB-исходники. как для TeX, так и для e-TeX, Omega. Best, v. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 13 окт 2000 13:24:36 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- Доброе утро! Vladimir Volovich wrote: > MG> Итак, выходит, что "чисто ТеХовская" реализация славянского > MG> набора по сути невозможна? И надо пользоваться другими > MG> программами (е-ТеХ или Омега), которые уже, вообще говоря, ТеХом > MG> не являются? Этого и следовало ожидать. > > в принципе, конечно, возможна и чисто TeXовская реализация, но гораздо > удобнее в данном случае пользоваться расширениями. И как эту чисто ТеХовскую реализацию делать? Ничего кроме воспроизведения ТеХовским макропроцессором той системы последовательных замен, которая была в письмах от (Wed, 11 Oct 2000 00:31:23) и (Wed, 11 Oct 2000 09:11:50), в голову не приходит. Но это заведомо муторней, чем внешний препроцессор. > MG> (А реализация с внешним HIP-препроцессором вполне будет работать > MG> с самым стандартным ТеХ-компилятором...) > > ну строго говоря TeX + внешний препроцессор -- это уже не "чистый TeX". Вообще-то наша задача -- имея HIP на входе, получить через ТеХ красивую распечатку. У народа имеется несколько разных ТеХов, в которых уже как-то реализован славянский набор. И что делать? Если даже использовать расширенные ТеХ-компиляторы, то для поддержки HIP-стиля нужно будет переделывать шрифты, изобретать какой-то аналог verbatim-режима (или по крайней мере локально менять категории у символов) и заниматься прочей мрачной деятельностью. Все ж внешний препроцессор проще будет... Такое вот ИМХО. Другой вопрос -- что именно препроцессировать. Есть вариант с конвертором в буквальном смысле слова: на входе -- HIP, на выходе -- ТеХ. И второй вариант: на входе -- ТеХ с HIP-вставками, на выходе -- чистый ТеХ. По сложности изготовления второй вариант лишь чуть хуже первого (надо, собственно, только отлавливать переключения режимов: ТеХ сохраняем, а HIP конвертируем), но пользоваться им будет заметно проще (не надо впихивать в сам HIP всю разметку). > MG> Тогда еще такой вопрос: доступны ли CWEB-исходники этих систем? > > да, конечно. все исходники в формате web, а не cweb (по сути pascal, в > отличие от cweb, где исходники на C) имеются в составе, напр., teTeX > (CTAN:systems/unix/teTeX) или MikTeX (CTAN:systems/win32/miktex). Иначе говоря, недоступны. (Я именно про CWEB спрашивал.) > >> вообще злоупотреблять командами явного переноса внутри текста не > >> следует, -- лучше поместить исключения в список \hyphenation{...}, > >> -- тогда проблем с кернингом не будет. > MG> Это да, но только если "слово" есть в чистом виде > MG> последовательность символов, а не всяких-разных боксов и кернов. > > а в последовательности боксов и кернов нет нужды расставлять переносы; > к тому же, если такая необходимость возникнет, то явные керны не > пропадают при использовании команды \-; пропадают только неявные керны > из шрифта. Ладно, уточняю: боксов, кернов и просто символов. ;-) > >> imho, это достаточно очевидно. это было бы не так, если бы > >> алгоритм переносов в TeX был реализован неэффективно, что не есть > >> на самом деле. > > MG> Дык у меня он тоже не то чтоб очень плохой. Но внутренняя > MG> структура данных сильно проще, а потому "достаточной очевидности" > MG> не нахожу. > > структура данных возможно и проще (хотя TeXовские таблицы переносов > также довольно просты); но подход с хранением полного словаря всех > словоформ с переносами требует обработки огромных файлов (а поэтому > заведомо более медленный), -- напр., в современном русском языке > кол-во всех словоформ заведомо больше, чем 900,000, -- файл много > мегабайтный. Когда-то я из одного спелчеккера такой список извлекал. Было порядка 2.000.000 словоформ. Но речь шла о другом -- через контекстные замены можно эмулировать именно ТеХовский алгоритм (конечно, потребуется некая трансформация таблицы). А использование "напрямую" словаря переносов можно считать первой возможной реализацией, которую просто легче всего сделать. Кстати, а нет ли уже готовой отдельной программы по расстановке переносов по ТеХовскому алгоритму? Ее бы как раз имело смысл включить в комплект нашего софта -- ведь не только же с ТеХом подразумевается работа. Собственно, и написать нетрудно -- но вдруг уже сделано? > заметим, что в пакете для ц.-сл. набора А.Слепухина имеются TeXовские > таблицы переносов. доработать их для HIP было бы не столь сложно; к > тому же, если бы был достаточно большой словарь переносов, то было бы > несложно сгенерировать таблицы переносов при помощи patgen. Вот! А для начала все равно словарь нужен! > MG> В "гражданских" шрифтах керны большей частию маленькие, и их > MG> порча не так бросается в глаза. > > ну не во всех. скажем, в Антикве керны существенно улучшают вид > текстов. > > MG> "Каноническая" литературная гарнитура кернов и вовсе не имеет. > > а нельзя ли узнать, что есть "Каноническая" литературная гарнитура? > (гда она, и кто установил каноничность) Собственно, это и есть первоначальная Antiqua. Железная гарнитура, изготовленная некой немецкой фирмой по русскому заказу году примерно в 1899-м. (Эта же фирма в 1910-м сделала "Академическую".) Нынешняя "Литературная" отличается от нее (для внешнего наблюдателя) очень мало -- заметнее всего разница в рисунке букв К и Ж. > MG> И такое соображение: принудительно воздействовать на разбиение на > MG> строки чаще приходится при наборе узких колонок, что в > MG> "гражданской" литературе встречается сильно реже, чем в > MG> "церковной". А там, где и встречается, обычно используют мелкий > MG> шрифт. > > а как же многоколоночный набор? 1) гражданские шрифты при равной физической ширине колонок обычно мельче; 2) в ц.-сл. словах чаще встречаются длинные куски, которые переносить нельзя (в частности, из-за ера в конце многих слов и из-за написаний с титлами). М. Г. === Пусть будет много программов, хороших и разных! === =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 13 окт 2000 12:03:58 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- "MG" == Mikhail Grinchuk writes: MG> Итак, выходит, что "чисто ТеХовская" реализация славянского MG> набора по сути невозможна? И надо пользоваться другими MG> программами (е-ТеХ или Омега), которые уже, вообще говоря, ТеХом MG> не являются? Этого и следовало ожидать. в принципе, конечно, возможна и чисто TeXовская реализация, но гораздо удобнее в данном случае пользоваться расширениями. MG> (А реализация с внешним HIP-препроцессором вполне будет работать MG> с самым стандартным ТеХ-компилятором...) ну строго говоря TeX + внешний препроцессор -- это уже не "чистый TeX". MG> Тогда еще такой вопрос: доступны ли CWEB-исходники этих систем? да, конечно. все исходники в формате web, а не cweb (по сути pascal, в отличие от cweb, где исходники на C) имеются в составе, напр., teTeX (CTAN:systems/unix/teTeX) или MikTeX (CTAN:systems/win32/miktex). MG> И какова их совместимость со "стандартом" по DVI-файлам, то есть MG> нужны ли новые программы просмотра и печати? e-TeX генерирует стандартные DVI файлы. PDF-e-TeX генерирует PDF-файлы. Omega генерирует dvi файлы с расширенным рнабором инструкций; имеются соответствующие утилиты odvips, odvicopy, odvitype, oxdvi, etc. формат хоть и расширен, но не кардинально. odvips генерирует стандартный postscript. >> вообще злоупотреблять командами явного переноса внутри текста не >> следует, -- лучше поместить исключения в список \hyphenation{...}, >> -- тогда проблем с кернингом не будет. MG> Это да, но только если "слово" есть в чистом виде MG> последовательность символов, а не всяких-разных боксов и кернов. а в последовательности боксов и кернов нет нужды расставлять переносы; к тому же, если такая необходимость возникнет, то явные керны не пропадают при использовании команды \-; пропадают только неявные керны из шрифта. >> imho, это достаточно очевидно. это было бы не так, если бы >> алгоритм переносов в TeX был реализован неэффективно, что не есть >> на самом деле. MG> Дык у меня он тоже не то чтоб очень плохой. Но внутренняя MG> структура данных сильно проще, а потому "достаточной очевидности" MG> не нахожу. структура данных возможно и проще (хотя TeXовские таблицы переносов также довольно просты); но подход с хранением полного словаря всех словоформ с переносами требует обработки огромных файлов (а поэтому заведомо более медленный), -- напр., в современном русском языке кол-во всех словоформ заведомо больше, чем 900,000, -- файл много мегабайтный. MG> Мне известны по крайней мере два случая, когда люди, "в MG> промышленных масштабах" применявшие ТеХ для ц.-сл. набора, MG> предпочитали видеть явно раставленные переносы. Один из MG> аргументов был и такой: быть заранее уверенным, что при смене MG> каких-либо параметров или при мелкой правке не возникнет MG> нежелательный перенос. заметим, что в пакете для ц.-сл. набора А.Слепухина имеются TeXовские таблицы переносов. доработать их для HIP было бы не столь сложно; к тому же, если бы был достаточно большой словарь переносов, то было бы несложно сгенерировать таблицы переносов при помощи patgen. MG> В "гражданских" шрифтах керны большей частию маленькие, и их MG> порча не так бросается в глаза. ну не во всех. скажем, в Антикве керны существенно улучшают вид текстов. MG> "Каноническая" литературная гарнитура кернов и вовсе не имеет. а нельзя ли узнать, что есть "Каноническая" литературная гарнитура? (гда она, и кто установил каноничность) MG> Да и для "живых" языков таблицы переносов достаточно хорошие (не MG> потому ли, что существуют словари переносов?), что касается русского языка, то таблицы переносов, насколько мне известно, разрабатывались либо вручную с постепенной доработкой, либо по далеко неполному словарю, с последующей доработкой. полных словарей переносов для русского языка в общедоступном виде, насколько мне известно, нет. MG> И такое соображение: принудительно воздействовать на разбиение на MG> строки чаще приходится при наборе узких колонок, что в MG> "гражданской" литературе встречается сильно реже, чем в MG> "церковной". А там, где и встречается, обычно используют мелкий MG> шрифт. а как же многоколоночный набор? Best, v. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 13 окт 2000 11:02:27 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- Доброе утро! Gleb Arkhangelsky wrote: > Насколько я понимаю, предполагается иметь какие-то базы данных по > переносам. Стоит ли игра свеч? Имхо прекрасно можно обходиться без > переносов (тем паче большинство богосл. книг делается в большом > формате). Есть ведь проблемы понасущнее переносов. > ЦС конвертер например, о немже забыхом зело. Как ни странно, эти две задачи (расстановка переносов и "повышение уровня" с упрощенного набора до полноценного) имеют больше общего, чем различного. Ведь "возможный перенос" можно трактовать как некий специальный диакритический символ, который во входном тексте отсутствует, но подлежит восстановлению. Абсолютно так же можно понимать и превращение упрощенного набора (скажем, вообще без надстрочных знаков и с неразличением некоторых букв) в полный -- тут можно считать, что есть "невидимый" диакритический знак, превращающий з -> s, о -> w, и -> i и т. п., и его надо восстановить наряду с "настоящей" диакритикой. Различие ситуаций: а) в случае с переносами "пропал" только один символ, а не много разных; б) переносы по слову в принципе (если знать язык) восстанавливаются однозначно даже без знания более широкого контекста (ц.-сл. контрпримеры пока что предъявлены не были, а в "живых" языках, типа русского и английского, их очень мало); в) в случае малейших сомнений не будет ошибкой просто не ставить переносы -- с диакритикой и вариантными буквами это не пройдет. То есть в принципе задача одна и та же, но при расстановке переносов мы имеем дело с неким частным случаем. Так почему бы сперва не разобраться с этим самым случаем, отработать методику (имея "образцовые" тексты с расставленными переносами, надо вычислить алгоритм их расстановки и применить его к другим текстам), а уж потом браться за более сложный общий случай? М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 13 окт 2000 01:05:40 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Конвертер?! -------------------------------------------------------------------------------- > From: Mikhail Grinchuk [mailto:grinchuk@worldnet.att.net] > Sent: Thursday, October 12, 2000 8:33 PM > Итак, выходит, что "чисто ТеХовская" реализация славянского > набора по сути невозможна? И надо пользоваться другими Отцы, а отцы? У меня создается впечатление, что ЦС конвертер, с которого, собственно, заварилась вся кухня, совершенно забыт и речь идет исключительно о ручном наборе ЦС текстов. Пусть меня поправят если я забыл, но по моему (еще в ру.литургике в самом начале дела) убедительно было показано, что русский набор (или еще лучше - сканирование) с последующим конвертированием - это значительно более эффективный и устойчивый к шумам способ создания текстов. Плюс к тому более насущный, т.к. богослужебных текстов в гражданке становится все больше, а следственно, проблема конвертера - все актуальнее. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 12 окт 2000 23:17:55 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RE: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- > From: grinchuk@lsil.com [mailto:grinchuk@lsil.com] > \hyphenation{сло-во} в ТеХовском файле надо добавлять правило > <::>слово<::>/<::>сло%-во<::>// > к списку правил. И явные разрешения переносов "%-" (в отличие от "\-") > не сбивают неявный керн. Насколько я понимаю, предполагается иметь какие-то базы данных по переносам. Стоит ли игра свеч? Имхо прекрасно можно обходиться без переносов (тем паче большинство богосл. книг делается в большом формате). Есть ведь проблемы понасущнее переносов. ЦС конвертер например, о немже забыхом зело. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 12 окт 2000 20:32:42 От: "Mikhail Grinchuk" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- Доброе утро! From: Vladimir Volovich Итак, выходит, что "чисто ТеХовская" реализация славянского набора по сути невозможна? И надо пользоваться другими программами (е-ТеХ или Омега), которые уже, вообще говоря, ТеХом не являются? Этого и следовало ожидать. (А реализация с внешним HIP-препроцессором вполне будет работать с самым стандартным ТеХ-компилятором...) Тогда еще такой вопрос: доступны ли CWEB-исходники этих систем? И какова их совместимость со "стандартом" по DVI-файлам, то есть нужны ли новые программы просмотра и печати? > MG> Ну и, например, такая проблема: если мы где-то явно вставляем > MG> разрешение переноса (команду "\-"), то в этом месте шрифтовой > MG> керн теряется. > > ну это вообще общее "свойство" TeX'а, имеющее место для всех языков, > в т.ч. для английского. к ц.-сл. особого отношения не имеет. > > вообще злоупотреблять командами явного переноса внутри текста не > следует, -- лучше поместить исключения в список \hyphenation{...}, -- > тогда проблем с кернингом не будет. Это да, но только если "слово" есть в чистом виде последовательность символов, а не всяких-разных боксов и кернов. > MG> Что касается времени исполнения (подготовку образцов переносов в > MG> него не включаем), то еще не факт, что чисто ТеХовская реализация > MG> будет шустрее. > > imho, это достаточно очевидно. это было бы не так, если бы алгоритм > переносов в TeX был реализован неэффективно, что не есть на самом деле. Дык у меня он тоже не то чтоб очень плохой. Но внутренняя структура данных сильно проще, а потому "достаточной очевидности" не нахожу. > MG> И что касается качества переносов -- при моем подходе > MG> "неизвестные" слова не окажутся перенесенными в неожиданном > MG> месте, что можно рассматривать скорее как плюс. > > как известно, TeXовский механизм переносов достаточно устойчив к > ошибкам, -- даже небольшие таблицы переносов, составленные, скажем, > автоматически при помощи patgen для какого-то словаря, успешно > справляются с новыми словами. исключения всегдя можно добавить в > словарь исключений \hyphenation{...}. Мне известны по крайней мере два случая, когда люди, "в промышленных масштабах" применявшие ТеХ для ц.-сл. набора, предпочитали видеть явно раставленные переносы. Один из аргументов был и такой: быть заранее уверенным, что при смене каких-либо параметров или при мелкой правке не возникнет нежелательный перенос. > MG> И чтобы вставка некой дополнительной команды между "р" и "д" > MG> обозначала мягкий перенос в этом месте, но без изменения р-д > MG> керна. > > этого скорее всего нет. > > но скажите, а вы тексты на русском языке (и на английском) тоже > пропускаете через систему контекстных замен, ради того, чтобы команда > мягкого переноса \- не убивала керн? В "гражданских" шрифтах керны большей частию маленькие, и их порча не так бросается в глаза. "Каноническая" литературная гарнитура кернов и вовсе не имеет. Да и для "живых" языков таблицы переносов достаточно хорошие (не потому ли, что существуют словари переносов?), и явные \- использовать приходится исключительно редко. И такое соображение: принудительно воздействовать на разбиение на строки чаще приходится при наборе узких колонок, что в "гражданской" литературе встречается сильно реже, чем в "церковной". А там, где и встречается, обычно используют мелкий шрифт. М. Г. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 12 окт 2000 18:19:54 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- "MG" == Mikhail Grinchuk writes: MG> Совершенно верно. Но только для ровно той "механической" MG> последовательности действий, которая была изложена. Но ведь никто MG> не заставляет ограничиваться только такими правилами. Можно MG> эмулировать и ТеХовский механизм. зачем его эмулировать какой-то внешней программой с последующей обработкой TeXом, если его можно непосредственно использовать? >> как, впрочем, и задачу выбора кернов между буквами, -- не стоит >> это делать на уровне макросов, если TeX может автоматически >> выбирать нужные керны. MG> Проблема в том, что для "идеального" решения потребуется слишком MG> сложная метрика (не менее 500 символов, связанных сложными MG> лигатурными и керновыми отношениями) -- "стандартный" ТеХ с MG> 8-битовыми шрифтами это не потянет. согласен, -- поэтому в данном случае лучше использовать не непосредственно TeX, а его расширение -- Omega, в ней можно в одном шрифте името до 65536 символов. MG> Ну и, например, такая проблема: если мы где-то явно вставляем MG> разрешение переноса (команду "\-"), то в этом месте шрифтовой MG> керн теряется. ну это вообще общее "свойство" TeX'а, имеющее место для всех языков, в т.ч. для английского. к ц.-сл. особого отношения не имеет. вообще злоупотреблять командами явного переноса внутри текста не следует, -- лучше поместить исключения в список \hyphenation{...}, -- тогда проблем с кернингом не будет. MG> Или взять такую проблему: пусть у нас есть лигатуры АБ и ВГ, MG> между которыми надо вставлять дополнительный керн. Откуда ТеХу MG> это понять, когда он имеет на входе последовательность АБВГ? (По MG> отрезку "АБВ" этот керн еще не вычисляется -- ведь в АБВД он MG> запросто может потребоваться другого размера.) такая возможность (кернов между лигатурами) заложена в e-TeX. MG> Что касается времени исполнения (подготовку образцов переносов в MG> него не включаем), то еще не факт, что чисто ТеХовская реализация MG> будет шустрее. imho, это достаточно очевидно. это было бы не так, если бы алгоритм переносов в TeX был реализован неэффективно, что не есть на самом деле. MG> И что касается качества переносов -- при моем подходе MG> "неизвестные" слова не окажутся перенесенными в неожиданном MG> месте, что можно рассматривать скорее как плюс. как известно, TeXовский механизм переносов достаточно устойчив к ошибкам, -- даже небольшие таблицы переносов, составленные, скажем, автоматически при помощи patgen для какого-то словаря, успешно справляются с новыми словами. исключения всегдя можно добавить в словарь исключений \hyphenation{...}. MG> P. S. Если вдруг все мои возражения проистекают только от того, MG> что я отстал от ТеХовской жизни -- то просьба просветить, как это MG> все сейчас можно решать (если можно, на базе plain TeXа). В MG> частности, хочу, чтобы набор MG> i=рда'нъ MG> превращался в последовательность символов и лигатур MG> i= р д а' н ъ MG> c правильными попарными кернами. это явно возможно в omega (если использовать механизм OTP, не используя лигатур в шрифтах) (и в e-tex, если использовать лигатуры в шрифтах). MG> И чтобы вставка некой дополнительной команды между "р" и "д" MG> обозначала мягкий перенос в этом месте, но без изменения р-д MG> керна. этого скорее всего нет. но скажите, а вы тексты на русском языке (и на английском) тоже пропускаете через систему контекстных замен, ради того, чтобы команда мягкого переноса \- не убивала керн? Best, v. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 12 окт 2000 18:19:54 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- "MG" == Mikhail Grinchuk writes: MG> Совершенно верно. Но только для ровно той "механической" MG> последовательности действий, которая была изложена. Но ведь никто MG> не заставляет ограничиваться только такими правилами. Можно MG> эмулировать и ТеХовский механизм. зачем его эмулировать какой-то внешней программой с последующей обработкой TeXом, если его можно непосредственно использовать? >> как, впрочем, и задачу выбора кернов между буквами, -- не стоит >> это делать на уровне макросов, если TeX может автоматически >> выбирать нужные керны. MG> Проблема в том, что для "идеального" решения потребуется слишком MG> сложная метрика (не менее 500 символов, связанных сложными MG> лигатурными и керновыми отношениями) -- "стандартный" ТеХ с MG> 8-битовыми шрифтами это не потянет. согласен, -- поэтому в данном случае лучше использовать не непосредственно TeX, а его расширение -- Omega, в ней можно в одном шрифте името до 65536 символов. MG> Ну и, например, такая проблема: если мы где-то явно вставляем MG> разрешение переноса (команду "\-"), то в этом месте шрифтовой MG> керн теряется. ну это вообще общее "свойство" TeX'а, имеющее место для всех языков, в т.ч. для английского. к ц.-сл. особого отношения не имеет. вообще злоупотреблять командами явного переноса внутри текста не следует, -- лучше поместить исключения в список \hyphenation{...}, -- тогда проблем с кернингом не будет. MG> Или взять такую проблему: пусть у нас есть лигатуры АБ и ВГ, MG> между которыми надо вставлять дополнительный керн. Откуда ТеХу MG> это понять, когда он имеет на входе последовательность АБВГ? (По MG> отрезку "АБВ" этот керн еще не вычисляется -- ведь в АБВД он MG> запросто может потребоваться другого размера.) такая возможность (кернов между лигатурами) заложена в e-TeX. MG> Что касается времени исполнения (подготовку образцов переносов в MG> него не включаем), то еще не факт, что чисто ТеХовская реализация MG> будет шустрее. imho, это достаточно очевидно. это было бы не так, если бы алгоритм переносов в TeX был реализован неэффективно, что не есть на самом деле. MG> И что касается качества переносов -- при моем подходе MG> "неизвестные" слова не окажутся перенесенными в неожиданном MG> месте, что можно рассматривать скорее как плюс. как известно, TeXовский механизм переносов достаточно устойчив к ошибкам, -- даже небольшие таблицы переносов, составленные, скажем, автоматически при помощи patgen для какого-то словаря, успешно справляются с новыми словами. исключения всегдя можно добавить в словарь исключений \hyphenation{...}. MG> P. S. Если вдруг все мои возражения проистекают только от того, MG> что я отстал от ТеХовской жизни -- то просьба просветить, как это MG> все сейчас можно решать (если можно, на базе plain TeXа). В MG> частности, хочу, чтобы набор MG> i=рда'нъ MG> превращался в последовательность символов и лигатур MG> i= р д а' н ъ MG> c правильными попарными кернами. это явно возможно в omega (если использовать механизм OTP, не используя лигатур в шрифтах) (и в e-tex, если использовать лигатуры в шрифтах). MG> И чтобы вставка некой дополнительной команды между "р" и "д" MG> обозначала мягкий перенос в этом месте, но без изменения р-д MG> керна. этого скорее всего нет. но скажите, а вы тексты на русском языке (и на английском) тоже пропускаете через систему контекстных замен, ради того, чтобы команда мягкого переноса \- не убивала керн? Best, v. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 12 окт 2000 03:56:19 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- Доброе утро! Vladimir Volovich wrote: > иными словами, предлагается составить словарь ВСЕХ возможных слов на > ц.-сл. языке, и расставить в них переносы, -- ибо этот алгоритм найдет > переносы в тех и только тех словах, которые оказались включенными в > "достаточно большой текст" из пункта а). :-) Совершенно верно. Но только для ровно той "механической" последовательности действий, которая была изложена. Но ведь никто не заставляет ограничиваться только такими правилами. Можно эмулировать и ТеХовский механизм. > imho, это весьма нерационально (как по времени выполнения, так и по > качеству результата), -- лучше все же составить TeXовскую таблицу > переносов (patterns), и возложить эту задачу на TeX. > > как, впрочем, и задачу выбора кернов между буквами, -- не стоит это > делать на уровне макросов, если TeX может автоматически выбирать > нужные керны. Проблема в том, что для "идеального" решения потребуется слишком сложная метрика (не менее 500 символов, связанных сложными лигатурными и керновыми отношениями) -- "стандартный" ТеХ с 8-битовыми шрифтами это не потянет. Ну и, например, такая проблема: если мы где-то явно вставляем разрешение переноса (команду "\-"), то в этом месте шрифтовой керн теряется. Или взять такую проблему: пусть у нас есть лигатуры АБ и ВГ, между которыми надо вставлять дополнительный керн. Откуда ТеХу это понять, когда он имеет на входе последовательность АБВГ? (По отрезку "АБВ" этот керн еще не вычисляется -- ведь в АБВД он запросто может потребоваться другого размера.) Что касается времени исполнения (подготовку образцов переносов в него не включаем), то еще не факт, что чисто ТеХовская реализация будет шустрее. И что касается качества переносов -- при моем подходе "неизвестные" слова не окажутся перенесенными в неожиданном месте, что можно рассматривать скорее как плюс. И обучение системы переносам новых слов не труднее, чем в ТеХе -- только вместо \hyphenation{сло-во} в ТеХовском файле надо добавлять правило <::>слово<::>/<::>сло%-во<::>// к списку правил. И явные разрешения переносов "%-" (в отличие от "\-") не сбивают неявный керн. М. Г. P. S. Если вдруг все мои возражения проистекают только от того, что я отстал от ТеХовской жизни -- то просьба просветить, как это все сейчас можно решать (если можно, на базе plain TeXа). В частности, хочу, чтобы набор i=рда'нъ превращался в последовательность символов и лигатур i= р д а' н ъ c правильными попарными кернами. И чтобы вставка некой дополнительной команды между "р" и "д" обозначала мягкий перенос в этом месте, но без изменения р-д керна. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 12 окт 2000 00:56:31 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- "MG" == Mikhail Grinchuk writes: >> а как предполагается расставлять переносы на первой фазе? MG> Например, можно так: MG> а) берем достаточно большой текст, в котором переносы расставлены MG> вручную (в формате RTF такие уже есть) и конвертируем его в HIP с MG> переносами; [...] MG> ж) наконец, напускаем систему замен из файла В; MG> з) последний шаг -- убираем маркеры <::>. иными словами, предлагается составить словарь ВСЕХ возможных слов на ц.-сл. языке, и расставить в них переносы, -- ибо этот алгоритм найдет переносы в тех и только тех словах, которые оказались включенными в "достаточно большой текст" из пункта а). :-) imho, это весьма нерационально (как по времени выполнения, так и по качеству результата), -- лучше все же составить TeXовскую таблицу переносов (patterns), и возложить эту задачу на TeX. как, впрочем, и задачу выбора кернов между буквами, -- не стоит это делать на уровне макросов, если TeX может автоматически выбирать нужные керны. вообще, я согласен с Александром Воиновым в том, что неплохим кандидатом в этом является Omega с ее возможностью поддерживать OTP. Best regards, -- Vladimir. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 11 окт 2000 20:11:50 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- Vladimir Volovich wrote: > MG> первая фаза процесса расставляет переносы, результат может быть > MG> таким: > > MG> ...,,Слово о полку Игореве`` начинается фразой ,,Не > MG> лjь'%-по ли ны` бя'%-шетъ бра'%-тiе``... > > а как предполагается расставлять переносы на первой фазе? Например, можно так: а) берем достаточно большой текст, в котором переносы расставлены вручную (в формате RTF такие уже есть) и конвертируем его в HIP с переносами; б) удаляем (соответствующей системой контекстных замен) все символы, не относящиеся собственно к словам -- точнее, любую последовательность HIP-символов, разделяющих слова, превращаем в один символ EOL, пусть результат составляет файл А; в) из файла А удалением переносов делаем файл Б (в нем столько же строк); г) пусть <::> -- некий несуществующий HIP-символ; тогда из каждой строки файлов Б и А собираем такую команду для контекстных замен: <::>Б<::>/<::>А<::>// (на самом деле прямо так нельзя, потому что не все ASCII-символы можно напрямую использовать в этих командах; предварительно придется в файлах А и Б заменить "%" на "%%", "/" на "%S" и "\" на "%B"); пусть полученный файл есть В; д) сортируем файл В; если в нем оказывается несколько экземпляров одной и той же строки, то дубликаты убираем; если встречается пара строк с одинаковым началом (до первого "/") -- это обозначает, что в одном и том же слове эталонные переносы были расставлены по-разному -- то выбираем "лучший" вариант, а прочие удаляем. Шаги а)-д) от того файла, в котором надо расставлять переносы, не зависят, так что их в принципе достаточно сделать один раз, заготовив файл В. Теперь собственно расстановка переносов в тексте. Она состоит из таких шагов: е) напускаем еще один набор контекстных замен, который в нашем смешанном тексте окружает каждое HIP-слово маркерами <::> -- в том примере получится следующее: ...,,Слово о полку Игореве`` начинается фразой ,,<::>Не<::> <::>лjь'по<::> <::>ли<::> <::>ны`<::> <::>бя'шетъ<::> <::>бра'тiе<::>``...; ж) наконец, напускаем систему замен из файла В; з) последний шаг -- убираем маркеры <::>. М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 11 окт 2000 16:25:05 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- "MG" == Mikhail Grinchuk writes: MG> первая фаза процесса расставляет переносы, результат может быть MG> таким: MG> ...,,Слово о полку Игореве`` начинается фразой ,,Не MG> лjь'%-по ли ны` бя'%-шетъ бра'%-тiе``... а как предполагается расставлять переносы на первой фазе? Best, v. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 11 окт 2000 11:31:23 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- Доброе утро! "Alexander V. Voinov" wrote: > Две основные задачи остаются те же: переносы и кернинг. (На первую пока > просто времени нет, а со второй - есть над чем подумать; может быть, > сразу в Омегу уйти? Тогда и Алексею будет интереснее, т.к. там 16битный > формат.) > > Другая задача - это скорее вопрос к Владимиру: как бы это можно было > органично втянуть в существующую систему T2+PsCyr, чтобы можно было > легко в рамках одного текста переключаться с "гражданки" на ц.с. и > обратно? Это пригодилось бы, например, в учебниках, для цитат и т.д. Некие соображения, как можно было бы эти проблемы решить -- то есть совместить набор в HIPе с "идеальным" кернингом и (по возможности) с переносами. Основная идея: я не стал бы сваливать всю работу на ТеХ, а сделал бы так: в исходных файлах HIP-фрагменты выделил какими-то сочетаниями символов, которые нигде больше не встречаются (скажем, в начале , а в конце ). Внутри этих фрагментов используется только HIP, а не ТеХ. Эти файлы пропускаются через систему контекстных замен, которая порождает файлы для скармливания собственно ТеХу. В последних славянский набор может быть устроен следующим образом (тут главное точность, а не наглядность). 1. Шрифты. Вообще говоря, ничего страшного не будет даже в том случае, если под ц.-сл. набор задействовать несколько шрифтов -- скажем, так, как это сделано в Ирмологионе. Желательно только, чтобы символы без надстрочных знаков сидели в одном и том же шрифте, и для них были бы указаны правильные попарные керны. 2. Внутреннее ТеХ-представление. Имея набор шрифтов, определяем единообразные ТеХовские команды для каждого возможного HIP-символа (в том числе с акцентами). В таком духе (буква "q" тут играет роль некоего разделителя): a \qqa A \qqA a' \qqaqoksia a~ \qqaqtitlo a\ч \qqaqch е \qqe \qqebig 3. Затем потребуются команды для вычисления и явной вставки керна между парами неакцентированных букв (две штуки -- просто керн и керн с возможным переносом). Что-нибудь с таким синтаксисом: \qqKern#1#2 (просто керн) \qqHyphen#1#2 (керн с возможным переносом) Собственно, требование иметь все неакцентированные символы в одном шрифте нужно для реализации этих команд. Например, так: \newdimen\kernValue \def\qqKern#1#2{\setbox0=\hbox{#1#2}% \setbox1=\hbox{#1\null#2}% \kernValue=\wd0 \advance\kernValue -\wd1 \nobreak\hskip\kernValue} 4. Перевод из HIP в эти команды должен действовать в таком духе: на входе: ...,,Слово о полку Игореве`` начинается фразой ,,Не лjь'по ли ны` бя'шетъ бра'тiе``... первая фаза процесса расставляет переносы, результат может быть таким: ...,,Слово о полку Игореве`` начинается фразой ,,Не лjь'%-по ли ны` бя'%-шетъ бра'%-тiе``... Вторая фаза собственно переводит из HIP в описанные выше команды для ТеХа: ...,,Слово о полку Игореве`` начинается фразой ,,\beginCS \qqN \qqKern\qqN\qqe \qqe \qqspace \qql \qqKern\qql\qqjat \qqjatqoksia \qqHyphen\qqjat\qqp \qqp \qqKern\qqp\qqo \qqo \qqspace \qql \qqKern\qql\qqih \qqih \qqspace \qqn \qqKern\qqn\qqy \qqyqvaria \qqspace \qqb \qqKern\qqb\qqjus \qqjusqoksia \qqHyphen\qqjus\qqsh \qqsh \qqKern\qqsh\qqe \qqe \qqKern\qqe\qqt \qqt \qqKern\qqt\qqer \qqer \qqspace \qqb \qqKern\qqb\qqr \qqr \qqKern\qqr\qqa \qqaqoksia \qqHyphen\qqa\qqt \qqt \qqKern\qqt\qqi \qqi \qqKern\qqi\qqe \qqe \endCS``... 5. HIP-команды для включения/выключения вразрядку при таком подходе естественным образом превращаются во что нибудь типа \qqRazrtrue и \qqRazrfalse -- имеется в виду, что мы завели флажок \newif\ifqqRazr Тогда можно определить \def\qqspace{\ifqqRazr\hskip2em plus1em minus .7em \else\ \fi} А в самом конце \qqKern надо дописать такое: \ifqqRazr\nobreak\hskip.5em \fi (определять "в уме" \qqHyphen не рискую, но это на самом деле тоже несложно). Вот такая в общих чертах концепция. Довольно громоздко, но в принципе должно работать в самых спартанских условиях. Все эти контекстные замены вместе с запуском собственно ТеХа можно собрать в один bat-файл, которым и пользоваться для таких смешанных текстов. М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 11 окт 2000 09:38:36 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Обновлен пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- Hi All, Я довел до некоторого ума стиль izhitsabook.sty, который теперь понимает два параметра - a5book и a6book, что покрывает два наиболее разумных формата "буклетов", которые можно делать в домашних условиях. Таким образом я делал различные сборники молитв для церковного и келейного (не обязательно собственного) употребления, года так с 95-го. С этого момента я считаю предлагаемый пакет употребимым для практических целей (с точностью до глюков, блох и пр.) Две основные задачи остаются те же: переносы и кернинг. (На первую пока просто времени нет, а со второй - есть над чем подумать; может быть, сразу в Омегу уйти? Тогда и Алексею будет интереснее, т.к. там 16битный формат.) Другая задача - это скорее вопрос к Владимиру: как бы это можно было органично втянуть в существующую систему T2+PsCyr, чтобы можно было легко в рамках одного текста переключаться с "гражданки" на ц.с. и обратно? Это пригодилось бы, например, в учебниках, для цитат и т.д. Страница та же: http://www.sobor.org/izhitsa, пдфы примеров вынесены в отдельную ссылку, сам пакет занимает ок. 230к. Добавлен еще шрифт Е.Кустовского (со товарищи) для подтекстовок. А сам шрифт izhitsacs тоже подправлен. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 10 окт 2000 06:54:11 От: Vlad Dorosh Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: Мой пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- Tuesday, October 10, 2000, 4:29:17: > А в обратную сторону, если длинные имена запакованы? Он их понимает? Нет, обрезает до 8 символов. Можно использовать WinZip. А чего Вы хотите от DOS? Там вообще по определению нет длинных имен (Win95 -- это уже не DOS). Влад Дорош ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 10 окт 2000 05:29:17 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Мой пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- Hi Vlad Dorosh wrote: > > Я могу только извиниться, действительно, можно было и зип положить. Вот > > только я сомневаюсь, что сделанный мной зип не доставил бы никаких > > проблем древнему досовскому pkzip'у. > > Не доставил бы однозначно. Я давно работаю с разными версиями Unix > (SCO, Unixware, BSD, Linux) и DOS, и pkzip для DOS является > единственным беспроблемным межплатформенным архиватором. Под Linux, > правда, приходится добавлять ключ -L, но использование под DOS не > меняется. А в обратную сторону, если длинные имена запакованы? Он их понимает? Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 10 окт 2000 05:19:43 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Мой пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- Доброе утро! Vlad Dorosh wrote: > > Я могу только извиниться, действительно, можно было и зип положить. Вот > > только я сомневаюсь, что сделанный мной зип не доставил бы никаких > > проблем древнему досовскому pkzip'у. > > Не доставил бы однозначно. Я давно работаю с разными версиями Unix > (SCO, Unixware, BSD, Linux) и DOS, и pkzip для DOS является > единственным беспроблемным межплатформенным архиватором. Под Linux, > правда, приходится добавлять ключ -L, но использование под DOS не > меняется. > > В отличие от arj, rar, tar. В данном конкретном случае возникла небольшая проблема из-за того, что в одной и той же директории оказались два файла с одинаковыми (с точки зрения pkunzip'а) именами -- он их все переводит в uppercase и сокращает до 8 символов. Но и это в конце концов не фатально -- в принципе можно подправить имена внутри самого zip-файла. М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 10 окт 2000 05:52:59 От: Vlad Dorosh Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: Мой пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- Monday, October 09, 2000, 11:06:00 PM: > Я могу только извиниться, действительно, можно было и зип положить. Вот > только я сомневаюсь, что сделанный мной зип не доставил бы никаких > проблем древнему досовскому pkzip'у. Не доставил бы однозначно. Я давно работаю с разными версиями Unix (SCO, Unixware, BSD, Linux) и DOS, и pkzip для DOS является единственным беспроблемным межплатформенным архиватором. Под Linux, правда, приходится добавлять ключ -L, но использование под DOS не меняется. В отличие от arj, rar, tar. С уважением, Влад Дорош ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 10 окт 2000 00:31:14 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Мой пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- Hi All, Я завел "страничку", где есть ссылки на обе упаковки - и зип и tar.gz. http://www.sobor.org/izhitsa (там index.html подхватывается) Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 10 окт 2000 00:06:00 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Мой пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- Hi Mikhail Grinchuk wrote: > > Вот, кому интересно, посмотрите, пожалуйста, сюда: > > > > http://www.sobor.org/izhitsa/izhitsatex.tgz > > Пожалуйста, не надо использовать экзотические архиваторы! Я могу только извиниться, действительно, можно было и зип положить. Вот только я сомневаюсь, что сделанный мной зип не доставил бы никаких проблем древнему досовскому pkzip'у. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 09 окт 2000 16:24:30 От: "Mikhail Grinchuk" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Мой пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- From: Vladimir Volovich > >> http://www.sobor.org/izhitsa/izhitsatex.tgz > MG> Пожалуйста, не надо использовать экзотические архиваторы! Чем > MG> плох старый добрый pkzip, который есть где угодно? > > ну зачем поднимать религиозные войны по поводу архиваторов? :-) > чем это tar+gzip более экзотичен, чем "старый добрый zip"? Ну хотя бы тем, что файлов с расширением tgz до сих пор мне не попадалось. (Было бы izhitsatex.tar.gz -- одной проблемой меньше.) > MG> Вот сейчас шарю по сетям, пытаюсь где-нибудь отыскать распаковщик > MG> этих неведомых tgz... А вдруг еще оно (в смысле распаковщик) с > MG> вирусом окажется... > > возьмите на www.winzip.com winzip, -- он понимает и tar+gzip (tgz) Да уже нашелся некий "Quick ZIP" -- и вышло, что для архива в 500К пришлось скачивать распаковщик в 2М, которому для работы нужно 4М. Прогресс, тудыть его в качель! М. Г. *** Неудобным называется программный продукт, который не работает под ДОС 5.0 и (или) не влазит на дискету в 360К. *** ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 09 окт 2000 16:07:17 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Мой пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- Можно взять Winzip, оно распаковывает все, что шевелится, вплоть до UUENCODE. Стоит долларов 20, но в интернете полно ключеделалок. ----- Original Message ----- From: "Mikhail Grinchuk" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Monday, October 09, 2000 3:23 PM Subject: Re: Мой пакет для набора Ц.С. текстов в HIP'e в ТеХе > Доброе утро! > > From: Alexander V. Voinov > > > Вот, кому интересно, посмотрите, пожалуйста, сюда: > > > > http://www.sobor.org/izhitsa/izhitsatex.tgz > > Пожалуйста, не надо использовать экзотические архиваторы! Чем плох > старый добрый pkzip, который есть где угодно? Вот сейчас шарю по сетям, > пытаюсь где-нибудь отыскать распаковщик этих неведомых tgz... А вдруг > еще оно (в смысле распаковщик) с вирусом окажется... > > М. Г. > > > ---------------------------------------------------------------------- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 09 окт 2000 15:46:55 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Мой пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- "MG" == Mikhail Grinchuk writes: >> http://www.sobor.org/izhitsa/izhitsatex.tgz MG> Пожалуйста, не надо использовать экзотические архиваторы! Чем MG> плох старый добрый pkzip, который есть где угодно? ну зачем поднимать религиозные войны по поводу архиваторов? :-) чем это tar+gzip более экзотичен, чем "старый добрый zip"? MG> Вот сейчас шарю по сетям, пытаюсь где-нибудь отыскать распаковщик MG> этих неведомых tgz... А вдруг еще оно (в смысле распаковщик) с MG> вирусом окажется... возьмите на www.winzip.com winzip, -- он понимает и tar+gzip (tgz) Best, v. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 09 окт 2000 15:23:07 От: "Mikhail Grinchuk" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Мой пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- Доброе утро! From: Alexander V. Voinov > Вот, кому интересно, посмотрите, пожалуйста, сюда: > > http://www.sobor.org/izhitsa/izhitsatex.tgz Пожалуйста, не надо использовать экзотические архиваторы! Чем плох старый добрый pkzip, который есть где угодно? Вот сейчас шарю по сетям, пытаюсь где-нибудь отыскать распаковщик этих неведомых tgz... А вдруг еще оно (в смысле распаковщик) с вирусом окажется... М. Г. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 09 окт 2000 10:11:56 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Мой пакет для набора Ц.С. текстов в HIP'e в ТеХе -------------------------------------------------------------------------------- Здравствуйте, Вот, кому интересно, посмотрите, пожалуйста, сюда: http://www.sobor.org/izhitsa/izhitsatex.tgz Здесь практически все самое свежее из разработок на данный момент. Это - совершенно не продукт, очень многое требует доводки. Но, может быть, кому-то будет интересно посмотреть на сам принцип. Может быть, кто-то (Владимир Волович или Михаил Гринчук) обратят внимание на какие-то вопиющие с т.з. ТеХпертизы проколы, за что я был им (и всем прочим) признателен. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 08 окт 2000 20:42:40 От: "Mikhail Grinchuk" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- Доброе утро! Alexander V. Voinov: > А есть ли вообще системы набора, учитывающие тройной кернинг? В самом > шрифте их может быть сколько угодно, по крайней мере фонтографер > позволяет строить любые сочетания. На самом деле достаточно поддержки символов нулевой ширины, "прозрачных" для кернинга: чтобы в сочетании а'б ударение встало в нужную позицию над "а", но на кернинг между "а" и "б" это не влияло. Для ТеХа (если использовать его стандартный метод набора акцентированных символов -- типа \'а для а') это можно реализовать так: 1) выводим сочетание а' (подразумевается, что в шрифте заложен нужный керн); 2) вычисляем его ширину; 3) выводим явный сдвиг влево на эту ширину и снова букву "а" (уже без акцента). Две копии буквы "а" при этом в точности наложатся друг на друга, причем вторая будет видна для следующей буквы и породит с ней правильный керн. М. Г. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 08 окт 2000 20:11:36 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- Hi A A G wrote: > > Все ли видели это? А есть ли вообще системы набора, учитывающие тройной кернинг? В самом шрифте их может быть сколько угодно, по крайней мере фонтографер позволяет строить любые сочетания. Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 08 окт 2000 18:58:05 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- бЧФПТБ ПВЕЭБМ ЛБЛ-ФП РТЙЧЕУФЙ УАДБ Ч ТБУУЩМЛХ иБНУФЕТ - дЙНБ уНЙТОПЧ. дЙН, ОХ ПФПТЧЙУШ ОБ ЮХФШ-ЮХФШ, ДЕМП ЦЕ ЧБЦОПЕ. ----- Original Message ----- From: "A A G" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Sunday, October 08, 2000 6:07 PM Subject: Re: Ch-Sl in Unicode > чУЕ МЙ ЧЙДЕМЙ ЬФП? > > http://www.cinfo.ru/CI/CI_150_8/Articles/Fonts_150.htm > > дSаО\SЌLў7·яj)ЉЛ±к‰Зњк†‡ЖЫ ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 08 окт 2000 18:07:49 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- Все ли видели это? http://www.cinfo.ru/CI/CI_150_8/Articles/Fonts_150.htm =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 03 окт 2000 10:26:05 От: "Sergey Skomorokhov" Кому: font-list@orthodox.tstu.ru Тема: Sergij Radonezhskij -------------------------------------------------------------------------------- Будьте здравы братие, если кому надо службу преподобному Сергию, то можно найти по адресам: http://sesk.8m.com/religion/serg.zip http://sesk.8m.com/religion/sergh.zip соответственно версии ворда и hip. В тексте могут встретиться ошибки. Сергей ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 02 окт 2000 09:20:27 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Пример сверстанного PDF -------------------------------------------------------------------------------- Hi All, Пожалуйста, посмотрите этот PDF и скажите все, что вы о нем думаете. Там еще немало шероховатостей, но меня интересуют моменты, которые я, может быть, не замечаю. Файл 240к. http://starship.python.net/crew/avv/ktest.pdf Если кому не лень, распечатайте его на двух сторонах и сшейте, для полноты картины. Я делал его под американский letter, хотя несколько листков a4 еще сохранилось, могу и на них попробовать. Заранее спасибо Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 02 окт 2000 06:56:09 От: Vlad Dorosh Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: Юникод -------------------------------------------------------------------------------- Вот, вернулся из отпуска, а дискуссия уже идет полным ходом. Дайте чуть-чуть времени, соберу все, что нашел, и напишу одной статьей. Давайте договоримся о единой терминологии. Как точно будем в дальнейшем называть "композитные лигатуры" -- символ без надстрочника+символ надстрочника, наползающий на предыдущую букву? Как назовем сам наползающий надстрочник? Как назовем данный метод получения букв с надстрочниками? Как назовем отдельную лигатуру, содержащую в одном глифе и символ, и надстрочник? Как назовем метод, в котором каждой возможной комбинации "буква-надстрочник" выделено отдельное место в пространстве кодировки? Влад Дорош ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 25 сен 2000 19:39:00 От: postmaster Кому: font-list@orthodox.tstu.ru Тема: Re[2]: Links -------------------------------------------------------------------------------- *Welcome to the Windows NT/WS4.0, Sergej A.Fedosov*. You have new mail. *sergej@sbible.donetsk.ua $* Saturday, September 23, 2000 10:26:21, you wrote to me: SAF> Гм, может кому и эта пригодится: SAF> http://come.to/sbible SAF> С уважением SAF> Федосов Сергей SAF> sergej@sbible.donetsk.ua А почему бы тебе не переехать на narod.ru или boom.ru, и место больше и домен? =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 23 сен 2000 10:26:21 От: "Sergej A.Fedosov" Кому: "Sergey Skomorokhov" Тема: Re: Links -------------------------------------------------------------------------------- SS> Обнаружил тут ссылку. Может кому пригодится. SS>... SS> http://biblerussia.org/software Гм, может кому и эта пригодится: http://come.to/sbible С уважением Федосов Сергей sergej@sbible.donetsk.ua =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 25 сен 2000 10:47:58 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC2: Ob invariante - Mikhail Grinchuk -------------------------------------------------------------------------------- Михаил, Вы действительно занимались набором ц.с. текста в ТеХе? Если да, расскажите хотя бы мылом, что это было и как. С уважением Александр Vladimir Volovich wrote: > LT> Предлагаю избрать Михаила ответственным за реализацию этой части > LT> проекта (создания базового инварианта), а всем остальным - > LT> всячески ему помогать советом и делом. > > по TeXовской части я с удовольствием помогу. > > Кстати, почему Михаил упоминал пакет SlavTeX Слепухина, но не упомянул > свой пакет (кодировку и шрифты) для набора ц.-сл. в TeX? =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 25 сен 2000 10:22:13 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Юникод -------------------------------------------------------------------------------- Hi Mikhail Grinchuk wrote: > Смотря что понимать под моноширинным шрифтом -- какие именно > объекты должны иметь одинаковую ширину: Шрифт, который в первых версиях windows назывался fixedsys, потом еще добавился courier. Это шрифт, которым собственно набраны тексты, которые вы мне послали. Которым мы пользуемся в _текстовых редакторах_. > физические символы > шрифта или печатные знаки, наблюдаемые на выходе. В последнем случае можно > строить их из базовых символов одной и той же ширины > и акцентов нулевой ширины. В перечисленных случаях одного флажка "моноширинности" мало. Если реально символы будут разной ширины, текстовый редактор сойдет с ума. Он принципиально исходит из того, что все символы отображаемого текста размещаются в квадратиках одинаковой ширины. > И, собственно, (а) зачем может потребоваться моноширинный > славянский шрифт? Для редактирования текстов в том же самом "сыром" виде, в каком существуют на данный момент ваши тексты в hip'е. Когда ничего, кроме последовательности кодов букв, ни в уме, ни в компьютере _нет_. (б) можно ли его в принципе нарисовать так, > чтобы это было не уродливо? Можно. Все европейцы работают с такими шрифтами уже много лет. Т.н. кракозябра, которую мы иногда видим, когда забываем выставить язык=русский, как раз и показывает все эти залигованные символы, которые честно размещены в 128 позициях latin-1. Другое дело, что у европейцев этих символов мало, так что они влезли в latin-1. Хотя latin-2 все равно пришлось ввести, но я не знаю, что там за буквы. > Как-то эта концепция совершенно > противоречит существованию, например, узкого и широкого "о". > Или взять, скажем, букву "i" и какой-нибудь йотированный юс > или "оу". Возьмите любой немецкий, шведский, чешский текст, набранный с помощью courier. Там i занимает такую же ширину, что и w. У нас это будут тоже w и i. Ничего нового. > Вот в чем-то аналогичная ситуация: разглядывал я как-то экранный > (для ДОСа, где все символы шириной в 8 пикселов) арабский шрифт. > Там использовался такой прием: некоторые широкие буквы были > разрезаны на две части, причем для каждой из них в шрифте был > отдельный символ со своим кодом. Ну, нам это не понадобится, все-таки шрифт в достаточной степени европейский, греческих истоков. > В списке символов оказался забыт <у> без диакритики (так что не 339, > а 341). Еще десятка полтора акцентированных символов заведомо > существуют (например, яти с придыханиями), но просто не попались > в данных текстах. Еще больше, видимо, сочетаний с буквенными > титлами (особенно если учитывать старообрядческую литературу). > И символы типа "несовершенно окруженных трех точек" в Библии, > естественно, не попадаются. Так что можно ожидать еще сотню-другую > знаков. А потому не рано ли нумеровать то, что есть сейчас? Это была одна из причин, по которой я в свое время избрал путь "наползающих диакритиков". > После некоторого размышления я соглашаюсь с тем, что иметь в одном > и том же "адресном пространстве" русский алфавит и славянский как > непересекающиеся множества не стоит. Ибо в противном случае они > должны содержать и полные наборы знаков препинания ("русская" > запятая и "славянская" должны различаться). У нас была на эту тему дискуссия зимой. Я продолжаю считать, что современный гражданский русский язык должен рассматриваться исключительно как упрощенный вариант, как некое просторечие церковнославянского. Если бы это было официальной позицией России, то пробить всякие юникодные и иные стандарты было бы куда легче. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 25 сен 2000 07:57:26 От: "Mikhail Grinchuk" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Юникод -------------------------------------------------------------------------------- Доброе утро! From: Alexander V. Voinov > > Я тоже возможно не вполне корректно выражаюсь. Я имею в виду > > такое решение, при котором диакритика существует исключительно > > как символы с нулевой шириной и сочетания типа a' возможны лишь > > в виде сочетания нужных знаков. > > То есть как в моей "ижице". Так вот в том-то и дело, что моноширинный > шрифт таким образом не построишь. Я в данном случае не говорю об > эстетических изысках, т.к. сам без них шесть лет обхожусь, для > практических нужд богослужения "композитных лигатур" оказывалось > все это время достаточно. Смотря что понимать под моноширинным шрифтом -- какие именно объекты должны иметь одинаковую ширину: физические символы шрифта или печатные знаки, наблюдаемые на выходе. В последнем случае можно строить их из базовых символов одной и той же ширины и акцентов нулевой ширины. И, собственно, (а) зачем может потребоваться моноширинный славянский шрифт? (б) можно ли его в принципе нарисовать так, чтобы это было не уродливо? Как-то эта концепция совершенно противоречит существованию, например, узкого и широкого "о". Или взять, скажем, букву "i" и какой-нибудь йотированный юс или "оу". Вот в чем-то аналогичная ситуация: разглядывал я как-то экранный (для ДОСа, где все символы шириной в 8 пикселов) арабский шрифт. Там использовался такой прием: некоторые широкие буквы были разрезаны на две части, причем для каждой из них в шрифте был отдельный символ со своим кодом. ==================================== В списке символов оказался забыт <у> без диакритики (так что не 339, а 341). Еще десятка полтора акцентированных символов заведомо существуют (например, яти с придыханиями), но просто не попались в данных текстах. Еще больше, видимо, сочетаний с буквенными титлами (особенно если учитывать старообрядческую литературу). И символы типа "несовершенно окруженных трех точек" в Библии, естественно, не попадаются. Так что можно ожидать еще сотню-другую знаков. А потому не рано ли нумеровать то, что есть сейчас? ==================================== После некоторого размышления я соглашаюсь с тем, что иметь в одном и том же "адресном пространстве" русский алфавит и славянский как непересекающиеся множества не стоит. Ибо в противном случае они должны содержать и полные наборы знаков препинания ("русская" запятая и "славянская" должны различаться). М. Г. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 25 сен 2000 07:16:04 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Юникод -------------------------------------------------------------------------------- Hi A A G wrote: > > > A A G wrote: > > > Пустоты в Юникоде я уже вчера указывал. Ясно, что для 339 знаков годится > > > только область U+E000 - U+F8FF. В противном случае нужно делать > композитные > > > лигатуры и добавлять между кириллицей и армянскими глифами. Там, > кажется, 37 > > > слотов. > > > > А что в данном случае значит "композитные лигатуры"? Прошу прощения, я > > что-то много чего подзабыл. > > Я тоже возможно не вполне корректно выражаюсь. Я имею в виду такое решение, > при котором диакритика существует исключительно как символы с нулевой > шириной и сочетания типа a' возможны лишь в виде сочетания нужных знаков. То есть как в моей "ижице". Так вот в том-то и дело, что моноширинный шрифт таким образом не построишь. Я в данном случае не говорю об эстетических изысках, т.к. сам без них шесть лет обхожусь, для практических нужд богослужения "композитных лигатур" оказывалось все это время достаточно. Хотя, если вы помните, я анонсировал экспериментальный шрифт, где все "наползающие" диакритики были размещены на соответствующей страницы. Но тогда это было безжалостно раскритиковано. Так что для моноширинного шрифта нужно перебирать все эти варианты, как в latin-1 для французских и шведских. Ничего не поделаешь. Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 25 сен 2000 03:52:40 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Юникод -------------------------------------------------------------------------------- > A A G wrote: > > Пустоты в Юникоде я уже вчера указывал. Ясно, что для 339 знаков годится > > только область U+E000 - U+F8FF. В противном случае нужно делать композитные > > лигатуры и добавлять между кириллицей и армянскими глифами. Там, кажется, 37 > > слотов. > > А что в данном случае значит "композитные лигатуры"? Прошу прощения, я > что-то много чего подзабыл. Я тоже возможно не вполне корректно выражаюсь. Я имею в виду такое решение, при котором диакритика существует исключительно как символы с нулевой шириной и сочетания типа a' возможны лишь в виде сочетания нужных знаков. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 24 сен 2000 23:25:00 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Юникод -------------------------------------------------------------------------------- Hi Alexei, A A G wrote: > Пустоты в Юникоде я уже вчера указывал. Ясно, что для 339 знаков годится > только область U+E000 - U+F8FF. В противном случае нужно делать композитные > лигатуры и добавлять между кириллицей и армянскими глифами. Там, кажется, 37 > слотов. А что в данном случае значит "композитные лигатуры"? Прошу прощения, я что-то много чего подзабыл. Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 24 сен 2000 16:37:22 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Юникод -------------------------------------------------------------------------------- > Ну, гарнитуру-то как раз можно менять (или нет?). С остальным я > согласен. А как же вы ее поменяете, если в одном слове, например, два разных шрифта используются? Иное дело - кегль, но радость от того невеликая. > Только нужно осознавать, что все это мы делаем для "исходных текстов", > так сказать, к которым человеческая рука прикасается. В недрах систем > верстки эти тексты могут превращаться во что угодно, отображаться хоть > на 15 шрифтов в рамках одного семейства, это уже "автора" или > "списателя" не касается. Так то оно так, но пока мы тут и верстальщики и списатели в одном лице. Вы сами еще вдобавок и создатель шрифтов. Разве не все равно нам, если была бы возможность получив текст в "Ирмологионе" изменить шрифт на "Ижицу", "Евангелие", а буквицы сделать в "Лавре"? И сделать это прямо в PM или QX, без хитрых конвертеров. Пустоты в Юникоде я уже вчера указывал. Ясно, что для 339 знаков годится только область U+E000 - U+F8FF. В противном случае нужно делать композитные лигатуры и добавлять между кириллицей и армянскими глифами. Там, кажется, 37 слотов. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 24 сен 2000 10:25:55 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Юникод -------------------------------------------------------------------------------- Hi All, Раз Михаил собрал список новых лигатур, может быть, ему нетрудно будет просто выстроить их всех в ряд, а Алексей к этому ряду подставит список тех позиций юникода, которые он рассматривает как свободные. После чего можно как минимум раскидать буквочки по боксикам и попытаться чего-нибудь с этим поделать. Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 24 сен 2000 06:16:02 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Юникод -------------------------------------------------------------------------------- A A G wrote: > Ну а как нам без Юникода поставить дело? Чтобы убралось свыше 300 символов? > Делать раскладку на более чем один шрифт бессмысленно - тогда невозможно > менять гарнитуру, сохраняя текст неизменным. Ну, гарнитуру-то как раз можно менять (или нет?). С остальным я согласен. Только нужно осознавать, что все это мы делаем для "исходных текстов", так сказать, к которым человеческая рука прикасается. В недрах систем верстки эти тексты могут превращаться во что угодно, отображаться хоть на 15 шрифтов в рамках одного семейства, это уже "автора" или "списателя" не касается. Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 24 сен 2000 04:20:56 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Юникод -------------------------------------------------------------------------------- > A A G wrote: > > Шести тысяч глифов нам за глаза достаточно, еще и детям хватило бы. > > Но я так и не понял, что будет, если их кто-то еще занимать будет. А > главное, если все программы, как одна (винворд, емакс, ...) будут > отказываться считать это диапазоном русского языка? Движение курсора по > словам - это малейшая из мелочей, которая ввиду этого приходит в голову. Волков бояться... На самом деле нужно просто решить, с Юникодом мы пойдем вперед или же без него. Программы, не поддерживающие Юникод, не в состоянии даже "ять" осознать как кириллический символ. Поэтому даже оставаясь в пределах оставшихся трех десятков пустых слотов мы ничего не выигрываем. Напротив, Ворд со всем работает четко и без проблем. Ему и дела нет, из какого алфавита мы вставляем символы. Ну а как нам без Юникода поставить дело? Чтобы убралось свыше 300 символов? Делать раскладку на более чем один шрифт бессмысленно - тогда невозможно менять гарнитуру, сохраняя текст неизменным. Надо что-то решать. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 24 сен 2000 02:34:39 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Юникод -------------------------------------------------------------------------------- A A G wrote: > Шести тысяч глифов нам за глаза достаточно, еще и детям хватило бы. Но я так и не понял, что будет, если их кто-то еще занимать будет. А главное, если все программы, как одна (винворд, емакс, ...) будут отказываться считать это диапазоном русского языка? Движение курсора по словам - это малейшая из мелочей, которая ввиду этого приходит в голову. Т.е. раскидать глифы - не проблема, у всех какой-нибудь редактор шрифтов имеется. Проблема - что с этим делать. Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 24 сен 2000 02:30:27 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Юникод -------------------------------------------------------------------------------- > Вот этого я не понял. Разве это не одно и то же? Ведь каждое пустое > место какой-то номер имеет?! Иметь то оно имеет, но при табличном отображении не все пустые слоты видны. Кириллица заканчивается глифом номер 04F9, а армянские глифы начинаются только с 0530. Недостача, получается! Но этого, конечно, мало если нужно для каждого глифа делать диакритику. Зато есть вот что: There are ways for programmers and scholarly organizations to make use of Unicode character encoding, even if the script they want to use or transmit is not yet (or may never be) part of the Unicode Standard. Individual groups that make use of rare scripts or special characters can reach a private agreement about interchange and set aside part of the Private Use Area to encode their private set of characters. Individuals with interests in rare scripts or materials relating to them may sometimes be contacted through an electronic mail list which the Consortium maintains. For information about these mail lists, please contact info@unicode.org. Взято из: http://www.unicode.org/pending/proposals.html Private Use. Unicode values from U+E000 to U+F8FF and surrogate pairs (see Section 3.7, Surrogates ) whose high-surrogate is from U+DB80 to U+DBFF are available for private use. (See Definition D12 in Section 3.4, Simple Properties .) Refers to code values and areas of the standard whose interpretation is not specified by the standard and whose use may be determined by private agreement among cooperating users. Взято из: http://www.unicode.org/glossary/index.html Шести тысяч глифов нам за глаза достаточно, еще и детям хватило бы. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 24 сен 2000 01:56:55 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Юникод -------------------------------------------------------------------------------- Hi Итого 339 (Excel рулит). Александр Mikhail Grinchuk wrote: > Число в начале каждой строки -- полученное число знаков, > "порожденных" этой строкой. > > (Табличку лучше смотреть в моноширинном шрифте.) =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 24 сен 2000 01:31:08 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Юникод -------------------------------------------------------------------------------- Доброе утро! "Alexander V. Voinov" wrote: > давайте соберем все лигатуры и расположим их _как > нибудь_, например: > > А' A` A= A=' A=` A~ a' a` a= a=' a=` a~ > > И т. д. Вот все символы и лигатуры, (а) использованные в имеющихся на данный момент у меня книгах Библии + (б) необходимые для записи чисел от 1 до 9999. (Каждая буква и лигатура посчитана дважды -- как заглавная и строчная, за исключением "е" и ее лигатур, которые только строчные, и лигатур с "о<у>", которые имеют по 3 варианта.) Число в начале каждой строки -- полученное число знаков, "порожденных" этой строкой. (Табличку лучше смотреть в моноширинном шрифте.) 13 ! ( ) * , - . : ; <-> [ ] # 16 а а~ а' а` а^ а= а=' а\ч 8 б б~ б\ъ б\с 8 в в~ в\ъ в\д 8 г г~ г\с г\д 8 д д~ д\ъ д\с 3 е е' е` 14 <е> <е>~ <е>' <е>` <е>= <е>=' <е>=` 8 jь jь' jь` jь^ 6 ж ж~ ж\с 6 з з~ з\ъ 4 s s~ 16 и и~ и' и` и^ и= и=' и=` 14 i i~ i' i` i^ i= i=' 2 2 й 4 к к~ 8 л л~ л\с л\д 6 м м~ м\д 4 н н~ 6 о о' о` 10 <о> <о>~ <о>' <о>= <о>=' 12 w w' w` w^ w= w=' 2 8 п п~ п\с п\д 10 р р~ р\с р\д р\о 4 с с~ 6 т т~ т\с 8 у у' у` у^ 9 о<у>= о<у>=' о<у>=` 2 <у>~ 12 v v' v^ v= v\г v" 4 ф ф~ 4 f f~ 4 х х~ 8 ц ц~ ц\с ц\д 6 ч ч~ ч\с 4 ш ш~ 4 щ щ~ 2 ъ 8 ы ы' ы` ы^ 2 ь 14 ю ю' ю` ю^ ю= ю=' ю=` 12 я я' я` я^ я= я=` 6 jа= jа=' jа=` 4 <пс> <пс>~ 4 <кс> <кс>~ 6 w\т w\т~ w\т' =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 23 сен 2000 23:52:50 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Юникод -------------------------------------------------------------------------------- A A G wrote: > > А вообще я уже подзабыл: кто-то уже подсчитывал, есть еще свободное > > место в славянской странице? > > Кажется, между последним кириллическим глифом и первым глифом следующего > алфавита полно места. Надо просто смотреть по номерам, а не искать пустые > места в таблице. Вот этого я не понял. Разве это не одно и то же? Ведь каждое пустое место какой-то номер имеет?! Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 23 сен 2000 23:50:35 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Юникод -------------------------------------------------------------------------------- Hi Gleb Arkhangelsky wrote: > > > From: Alexander V. Voinov [mailto:avv@quasar.ipa.nw.ru] > > > А вообще я уже подзабыл: кто-то уже подсчитывал, есть еще свободное > > место в славянской странице? > > А послезавтра Билли-Бульдозер к-ааа-аааак родит! чево-нибудь такое > совсем новенькое... И Уникод отменят. А? Вот то-то. Поэтому я и держусь, в разумных пределах, за freeware. Хотя там тоже не без проблем (те же страсти, не деньги, так слава или просто fun), например в емаксе взяли и подрубили под корень ту доморощенную русификацию, к которой я привык с 95 года. Но все-таки можно на что-то влиять. Но Юникод вряд ли отменят, потому что за ним стоят уже большие деньги азиатов, вложенные в разные поделия г-на Билии и пр. Та же Математика (система компьютерной алгебры) завоевала азиатский рынок именно в силу поддержки юникода. Хотя именно также в силу подавляющей массы азиатов (и по численности и по деньгам) поддержка юникода "для европейцев" до сих пор находится в состоянии какого-то квантового перехода. "Верхи", т.е. разработчики уже не хотят, а "низы" - пользователи - еще не могут... Или наоборот. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 23 сен 2000 23:36:48 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RE: Юникод -------------------------------------------------------------------------------- > From: Alexander V. Voinov [mailto:avv@quasar.ipa.nw.ru] > А вообще я уже подзабыл: кто-то уже подсчитывал, есть еще свободное > место в славянской странице? А послезавтра Билли-Бульдозер к-ааа-аааак родит! чево-нибудь такое совсем новенькое... И Уникод отменят. А? ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 23 сен 2000 21:55:37 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Юникод -------------------------------------------------------------------------------- > А я так с самой зимы и не понял, какой должен быть следующий шаг. > Инициировать переговоры с комитетом? Захватить эти слоты революционно, в > явочном порядке, как кратеры на Луне? Давайте пока революционно. По крайней мере, мы можем с совершенно чистой совестью распорядиться user defined частью Юникода. В этом даже есть преимущество. Тогда можно будет иметь шрифты пригодные и для современной кириллицы и для, так сказать, исторической. В одном флаконе. Добиться отдельной зоны для ц-славянского, видимо не удастся. Альтернативно, можно добавить все недостающее и воспользоваться уже существующей в Юникоде таблицей. Тогда придется разделять шрифты на русские и славянские, зато будет хороший шанс сделать это частью стандарта. А можно даже совместить оба пути. Наконец, не так важно по какому адресу мы разместим все глифы. Всегда можно их сместить целым блоком. Нужно лишь определить, что нам нужно. > Если второе, то давайте соберем все лигатуры и расположим их _как > нибудь_, например: > > А' A` A= A=' A=` A~ a' a` a= a=' a=` a~ Думаю, что это единственно возможный вариант, хотя и теоретически неправильный и неудобный. Иначе будет все "некрасиво". > А вообще я уже подзабыл: кто-то уже подсчитывал, есть еще свободное > место в славянской странице? Кажется, между последним кириллическим глифом и первым глифом следующего алфавита полно места. Надо просто смотреть по номерам, а не искать пустые места в таблице. Алексей =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 23 сен 2000 20:53:58 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Юникод -------------------------------------------------------------------------------- Hi Alexei, A A G wrote: > > Нет ли у кого наработок по созданию шрифта или хотя бы таблицы символов, > совершенным образом дополняющей Юникод до нужд церковно-славянского набора? > Я решил-таки добиться хоть какого-либо результата в этом направлении. > Предполагаю выделить для этой цели блок слотов, непосредственно примыкающих > к кириллице. А я так с самой зимы и не понял, какой должен быть следующий шаг. Инициировать переговоры с комитетом? Захватить эти слоты революционно, в явочном порядке, как кратеры на Луне? Если второе, то давайте соберем все лигатуры и расположим их _как нибудь_, например: А' A` A= A=' A=` A~ a' a` a= a=' a=` a~ И т.д. Но вот беда: я не уверен, что нынешние текстовые редакторы (где нужен был бы моноширинный шрифт), вордпроцессоры и системы верстки будут "рады" такому расширению русского языка. Даже при наличии исходных текстов, как в случае емакса, допинать программу до нужной кондиции может оказаться не так просто. Впрочем, мы, кажется, это обсуждали. Кроме того, один из активных участников самого недавшего обсуждения - Влад Дорош - в отпуске. Давайте хоть его дождемся. А вообще я уже подзабыл: кто-то уже подсчитывал, есть еще свободное место в славянской странице? С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 23 сен 2000 17:59:02 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Юникод -------------------------------------------------------------------------------- Нет ли у кого наработок по созданию шрифта или хотя бы таблицы символов, совершенным образом дополняющей Юникод до нужд церковно-славянского набора? Я решил-таки добиться хоть какого-либо результата в этом направлении. Предполагаю выделить для этой цели блок слотов, непосредственно примыкающих к кириллице. Алексей =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 22 сен 2000 10:12:39 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: ноты с помощью HIPa -------------------------------------------------------------------------------- Hi All, Вот какие ноты я набираю в ТеХе с помощью привнесенной туда Ижицы: http://str12.sobor.org/tmp/antiph2cslig.pdf http://str12.sobor.org/tmp/antiph2cs.pdf http://str12.sobor.org/tmp/antiphcs.pdf На самом деле тот факт, что я освоил набор нот в ТеХе (точнее - в препроцессоре, язык тоже типа HIPa), был последним толчком к тому, чтобы и церковнославянское письмо в ТеХе перенести. Хотя хватило бы и одних проблем с вордом и ПМ. С уважением Александр ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 21 сен 2000 20:59:46 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Анонс: HIP и TeX -------------------------------------------------------------------------------- Hi Gleb Arkhangelsky wrote: > > > From: Alexander V. Voinov [mailto:avv@quasar.ipa.nw.ru] > > > я сам _не_ собираюсь набирать в HIPe, а конвертить из ворда.) > > У меня сразу вопрос о совместимости того, что ты придумал, с > программами, при использовании которых не приходится _думать_ (т.е. > вордом, пижамкером итп). Во-первых, _подумай сам_: при чем здесь ТеХ? Сам по себе HIP совместим с вордом и ПМ? А исходный текст, который я показал, отличается от стандарта только на уровне разметки, это всего несколько команд. Конечный продукт - пдф - это правильно. Но вот > начальный - ТеХ - это ужасно. Т.е. там думать надо. Поэтому какие > остаются варианты для пользователей, не отягощенных привычкой думать над > используемыми программами? Я набираю в ворде и верстаю в PM с конца 1994 года. Так что, на основании почти шестилетнего опыта я заявляю однозначно: в ситуации _жесткого_ выбора между "подумать" и "помучаться" я выбираю первое. YMMV. Тем более, взгляни еще раз на строчку, которую ты отквотил. * * * Другой вопрос, уже в большей степени ко всем. Недавно была дискуссия с участием Влада Дороша, который в отпуске, на тему того, что идеологически неверно объявлять отдельными буквами сочетания буквы и надстрочного знака, который не меняет смысл буквы. Вместо этого "ответственность" за совмещение букв и надстрочных знаков возлагалась на вордпроцессоры и системы верстки. Это, наверное, все очень правильно, но если бы мы имели простой моноширинный юникодный шрифт со всеми возможными сочетаниями букв и знаков, то процесс набора текстов в простых _текстовых редакторах_ типа лексикона, vi'я и емакса существенно упростился бы. Текст с самого начала был бы более читабельным, чем HIP, было бы меньше ошибок, а конвертация, естественно, была бы почти тривиальна. Однако, существенно то, что в данном случае никаких особых надежд на редакторы не возлагается, они честно отображают то, что им подано в шрифте, букву за буквой. Другое дело, что сейчас во всех операционках юникод для русского (и наверное европейских) языков вносит больше проблем, чем разрешает. Но это же дело времени? Как вы думаете? С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 21 сен 2000 17:55:20 От: "Sergey Skomorokhov" Кому: font-list@orthodox.tstu.ru Тема: Links -------------------------------------------------------------------------------- Будьте здравы братие, Обнаружил тут ссылку. Может кому пригодится. http://www.abbyy.ru и последствия http://www.lingvo.ru http://biblerussia.org/software ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 21 сен 2000 17:55:41 От: "Sergey Skomorokhov" Кому: font-list@orthodox.tstu.ru Тема: Links -------------------------------------------------------------------------------- Будьте здравы братие, Обнаружил тут ссылку. Может кому пригодится. http://www.abbyy.ru и последствия http://www.lingvo.ru http://biblerussia.org/software ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 21 сен 2000 17:30:03 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RE: Анонс: HIP и TeX -------------------------------------------------------------------------------- > From: Alexander V. Voinov [mailto:avv@quasar.ipa.nw.ru] > я сам _не_ собираюсь набирать в HIPe, а конвертить из ворда.) У меня сразу вопрос о совместимости того, что ты придумал, с программами, при использовании которых не приходится _думать_ (т.е. вордом, пижамкером итп). Конечный продукт - пдф - это правильно. Но вот начальный - ТеХ - это ужасно. Т.е. там думать надо. Поэтому какие остаются варианты для пользователей, не отягощенных привычкой думать над используемыми программами? > запрос в hipe, Имхо сие есть безумство. Ибо в тексте Библии куча очепяток, и пользователю для ввода запроса надо знать ХИП, чего требовать от него жестоко. Я бы лучше на ввод запрашивал как в словаре Даля: "хотите вводить в старой орфографии или в новой?" Если надо что-нить извращенное типа найти слово мiр, пусть вводить хипом. А если это из нормальных человеческих потребностей поиска (а таких 99%), то нечего его удручать хипом, пусть вводит гражданкой мир, а прога сама выдает мiр, мир, мvро, итд. Так же со всякими юсами итд. Короче говоря, все извращенные супер-пупер возможности для особо продвинутых юзеров должны быть легко отключаемы, чтобы нормальный человек мог пользоваться поиском, не напрягая извилины. ---- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 21 сен 2000 08:50:58 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Анонс: HIP и TeX -------------------------------------------------------------------------------- Hi All, Я не помню, чтобы кто-то в данном листе интересовался субжем. Вот что у меня получилось на основе моей Ижицы, добавленной к ТеХу как ps-font. Благодаря тому, что в HIP'e надстрочные знаки располагаются справа, а не слева от буквы (я знал, что делал, когда зимой за это голосовал ;-), весь алфавит HIPa удалось выразить практически полностью средствами лигатур самого шрифта, не прибегая к мощи теховских команд. Посмотрите на исходный текст, который состоит из _неизмененного_ HIP'a-B плюс теховские команды разметки: http://str12.sobor.org/hip/exodus.tex. (Здесь, наверное, только одно отклонение от стандарта: для разрядки используются удвоенные '_'.) Разметку по-hipовски сохранить не удалось бы в любом случае, т.к. в ТеХе процент - знак комментария. И так пришлось пожертововать математикой, впрочем, как я понимаю, не безнадежно. Глеб, каково набрать учебник математики на ц.с.? Неповрежденность HIPa внутри правильного теховского текста позволяет тем, кто и так собирался набирать тексты прямо в HIPe, совместить приятное (для них) с полезным (для всех): на каждом этапе иметь почти-сверстанную пригодную для чтения версию текста. (На данный момент я сам _не_ собираюсь набирать в HIPe, а конвертить из ворда.) Результат обработки приведенного примера см. здесь: http://str12.sobor.org/hip/exodus.pdf. Для знатоков ТеХа приведую ближайший TODOlist: 1. Сделать переносы согласно недавнему совету Виктора Вагнера. У меня есть немало текстов в ворде и ПМ, где вручную расставлены переносы в значительной части текста. 2. Сделать составление списка первых слов следующих страниц, с последующим прочтением его латехом, с помощью утилиты dvitype. Я правильно понимаю, что она является стандартной компонентой всех современных дистрибутивов? 3. Сделать латеховский стиль, который позволял бы переключаться между ц.с. и гражданским шрифтом. Это нужно для набора разных пособий и учебников. На этом proof of the concept я бы считал законченным, если не возникнет неизвестных пока мне подводных камней. Это приведет данный инструмент к тому уровню, на котором я сейчас реально пользуюсь своей ижицей для набора богослужебных текстов. И тогда, если кому-то будет нужно большее, можно заняться доводкой. Ввести семейство шрифтов и прописать все лигатуры и кернинги (сейчас все делается с помощью одного файла шрифта, 256 символов, где осталось свободно ок. 30 позиций). Предоставляет ли pdftex возможность поиска в pdf'e? Это могло бы упростить электронный вариант Библии с поиском: вводится запрос в hipe, а на следующей страницы показывается плугин-пдф с отмеченным местом. Но, может быть, это не так просто. Михаил, и все, кто уже серьезно поработал с HIP'ом. Пожалуйста, посмотрите на исходный текст на предмет соответствия стандарту и здравому смыслу (рабочая версия может отличаться от стандарта, как и Михаил сам уже заметил.) Я буду рад любым замечаниям, в т.ч. и таким, которые выражают сомнение в осмысленности данного подхода. С уважением Александр ЗЫ. По поводу Слепухина: даже если бы мне его и дали, его "язык" - это не HIP. Конвертация, конечно, проблемы бы не составила, но тем, кто хотел бы прямо так набирать, пришлось бы учить два языка вместо одного, учить не только головой, но и пальцами (и макросами своего редактора). Кроме того, мне совершенно не хотелось влезать в дебри метафонта. А на уровне type-1 мы всегда можем заменить мою корявую ижицу чем-либо более достойным. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 21 сен 2000 03:06:04 От: "Mikhail Grinchuk" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Novosti -------------------------------------------------------------------------------- Всем доброе утро! 1. На сайте pechatnyj_dvor.boom.ru только что выложены исправленные тексты Библии (все с "Елисаветы" + Бытие + Исход) в HIP-6A/DOS. См. раздел "Текстовый архивъ". Ответы на два из вопросов: 2. Кавыка -- символ "@". Сноски с кавыкой оформляются так: ...текст текст @&{текст сноски} текст текст... Надо ли при этом указывать кавыку и в тексте сноски, мы еще не обсуждали. Скорее не надо, если считать, что запись X&{текст} где X -- обычный символ, должна в основном тексте породить "X", а в сноске -- "X текст". Ваше мнение? 3. Просто i имеет две точки, но любой надстрочный знак их снимает. Это уже согласовано. Обозначение (или _i) имеет смысл, когда никаких надстрочных знаков нет. (На прочие многочисленные накопившиеся письма разных авторов отвечу позже.) М. Г. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 21 сен 2000 02:46:20 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: _i^ вместо i^ -------------------------------------------------------------------------------- Hi All, В субже во втором выражении имеется в виду i с двумя точками. Я не знаю, как набрать ее на клавиатуре. Жаль, что Михаил пропал, но тем, кто заинтересован в HIP'е, предлагаю в тех случаях, когда i идет с надстрочным знаком, использовать _i. Т.е. Число` дн_i'й мои'хъ, а не Число` днi'й мои'хъ, Хотя при программном разборе такая ситуация проблемы не представляет, тем не менее, раз уж есть подходящий символ в алфавите HIP'а, почему бы его не использовать? Возможно, я в данном случае "тяну одеяло на себя", однако смирюсь с мнением Консенсуса. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 21 сен 2000 01:20:01 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: кавыка и %сноски в HIPe? -------------------------------------------------------------------------------- Hi All, прежде всего Михаил Гринчук. Я не увидел в стандарте символа для кавыки, которая используется для сносок. Как изобразить сами сноски я тоже не очень понял. А ведь в Псалтири, часослове и т.д. их не так мало. Вспомним знаменитое "яко непостоянно великолепие славы Твоея". Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 21 сен 2000 01:17:52 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: примеры текстов в HIPе, validating HIP parser? -------------------------------------------------------------------------------- AG wrote: > > Чуть позже кину. А зачем, если не секрет? Тренироваться. Но я мог бы избежать необходимости тренироваться на чужих текстах, когда своих не так мало, если бы был validating HIP parser, который проверял бы соотвествие текста _букве_ стандарта HIP. При прочих равных я предпочел бы тексты в варианте B, где не угловые скобки, а знак подчеркивания, но это не принципиально. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 21 сен 2000 01:01:16 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: примеры текстов в HIPe -------------------------------------------------------------------------------- Чуть позже кину. А зачем, если не секрет? ----- Original Message ----- From: "Alexander V. Voinov" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Wednesday, September 20, 2000 4:04 PM Subject: примеры текстов в HIPe > Hi All, > > Киньте в меня субжем, пожалуйста. Чем больше, тем лучше. > > Заранее спасибо > > Александр > ЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪ9г83—ЭSЌ®€чrъЪ1ЁҐ.+-Іг «ѕ'ўs«¶ =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 21 сен 2000 00:04:21 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: примеры текстов в HIPe -------------------------------------------------------------------------------- Hi All, Киньте в меня субжем, пожалуйста. Чем больше, тем лучше. Заранее спасибо Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 18 сен 2000 13:51:36 От: "Andrew" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: САЙТ -------------------------------------------------------------------------------- Привет, Глеб! >Вот, создал сайт: > >"Организация времени" http://orgt.narod.ru/ , > >весьма желаю ваших, отцы честные, замечаний, предложений, возмущений, >восхищений, и прочая и прочая... > >За вся сия буду весьма благодарен. Весьма польщен и признателен за доверие, но катастрофически нет сейчас времени и возможности заглянуть на твой сайт в связи с планируемым переездом в Москву. Но как только - так сразу! :-) С Уважением Андрей Ves'ma pol'schen i priznatelen za doverie, no katastroficheski net sejchas vremeni i vozmozhnosti zaglyanut' na tvoj sajt v svyazi s planiruemym pereezdom v Moskvu. No kak tol'ko - tak srazu! :-) S Uvazheniem Andrej ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 14 сен 2000 04:05:44 От: Vlad Dorosh Кому: -=ORTHODOX-FONT=- Project Participants Тема: Отпуск -------------------------------------------------------------------------------- Ухожу в отпуск на две недели. Буду к концу сентября. --- Владислав Дорош ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 09 сен 2000 16:04:59 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" , "Vlad Dorosh" Тема: RE: Re[6]: САЙТ -------------------------------------------------------------------------------- > From: Vlad Dorosh [mailto:vvdorosh@mtu-net.ru] > У меня после инсталляции занял 15М. Пользоваться удобно, на мой вкус. А в архиве? Если столь мал, дык можно бы и скачать откуда-нить? > но как же без этого? Что значит совместимость HTML с чем-то, > я не понимаю. HTML есть HTML, ты его либо принимаешь и понимаешь, Ну, если я работаю во фронтпейдже, я могу любым образом извращаться внутри оффиса - типа скопировать на сайт кусочек екселевской странички, итп. > Тьфу еще раз! Что же это за средство, что ты его сначала > устанавливаешь, потом вычищаешь, потом работаешь? Несколько похоже на Я имею в виду, чистят конечный продукт. Избыточный код удаляют. :-) Впрочем, надо попробовать оную дримваву. Вас буду напрягать консультациями. :-) ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 09 сен 2000 15:23:51 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" , "Vlad Dorosh" Тема: Re: Re[6]: САЙТ -------------------------------------------------------------------------------- > > А велик ли сей дримвевер и насколько совместим с мелкософтом? И где его > > можно взять? И насколько удобно в нем работать? > С Дримвивером я работал по службе. Ничего программка, но очень уж громоздкая. А недавно у нас один клиент заявил, что желает, чтобы сайт для него делался в NetObjects Fusion. Смешно, конечно. Будто бы эти две программы разный HTML выдают. Однако я этот продукт попробовал, и он мне весьма понравился. А еще они делают NetObjects ScroptBuilder. Весьма мило. Но не советую увлекаться такими программами до знакомства с собственно HTML. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 09 сен 2000 08:41:15 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Диакритики -------------------------------------------------------------------------------- Hi Vlad Dorosh wrote: > > Saturday, September 09, 2000, 6:05:40 AM: > > Сорри, если можно, помедленнее. > 1. Что есть AbiWord, где можно посмотреть о нем. Бесплатный вордпроцессор. http://www.abiword.org/ > 2. > > Кстати, если надо положить мой фонт на сайт, он - там же, где и был, > > сервер starship.python.net восстановлен. > Где конкретно и что за фонт? На starship.python.net я не понял, где > искать. ftp://starship.python.net/pub/crew/avv/tmp_fl/ В общем, в этой директории лежит все, что я когда-либо людям раздавал из текстов, шрифтов и пр. Наиболее стабильна неюникодная версия ftp://starship.python.net/pub/crew/avv/tmp_fl/cs/IzCS____.PFB.bz2 ftp://starship.python.net/pub/crew/avv/tmp_fl/cs/IzCS____.PFM.bz2 ftp://starship.python.net/pub/crew/avv/tmp_fl/cs/IzCS____.TTF.bz2 потому что юникодная ftp://starship.python.net/pub/crew/avv/tmp_fl/izhitsa-unicode.rar пребывает в каком-то подвешенном состоянии. Я сам ей пользуюсь, т.к. иначе в ворде2000 под НТ или в2000 набирать невозможно. Но потом начинаются проблемы в PM652 или еще где-нибудь (наверняка). Проблемы решаются, но нужно время. Мой должок - написать маленькую инструкцию, как им пользоваться (если шаблон для ворда). > > Да, конечно, должна быть поддержка визивиг набора символов с > > надстрочными знаками - хотя бы так, как рисуются формулы в MS Equation. > > Если набор ЦС-текстов делать так, как набираются формулы в MSEquation, > то лучше уж вообще набивать хипом в лексиконе. Это же тоска, TeXом формулы > и то проще и быстрее набирать. Я сказал например, сам разве что $E=mc^2$ в нем набрал. Я имел в виду, что либо курсором наверх забегать, либо какой-нибудь shortcut нажимать. Хипом в лексиконе - рулез. Но без shortcut'ов все равно не обойдешься, так что лучше сразу в emacs'е. Тем более, что он есть под все платформы, вкл. дос. А еще лучше сразу переходить на SGML/XML, все равно придется. С русским в этих форматах все в порядке, его интерпретация зависит от программ (типа переносы делаем или нет), а в стандартах предусмотрен атрибут encoding, как в html. Есть русский перевод режима работы psgml в emacs'е. Ссылка на него у меня на работе. > > Это тоже надо посмотреть, хотя и времени нет. Сорри, я пишу о том, что > > считаю для себя достаточно ясным и известным. > > Если все же будет время и желание, читать надо о TrueType Open > (подмножество OpenType, содержащее нужные нам вещи). Полная > спецификация лежит в: > http://www.microsoft.com/typography/tt/tt_open/msdn/ttospec.zip, > достаточно прочесть первые главы -- вводную часть без конкретики. Да. Вообще нынешнее состояние юникода, как мне кажется, недружествено по отношению к русскому, или вообще европейским языкам. Очень часто сталкиваешься с тем, что в какой-то программе юникод обрабатывается корректно только для азиатских языков. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 09 сен 2000 07:21:19 От: Vlad Dorosh Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: Диакритики -------------------------------------------------------------------------------- Saturday, September 09, 2000, 6:05:40 AM: Сорри, если можно, помедленнее. 1. Что есть AbiWord, где можно посмотреть о нем. 2. > Кстати, если надо положить мой фонт на сайт, он - там же, где и был, > сервер starship.python.net восстановлен. Где конкретно и что за фонт? На starship.python.net я не понял, где искать. Может, я не все письма из рассылки получаю? Впечатление пропущенного куска солидного размера. > Да, конечно, должна быть поддержка визивиг набора символов с > надстрочными знаками - хотя бы так, как рисуются формулы в MS Equation. Если набор ЦС-текстов делать так, как набираются формулы в MSEquation, то лучше уж вообще набивать хипом в лексиконе. Это же тоска, TeXом формулы и то проще и быстрее набирать. > Это тоже надо посмотреть, хотя и времени нет. Сорри, я пишу о том, что > считаю для себя достаточно ясным и известным. Если все же будет время и желание, читать надо о TrueType Open (подмножество OpenType, содержащее нужные нам вещи). Полная спецификация лежит в: http://www.microsoft.com/typography/tt/tt_open/msdn/ttospec.zip, достаточно прочесть первые главы -- вводную часть без конкретики. --- Влад Дорош, с уважением. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 09 сен 2000 06:05:40 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Диакритики -------------------------------------------------------------------------------- Vlad Dorosh wrote: > > Saturday, September 09, 2000, 3:25:01 AM: > > > Понятие "надстрочный знак" в данном случае хорошо тем, что не исключает случаи, > > когда эти знаки относятся на самом деле не к букве, а к слову или даже к > > предложению в целом. (Облеченные ударения, например.) > > Что опять же подчеркивает _концептуальную некорректность_ слияния в рамках шрифта > > надстрочного знака с буквой, которое порождало бы _новую букву_ со своим кодом в > > раскладке шрифта. > > Не понял -- как может облеченное ударение относиться не к букве, а к > предложению в целом? Это в смысле того, что смена вида ударения может, > скажем, поменять падеж/число существительного и, таким образом, косвенно > влияет на смысл предложения (и всего произведения, уж по большому > счету, в целом)? При чем же здесь особенности конкретной реализации > электронного представления текстов? И если уж на то пошло, breve над > "й" также меняет смысл слова, но тем не менее это -- символ с > самостоятельным кодом и самостоятельным местом в сортировочном порядке. Конечно, это самостоятельный символ для самостоятельного лексического и фонетического элемента. Помните, как в курсе русского языка для средней школы: "Фонетика и графика. Лексика". Его связь с "И" - давно в прошлом, в т.ч. и для ц.с. языка, как юсов и ятей. > Кстати, о недопустимости выделения отдельных кодов комбинациям > "буква-надстрочник". Вот если бы мелкомягкие не оставили OpenType в > стадии декларации стандарта, а поддержали бы его хоть в ворде, многие > проблемы с ЦС-фонтами были бы сняты. Выделили бы коды для букв и для > диакритиков (пардон, надстрочников), и определили бы просто кучу > глифов-комбинаций оных, аккуратно прорисованных, с приложением таблицы > подстановки-преобразования пары кодов в глиф с соответствующим > номером. Но OpenType сейчас поддерживается лишь в новом InDesign от Adobe, > насколько я знаю (см., напр., http://www.az-graphics.ru/indesignmain.htm). Это тоже надо посмотреть, хотя и времени нет. Сорри, я пишу о том, что считаю для себя достаточно ясным и известным. > Или есть что-то еще? Что там по поводу AbiWord? А надо посмотреть. Да, это морока, зато исчезает зависимость от экскаваторов и бульдозеров. Кстати, Гейтс всерьез озаботился _реальным_ богатством в виде серебряных рудников (пока его акции не превратились в осенние листья, как в "31 июня"), так что данное прозвище, похоже, имеет глубокий смысл. > Но в любом случае, выделение отдельных кодов для комбинированных > символов -- это варварство, допускаемое лишь по крайней нужде в > сложившейся сейчас ситуации. И варварством это является не столько по > причине семантического уродства в свете определения диакритиков и пр., > сколько в мощности необходимого для реализации кодового пространства. > Irmologion необходимо выпустить отдельным шрифтом, но как это реализовать? > Идею о накладных надстрочниках с отрицательным смещением я рассматривать > не хочу -- слишком просто и визуально некрасиво. Да, конечно, должна быть поддержка визивиг набора символов с надстрочными знаками - хотя бы так, как рисуются формулы в MS Equation. > вышеописанным причинам. OpenType существует лишь на бумаге. Может, мы > слишком рано появились со своей проблемой? Никогда не рано и не поздно. Были бы силы и время. > > Даже в Ирмологионе указанная некорректность не проявляет себя в полном объеме, > > т.к. новых кодов букв, как я понимаю, не заводится. Просто _совмещение_ буквы и > > надстрочного знака производится не путем геометрического наложения в редакторе, а > > эмулируется с помощью разновидности _того же_ шрифта. > > Кстати, вот была бы у мелкомягких доведена до логического конца идея > шрифтовых семейств и видов начертаний внутри них, можно было бы > сделать ЦС-шрифты в таком ключе: семейство Irmologion, начертания: > Normal, AcuteAccented, GraveAccented, ..., SlovoTitled, ... (вместо > Bold, Italic, BoldItalic, ...). И со сменой шрифта простым выделением > мышью проблемы бы исчезли. Во-во. Нажмешь Ctl-пробел (возврат к посимвольному формату параграфа по умолчанию) - и никаких диакритиков (вместе с курсивами и т.д.). Поэтому я в свое время и отказался от такого подхода (ну ... и лень было пятнадцать шрифтов выписывать...) Кстати, если надо положить мой фонт на сайт, он - там же, где и был, сервер starship.python.net восстановлен. А потом положу и на www.sobor.org, это Храм Христа Спасителя в СФ. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 09 сен 2000 04:23:59 От: Vlad Dorosh Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[6]: САЙТ -------------------------------------------------------------------------------- Saturday, September 09, 2000, 3:47:44 AM: > :-) Лева, ау! Мелкософт обижають! Думаете, я солист-одиночка? Эта тема хорошо и неоднократно оранжирована для большого состава с оркестром. Антифонят нам такой же состав сторонников Билли Вратарника. > А велик ли сей дримвевер и насколько совместим с мелкософтом? И где его > можно взять? И насколько удобно в нем работать? У меня после инсталляции занял 15М. Пользоваться удобно, на мой вкус. Отвечать "Нет" на всякие дурацкие предложения сделать работу за тебя в свете своего убогого понимания твоих потребностей там не приходится. Конечно, у каждой проги есть пара фичей, не имеющихся у конкурента, но как же без этого? Что значит совместимость HTML с чем-то, я не понимаю. HTML есть HTML, ты его либо принимаешь и понимаешь, либо нет. Взять можно на пиратском сидюке либо купить официально. > На самом деле, к этому средству добавляется Андрей Волков или еще > кто-нибудь, кто отплевываясь все это хозяйство чистит. :-) Тьфу еще раз! Что же это за средство, что ты его сначала устанавливаешь, потом вычищаешь, потом работаешь? Несколько похоже на начало работы с действительно серьезными системами, но именно только "несколько похоже". --- Влад Дорош ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 09 сен 2000 04:09:07 От: Vlad Dorosh Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: Диакритики -------------------------------------------------------------------------------- Saturday, September 09, 2000, 3:25:01 AM: > Понятие "надстрочный знак" в данном случае хорошо тем, что не исключает случаи, > когда эти знаки относятся на самом деле не к букве, а к слову или даже к > предложению в целом. (Облеченные ударения, например.) > Что опять же подчеркивает _концептуальную некорректность_ слияния в рамках шрифта > надстрочного знака с буквой, которое порождало бы _новую букву_ со своим кодом в > раскладке шрифта. Не понял -- как может облеченное ударение относиться не к букве, а к предложению в целом? Это в смысле того, что смена вида ударения может, скажем, поменять падеж/число существительного и, таким образом, косвенно влияет на смысл предложения (и всего произведения, уж по большому счету, в целом)? При чем же здесь особенности конкретной реализации электронного представления текстов? И если уж на то пошло, breve над "й" также меняет смысл слова, но тем не менее это -- символ с самостоятельным кодом и самостоятельным местом в сортировочном порядке. Кстати, о недопустимости выделения отдельных кодов комбинациям "буква-надстрочник". Вот если бы мелкомягкие не оставили OpenType в стадии декларации стандарта, а поддержали бы его хоть в ворде, многие проблемы с ЦС-фонтами были бы сняты. Выделили бы коды для букв и для диакритиков (пардон, надстрочников), и определили бы просто кучу глифов-комбинаций оных, аккуратно прорисованных, с приложением таблицы подстановки-преобразования пары кодов в глиф с соответствующим номером. Но OpenType сейчас поддерживается лишь в новом InDesign от Adobe, насколько я знаю (см., напр., http://www.az-graphics.ru/indesignmain.htm). Или есть что-то еще? Что там по поводу AbiWord? Но в любом случае, выделение отдельных кодов для комбинированных символов -- это варварство, допускаемое лишь по крайней нужде в сложившейся сейчас ситуации. И варварством это является не столько по причине семантического уродства в свете определения диакритиков и пр., сколько в мощности необходимого для реализации кодового пространства. Irmologion необходимо выпустить отдельным шрифтом, но как это реализовать? Идею о накладных надстрочниках с отрицательным смещением я рассматривать не хочу -- слишком просто и визуально некрасиво. Многошрифтовой метод хорош до первой необходимости смены гарнитуры. Напихать в шрифт кучу глифов и пиратским образом присвоить каждому по юникоду -- плохо по вышеописанным причинам. OpenType существует лишь на бумаге. Может, мы слишком рано появились со своей проблемой? > Даже в Ирмологионе указанная некорректность не проявляет себя в полном объеме, > т.к. новых кодов букв, как я понимаю, не заводится. Просто _совмещение_ буквы и > надстрочного знака производится не путем геометрического наложения в редакторе, а > эмулируется с помощью разновидности _того же_ шрифта. Кстати, вот была бы у мелкомягких доведена до логического конца идея шрифтовых семейств и видов начертаний внутри них, можно было бы сделать ЦС-шрифты в таком ключе: семейство Irmologion, начертания: Normal, AcuteAccented, GraveAccented, ..., SlovoTitled, ... (вместо Bold, Italic, BoldItalic, ...). И со сменой шрифта простым выделением мышью проблемы бы исчезли. Но -- давать свои названия разрабатываемым начертаниям система позволяет, а регистрировать их по-нормальному не хочет, смотрит лишь на флаги Bold, Italic, ... Даже показывает в меню зарегистрированные начертания, но выбрать какое-то кроме первого в группе с идентичными значениями флагов не дает. Ну что за платформа, в самом деле! --- С уважением, Влад Дорош ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 09 сен 2000 03:47:44 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" , "Vlad Dorosh" Тема: RE: Re[4]: САЙТ -------------------------------------------------------------------------------- > From: Vlad Dorosh [mailto:vvdorosh@mtu-net.ru] > Глеб, а Вы не хотите попробовать Macromedia Dreamweaver? Я тут :-) Лева, ау! Мелкософт обижають! А велик ли сей дримвевер и насколько совместим с мелкософтом? И где его можно взять? И насколько удобно в нем работать? > средством многие пользуются, и я, похоже, не умею в нем работать, На самом деле, к этому средству добавляется Андрей Волков или еще кто-нибудь, кто отплевываясь все это хозяйство чистит. :-) ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 09 сен 2000 03:25:01 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Диакритики -------------------------------------------------------------------------------- Hi Действительно, понятие "диакритический знак" к букве i не применимо, так же как и "ы" - не есть лигатура. "Сбивание" точки ударением, как в Ц.С., делается, афаик, только ради удобства (и красоты). Сами ударения, конечно, к (европейскому) понятию "диакритического знака" тоже отношения не имеют. Если учесть, что в Ц.С. и придыхания на произношение (и понимание) не влияют, то остается заключить, что в Ц.С. _вообще нет_ диакритических знаков. Так? Понятие "надстрочный знак" в данном случае хорошо тем, что не исключает случаи, когда эти знаки относятся на самом деле не к букве, а к слову или даже к предложению в целом. (Облеченные ударения, например.) Что опять же подчеркивает _концептуальную некорректность_ слияния в рамках шрифта надстрочного знака с буквой, которое порождало бы _новую букву_ со своим кодом в раскладке шрифта. Хотя _практические_ достоинства такового слияния бесспорны. Тем не менее, имхо, следует не идти на поводу этих достоинств, а ... "бороться за все более адекватное" совмещение букв и надстрочных знаков в рамках распространенных систем набора и верстки текстов. (Включая и самостоятельную разработку таковых. Не здесь ли предлагалось попотрошить AbiWord? Или я что-то путаю?) Даже в Ирмологионе указанная некорректность не проявляет себя в полном объеме, т.к. новых кодов букв, как я понимаю, не заводится. Просто _совмещение_ буквы и надстрочного знака производится не путем геометрического наложения в редакторе, а эмулируется с помощью разновидности _того же_ шрифта. С уважением Александр Vlad Dorosh wrote: > Интересная статейка из fido7.ru.dtp.fonts о значении понятия > "диакритический знак": > > ---CUT--- > SZ>>> Как называется "верхняя" часть букв "i" и "й"? > AV>> первая "dotaccend" > AV>> вторая "breve" > SZ> А их собирательное название "диакритичекий знак"? > > давай рассмотрим... > >Диакритический знак - //(гр.- diakritikos - различительный)// - *лингв.* - > >знак при букве, указывающий на то, что её надо читать иначе, чем без него. > >Hапример в русском языке - е-ё. (Словарь иностранных слов) > > Стало быть для буквы й это верно, а для i я так думаю, что нет, т.к. буквы без > dotaccecend я не знаю. > ---CUT--- > > Занятно. Как же все-таки называть верхнюю часть в целом? "Надстрочный знак"? > > --- > Влад Дорош > > ---------------------------------------------------------------------- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 09 сен 2000 02:55:03 От: Vlad Dorosh Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Диакритики -------------------------------------------------------------------------------- Интересная статейка из fido7.ru.dtp.fonts о значении понятия "диакритический знак": ---CUT--- SZ>>> Как называется "верхняя" часть букв "i" и "й"? AV>> первая "dotaccend" AV>> вторая "breve" SZ> А их собирательное название "диакритичекий знак"? давай рассмотрим... >Диакритический знак - //(гр.- diakritikos - различительный)// - *лингв.* - >знак при букве, указывающий на то, что её надо читать иначе, чем без него. >Hапример в русском языке - е-ё. (Словарь иностранных слов) Стало быть для буквы й это верно, а для i я так думаю, что нет, т.к. буквы без dotaccecend я не знаю. ---CUT--- Занятно. Как же все-таки называть верхнюю часть в целом? "Надстрочный знак"? --- Влад Дорош ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 09 сен 2000 02:46:45 От: Vlad Dorosh Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[4]: САЙТ -------------------------------------------------------------------------------- Friday, September 08, 2000, 3:32:37 PM: > Я пока поставил там абсолютные ссылки хттп//итд, но таки жду узнать, что > такое относительные. :-) > Обнаружилась, правда, новая забавность при чтении картотек - "параметры > безопасности вашего компа запрещают доступ к данным на другом домене". > Это у всех такое, или я лох? И что с этим можно сделать? Глеб, а Вы не хотите попробовать Macromedia Dreamweaver? Я тут попытался во FrontPage создать страничку из одной ссылки, а потом записать полученное -- заплевал себе весь монитор. Конечно, этим средством многие пользуются, и я, похоже, не умею в нем работать, но в Ткаче все гораздо очевиднее и предсказуемее. --- Влад Дорош ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 08 сен 2000 15:32:37 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" , "Vlad Dorosh" Тема: RE: Re[2]: САЙТ -------------------------------------------------------------------------------- Я пока поставил там абсолютные ссылки хттп//итд, но таки жду узнать, что такое относительные. :-) Обнаружилась, правда, новая забавность при чтении картотек - "параметры безопасности вашего компа запрещают доступ к данным на другом домене". Это у всех такое, или я лох? И что с этим можно сделать? ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 08 сен 2000 14:41:24 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" , "Vlad Dorosh" Тема: RE: Re[2]: САЙТ -------------------------------------------------------------------------------- > From: Vlad Dorosh [mailto:vvdorosh@mtu-net.ru] > > Глючит. Ссылки сделаны абсолютные, а не относительные. Но эт > о не беда. А что такое относительные ссылки? Впрочем, понятно что такое - вопрос конкретнее: как сделать относительную ссылку из каталога нижележащего? Т.е. у меня ссылка из сайт/index.files/main.htm на сайт/vvedenie/vvedenie.htm . Как она должна выглядеть? > file:///c|Мои документы/My Webs/orgt/vvedenie/vvedenie.html. Возиться > с открытием каждой просто ломает. Глеб, нужно же хоть раз проверять > после выгрузки на сервер файлов, как у Вас открываются ссылки. Дык проверил. Но видимо,оно просто открывало соответствующие файлы у меня на компе, поэтому я ничего не заметил. Спасибо за быструю реакцию - попытаюсь исправить. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 08 сен 2000 04:27:08 От: Vlad Dorosh Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: САЙТ -------------------------------------------------------------------------------- >> Вот, создал сайт: >> "Организация времени" http://orgt.narod.ru/ , > Глючит. Ссылки сделаны абсолютные, а не относительные. Но это не беда. Ну не знаю. Вот, у меня они светятся в виде file:///c|Мои документы/My Webs/orgt/vvedenie/vvedenie.html. Возиться с открытием каждой просто ломает. Глеб, нужно же хоть раз проверять после выгрузки на сервер файлов, как у Вас открываются ссылки. --- С уважением, Влад Дорош ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 07 сен 2000 19:26:07 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: САЙТ -------------------------------------------------------------------------------- Глючит. Ссылки сделаны абсолютные, а не относительные. Но это не беда. > Вот, создал сайт: > > "Организация времени" http://orgt.narod.ru/ , > > весьма желаю ваших, отцы честные, замечаний, предложений, возмущений, > восхищений, и прочая и прочая... > > За вся сия буду весьма благодарен. > > > ---- > Архангельский Г.А. > > Vot, sozdal sajt: > > "Organizaciya vremeni" http://orgt.narod.ru/ , > > ves'ma zhelayu vashix, otcy chestnye, zamechanij, predlozhenij, > vozmuwenij, vosxiwenij, i prochaya i prochaya... > > Za vsya siya budu ves'ma blagodaren. > > > ---- > Arxangel'skij G.A. > > > ---------------------------------------------------------------------- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru > > =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 06 сен 2000 03:21:58 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: конвертилка -------------------------------------------------------------------------------- ----- Original Message ----- From: Lev Tikhonov To: -=ORTHODOX-FONT=- Project Participants Sent: Sunday, August 27, 2000 10:38 PM Subject: Хытрющая текстовая конвертилка под Win32 > Зеально умная штуковина, рекомендую > > http://www.crystalsoftware.com.au/ Это иже именуется textpipe? А зачем она нужна и что может - я из надписи не понял? ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 30 авг 2000 03:59:23 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: [Fwd: ScanFont Was: Build font easy?] -------------------------------------------------------------------------------- Hi All, Всех с праздниками. Вот, может быть полезная информация здесь содержится. Александр -------- Original Message -------- Subject: ScanFont Was: Build font easy? Date: Mon, 21 Aug 2000 22:54:50 +0400 From: Andrey Janishewskiy Organization: JAW Home, St.Petersburg, NoFreq [Wt: 01:00-09:00] Newsgroups: fido7.ru.dtp.fonts References: <1660367030@www.fido-online.com> Привет Maxim! 19 августа 2000 16:27, Maxim Klimov -> All: FA>> Интересуюсь популярной литературой \ документацией по созданию FA>> шрифтов. А то во множество терминов просто не врубаюсь. И тем FA>> более понятие не имею о нужности некоторых параметров. Кто бы FA>> подсказал чего? FA>> зы. Еще слышал о проге, которая распознает шрифты с тврдой копии. FA>> Этакий OCR+Font Builder в одном флаконе. (мало верится что у нее FA>> нормально плучается, но хоть кучу ручной работы она сэкономит) FA>> кто вспомнит как ее зовут и кто делает? MK> Присоединяясь к вопросу предыдущего оратора, отмечу, что есть такая MK> софтина как ScanFont. Которая, судя по деме, довольно неплохо MK> сканирует буковки в TTF. Так вот, люди добрые, кто-нибудь где-нибудь MK> (URL) видел версию _3.1_, или другую, чтоб полностью записывала в MK> файл? Кстати... Если поставить ScanFont вместе с FontLab'ом, то в FontLab'е откроется менюшка трассировки символов. С моей точки зрения эта трассировка хоть и использует .dll от ScanFont работает существенно лучше (вероятно благодаря последующей оптимизации контуров) чем ScanFont. P.S. Конечно желательно на входе иметь идеальный растр как можно большего разрешения, (например, чтобы _полная_ высота буквы равнялась 1000 точкам) С уважением, Andrey =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 27 авг 2000 22:38:00 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: иЩФТАЭБС ФЕЛУФПЧБС ЛПОЧЕТФЙМЛБ РПД Win32 -------------------------------------------------------------------------------- ъЕБМШОП ХНОБС ЫФХЛПЧЙОБ, ТЕЛПНЕОДХА http://www.crystalsoftware.com.au/ ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 14 авг 2000 01:00:17 От: "Gleb Arkhangelsky" Кому: "Vlad Dorosh" , "-=ORTHODOX-FONT=- Project Participants" Тема: RE: Пря о Билли по прозвищу "Бульдозер" -------------------------------------------------------------------------------- > From: Vlad Dorosh [mailto:vvdorosh@mtu-net.ru] > Sent: Sunday, August 13, 2000 2:02 AM > To: -=ORTHODOX-FONT=- Project Participants > Subject: Re: Пря о Билли по прозвищу "Бульдозер" > Прошу прощения, не могу ответить сейчас по сабжу в фидо, поэтому пишу > в Orthodox Font. Надеюсь, все участники дискуссии меня услышат. Кроме > того, в ру.литургике это уже может быть офтопиком. Не будет, не будет. :-) Герр прокуратор очень трепетно относится к сабжу и никакоже оный возбраняет. :-) В принципе, здесь это логичнее, кроме одного минуса - сам Забавин на сию рассылку не подписан, нехороший человек. Поэтому звиняйте за оверквотинг - ничего из письма Влада не вырезаю, дабы Витя все прочитал. Собственно, мое письмо на этом заканчивается. :-) > > Про раскладку для греческого имхо сказано достаточно. Немного > о размере > шрифтов. Большое количество символов в шрифте не есть свойство > собственно Юникодных шрифтов. В самом крайнем случае можно просто > повыдергивать из шрифтов глифы всех неиспользуемых символов. Работа > будет нудной, но однократной. Это, повторю, на крайний случай. > > Однако лишние 150-200 кб оперативки, занимаемые арабикой, ивритом и > пр., думаю, быстро уходят в своп. Как правило, глифы в памати > сгруппированы по кодовым страницам. Глифов иврита наберется на > несколько 4кб-страниц, и они будут спокойно вытеснены в своп ввиду > тотальной невостребованности. > > Но вот в ЦС-шрифтах юникод мог бы помочь. Возьмем Ирмологий. Состоит > из 13 шрифтов. Зничит, описание кривых контура глифа "азъ", например, > повторяется 11 раз -- по количеству диакритиков, могущих над ним (ней) > стоять. И в своп они не уйдут -- все эти символы регулярно встречаются > в текстах. Кроме того, ттф-шрифт состоит не только из описания глифов. > Там много таблиц, и наиболее сдублированы имхо разделы с программами > по уточнению растеризации, занимающие тоже немало, но являющиеся > идентичными, если группа шрифтов компилялась одним редактором. > > А если бы все символы были в одном шрифте, суммарно он занимал бы > гораздо меньше места. Можно пользоваться ссылками при написании "азъ > с ударением". Служебные разделы в одном экземпляре. > > Насчет переключения шрифтов при переключении раскладки. Это тоже не > свойство юникода, а скорее попытка сделать юникодный текст видимым из > не-юникодных старых приложений, а также корректно подгужать > не-юникодные тексты в юникодный ворд. Это в теории, конечно. Кстати, > переключение шрифтов, похоже, -- свойство только ворда и является > намертво в нем прошитым. > > Это для затравки. Жду ответов. > > --- > Влад Дорош. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 14 авг 2000 06:39:41 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: МIРЯНСКИЙ УСТАВ БДЕНИЯ -------------------------------------------------------------------------------- Чин воскресного всенощного бдения, с указаниями о порядке совершения его мiрянами в отсутствие священнослужителя Предлагаемое вниманию благочестивого читателя издание может быть полезным каждому человеку, любящему молитву и богослужение, но не всегда имеющему необходимые богослужебные книги или знания для его совершения. Между тем, обстоятельства жизни часто ставят христианина в условия, в которых он лишается участия в храмовом богослужении (в поездках, при невозможности посетить храм в какой-то день, итд). Таким образом, сокровища богословия, образцы благочестия, выработанный св. отцами чин и образ молитвы - все это богатство остается для него недоступным. Существующие же популярные издания богослужебных последований, наподобие <Православного богослужебного сборника> или брошюры <Всенощное бдение. Литургия>, содержат в себе чинопоследования в таком виде, в каком они совершаются в храмах. Кроме того, эти книги в значительной степени расчитаны на клиросное употребление, и поэтому в них отсутствует значительная часть изменяемых богослужебных текстов. Наконец, даже если христианин имеет Часослов, Октоих и др. богослужебные книги, не всегда бывает легко совершать по ним богослужение, т.к. их краткие указания и пояснения предполагают знакомство с устной традицией совершения богослужения, знание многих мелочей, не зафиксированных письменно. Итак, настоящая книга призвана помочь мiрянам, желающим возможно более полно участвовать в праздничной молитве Церкви в случаях, когда они не могут принять участие в богослужении в храме. В книге содержится чинопоследование совершения воскресного всенощного бдения в двух вариантах: при раздельном служении вечерни, повечерия, полунощницы и утрени, а также при их соединении во всенощное бдение. Оно снабжено уставными указаниями и замечаниями о различных традициях совершения тех или иных элементов чина. На тот случай, если совершающий богослужение по данной книге человек не имеет Октоиха или иной книги, содержащей воскресные службы всех восьми гласов, мы включили в данное издание воскресную службу Октоиха 6 гласа, как принято в часословах, и расположили ее песнопения на положенных местах в чинопоследовании, выделив их мелким шрифтом. Вместо песнопений святого из Минеи на Господи воззвах помещены стихиры Павла Аморрейского, <поемые идеже несть Минеи>; в канонах утрени - канон Всем святым из субботней службы Октоиха 6 гласа. Кроме того, были сделаны уставные указания, облегчающие совершение по данной книге и всенощных бдений большинства праздников (правда, это уже невозможно сделать без Праздничной или хотя бы Общей Миней). Уставные указания в тексте, набранные мелким курсивом, взяты из богослужебных книг и Типикона с незначительными дополнениями. В подстрочных примечаниях содержатся более развернутые указания, отмеченные словом ЗРИ, как принято в Типиконе. Кроме того, перед стихирами на Господи воззвах и каноном помещено два больших блока примечаний, по странице каждый, повествующих о предстоящих частях богослужения и порядке соединения служб. Так как примечания не могут претендовать на исчерпывающую полноту, да никогда и не смогут, в конце книги мы указали основные источники, желая дать читателю материал для дальнейшего самостоятельного изучения богослужения. Великий знаток православного богослужения, М.Н.Скабалланович, писал: "Будучи соборным творением Церкви, богослужебный Устав однако разрабатывался по преимуществу лишь достойнейшими сынами ея. Непосредственными авторами его были люди, не имевшие другой жизни, кроме молитвы и поста, которым сладость богослужения позволяла принимать пищу раз в 5 дней и спать не иначе, как стоя или сидя, доканчивавшие свои всенощные бдения в подожженных запертых снаружи язычниками храмах, люди, мученическая кровь которых смешивалась иногда с евхаристическою Кровию. Страницы составлявшегося ими устава не могли не оказаться политыми слезами умиления и богожертвенною кровию исповедничества, которые не могут не чувствоваться оттуда и не сообщать книге духа особенной святости и чистоты. В этом и тайна глубокого действия на душу православного богослужения, что участвующий в нем воспринимает влияние Церкви всех времен в лице лучших ее сил и живет жизнию всей Церкви, и это влияние исходит не только от поэзии и музыки богослужения, но и от самой архитектоники его, от этих 40-кратных "Господи помилуй", безмолвных поклонов, вторгающихся долгой паузой в пение и чтение, от антифонного способа пения..." (<Толковый Типикон>). Надеемся, что эта книга поможет Вам увидеть дивную красоту, скрывающуюся за суховатыми словами Типикона, услышать отзвуки ангельского пения в творениях вдохновенных песнотворцев Церкви, приобщиться духу и жизни тех, кто вкладывал в богослужение лучшие силы своей души, почитал его вершиной и лучшим временем своей жизни; для кого жизнь была воистину богослужением, а богослужение - жизнью. * * * Источники, послужившие основой для составления книги <Чин воскресного всенощного бдения> При составлении данного издания мы пользовались в основном следующими книгами: М.Н. Скабалланович <Толковый Типикон>. Киев, 1910-1913 (репр. М, 1995). Еп. Афанасий (Сахаров) <О поминовении усопших по Уставу Православной Церкви> СПб, Сатис: 1999. (несмотря на <узкоспециальное> название, книга содержит значительное количество соображений известного литургиста и исповедника о богослужении вообще). Н.Д.Успенский <Чин всенощного бдения на Востоке и в Русской Церкви>. Богословские труды, ? 18-19. В.Розанов <Богослужебный Устав Православной Церкви>. М, 1998. Свящ. К.Никольский <Учебный устав богослужения>. М, 1999. Мы не даем ссылок на использованные богослужебные книги, т.к. тексты различных изданий отличаются незначительно. В основном, использованы репринтные издания синодальных богослужебных книг конца XIX - начала XX веков. При составлении указаний о порядке совершения отдельных частей чинопоследования в отсутствие священнослужителя мы, в основном, следовали традиции, сложившейся до богослужебных реформ XVII века, когда совершение мiрянами богослужения суточного круга было обычным делом. Как правило, в русле этой традиции лежит и практика совершения служб в отсутствие священнослужителей, принятая в возрождаемых ныне русских монастырях. У этой книги нет одного автора - над ее составлением, набором текстов, написанием примечаний потрудились различные люди, объединенные любовью к богослужению и желанием поделиться с этой любовью с другими. Таким образом, книга эта явилась плодом соборного творчества, как и все вообще богослужение Православной Церкви, авторы песнопений и чинопоследований которого никогда не подчеркивали свое авторство, приписывая себе роль лишь скромных <списателей>, как именует Предание евангелиста Луку. Поэтому, естественно, мы не говорим ни о каких копирайтах и предоставляем эту книгу в свободное и безвозмездное пользование всем желающим. Состав данного издания, а также содержание уставных указаний и примечаний широко обсуждались в посвященной литургике эхоконференции FidoNet fido7.ru.liturgica (в интернете, напр., news://ddt.demos.su/fido7.ru.liturgica/ ), объединяющей знатоков и любителей богослужения из самых разных уголков России. Кроме того, участие в обсуждении принимали посетители интернет-форума Московских Регентских курсов ( http://art-gallery.ru/kliros/ ). Большинство текстов, вошедших в книгу, было взято с сайта http://www.mrezha.ru/lestovka/ , содержащего, насколько нам известно, наиболее основательное собрание богослужебных текстов (не считая англоязычных сайтов). Кроме большого количества текстов, не вошедших в эту книгу, на сайте содержатся также ссылки на другие сайты, посвященные литургике, и на интернет-версию эхоконференции. Составители книги благодарны всем, способствовавшим ее появлению на свет, и заранее благодарны всем, кто сочтет полезным поделиться с ними своими соображениями о ее содержании, оформлении, и о возможных направлениях развития издания книг такого рода. Все Ваши замечания и предложения просим высказывать посредством любого из перечисленных средств электронной информации, а также по адресам электронной почты: aga@des-nt.tstu.ru, aga@mrezha.ru , vicza@mrezha.ru . Санкт-Петербург - Москва, август 2000 г. * * * Примечание относительно электронной версии книги Электронная версия является в значительной мере пробной. Уже на обозримое будущее запланировано ее расширение и дополнение. Но даже в таком виде, надеемся, эта книга может быть полезной, поэтому представляем ее суду общественности. Электронную версию книги можно взять в конференции: news://des-nt.tstu.ru/fido7.ru.liturgica.files/ А также по адресам: в формате word 97: http://www.aga2000.newmail.ru/BP_VECH7.ZIP (38К) http://www.aga2000.newmail.ru/BP_UTR7.ZIP (87К) в формате word 6.0: http://www.aga2000.newmail.ru/BP_VECH6.ZIP (30К) http://www.aga2000.newmail.ru/BP_UTR6.ZIP (68 К) ЗРИ: к сожалению, при перекодировании в этот формат несколько уставных указаний превратились в вопросительные знаки. В ближайшее время на упомянутом сайте http://www.mrezha.ru/lestovka/ должна появиться исправленная версия ЕЩЕ ЗРИ: файлы можно взять только по ссылкам, на главной странице они не указаны. Или просто обратившись по электронной почте: aga@des-nt.tstu.ru aga@mrezha.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 13 авг 2000 02:01:37 От: Vlad Dorosh Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Пря о Билли по прозвищу "Бульдозер" -------------------------------------------------------------------------------- Прошу прощения, не могу ответить сейчас по сабжу в фидо, поэтому пишу в Orthodox Font. Надеюсь, все участники дискуссии меня услышат. Кроме того, в ру.литургике это уже может быть офтопиком. Про раскладку для греческого имхо сказано достаточно. Немного о размере шрифтов. Большое количество символов в шрифте не есть свойство собственно Юникодных шрифтов. В самом крайнем случае можно просто повыдергивать из шрифтов глифы всех неиспользуемых символов. Работа будет нудной, но однократной. Это, повторю, на крайний случай. Однако лишние 150-200 кб оперативки, занимаемые арабикой, ивритом и пр., думаю, быстро уходят в своп. Как правило, глифы в памати сгруппированы по кодовым страницам. Глифов иврита наберется на несколько 4кб-страниц, и они будут спокойно вытеснены в своп ввиду тотальной невостребованности. Но вот в ЦС-шрифтах юникод мог бы помочь. Возьмем Ирмологий. Состоит из 13 шрифтов. Зничит, описание кривых контура глифа "азъ", например, повторяется 11 раз -- по количеству диакритиков, могущих над ним (ней) стоять. И в своп они не уйдут -- все эти символы регулярно встречаются в текстах. Кроме того, ттф-шрифт состоит не только из описания глифов. Там много таблиц, и наиболее сдублированы имхо разделы с программами по уточнению растеризации, занимающие тоже немало, но являющиеся идентичными, если группа шрифтов компилялась одним редактором. А если бы все символы были в одном шрифте, суммарно он занимал бы гораздо меньше места. Можно пользоваться ссылками при написании "азъ с ударением". Служебные разделы в одном экземпляре. Насчет переключения шрифтов при переключении раскладки. Это тоже не свойство юникода, а скорее попытка сделать юникодный текст видимым из не-юникодных старых приложений, а также корректно подгужать не-юникодные тексты в юникодный ворд. Это в теории, конечно. Кстати, переключение шрифтов, похоже, -- свойство только ворда и является намертво в нем прошитым. Это для затравки. Жду ответов. --- Влад Дорош. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 10 авг 2000 14:41:22 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RE: форум -------------------------------------------------------------------------------- > From: Mikhail Grinchuk [mailto:grinchuk@worldnet.att.net] > > Все это хозяйство в 16-битной версии Ирмологиона в формате word 6.0 > > (что-то в РТФ). > > Напомните, пожалуйста, где это вс. лежит. На моем винче. :-) Давайте фтп - будет лежать там. > Чтобы понять, делается ли такой конвертор, нужны тексты, существующие > одновременно в двух вариантах (оба выверенные). Такое имеется? Полностью аналогичные и выверенные - служба Введению и полслужбы праотцов. Если надо много текста - есть Псалтирь славянская и гражданская, славянская (иже на елизавете), помнится, была неплоха (я в нее вставлял первые буквы и немного следил за окружающим), русская иже на Лестовке тоже хороша, но вот насколько они соответствуют друг другу - не вем. Впрочем, Псалтирь - штука стабильная. Если научиться игнорировать различие знаков препинания, то думаю, она подойдет. > Все же "Елисавета" -- это проект с вполне конкретной целью > изготовления > одной Книги, причем уже в "потребительском" формате RTF, а не в > "конвертируемом межплатформенном" HIP. Ну печатный двор - разницы-то. Главное: одно место, хорошо раструбленное по всему белу свету. Чтоб все знали - "славянские тексты? А-аа, ну это вам тады туды...". :-) > Хорошо, это ничему не противоречит. > Но если ТОЛЬКО ССЫЛКА -- то это все ж запасной вариант. Нет, конечно, нужны сами тексты. Лазить по ссылкам - мастдаище. > Да шлите прямо мне, на этот адрес (если уже тексты где-то выложены как > TXT или RTF, достаточно просто ссылки, если нет -- Нет, надо таки сделать перевалочную базу. Заведите хоть на бум.ру какой-нибудь временный ящик для подобных целей, или на ньюмейле (там 32 метра дают - хватит же нам?). > По итогам работы будет сделан универсальный конвертор из RTF в HIP, > который "чисто" съест все представленные тексты (то есть ручной > доводки результата не должно потребоваться, если речь идет о > конвертации > как таковой, а не об исправлении самогО текста). Как-то вы имхо чрезмерно зациклены на хипе. Хип не самоцель, хип средство. Самоцель - славянские тексты, а для них нужен конвертер. > А как бы нам этих филологов сюда вытащить? Потому что довольно Я об этом думал. Из мне знакомых никто не объелектронен. Есть всякие эхи типа фидо7.спб.студент, но они обычно для инетчиков ридонли. А там бы можно поспрошать славистов. > правильным, а другие -- то ли ошибкой, то ли остатками орфографии > другой "школы"? Например (по Библии 1900 года): велблю'дъ, велблу'дъ, > велбу'дъ и вельбу'дъ. Как минимум, есть московско-киевские различия. Плюс вообще никониянские глюки. :-) > Так это уже не анализатор будет, а великий и могучий конвертор с > уклоном в Машинный Перевод. И с распознаванием семантики -- > чтобы отличить глаго'летъ от гл~етъ. Ну дык да. Я рисую идеальное конечное решение, вы ж понимаете. :-) Чтоб было видно, к чему мы должны придти в 1980 году. :-) > Причем для каждой версии орфографии, вообще говоря, надо будет > изготавливать отдельный набор словарей... Да нет. Если говорить о дониконцах, то там в орфографии понятные различия типа диякон,християнин,стихеры, отсутствие И краткого, итп. Ну, какой-то набор слов не совпадает. Я думаю, это что-то типа единого блока-ядра + для каждой версии свои доп. словари и правила преобразования этого ядра. > И еще: ведь отличия между разными версиями ц.-сл. языка не сводятся > только к орфографии. То есть даже если писать гражданкой, то тексты > получатся разные. Или "общий знаменатель" -- не гражданка, а Гм. Это меня настолько занесло, что я о машинном переводчике возглаголал? :-) Нет, это нереально, конечно. Учитывая, что переводили "абы как, лишь бы не по старому". > перевод на русский язык? Ой!.. Это ж еще таких Платонов и Дамаскинов русская земля должна нарожать... > > Начал сегодня Мельникова "Краткую историю древлеапостольской Церкви" > > Бумажная книга или в Интернете? Бумажная. Хотя может у каких старообрядцев где и лежит. ---- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 10 авг 2000 09:22:55 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Ввод текста в word97/2000 -------------------------------------------------------------------------------- Hi All, Вот, на сайте написано: "Простейшим решением этой проблемы является использование независимого клавиатурного драйвера. " Для win9x предлагается cyrwin. А для winnt/2k? Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 10 авг 2000 06:24:53 От: Vlad Dorosh Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: форум -------------------------------------------------------------------------------- Thursday, August 10, 2000, 5:45:29 AM: > Vlad Dorosh wrote: >> У меня на страничке лежат немного ЦС-богослужебных текстов: > Верно ли, что это те же файлы, что и на странице > http://m82.ipmce.ru/trio/texts.html ? Нет. Изначально они были те же, но потом их правил другой человек, параллельно моей правке (мы ничего друг о друге не знали). И потом, у меня более обширная библиотека. > В таком случае просьба просто > перевести их в формат RTF -- у меня это не для всех файлов > почему-то получалось (сейчас точно не помню, но то ли памяти не > хватало, то ли Word зависал). А ручной коррекции как раз не надо, > лучше обучить конвертор со всеми этими "украшениями" справляться. Влад Дорош ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 10 авг 2000 05:45:29 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: форум -------------------------------------------------------------------------------- Vlad Dorosh wrote: > У меня на страничке лежат немного ЦС-богослужебных текстов: > http://vvdorosh.narod.ru/dstexts.html. Все в 95 ворде, необходима > небольшая ручная коррекция -- удаление буквиц, переносов и певческой > разметки. Если будет нужно, могу заняться. Верно ли, что это те же файлы, что и на странице http://m82.ipmce.ru/trio/texts.html ? В таком случае просьба просто перевести их в формат RTF -- у меня это не для всех файлов почему-то получалось (сейчас точно не помню, но то ли памяти не хватало, то ли Word зависал). А ручной коррекции как раз не надо, лучше обучить конвертор со всеми этими "украшениями" справляться. М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 10 авг 2000 05:18:14 От: Vlad Dorosh Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: форум -------------------------------------------------------------------------------- Wednesday, August 09, 2000, 10:36:56 AM: У меня на страничке лежат немного ЦС-богослужебных текстов: http://vvdorosh.narod.ru/dstexts.html. Все в 95 ворде, необходима небольшая ручная коррекция -- удаление буквиц, переносов и певческой разметки. Если будет нужно, могу заняться. --- Влад Дорош ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 10 авг 2000 02:26:51 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: HIP Re: форум -------------------------------------------------------------------------------- "Alexander V. Voinov" wrote: > На всякий случай, пошлите мне, пожалуйста, последнюю версию HIP, я мог > пропустить что-нибудь. > > (Можно даже без слов, а просто таблицу - что чему соответствует) Она лежит тут (и полный вариант, и краткая таблица): http://www.pechatnyj_dvor.boom.ru/docs.html Здесь всегда (насколько в наших силах) будет лежать именно последняя версия. М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 10 авг 2000 02:10:25 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: HIP Re: форум -------------------------------------------------------------------------------- HI ALL На всякий случай, пошлите мне, пожалуйста, последнюю версию HIP, я мог пропустить что-нибудь. (Можно даже без слов, а просто таблицу - что чему соответствует) Спасибо Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 10 авг 2000 01:20:58 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RE: форум -------------------------------------------------------------------------------- > From: Mikhail Grinchuk [mailto:grinchuk@worldnet.att.net] > из гражданки в ц.-сл. письменность сделать можно. То есть, конечно, > это будет не полноценное восстановление, но, по-видимому, довольно > пристойное, где-нибудь с точностью до 5-10 ошибок на страницу. Хотя > надо поэкспериментировать. Это было бы _очень_ пристойно. Особенно если бы программа выделяла те места, в которых сомневается, и удобно показывала их корректору. > > А для этих экспериментов как раз и потребуется конвертор в гражданку. > Чтобы действовать так: взять полноценный ц.-сл. текст, перегнать его > в гражданку, потом обратно, и сравнить результат с тем, что было в > самом начале. Обнаруженные расхождения анализируются, и по Что-то вы усложняете. Есть же гражданско-славянские тексты (та же Псалтирь) - берите, да сравнивайте? Или вы хотите по обратному алгоритму восстанавливать прямой? Как прием активизации мышления, пожалуй, красиво. ---- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 10 авг 2000 00:50:32 От: "Mikhail Grinchuk" Кому: "-=ORTHODOX-FONT=- Project Participants" , Тема: Re: форум -------------------------------------------------------------------------------- Доброе утро! From: Gleb Arkhangelsky > Славянское: > > Имам службу Введения на славянском всю целиком, очень тщательно > выверенную. Еще полслужбы недели праотцов, тоже выверенную. (но > осторожно, г.г. библеисты, литургика - особая статья. :-) Могут быть > расхождения.) > > Еще у меня есть паремии нескольких двунадесятых праздников, которые > набирал Скоморохов (он кажется и Гришину копии посылал). Часть в > библейской версии, часть в богослужебной. > > Еще воиновские тексты в Ижице, но тут он пусть сам возглаголет. > > Все это хозяйство в 16-битной версии Ирмологиона в формате word 6.0 > (что-то в РТФ). Напомните, пожалуйста, где это вс. лежит. > Гражданское: > > http://www.mrezha.ru/lestovka/ - множество сих текстов, плюс у Забавина > в загашниках не прошедшие еще украшательство (киноварь итп) и потому не > выложенные. Все это в 6 ворде. Орфографическое их качество приличное > (только заглавными буквами Витя злоупотребляет). Много > старообрядческого. Кстати, вот вам, отцы, мощная загадка - как сделать > конвертер Никон и конвертер Анти-Никон? :-) Первый нужен для конвертации > того, что у Вити есть только в старообр. вариантах, а второй - при > грядущем возвращении к дониконовским текстам. :-) Чтобы понять, делается ли такой конвертор, нужны тексты, существующие одновременно в двух вариантах (оба выверенные). Такое имеется? > Если говорить о собирании в одном месте (что весьма надо, дублируемся бо > по страшному. Герр Воинов, кстати, так все еще Псалтирь и набирает? Или > хоть на ВЗ песни переключился для пользы общества?) то мое имхо - не > умножать сущностей без необходимости. Славянское сваливать на елизавету > (я давно еще Гришину предлагал расширить идеологию - с библеистской на > вообще славянскую), а гражданские (аще таковые обретутся) - на лестовку. > И трубить о сих двух точках на стогнах градов и весей уже не просто как > о каких-то сайтах каких-то людей, но как о местах сборищ славянофилов. Все же "Елисавета" -- это проект с вполне конкретной целью изготовления одной Книги, причем уже в "потребительском" формате RTF, а не в "конвертируемом межплатформенном" HIP. > > Как народ относится к тому, чтобы завести на "Печатном дворе" раздел > > "Библиотека", где лежали бы (в пределе) сконвертированные в HIP версии > > Кто такое печатный двор? А это как раз намечаемое место для собирания всего и вся в единообразном виде. Лежит на www.slavonic.orthodoxy.ru (изначальный вариант, изготовленный Алексеем) и в несколько измененном виде на www.pechatnyj_dvor.boom.ru (И, как вспомнилось поутру, раздел для текстов там уже имеется. Называется "текстовый архив". На втором варианте сайте там кое-что уже лежит.) Планируется текст Библии, сконвертированный в HIP, выложить как раз туда. > > всех этих текстов? (Как запасной вариант -- прямые ссылки на > > хранящиеся > > где-то тексты в других форматах, то есть "текст такой-то > > лежит там-то", > > а не просто "на таком-то сайте есть славянские тексты".) > > Почему не иметь и то, и другое? Хорошо, это ничему не противоречит. Но если ТОЛЬКО ССЫЛКА -- то это все ж запасной вариант. > > От текстовладельцев неплохо бы получить "конвертабельные" варианты > > (например, сохраненные в виде .RTF -- с ними разбираться вполне можно, > > независимо от используемых шрифтов, пусть даже и Уникодовских). > > Рцыте куда слать. А еще лучше - давайте какое-нибудь ФТП, дабы на него > перекладать. Да шлите прямо мне, на этот адрес (если уже тексты где-то выложены как TXT или RTF, достаточно просто ссылки, если нет -- конвертируйте в RTF, и чем-нибудь архивируйте (ZIP, RAR, ARJ или LHA, но только не самораспаковывающиеся EXE-шки); если можно -- чтобы суммарные размеры приложений к одному письму были не более 1-2Мб). А хорошего "перевалочного" места в ФТП у меня нет -- на днях надо было Алексею 30Мб переслать, так в конце концов пришлось емэйлом. По итогам работы будет сделан универсальный конвертор из RTF в HIP, который "чисто" съест все представленные тексты (то есть ручной доводки результата не должно потребоваться, если речь идет о конвертации как таковой, а не об исправлении самогО текста). > > Скажем, в данном случае: почти наверняка вариант ВСЯ^ > > встречается на порядок чаще, > > чем ВСЯ`. А потом можно учесть информацию из предыдущего > > Не скажите. С ударениями таки сложно. Кто ж спорит. Утвержается лишь, что для большинства слов ударение вычисляется однозначно, а для большинства из оставшихся -- есть несколько вариантов, но один из них употребляется заметно чаще других. Причем в случае с неоднозначностью учет ближайших соседних слов может сильно помочь. > Разговаривал я как-то с одной филологиней на предмет конвертера. > Говорит, есть у них, славистов, и сборники корней, и какие-то совсем > кошмарные чуть ли не таблицы суффиксов, и все это в рукописях у > преподов. Если серьезно дело зайдет о конвертере - интересно бы такие > источники пораскопать. А как бы нам этих филологов сюда вытащить? Потому что довольно часто возникают вопросы такого сорта: некое слово в тексте пишется несклькими способами, а почему так и не является ли один вариант правильным, а другие -- то ли ошибкой, то ли остатками орфографии другой "школы"? Например (по Библии 1900 года): велблю'дъ, велблу'дъ, велбу'дъ и вельбу'дъ. > > Не только для ятей и не просто словарь, а (по большому счету) полный > > грамматический анализатор. > > Вот! архинужен. > > Только вот вопрос о методологии сего анализатора. Интересно было бы > сделать его таким образом, чтобы он был перенастраиваем. Т.е. хотим > печатать иосифовскую Кормчую или Просветитель прп. Иосифа - выбираем > одну грамматику (и/или добавляем/отключаем какие-то правила). Хотим > мелетиесмотрицкие никониянские штуки - это скажем будет по умолчанию. > Решили осуществить мечту прп. Феофана Затв. о новом славянском тексте - > ставим третью, совсем а ля рюсс. И гонять туда-сюда, из одной в другую. Так это уже не анализатор будет, а великий и могучий конвертор с уклоном в Машинный Перевод. И с распознаванием семантики -- чтобы отличить глаго'летъ от гл~етъ. Причем для каждой версии орфографии, вообще говоря, надо будет изготавливать отдельный набор словарей... И еще: ведь отличия между разными версиями ц.-сл. языка не сводятся только к орфографии. То есть даже если писать гражданкой, то тексты получатся разные. Или "общий знаменатель" -- не гражданка, а перевод на русский язык? Ой!.. > Начал сегодня Мельникова "Краткую историю древлеапостольской Церкви" > читать - ахнул. Я конечно знал, что никоновские справщики много глючили, > но не думал, чтобы настолько. Бумажная книга или в Интернете? М. Г. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 09 авг 2000 19:42:13 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RE: форум -------------------------------------------------------------------------------- > From: Alexander V. Voinov [mailto:avv@quasar.ipa.nw.ru] > А по поводу обратного перевода, может быть - методом лома? > Набрать (в смысле - в одном > месте собрать ;) текстов в ц.с. побольше, прогнать через > упрощатель, один раз руками > пройтись, после чего обратное преобразование делать с помощью > получившегося словаря. Имхо рациональнее думать о прямом переводе, а не обратном. Ибо сканировать и распознавать тексты в гражданке значительно легче. А грамматический анализатор все равно потребуется - так и делать его сразу конвертоспособным. А словарь гражданский можно сделать из уже имеющегося на лестовке. Или ты имеешь в виду словарь конвертирования, связки славянский-гражданский? Так тоже можно сделать. Правда, мало сейчас того, что в обеих версиях есть - богослужебного очень мало славянского, а Библии нету гражданской. Впрочем, Псалтирь - готовое поле для изучения, благо и такая, и такая есть. ---- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 09 авг 2000 19:42:09 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RE: форум -------------------------------------------------------------------------------- > From: grinchuk@mvs2.adl.lsil.com [mailto:grinchuk@mvs2.adl.lsil.com]On > Что касается собирания всех текстов в одном месте, то давайте > для начала > хотя бы информацию соберем (пусть даже прямо здесь) -- где и > что лежит, > и в каких физических форматах (TXT, RTF, DOC...). Говорю за себя и за отсутствующего Забавина. Славянское: Имам службу Введения на славянском всю целиком, очень тщательно выверенную. Еще полслужбы недели праотцов, тоже выверенную. (но осторожно, г.г. библеисты, литургика - особая статья. :-) Могут быть расхождения.) Еще у меня есть паремии нескольких двунадесятых праздников, которые набирал Скоморохов (он кажется и Гришину копии посылал). Часть в библейской версии, часть в богослужебной. Еще воиновские тексты в Ижице, но тут он пусть сам возглаголет. Все это хозяйство в 16-битной версии Ирмологиона в формате word 6.0 (что-то в РТФ). Гражданское: http://www.mrezha.ru/lestovka/ - множество сих текстов, плюс у Забавина в загашниках не прошедшие еще украшательство (киноварь итп) и потому не выложенные. Все это в 6 ворде. Орфографическое их качество приличное (только заглавными буквами Витя злоупотребляет). Много старообрядческого. Кстати, вот вам, отцы, мощная загадка - как сделать конвертер Никон и конвертер Анти-Никон? :-) Первый нужен для конвертации того, что у Вити есть только в старообр. вариантах, а второй - при грядущем возвращении к дониконовским текстам. :-) Если говорить о собирании в одном месте (что весьма надо, дублируемся бо по срашному. Герр Воинов, кстати, так все еще Псалтирь и набирает? Или хоть на ВЗ песни переключился для пользы общества?) то мое имхо - не умножать сущностей без необходимости. Славянское сваливать на елизавету (я давно еще Гришину предлагал расширить идеологию - с библеистской на вообще славянскую), а гражданские (аще таковые обретутся) - на лестовку. И трубить о сих двух точках на стогнах градов и весей уже не просто как о каких-то сайтах каких-то людей, но как о местах сборищ славянофилов. > Как народ относится к тому, чтобы завести на "Печатном дворе" раздел > "Библиотека", где лежали бы (в пределе) сконвертированные в HIP версии Кто такое печатный двор? > всех этих текстов? (Как запасной вариант -- прямые ссылки на > хранящиеся > где-то тексты в других форматах, то есть "текст такой-то > лежит там-то", > а не просто "на таком-то сайте есть славянские тексты".) Почему не иметь и то, и другое? > > От текстовладельцев неплохо бы получить "конвертабельные" варианты > (например, сохраненные в виде .RTF -- с ними разбираться вполне можно, > независимо от используемых шрифтов, пусть даже и Уникодовских). Рцыте куда слать. А еще лучше - давайте какое-нибудь ФТП, дабы на него перекладать. > Скажем, в данном случае: почти наверняка вариант ВСЯ^ > встречается на порядок чаще, > чем ВСЯ`. А потом можно учесть информацию из предыдущего Не скажите. С ударениями таки сложно. Разговаривал я как-то с одной филологиней на предмет конвертера. Говорит, есть у них, славистов, и сборники корней, и какие-то совсем кошмарные чуть ли не таблицы суффиксов, и все это в рукописях у преподов. Если серьезно дело зайдет о конвертере - интересно бы такие источники пораскопать. > Аналогично будет и с восстановлением буквы: ми'ра -- мi'ра -- мv'ра. > Если "сего", то вариант определяется с точностью 99%. Остроумно. :-) А если миру сему итп? > Не только для ятей и не просто словарь, а (по большому счету) полный > грамматический анализатор. Вот! архинужен. Только вот вопрос о методологии сего анализатора. Интересно было бы сделать его таким образом, чтобы он был перенастраиваем. Т.е. хотим печатать иосифовскую Кормчую или Просветитель прп. Иосифа - выбираем одну грамматику (и/или добавляем/отключаем какие-то правила). Хотим мелетиесмотрицкие никониянские штуки - это скажем будет по умолчанию. Решили осуществить мечту прп. Феофана Затв. о новом славянском тексте - ставим третью, совсем а ля рюсс. И гонять туда-сюда, из одной в другую. Начал сегодня Мельникова "Краткую историю древлеапостольской Церкви" читать - ахнул. Я конечно знал, что никоновские справщики много глючили, но не думал, чтобы настолько. ---- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 09 авг 2000 17:25:21 От: "Mikhail Grinchuk" Кому: "-=ORTHODOX-FONT=- Project Participants" , Тема: Re: форум -------------------------------------------------------------------------------- > > "Система контекстных замен" как конвертор вполне даже работает > > (собственно, HIP в RTF у меня она переводит). > > Под конвертером я понимаю перевод в славянский _гражданки_. > > > Изготовить на ее же базе "упрощатель" ц.-сл. текста, делающий из HIP > > "гражданский" текст, -- дело одного часа. (Самое сложное -- > > настроить правильные раскрытия буквосочетаний с титлами.) > > А может все-таки проще от гражд. двигаться к слав., а не наоборот? > Опять же, есть много гражданских текстов... Неужели их теперь сканить > славянские и распознавать? Имхо нерационально. Прошу прощения -- я-то как раз предыдущее письмо понял в смысле конвертации В гражданку. В эту сторону проблем гораздо меньше, чем наоборот. Но и наоборот не совершенно глухо -- восстановитель из гражданки в ц.-сл. письменность сделать можно. То есть, конечно, это будет не полноценное восстановление, но, по-видимому, довольно пристойное, где-нибудь с точностью до 5-10 ошибок на страницу. Хотя надо поэкспериментировать. А для этих экспериментов как раз и потребуется конвертор в гражданку. Чтобы действовать так: взять полноценный ц.-сл. текст, перегнать его в гражданку, потом обратно, и сравнить результат с тем, что было в самом начале. Обнаруженные расхождения анализируются, и по результатам этого анализа к "восстановителю" добавляются новые правила (слова). Процесс повторяется до тех пор, пока восстановление не дойдет до разумного качества (либо пока не станет ясно, что деятельность безнадежна ;-) ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 09 авг 2000 16:01:03 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RE: форум -------------------------------------------------------------------------------- > From: grinchuk@mvs2.adl.lsil.com [mailto:grinchuk@mvs2.adl.lsil.com]On > "Система контекстных замен" как конвертор вполне даже работает > (собственно, HIP в RTF у меня она переводит). Под конвертером я понимаю перевод в славянский _гражданки_. > > Изготовить на ее же базе "упрощатель" ц.-сл. текста, делающий из HIP > "гражданский" текст, -- дело одного часа. (Самое сложное -- > настроить правильные раскрытия буквосочетаний с титлами.) А может все-таки проще от гражд. двигаться к слав., а не наоборот? Опять же, есть много гражданских текстов... Неужели их теперь сканить славянские и распознавать? Имхо нерационально. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 09 авг 2000 10:36:56 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: форум -------------------------------------------------------------------------------- "Alexander V. Voinov" wrote: > > Изготовить на ее же базе "упрощатель" ц.-сл. текста, делающий из HIP > > "гражданский" текст, -- дело одного часа. (Самое сложное -- > > настроить правильные раскрытия буквосочетаний с титлами.) > > И в нужном регистре? Частично. Ясное дело, что "Его" от "его" такими простыми средствами не отличить. А вот, скажем, сделать заглавные буквы в начале предложений очень даже можно (даже если в оригинале их не было). Или писать с заглавной буквы слова, которые были с титлами. > А по поводу обратного перевода, может быть - методом лома? Набрать (в смысле - в одном > месте собрать ;) текстов в ц.с. побольше, прогнать через упрощатель, один раз руками > пройтись, после чего обратное преобразование делать с помощью получившегося словаря. Есть такая задумка. Пока что для нее надо выверить побольше текстов (относительно "Елисаветы" такая деятельность ведется). Что касается собирания всех текстов в одном месте, то давайте для начала хотя бы информацию соберем (пусть даже прямо здесь) -- где и что лежит, и в каких физических форматах (TXT, RTF, DOC...). Как народ относится к тому, чтобы завести на "Печатном дворе" раздел "Библиотека", где лежали бы (в пределе) сконвертированные в HIP версии всех этих текстов? (Как запасной вариант -- прямые ссылки на хранящиеся где-то тексты в других форматах, то есть "текст такой-то лежит там-то", а не просто "на таком-то сайте есть славянские тексты".) От текстовладельцев неплохо бы получить "конвертабельные" варианты (например, сохраненные в виде .RTF -- с ними разбираться вполне можно, независимо от используемых шрифтов, пусть даже и Уникодовских). С форматом .DOC уже возникают проблемы, а с PageMaker'ом -- тем более. > Редактировать же _все равно_ надо, т.к. никакая формальная система не выставит > правильные ударения в сочетании "вся красная мира сего" и пр. Но никто не запрещает нам выяснить самые "типичные" ударения и использовать их. Скажем, в данном случае: почти наверняка вариант ВСЯ^ встречается на порядок чаще, чем ВСЯ`. А потом можно учесть информацию из предыдущего слова в следующем. По крайней мере наиболее частотные сочетания так вполне восстанавливаются. Аналогично будет и с восстановлением буквы: ми'ра -- мi'ра -- мv'ра. Если "сего", то вариант определяется с точностью 99%. > Конечно, это можно усовершенствовать с помощью таблицы окончаний из > Гамановича, но для ятей все равно нужен словарь. Не только для ятей и не просто словарь, а (по большому счету) полный грамматический анализатор. М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 09 авг 2000 09:37:46 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: форум -------------------------------------------------------------------------------- HI Mikhail Grinchuk wrote: > Изготовить на ее же базе "упрощатель" ц.-сл. текста, делающий из HIP > "гражданский" текст, -- дело одного часа. (Самое сложное -- > настроить правильные раскрытия буквосочетаний с титлами.) И в нужном регистре? А по поводу обратного перевода, может быть - методом лома? Набрать (в смысле - в одном месте собрать ;) текстов в ц.с. побольше, прогнать через упрощатель, один раз руками пройтись, после чего обратное преобразование делать с помощью получившегося словаря. Редактировать же _все равно_ надо, т.к. никакая формальная система не выставит правильные ударения в сочетании "вся красная мира сего" и пр. Конечно, это можно усовершенствовать с помощью таблицы окончаний из Гамановича, но для ятей все равно нужен словарь. Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 09 авг 2000 08:06:07 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: форум -------------------------------------------------------------------------------- Доброе утро! Gleb Arkhangelsky wrote: > Вопрос: "система контекстных замен" может работать как конвертер? Хотя > бы на некий процент? С возможностью доводки? Не знаю как библеистам > (хотя полагаю тоже пригодился бы), а вот литургистам побочный продукт в > виде гражданского текста весьма необходим (бо народ необучен славянщине > в массах своих). Тем паче сей продукт на настоящий момент обычно > первичен (его уже много, и не хотелось бы бросать). Да и сканировать > гражданские богосл. книги все же легче, чем славянские - текст плотнее, > распознается лучше, книги есть много у кого. "Система контекстных замен" как конвертор вполне даже работает (собственно, HIP в RTF у меня она переводит). Изготовить на ее же базе "упрощатель" ц.-сл. текста, делающий из HIP "гражданский" текст, -- дело одного часа. (Самое сложное -- настроить правильные раскрытия буквосочетаний с титлами.) М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 09 авг 2000 07:33:38 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AG" Тема: RE: Re[2]: форум -------------------------------------------------------------------------------- > Subject: Re: Re[2]: форум Вот стоило в отпуск уехать, и народ озверел. :-) Форум - это же жутко неудобно?! Или по крайней мере давайте сделаем как на egroups.com - кто хочет, работает в форумном режиме, а кто хочет - получает почтой. Инет-то денег стоит у некоторых людей, простите за меркантильность! Да не столько деньги дороги, сколько время. А с этими форумами - страшно все коряво устроено. Но насчет публичности - архиверно. Обратите внимание -какой-то буржуйский монастырь на питерскую Начинку уже клюнул. :-) Отсюда следует, Алексей Анатольич, что служба рекламы и маркетинга у вас поставлена не ахти как. :-) О Елизавете надо громко и долго трубить - тогда пираты не будут иметь с ваших текстов денежки, а глупые буржуи лучше пришлют их вам, чем Начинкину. Кстати на этом егрупсе - куча буржуиноязычных православных эх (сам подписан на ustav и typicon). А в них много разных попов, дьяконов, чтецов и просто мирян со всего света. Почему туда не кинуть по письмецу? Сделайте рекламный текстик на английском, и забросим. Хотя бы я в уставоведческие с просьбой раскидать по остальным (благо елизавета денег не берет - рекламируем с чистой совестью где попало). Вопрос: "система контекстных замен" может работать как конвертер? Хотя бы на некий процент? С возможностью доводки? Не знаю как библеистам (хотя полагаю тоже пригодился бы), а вот литургистам побочный продукт в виде гражданского текста весьма необходим (бо народ необучен славянщине в массах своих). Тем паче сей продукт на настоящий момент обычно первичен (его уже много, и не хотелось бы бросать). Да и сканировать гражданские богосл. книги все же легче, чем славянские - текст плотнее, распознается лучше, книги есть много у кого. ---- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 09 авг 2000 07:33:36 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RE: Уникодные дела -------------------------------------------------------------------------------- > From: Vlad Dorosh [mailto:vvdorosh@mtu-net.ru] > >24.07.00. И мой ответ "Пря о Билли по прозвищу "бульдозер". :-) > > > > > Я не нашел ответа про бульдозера почему-то :( Может, удалили > оффтопиком? Это я его уезжая не сумел послать, теперь послал. Но главное-то было в письме Забавина - какая-то умная ругань в адрес уникода, коей я не понял на 40%, а с остальными 60% согласился. ---- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 03 авг 2000 15:23:36 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: a few bugs in www.slavonic.orthodoxy.ru -------------------------------------------------------------------------------- > Vladimir Volovich wrote: > > > на странице http://www.slavonic.orthodoxy.ru/fonts.asp > > имеются неправильные линки: > > (...) > > <версия> указывает на > > http://www.slavonic.orthodoxy.ru/fonts/irmologion2 > > тогда как правильная ссылка -- > > http://www.slavonic.orthodoxy.ru/fonts/irmologion2.zip > > На http://www.pechatnyj_dvor.boom.ru починено. Спасибо. > На основном сайте тоже все исправлено. Алексей =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 03 авг 2000 12:52:34 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: a few bugs in www.slavonic.orthodoxy.ru -------------------------------------------------------------------------------- Доброе утро! Vladimir Volovich wrote: > на странице http://www.slavonic.orthodoxy.ru/fonts.asp > имеются неправильные линки: > (...) > <версия> указывает на > http://www.slavonic.orthodoxy.ru/fonts/irmologion2 > тогда как правильная ссылка -- > http://www.slavonic.orthodoxy.ru/fonts/irmologion2.zip На http://www.pechatnyj_dvor.boom.ru починено. Спасибо. М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 03 авг 2000 12:22:15 От: Vladimir Volovich Кому: font-list@orthodox.tstu.ru Тема: a few bugs in www.slavonic.orthodoxy.ru -------------------------------------------------------------------------------- Hi, на странице http://www.slavonic.orthodoxy.ru/fonts.asp имеются неправильные линки: 1) > Существует более новая <версия>, несовместимая с этими > текстами. Конвертация текстов проекта "Елисавета" в эту версию шрифта > не предусматривается. <версия> указывает на http://www.slavonic.orthodoxy.ru/fonts/irmologion2 тогда как правильная ссылка -- http://www.slavonic.orthodoxy.ru/fonts/irmologion2.zip 2) > Дополнительные шрифты можно найти <здесь>. <здесь> указывает на: http://www.slavonic.orthodoxy.ru/C:%5Cprojects%5Cfontlist%5Cweb%5C-=ORTHODOX-FONT=-%20Project.htm Просьба поправить. :) Best, v. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 01 авг 2000 17:27:12 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" , "Sergey Skomorokhov" Тема: Re: Re[2]: форум -------------------------------------------------------------------------------- Рад видеть Вас здесь, Сергей. > Плюсом можно бы назвать вовлечение бОльшего числа людей, способных, также, вводить тексты, обмениваться введенными, давать (иногда полезные)советы и задавать приоритеты по введению текстов - что вводить в первую и что во вторую очередь, создавать объединенную базу текстов. > Кстати, интересно, что стоит сейчас в первой очереди на перевод? Пока я вижу больше плюсов, чем минусов. Нужен единый центр по всем церковно-славянским делам. Наш сайт на orthodoxy.ru на это, кажется, не годится по причине нестабильной работы. Приоритетом я сейчас считаю сканирование Библии и создание расширяемой системы сканирования текстов. Собственно, то, что сделал Михаил уже таковой является и осталось лишь сделать документацию по созданию шаблонов, сделать несколько готовых файлов шаблонов и распространять (вычистив, разумеется, все глюки). Я только что написал Егору Начинкину, предлагая ему все-таки объединить усилия. Аще интереса с его стороны не будет, в ближайшие дни я усаживаю человека за круглосуточное сканирование Библии. Я еще не определился с разрешением, но если есть хоть какая-то польза от 600 dpi в отличие от 300, буду делать на 600. Хотелось бы узнать мысли Михаила и всех остальных по поводу технологии работы. Понятно, что первичное распознавание буду делать я. А дальше? Алексей ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 01 авг 2000 16:30:19 От: "Sergey Skomorokhov" Кому: font-list@orthodox.tstu.ru Тема: Re[2]: форум -------------------------------------------------------------------------------- Здравы буди братие (правильно написал?)! Плюсом можно бы назвать вовлечение бОльшего числа людей, способных, также, вводить тексты, обмениваться введенными, давать (иногда полезные)советы и задавать приоритеты по введению текстов - что вводить в первую и что во вторую очередь, создавать объединенную базу текстов. Кстати, интересно, что стоит сейчас в первой очереди на перевод? ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 01 авг 2000 15:50:46 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: форум -------------------------------------------------------------------------------- И еще один плюс: проще понять, какая реплика на какую отвечает. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 01 авг 2000 15:25:15 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: форум -------------------------------------------------------------------------------- A A G wrote: > Братья, > > Нам предлагают сделать отдельную комнату в Православной Беседе > http://beseda.mscom.ru/forum/ ). Нужно нам сие или нет? Плюсы: агитация и пропаганда. Минусы (если полностью туда переселяться): 1) к сообщениям на форуме затруднительно прицеплять attach; 2) тамошний софт слишком умный -- кое-какие символы пытается перекодировать по своему разумению. А нам бы нужна буквальная точность. И еще скорее минус: нас будут видеть роботы поисковых систем. М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 01 авг 2000 15:08:08 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" , "Vlad Dorosh" Тема: форум -------------------------------------------------------------------------------- Братья, Нам предлагают сделать отдельную комнату в Православной Беседе http://beseda.mscom.ru/forum/ ). Нужно нам сие или нет? Алексей =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 30 июл 2000 01:07:56 От: Vlad Dorosh Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re[2]: Славянская Библия, шрифты. -------------------------------------------------------------------------------- Saturday, July 29, 2000, 7:07:21 PM, AAG wrote: > А есть ли в шрифте интересные идеи в плане 8-ми битовой реализации > славянщины? Или и тут все из Вашего шрифта унаследовано? Интересного ничего не нашел. Лигатуры с диакритиками просто свалены в кучу, только те, что были нужны для отображения текста. Собственно, даже 8-битности здесь не требуется. Можно использовать 16 бит, и даже вообще без Юникода, рисуя буквы по конкретным номерам глифов, 32 бита. Это ж закрытый проект, для рисования текста доступен весь мощный API виндов. Нас же удерживает универсальность и прозрачность наших шрифтов для любых программ сторонних разработчиков. > Вообще-то, Егор Начинкин немало потрудился именно над тем, чтобы спрятать > шрифты... Даже отказался от этого от совместимости с NT, если только не > наладил это дело за истекшие два месяца. Зря прятал, выцарапывается легко. При запуске используется что-нибудь типа API-шной AddFontResource (), регистрирующей фонт в виндах, при выходе ReleaseFontResource (), удаляющая его из системы. Но во время работы приложения шрифт доступен всей системе, его можно вытянуть и записать в файл. Я поступил проще: при запущенной "Библии" пустил ворд, набрал несколько символов появившимся в меню Hieronym-ом, записал документ с опцией "Внедрять шрифты TrueType", нашел его в документе, высчитал длину, выделил в файл, подарил расширение ttf. Делов-то на час... Пусть уж лучше работает прога в NT, имхо шрифт не самое главное. Тексты -- это ценно, шрифт -- оболочка. > А извлекать целые куски из Ирмологиона - не нарушение авторского права? :) > Мне Егор говорил, что он все сам сканировал. Вот и верь теперь людям. Ничего против не имею. Немного укололо то, что в копирайте шрифтов об Ирмологии ни слова. Да ладно, мы не гордые. Saturday, July 29, 2000, 7:41:21 PM, Федосов Сергей wrote: > Ну и сабж Вы выбрали, любезный. Меня чуть кондрашка не хватила. ;-) Звиняйте, панове, я ж нi на кого балонiв не катав... ;) Истории не зная, просто поделился наблюдением. Обшибся, если кого обидел -- извините. > Я против использования своего текста в любых проектах не возражаю, никаких > прав на славянский НЗ у меня, естественно, нет и быть не может. Вот и я поэтому на Ирмологий ограничений не накладываю особых. Рисунок гарнитуры ведь не я придумал... --- Влад Дорош ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 июл 2000 19:53:13 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: форум -------------------------------------------------------------------------------- Братья, А не имело бы смысл нам перенести дискуссию на web? Александр Иванов (Православная Беседа) выразил готовность помочь. Тогда уж мимо нашего проекта никто пройдет. Алексей =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 июл 2000 19:41:21 От: "Sergej Fedosov" Кому: "-=ORTHODOX-FONT=- Project Participants" , "Vlad Dorosh" Тема: Re: Исходники Славянской Библии -------------------------------------------------------------------------------- Ну и сабж Вы выбрали, любезный. Меня чуть кондрашка не хватила. ;-) >Очевидно, основой представленному в деме тексту послужил идентичный >тому, что лежит на Елизавете. Справедливости ради следует отметить, >очень хорошо выверенный и отредактированный. Ну да это и мы можем >сделать, сами. > >Вопрос к участникам проекта Елизавета: вам лучше известны подробности: >откуда взялась основа, как дорабатывалась. Есть какое-нибудь объяснение, >как ваш текст попал в коммерцию? Так там на сайте, по моему, всё написано. Основа НЗ - текст из моей программы "Славянская Библия". Алексей перевел его в другой шрифт и снабдил диакритикой. Я против использования своего текста в любых проектах не возражаю, никаких прав на славянский НЗ у меня, естественно, нет и быть не может. Кстати, любой желающий может скачать СБ и ц-славянский НЗ с нашего сайта http://come.to/sbible . Текст из программы "выкусывается" простым копированием, шрифт Ижица устанавливается при инсталляции. С уважением Федосов Сергей email: sergej@sbible.donetsk.ua www: http://come.to/sbible =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 июл 2000 19:34:39 От: "Sergej Fedosov" Кому: "-=ORTHODOX-FONT=- Project Participants" , "Vlad Dorosh" Тема: Re: Славянская Библия, шрифты. -------------------------------------------------------------------------------- >Кстати, даже если купить коммерческий >вариант, извлечь тексты будет не совсем легко -- демо-экзешник имхо >чем-то упакован (тексты и шрифты -- в нем), просто так тексты не >выцарапаешь. Есть, правда, передача видимой странички в Clipboard (в >виде простого текста, не RTF), при наличии шрифта текст можно увидеть >в ворде. Текст можно увидеть и без шрифта, если файл slavonic.exe запущен. Кстати, так можно конвертнуть текст в PDF и пользовать его в "твердой копии" на любой машине и без шрифта. http://jove.prohosting.com/~ggz/prices.htm : licence in November 2000 and later on for those who subscribe now individual licence Standard (for individual use on one machine only) 150 100 individual licence Plus (for individual use on one machine only) 200 120 STANDARD and PLUS The difference between a Standard licence and a Plus licence is that a Plus licence allows you (technically speaking, and not only from a legal point of view) to use the Old Slavonic font in other applications and type Old Slavonic easily by means of a special keyboard utility. You need a Plus licence, e.g., if you want to format beautifully your commentaries on the Bible (including quotations) in MS Word and then print them out. If you do not want to use the Old Slavonic font in other applications and do not need to type texts in Old Slavonic, the Standard licence must be your choice. >Впрочем, по-моему, даже извлечение шрифта -- это нарушение лицензии. Был бы текст, затем можно и переконвертировать его и под другой шрифт. С уважением Федосов Сергей email: sergej@sbible.donetsk.ua www: http://come.to/sbible =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 июл 2000 19:07:21 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" , "Vlad Dorosh" Тема: Re: Славянская Библия, шрифты. -------------------------------------------------------------------------------- > По поводу шрифтов в Славянской Библии. Церковно-славянский называется > Hieronymus, сделан на основе Ирмология -- многие символы совпадают > точь-в-точь (с учетом двойной конвертации), из оставшихся часто можно > выделить неизмененные элементы. Даже значок "стоянка запрещена" > оставлен. Все необходимые лигатуры "буква-диакритик" в одном шрифте. > Кому интересно, могу переслать. А есть ли в шрифте интересные идеи в плане 8-ми битовой реализации славянщины? Или и тут все из Вашего шрифта унаследовано? Кстати, даже если купить коммерческий > вариант, извлечь тексты будет не совсем легко -- демо-экзешник имхо > чем-то упакован (тексты и шрифты -- в нем), просто так тексты не > выцарапаешь. Есть, правда, передача видимой странички в Clipboard (в > виде простого текста, не RTF), при наличии шрифта текст можно увидеть > в ворде. Вообще-то, Егор Начинкин немало потрудился именно над тем, чтобы спрятать шрифты... Даже отказался от этого от совместимости с NT, если только не наладил это дело за истекшие два месяца. А выцарапать текст совсем несложно. Да только будет ли этот текст? Надо мне написать Егору опять с недоумением и вопросами по поводу его проекта. > > Впрочем, по-моему, даже извлечение шрифта -- это нарушение лицензии. А извлекать целые куски из Ирмологиона - не нарушение авторского права? :) Мне Егор говорил, что он все сам сканировал. Вот и верь теперь людям. Алексей Гришин =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 июл 2000 18:09:07 От: Vlad Dorosh Кому: -=ORTHODOX-FONT=- Project Participants Тема: Славянская Библия, шрифты. -------------------------------------------------------------------------------- Добрый день! По поводу шрифтов в Славянской Библии. Церковно-славянский называется Hieronymus, сделан на основе Ирмология -- многие символы совпадают точь-в-точь (с учетом двойной конвертации), из оставшихся часто можно выделить неизмененные элементы. Даже значок "стоянка запрещена" оставлен. Все необходимые лигатуры "буква-диакритик" в одном шрифте. Кому интересно, могу переслать. Кстати, даже если купить коммерческий вариант, извлечь тексты будет не совсем легко -- демо-экзешник имхо чем-то упакован (тексты и шрифты -- в нем), просто так тексты не выцарапаешь. Есть, правда, передача видимой странички в Clipboard (в виде простого текста, не RTF), при наличии шрифта текст можно увидеть в ворде. Впрочем, по-моему, даже извлечение шрифта -- это нарушение лицензии. --- Влад Дорош ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 июл 2000 05:25:27 От: Vlad Dorosh Кому: -=ORTHODOX-FONT=-ProjectParticipants Тема: Исходники Славянской Библии -------------------------------------------------------------------------------- Доброй ночи, отцы и братие! Скачал вот и посмотрел демоверсию Славянской Библии с http://jove.prohosting.com/~ggz/. Набрел на интересный факт: кажется, я понял, какая "хитрость" была применена для набора по крайней мере представленного там Евангелия от Иоанна. Текст, конечно же, содержит ряд ошибок -- примерно по десятку на главу, это тех, которые ловятся с первого, не очень глубокого синтаксического анализа. В основном надстрочники, неправильная простановка титл, явное отсутствие букв... Так вот, все (повторяю, ВСЕ!) встретившиеся мне ошибки обязательно содержатся в тексте, выложенном на Елизавете. Я проверил выборочно первую и шестую главу (конечные главы проверять не имеет смысла, на Елизавете там вовсе отсутствуют надстрочники). Привожу список найденных мною ошибок в Славянской Библии: (<номер главы>.<номер стиха>.<номер слова>. Если номер слова отрицателен, считать надо от конца стиха) 1.13.12 1.14.18 1.20.5 1.26.1 1.33.-1 1.37.-2 1.38.5 1.41.-1 1.46.4 6.2.9 6.4.-1 6.11.9 6.19.10 6.27.13 6.33.3 6.45.4 6.55.4 6.68.10 В "елизаветинском" тексте ошибок, конечно, гораздо больше (примерно 1:5 по отношению к рассматриваемому тексту в первой главе, дальше не смотрел), но это множество полностью поглощает Сл.Библию. И какие ошибки! Конечно, некоторое число совпадений можно было бы объяснить одинаково плохими местами печатного оригинала, давших сходные ошибки при распознавании. Но все! Ведь "елизаветинский" текст, по-моему, еще и вручную правился после OCR. Очевидно, основой представленному в деме тексту послужил идентичный тому, что лежит на Елизавете. Справедливости ради следует отметить, очень хорошо выверенный и отредактированный. Ну да это и мы можем сделать, сами. Вопрос к участникам проекта Елизавета: вам лучше известны подробности: откуда взялась основа, как дорабатывалась. Есть какое-нибудь объяснение, как ваш текст попал в коммерцию? Насчет шрифта. Имхо очень похоже половина символов взята из Ирмология. Сейчас попробую извлечь его из экзешника, тогда можно будет сказать точно. Но даже если и так, ничего против пока не имею, жаль только, что другая половина изуродована паче терпения очей моих. Не я же придумывал когда-то гарнитуру -- спецы в словолитне синодальной, весьма хорошее имевшие представление о законах удобочитаемости шрифтов... Вообще имхо даже Ирмологий не следует использовать на малом разрешении экранных шрифтов. Сверстать текст для печати -- еще можно потерпеть "кривизну" растеризованных букв, но для чтения с экрана... Там другие гарнитуры есть, попроще. По поводу Юникода -- начал было письмо, но наткнулся тут на статью Ермолаева (редактор "Книжица"). Пожалуй, спишусь сначала с ним, очень похожие мысли высказывает. Кстати, Глеб, пришлите все-таки мне копию вашего письма про бульдозера-Билли, нету его на Ру.Литургике. --- Влад Дорош ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 июл 2000 18:30:24 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Уникодные дела -------------------------------------------------------------------------------- А вот еще один наш старый знакомый что делает. И тоже, что характерно, хочет объединяться. http://www.chat.ru/~st_ign/f_ctf.htm ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 июл 2000 18:21:40 От: "Vlad Dorosh" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Уникодные дела -------------------------------------------------------------------------------- From: Gleb Arkhangelsky Date: Tuesday, July 25, 2000 16:40 Subject: Уникодные дела >Воззрите, отцы, в ру.литургику - там Забавин такое прочувствованное >письмо про юникод написал, я ажно почти прослезился. :-) Интересно было >бы узнать ваше мнение на сей счет. >news://ddt.demos.su/fido7.ru.liturgica/ ,сабж "Мирянский устав бдения", >24.07.00. И мой ответ "Пря о Билли по прозвищу "бульдозер". :-) > Я не нашел ответа про бульдозера почему-то :( Может, удалили оффтопиком? --- Влад Дорош ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 июл 2000 06:18:01 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Pro vsjo srazu (ugolki) -------------------------------------------------------------------------------- Доброе утро! "Alexander V. Voinov" wrote: > > А причем тут эти *ML? У нас же обычный текстовый файл, в котором допустимы > > все символы ASCII плюс русские буквы. Если уж захочется "вклеить" туда > > HIP-код, то проблемы ровно те же, что для любых текстовых файлов -- > > уголки надо заменить на "<" и ">", а знак "&" -- на "&". Совершенно > > формальное преобразование, а на экране при просмотре *ML-гляделкой > > покажется как надо. Скорее чуть повозиться придется с разделением абзацев > > (если не использовать режим
...
). > > Формально все это так, но зачем создавать потенциальные неудобства > тогда, когда вроде ничего к этому не подталкивает. Насколько я помню, в > первых версиях стандарта угловых скобок не было, и не было необходимости > их вводить. Насколько задействован символ &, я в данный момент не помню. История вопроса такова. Сперва предлагалась система с неявными лигатурами (типа кs для 'кси') и без возможностей расширения набора символов. Там было нужно средство для разбиения лигатур (к\\s) и возникали нехорошие побочные эффекты при удалении комментариев (к%{нечто}s превращается в кs и возникает лигатура -- либо она же должна пониматься и в случае со вставленным комментарием). Народу это не понравилось, и неявные лигатуры исчезли, а взамен появились обозначения типа &{кс} -- что дало систему с потенциально бесконечным набором символов. Заодно эти же обозначения пригодились для единообразной записи вариантных букв (в частности, для i, е, о, ук-ик, s). Наконец, их было решено упростить, доведя до нынешнего варианта с уголками (тогда-то они и возникли). И тогда же для & было предложено значение символа склейки явных лигатур. А потом как некий возврат к первоначальной системе появилась версия HIP-5B, где для фиксированного конечного набора самых частых символов запись заменена на _xxx В принципе можно вместо уголков применять что-то другое -- например, квадратные скобки. Но тогда их сами придется как-то закодировать -- например, [(] и [)]. И для явной склейки лигатур тоже что-нибудь можно предложить (причем почти все равно, что -- ведь это вещь довольно редкая). Например, [++]. И еще придется подправить систему спецкомментариев. Скажем, вместо %<киноварь%> использовать %`киноварь%' или %\киноварь%/. > Действительно, формальные преобразования все равно в большинстве > содержательных случаев делать надо, однако я предвижу, что если вообще > существует потребность иметь более или менее читаемый > ц.с.-ascii-стандарт, то надо озаботиться тем, чтобы и произвольный > *ML-документ, составленный с его помощью, тоже был читаемым. Но зачем его читать прямо так, если есть *ML-гляделки типа тех же Интернет Експлореров и Нетскейпов? А имея в виду уклон в сторону Уникода, там вообще мало что можно будет просто так увидеть -- кириллица как таковая превратится в цифирь. > Да даже и безотносительно к ML, <з>, имхо, некрасиво. Но Z/z нелогично, а / -- тогда уж и нелогично, и некрасиво. М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 26 июл 2000 15:33:40 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Pro vsjo srazu (ugolki) -------------------------------------------------------------------------------- > Насколько задействован символ & я в данный момент не помню. Коль на то пошло, то и этот символ не без дела оставлен в HTML. Он ставится перед последовательностями, передающими нестандартные символы. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 26 июл 2000 01:54:40 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Pro vsjo srazu (ugolki) -------------------------------------------------------------------------------- Hi Mikhail Grinchuk wrote: > > > К сожалению у меня совершенно нет сейчас времени всерьез участвовать в > > каких-либо дискуссиях, но с угловыми скобками однозначно: занимать их > > под что-либо, кроме тегов SGML/XML было бы в наше время полнейшим > > безумием. > > А причем тут эти *ML? У нас же обычный текстовый файл, в котором допустимы > все символы ASCII плюс русские буквы. Если уж захочется "вклеить" туда > HIP-код, то проблемы ровно те же, что для любых текстовых файлов -- > уголки надо заменить на "<" и ">", а знак "&" -- на "&". Совершенно > формальное преобразование, а на экране при просмотре *ML-гляделкой > покажется как надо. Скорее чуть повозиться придется с разделением абзацев > (если не использовать режим
...
). Формально все это так, но зачем создавать потенциальные неудобства тогда, когда вроде ничего к этому не подталкивает. Насколько я помню, в первых версиях стандарта угловых скобок не было, и не было необходимости их вводить. Насколько задействован символ & я в данный момент не помню. Действительно, формальные преобразования все равно в большинстве содержательных случаев делать надо, однако я предвижу, что если вообще существует потребность иметь более или менее читаемый ц.с.-ascii-стандарт, то надо озаботиться тем, чтобы и произвольный *ML-документ, составленный с его помощью, тоже был читаемым. Да даже и безотносительно к ML, <з>, имхо, некрасиво. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 июл 2000 23:54:44 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Pro vsjo srazu (ugolki) -------------------------------------------------------------------------------- > К сожалению у меня совершенно нет сейчас времени всерьез участвовать в > каких-либо дискуссиях, но с угловыми скобками однозначно: занимать их > под что-либо, кроме тегов SGML/XML было бы в наше время полнейшим > безумием. А причем тут эти *ML? У нас же обычный текстовый файл, в котором допустимы все символы ASCII плюс русские буквы. Если уж захочется "вклеить" туда HIP-код, то проблемы ровно те же, что для любых текстовых файлов -- уголки надо заменить на "<" и ">", а знак "&" -- на "&". Совершенно формальное преобразование, а на экране при просмотре *ML-гляделкой покажется как надо. Скорее чуть повозиться придется с разделением абзацев (если не использовать режим
...
). =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 июл 2000 22:36:17 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Pro vsjo srazu -------------------------------------------------------------------------------- Hi All, Mikhail Grinchuk wrote: > 2. Замечания по данному варианту HIP-?B. > > ИВ> z-образная буква З > > Логичнее <З>/<з> -- так виднее, что это именно вариант К сожалению у меня совершенно нет сейчас времени всерьез участвовать в каких-либо дискуссиях, но с угловыми скобками однозначно: занимать их под что-либо, кроме тегов SGML/XML было бы в наше время полнейшим безумием. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 июл 2000 22:18:03 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Pro vsjo srazu -------------------------------------------------------------------------------- > > Потому клич номер раз: кто готов для начала просто сканировать? > (Нужен Ветхий Завет, кроме Быт, Исх, Пс, Притчей и Ионы -- по > изданию 1900 года -- или его репринты 1993 и 1997 года.) > Я, кажется, договорился с человеком на предмет сканирования. Только мне сначала надо проверить, что будет, если увеличить разрешение. Хуже не будет, но вдруг шибко лучше? Алексей ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 июл 2000 22:05:51 От: "Mikhail Grinchuk" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Pro vsjo srazu -------------------------------------------------------------------------------- Доброе утро! Попытаюсь кое на что ответить. ИВ = Иер. Владимир СФ = Сергей Федосов АГ = Алексей Гришин 1. Просьба ко всем не называть измененные форматы так же, как исходные (за исключением разве что случаев обнаружения опечаток). Чтобы путаницы не было. 2. Замечания по данному варианту HIP-?B. ИВ> z-образная буква З Логичнее <З>/<з> -- так виднее, что это именно вариант именно буквы "земля", а не что-то само по себе. ИВ> Если есть возможность, то лучше избегать лишних ИВ> нововведений через угловые скобки. Например: ИВ> Ъ_I ъ_i буква Ы в форме ЪI Это можно было бы принять в том случае, если выкинуть из алфавита букву "ы" как таковую, считая ее парой "ь" + "i без точек". То есть (в терминах HIP-?B) тогда надо обозначать "ы" как ь_i А иначе возникает проблема с неоднозначным чтением лигатур: то ли ъ_i -- один знак, то ли два. ИВ> Примечание. Хотелось зафиксировать хотя бы нулевой уровень. ИВ> Ну, может, еще очевидные расширения. За. ИВ> А все остальное вводить по мере необходимости авторам ИВ> документов, раскрывая все вводимые обозначения в комментариях, ИВ> расположенных, например, в начале текстового файла. Это плохо, поскольку комментарии при конвертации куда-либо теряются. То есть в том случае, когда действительно в тексте надо обозначить некий новый значок, что-то такое пояснить про него придется, но лишь временно -- пока наш "UniOCS consortium" этот значок не стандартизует. ИВ> Про Примечание 5. Лигатурные обозначения с символом "&" не ИВ> нравятся мне совсем. А что делать? Альтернативные варианты тут, насколько вижу, такие: 1) вообще никак лигатуры не обозначать (В таком случае зачем мы различаем вариантные буквы? Конечно, в стандартном ц.-сл. книгопечатании ни того, ни другого и не встречается, но здесь речь идет о расширениях.) 2) использовать неявные лигатуры (Тогда не обойтись без знака для разбиения лигатур, а тогда рано или поздно придется ставить его между любыми соседними буквами -- а вдруг завтра очередное расширение объявит их лигатурой. Лучше уж использовать запись, "похожую" на неявные лигатуры, только в том случае, когда хотя бы один из соединяемых символов сам по себе существовать не может -- подобно "j", "_" (в HIP-?B) и надстрочным знакам.) 3) использовать для каждой лигатуры новый <...>-значок (Потребуется слишком много значков -- при расширении в глаголицу не меньше нескольких сотен, причем никогда не будет уверенности, что очередной документ не подарит еще десяток новых.) Мне &-система представляется предпочтительнее по таким причинам: 1) видно, из каких букв лигатура составлена; 2) а потому для целей формальной обработки текста (скажем, при составлении словника или при орфографической проверке) можно просто игнорировать символ "&"; 3) при визуализации (в случае отстутствия данной лигатуры в шрифтах) не возникает проблем из-за "неопознанных символов": можно, например, один раз заготовить для этого "&" символ типа подстрочной дужки с нулевой шириной. ИВ> ^^ облеченное ударение ИВ> ^ тонкое придыхание ИВ> ^^^ тонкое придыхание + облеченное ударение А чем плохи записанные в HIP-5 обозначения? ("^" для ударения и "=" для придыхания.) Знак "=" визуально не похож на придыхание? Но и "^^" на ударение тоже не очень-то... Или символ "=" набирать в каком-то редакторе неудобно? Так можно вообще (при наборе текста на "стандартном" ц.-сл. языке) придыхания не обозначать -- вставляя их потом автоматически по принципу "если первая буква слова -- гласная, и над ней нет титла, то ставь тонкое придыхание" (вроде бы исключений из этого правила нет). Впрочем, если хочется использовать "^" именно для придыхания, то это можно -- тогда "=" пусть будет облеченным ударением. ИВ> Все необходимые титла можно ввести в нулевой уровень. По определению нулевой уровень -- это то, что нужно для стандартной современной ц.-сл. орфографии. А там набор титл невелик. Естественнее остальные титла скинуть в "очевидные расширения". ИВ> <абзац> явный символ конца абзаца для HIP-?B предлагается более краткий вариант: _/ (заодно это напоминает значок на кнопке "enter") ИВ> \\ явный символ конца строки А что это такое? Чем отличается от: а) конца абзаца; б) символа "/"? ИВ> %к переход на красный цвет (киноварь) ИВ> %ч переход на черный цвет (конец киновари) Не радуют меня %квот такие обозначения: %чих понять, не споткнувшись на месте %кровном, %честь особенность только %копытных %часов -- да и %кони-%что вряд ли будут рады. Предлагаю оставить %<как было%>. Заодно, как оказалось, для текста Библии требуются обозначения для выделений %[разрядкой%] и %(петитом%) (в заголовках псалмов). Предлагается так, как в предыдущей фразе. ИВ> %{!паралл HIP-текст} возможное оформление параллельных мест ИВ> %{!сноска HIP-текст} возможное оформление сносок Нехорошо, чтобы некие элементы текста (состоящие из значков, явно видимых на бумаге) уходили в комментарии. Они ведь запросто исчезнут, если при туда-сюда конвертировании хоть один конвертор их примет за "обычные" комментарии. ИВ> ?%{!варианты Т1|Т2|Т3} альтернативные прочтения текста А что делать, если Т1 начинается с пробела? Но сама идея неких единообразных спецкомментариев -- типа {!имя значение} -- вполне разумная. Если еще в подобной записи заменить пробел на другой символ (скажем, запятую) -- будет и вовсе славно (снимется возражение про Т1). ========================= По поводу 16-битового представления -- напомните, как в нем записываются буквы с акцентами, если их надо составлять из двух отдельных символов. И будет ли в таком случае нужно подбирать разный символ акцента в зависимости от (скажем) высоты буквы? (В любом случае конвертировать между HIP и TXT/Unicode будет чрезвычайно просто, а RTF/Unicode не сильно хитрее обычного RTF/Irmologion или RTF/Izhitsa -- я себе стряпаю единый конвертор из RTF, который должен понимать все эти варианты.) ========================== СФ> Сначала сам, а затем по просьбе авторов посетил СФ> http://jove.prohosting.com/~ggz/ . Анонсируют сабж, СФ> причем называется так же, как и моя программа. Цены СФ> на софт немаленькие (только констатирую, их СФ> право), но вот что я подумал: может скинемся на СФ> комплект, вытащим текст ц-сл.Библии и выложим СФ> на сайт Алексея? Криминала в этом нет, ц-сл. текст - СФ> public domain. Не скрываю и своего интереса - СФ> подготовлю модуль для СБ. Что скажете? Присоединяюсь к сомнению о наличии у них этого самого текста. Ведь пока что они только объявили подписку на продукт, который только еще собирается появиться в будущем. =========================== АГ> Между прочим, Михаил Гринчук сделал ловкую систему АГ> для сканирования славянских текстов. Может он захочет АГ> ей поторговаться с автором того проекта. Он, кстати, АГ> добрый человек и не от хорошей жизни вынужден АГ> требовать деньги за такие вещи. [В последней фразе "он" = "автор", а вовсе не я ;-] СФ> Можно об этом поподробнее? За чем же тогда дело СФ> стало? Каково качество распознавания? С системой дела такие. Сканируется текст с разрешением 300 dpi, черно-белая картинка. На нее запускается хитрым образом обученный FineReader, а результат пропускается через несколько систем контекстных замен. То, что получается, правится вручную. Процесс занимает не более 15 минут на страницу, из которых 2/3 или больше -- та самая ручная правка (распознаватель часто теряет надстрочные знаки, причем обучением сие не лечится). Итого всю Библию можно где-то за 60 рабочих дней преодолеть. (А на самом деле меньше, ведь примерно треть объема уже имеется.) И это было после обучения по трем страницам. Готовый продукт (Быт+Исх) в HIP-5A см. на http://www.pechatnyj_dvor.boom.ru в разделе "Текстовый архив" (правда, потом там было отловлено еще несколько опечаток -- обновлю в ближайшие выходные). Потому клич номер раз: кто готов для начала просто сканировать? (Нужен Ветхий Завет, кроме Быт, Исх, Пс, Притчей и Ионы -- по изданию 1900 года -- или его репринты 1993 и 1997 года.) М. Г. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 июл 2000 19:39:16 От: "Sergej Fedosov" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AG" Тема: Re: Software с ц-славянским текстом -------------------------------------------------------------------------------- >Месяца два назад у них было лишь Евангелие от Иоанна. Вы точно знаете, что только Иоанн? Они сами сказали? Если так, то тему можно закрыть, и через год релиза не будет. В демке только Евангелие от Иоанна, но на то это и демонстрационка. А в загашнике может и весь текст быть. По себе знаю, подобная работа начинается с поиска текста. Написание оболочки - вторая ступень. >Сам создатель проекта говорит, что использовал некую хитрость. О том, какая >хитрость, не говорит Хитрости они разные бывают. Помните статью в "Мир Библии": "Мир Библии" ?1 1993 г. стр 107-108 ИНСТИТУТ ВОСТОКОВЕДЕНИЯ РОССИЙСКОЙ АКАДЕМИИ НАУК. КОНФЕРЕНЦИЯ "БИБЛИЯ И ЕЕ МИР" ... Геннадиевская Библия оказалась в центре внимания также и Русского Библейского Института в Санкт-Петербурге - об этом сообщил в своем докладе директор Института д-р А. Алексеев. На этот раз, однако, речь идет не о факсимильном воспроизведении рукописи, а о ее наборном издании с научно-критическим аппаратом. В процессе подготовки такого издания создается также и "компьютерная версия" Геннадиевской Библии, которая может оказать огромную помощь исследователям этого ценнейшего памятника нашей культуры - первой полной Библии на славянском языке. Может вся хитрость - оказаться в нужное время в нужном месте? >А не организовать ли нам серию статей в церковной печати с рассказом, >что где происходит и кто чем занимается? Не все ведь Интернетом балуются. >Но и не все, конечно церковную прессу читают... В "Православной Руси" последняя страничка - информационная. Они напечатают, наверно. >Михаил воплотил в жизнь витавшую в воздухе идею >натаскивания ФайнРидера на славянский текст, Можно об этом поподробнее? За чем же тогда дело стало? Каково качество распознавания? С уважением Федосов Сергей email: sergej@sbible.donetsk.ua www: http://come.to/sbible =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 июл 2000 18:52:37 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" , Тема: Re: Software с ц-славянским текстом -------------------------------------------------------------------------------- > Ну мраа-ааак... Это тут Алексей Анатольич со своими робятами корячились > больше года, а в это же время параллельно все другие люди сделали... До > чего доводит наша некоммуникабельность и малоподвижность, е-мое! (хотя > интересно - не содрали ли они с Елизаветы те тексты, которые там уже > были? И со шрифтом ихним было бы интересно познакомиться - по скриншотам > судя, дык вылитый ирмологион). Нет, текст они не сдирали, к тому же он до сих пор не выверенный. Месяца два назад у них было лишь Евангелие от Иоанна. Дему можно загрузить. Шрифт - самодельный. > Товарищей литургистов прошу обратить сугубое внимание на сей факт > (Волкова и Забавина особенно). Где гарантия, что наши набирания текстов > в один прекрасный момент не натолкнутся на такой же супердубляж? > (маленький пример - недавнее появление из подполья Дороша с его > воскресными и праздничными стихирами). Вам не кажется, что мы тычемся > головой в стенку вместо того, чтобы заглянуть через нее сверху и > обнаружить там человека с отбойным молотком? А не организовать ли нам серию статей в церковной печати с рассказом, что где происходит и кто чем занимается? Не все ведь Интернетом балуются. Но и не все, конечно церковную прессу читают... > Особенно интересно то, что эти ребята научились распознавать славянский > текст. Теперь большой еще вопрос - целесообразность написания > конвертера. Учитывая конечность количества цс текстов, возможно, более > рационально просто сканить их и распознавать. Тем паче, орфопроверятель > почти снимает необходимость в конвертере. Сам создатель проекта говорит, что использовал некую хитрость. О том, какая хитрость, не говорит. Значит не вельми хитрая. Интересно, что когда я сообщил ему, что Михаил воплотил в жизнь витавшую в воздухе идею натаскивания ФайнРидера на славянский текст, никакой реакции на это мое радостное сообщение не последовало. С чего бы? Если и впрямь у нас параллельные технологии, я почему-то думаю, что у Михаила получше сработано все. Мы с ним даже обсуждали возможность некой довольно гибкой системы для сканирования разных славянскх текстов. Дело в том, что у меня книжка с образцами распространенных шрифтов. Они весьма стандартны. Надо лишь найти их в книжках. Алексей ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 июл 2000 18:14:28 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RE: Software с ц-славянским текстом -------------------------------------------------------------------------------- > From: Sergej Fedosov [mailto:sergej@sbible.donetsk.ua] > Сначала сам, а затем по просьбе авторов посетил > http://jove.prohosting.com/~ggz/ . Анонсируют сабж, причем > называется также, > как и моя программа. Цены на софт немаленькие (только констатирую, их Ну мраа-ааак... Это тут Алексей Анатольич со своими робятами корячились больше года, а в это же время параллельно все другие люди сделали... До чего доводит наша некоммуникабельность и малоподвижность, е-мое! (хотя интересно - не содрали ли они с Елизаветы те тексты, которые там уже были? И со шрифтом ихним было бы интересно познакомиться - по скриншотам судя, дык вылитый ирмологион). Кстати, Влад высказывал идею славянского орфокорректора - они и это сделали. Надо имхо как-то сдружиться с этими товарищами. У них эти дела поставлены явно на более серьезной основе, чем у нас. Можно с них даже денег за написание конвертера содрать. :-) А также всякие планы с революционной Минеей и прочими подобными интересными штуками проталкивать. Товарищей литургистов прошу обратить сугубое внимание на сей факт (Волкова и Забавина особенно). Где гарантия, что наши набирания текстов в один прекрасный момент не натолкнутся на такой же супердубляж? (маленький пример - недавнее появление из подполья Дороша с его воскресными и праздничными стихирами). Вам не кажется, что мы тычемся головой в стенку вместо того, чтобы заглянуть через нее сверху и обнаружить там человека с отбойным молотком? Особенно интересно то, что эти ребята научились распознавать славянский текст. Теперь большой еще вопрос - целесообразность написания конвертера. Учитывая конечность количества цс текстов, возможно, более рационально просто сканить их и распознавать. Тем паче, орфопроверятель почти снимает необходимость в конвертере. Это пока материал для размышлений. Уезжаю в отпуск числа до 10 августа, по приезде могу попробовать сконтачиться с ними на предмет выпуска компакта с богослужебными текстами. Тут надо подумать а) что они нам могут дать (часть упомянута выше). б) что они и мы можем с этого поиметь. в) как при этом не подпасть под осуждение торговавших в храме. Жду предложений! ---- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 июл 2000 17:30:19 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Software с ц-славянским текстом -------------------------------------------------------------------------------- Насколько я знаю, у автора этого проекта были проблемы с финансированием. Не знаю, решил ли он их. Купить полную лицензию было бы и впрямь неплохо. Но пока нет еще самого продукта. Если, братья, проявите интерес, я могу возобновить переговоры. Между прочим, Михаил Гринчук сделал ловкую систему для сканирования славянских текстов. Может он захочет ей поторговаться с автором того проекта. Он, кстати, добрыйчеловек и не от хорошей жизни вынужден требовать деньги за такие вещи. Алексей Гришин > Господа, > > Сначала сам, а затем по просьбе авторов посетил > http://jove.prohosting.com/~ggz/ . Анонсируют сабж, причем называется также, > как и моя программа. Цены на софт немаленькие (только констатирую, их > право), но вот что я подумал: может скинемся на комплект, вытащим текст > ц-сл.Библии и выложим на сайт Алексея? Криминала в этом нет, ц-сл. текст - > public domain. Не скрываю и своего интереса - подготовлю модуль для СБ. Что > скажете? > > С уважением > > Федосов Сергей Алексеевич > Секретарь > Христианская библиотека > ул.Пинтера 18-27 > 83120 Донецк Украина > тел. 38-062-334-64-75 > email: sergej@sbible.donetsk.ua > www: http://come.to/sbible > "Славянская Библия" 1.5 Windows экономит Ваше время и деньги > > ЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪ9г83—ЭSЌ®€чrъЪ1ЁҐ.+-Іг «ѕ'ўs«¶ ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 июл 2000 16:31:42 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Уникодные дела -------------------------------------------------------------------------------- > From: Vlad Dorosh [mailto:vvdorosh@mtu-net.ru] > >16-битное мне сейчас кажется более важным, по нему есть > наработки, и его > >легче расширить. > > Что за наработки? Воззрите, отцы, в ру.литургику - там Забавин такое прочувствованное письмо про юникод написал, я ажно почти прослезился. :-) Интересно было бы узнать ваше мнение на сей счет. news://ddt.demos.su/fido7.ru.liturgica/ ,сабж "Мирянский устав бдения", 24.07.00. И мой ответ "Пря о Билли по прозвищу "бульдозер". :-) (кстати, Влад, это навеяно непосредственно вашей притчей о рождении юникода, так что вас особенно призываю туда воззреть :-). ---- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 июл 2000 12:47:09 От: "Sergej Fedosov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Software с ц-славянским текстом -------------------------------------------------------------------------------- Господа, Сначала сам, а затем по просьбе авторов посетил http://jove.prohosting.com/~ggz/ . Анонсируют сабж, причем называется также, как и моя программа. Цены на софт немаленькие (только констатирую, их право), но вот что я подумал: может скинемся на комплект, вытащим текст ц-сл.Библии и выложим на сайт Алексея? Криминала в этом нет, ц-сл. текст - public domain. Не скрываю и своего интереса - подготовлю модуль для СБ. Что скажете? С уважением Федосов Сергей Алексеевич Секретарь Христианская библиотека ул.Пинтера 18-27 83120 Донецк Украина тел. 38-062-334-64-75 email: sergej@sbible.donetsk.ua www: http://come.to/sbible "Славянская Библия" 1.5 Windows экономит Ваше время и деньги =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 24 июл 2000 20:53:20 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RE: Привет всем -------------------------------------------------------------------------------- > From: Vlad Dorosh [mailto:vvdorosh@mtu-net.ru] > программированию, например, на Билдере. Могу, впрочем, предста > вить на суд > некоторые соображения по поводу стандартизаии и реализации ЦС в одном > шрифте. > > Жду ответа, если меня еще кто-то услышит :) Ждем представления оных соображений. :-) ---- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 24 июл 2000 20:17:07 От: "Vlad Dorosh" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AG" Тема: Re: Привет всем -------------------------------------------------------------------------------- >16-битное мне сейчас кажется более важным, по нему есть наработки, и его >легче расширить. Что за наработки? --- Влад Дорош ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 24 июл 2000 18:40:12 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Привет всем -------------------------------------------------------------------------------- Могу, впрочем, представить на суд > некоторые соображения по поводу стандартизаии и реализации ЦС в одном > шрифте. Это очень насущно. Как показывает практика, есть пока необходимость как в 8-ми битном, так и в 16-битном моношрифтовом отображении славянского текста. 16-битное мне сейчас кажется более важным, по нему есть наработки, и его легче расширить. Алексей ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 24 июл 2000 17:45:28 От: "Vlad Dorosh" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Привет всем -------------------------------------------------------------------------------- Добрый вечер всем. Заинтересовался вашим проектом и хочу предложить свои силы для приложения к общем делу. Я некоторое время переписываюсь с несколькими участниками списка рассылки, и не писал сюда по причине полного отсутствия активности в течение двух последних месяцев. Алексей Гришин предложил мне заняться юникод-стандартом ЦСл-шрифтов, но, возможно, у участников будут другие предложения. Я могу заниматься дизайном шрифтов, не являясь специалистом в этой области, но более приспособлен к программированию, например, на Билдере. Могу, впрочем, представить на суд некоторые соображения по поводу стандартизаии и реализации ЦС в одном шрифте. Жду ответа, если меня еще кто-то услышит :) --- Влад Дорош ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 24 июл 2000 02:47:47 От: "ier. V." Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: HIP-5A, HIP-5B -------------------------------------------------------------------------------- Добрый день всем. A A G писал: > Что же мы братцы, замолчали? Прошу прощения за долгое отсутствие. Было мало времени в связи с праздниками и окончанием учебного года. Кроме того, ждал осуществления более регулярного и удобного доступа в И-нет. В прилагаемом файле находится конвертер из rtf (комплект шрифтов Ирмологион) в предлагаемый HIP-5В (немного отличается от того, что было в письме рассылки от 22 апреля 2000 г. 16:59). Работает в DOS-строке. Аргумент -- файл.rtf Результат -- файл.txt (если в каталоге есть файл с таким именем, то переписывается безжалостно). Файл.txt требует небольшой ручной (очевидной) доработки в текстовом редакторе (например в FAR). Если что-то не сработает, пишите. Или подправьте сами :)(исходники на Паскале прилагаются). С уважением, иер. Владимир =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 30 май 2000 21:10:51 От: "Gleb Arkhangelsky" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RE: -------------------------------------------------------------------------------- > From: A A G [mailto:lux@bigfoot.com] > Sent: Tuesday, May 30, 2000 2:35 AM > To: -=ORTHODOX-FONT=- Project Participants > Subject: > > > Что же мы братцы, замолчали? Или перевелись богатыри в земле Русской? Дык эта. Лев Евгеньич-то, главный двигатель прогресса, поник, приуныл, затих. Говорит, его не понимают, не разумеют, и ваще скоро конец света - зачем нам конвертер? Верно я говорю, Асланбек Тихоныч? Я боюсь, он не в командировке ли какой? Что-то его даже в РПТ не слышно на тему "Анаксиоса", что зело странно. ---- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 30 май 2000 02:34:41 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: -------------------------------------------------------------------------------- Что же мы братцы, замолчали? Или перевелись богатыри в земле Русской? =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 21 май 2000 15:04:55 От: "Gleb Arkhangelsky" Кому: Тема: А что с цс-стандартом? -------------------------------------------------------------------------------- Дык что, отцы, все так намертво и заглохло? Кажется уже почти дошли до результата. И противоречие-то имхо не фатальное - на зрительное восприятие ориентироваться или на слуховое. Какая в конце концов разница, если стандарт не для того предназначен, чтобы его постоянно без всяких посредствующих преобразований читать. ---- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 22 апр 2000 14:59:59 От: "Mikhail Grinchuk" Кому: Тема: HIP-5A, HIP-5B -------------------------------------------------------------------------------- Доброе утро! Предлагается новая версия HIP (варианты 5A и 5B). Обещанные конверторы (для HIP-5A) выложу на своем сайте (наконец обзавелся), а сюда напишу ссылку. М. Г. ============================================================= ПРОЕКТ ИНВАРИАНТНОГО ПРЕДСТАВЛЕНИЯ ЦЕРКОВНОСЛАВЯНСКОГО ТЕКСТА (версии 5A и 5B системы HIP) ============================================================= I. ОБЩИЕ ПРИНЦИПЫ 1. Инвариантное представление HIP предназначено для записи в "читаемой" форме церковнославянских текстов с сохранением всех деталей правописания. Оно в своей базовой форме не обязано представлять внеязыковые элементы текста и детали верстки: размер и вид шрифта, разного рода отступы, разбиение на строки, столбцы и страницы и т. п. Кодируются только слова (и числа) текста, знаки препинания, пробелы между словами и разбиение на абзацы. Однако базовое HIP содержит возможность отмечать часть текста как "пояснение" (сноски, параллельные места и т. п.). Также имеется возможность обозначать выделение киноварью. 2. В связи с тем, что церковнославянский язык изменялся со временем и его "современная" версия с достаточно четкими правилами правописания заметно отличается -- в том числе и по набору используемых символов -- от языка старых книг и тем более рукописей, элементы кодировки HIP могут быть отнесены к нескольким "уровням": уровень 0 -- набор символов для современной ц.-сл. печати (приблизительно с середины XIX века до наших дней); уровень 1 -- набор символов, встречающихся в печатных книгах предшествующих эпох, а также символы, применяемые для транслитерации глаголических памятников; уровень 2 -- набор символов, встречающихся в рукописях. Каждый следующий уровень отличается от предыдущего наличием обозначений для дополнительных символов. 3. Для использования внетекстовой информации (далее она именуется "комментариями") зарезервированы (пусть пока не полностью формализованные) механизмы ее возможной вставки. Любая конкретная реализация вставки внетекстовой информации далее называется "расширенным HIP". Примечание 1. Любой текст в виде базового HIP является текстом в расширенном HIP. Любой текст в расширенном HIP можно перевести в базовое HIP, удалив комментарии. Примечание 2 -- о корректности терминологии. Комментарий в "узком" смысле (некая пометка для памяти или кусок текста, "отключенный" от документа) тоже является внетекстовой информацией. 4. HIP является абстрактным 8-битовым представлением текста. Его конкретные реализации могут меняться в соответствии с различными возможными кодировками кириллицы. Поэтому в HIP-файлах разрешается использовать только символы, гарантированно присутствующие во ВСЕХ кодировках, пригодных для русского языка, а именно: 1234567890-=[]\;',./` A...Z А...Я !@#$%^&*()_+{}|:"<>?~ a...z а...я Кроме того, используются два "абстрактных белых символа": пробел и EOL (TAB, BS и проч. приравниваются к пробелу, а VT, FF, EOF и проч. -- к EOL). 5. В HIP визуально неразличимые символы и сочетания символов ("е" русское и "e" латинское, например) обозначают ВО ВСЕХ СИТУАЦИЯХ одно и то же. Более того, мы считаем неразличимыми строчные буквы, если соответствующие прописные неразличимы, и наоборот. Список "неразличимых" букв такой: Аа Вв Ее Кк Мм Нн Оо Рр Сс Тт Уу Хх Aa Bb Ee Kk Mm Hh Oo Pp Cc Tt Yy Xx 6. По этой причине (но не только) HIP не замечает пробелов рядом с EOL, рассматривает любое число соседних пробелов как один и любое число пустых строк (строк, состоящих только из пробелов) как одну -- логический конец абзаца. Одиночный символ EOL (пустая строка -- это пара EOL'ов) эквивалентен пробелу. 7. В HIP включено обозначение для явного конца абзаца (см. ниже). Оно эквивалентно паре символов EOL EOL (то есть пустой строке) и так же, как эта пара символов, взаимодействует с соседними пробелами и EOL. 8. Желательно, чтобы HIP-закодированный текст был "читабельным" и без применения каких-либо программ. 9. Также желательно, чтобы HIP-текст как можно проще переводился из uppercase в lowercase и обратно. (Из этих соображений в многобуквенных обозначениях предусмотрены синонимы типа JА и Jа.) 10. В данном документе описываются два варианта кодировки HIP (в основном сходные); в дальнейшем одна из них будет отброшена. А пока они именуются HIP-5A и HIP-5B. В тех случаях, когда между ними разницы нет, говорим просто "HIP-5" или "HIP" (потому что HIP-4 и предыдущие версии считаются более не существующими). II. ПОЧТИ ФОРМАЛЬНАЯ ГРАММАТИКА HIP HIP-ТЕКСТ есть последовательность вида Р[0] С[1] Р[1] С[2] Р[2] ... С[N-1] Р[N-1] С[N] Р[N] где С[1] ... С[N] -- СЛОВА, а Р[0] ... Р[N] -- РАЗДЕЛИТЕЛИ (Р[0] и Р[N] могут отсутствовать, остальные элементы обязательны) РАЗДЕЛИТЕЛИ бывают двух сортов: РАЗДЕЛИТЕЛИ_СЛОВ и РАЗДЕЛИТЕЛИ_АБЗАЦЕВ. РАЗДЕЛИТЕЛЬ_СЛОВ есть последовательность пробелов, EOL'ов и КОММЕНТАРИЕВ, содержащая не более одного EOL и не состоящая только из КОММЕНТАРИЕВ. РАЗДЕЛИТЕЛЬ_АБЗАЦЕВ есть последовательность пробелов, EOL'ов, явных символов конца абзаца и КОММЕНТАРИЕВ, не являющаяся РАЗДЕЛИТЕЛЕМ_СЛОВ и не состоящая только из КОММЕНТАРИЕВ. СЛОВО есть последовательность ЗНАКОВ и КОММЕНТАРИЕВ, содержащее хотя бы один ЗНАК. ЗНАК есть ПРОСТОЙ_ЗНАК или последовательность ПРОСТЫХ_ЗНАКОВ, соединенных символами "&". ПРОСТОЙ_ЗНАК есть БАЗОВЫЙ_ЗНАК за которым следует несколько (в том числе один или ни одного) АКЦЕНТОВ. КОММЕНТАРИЙ есть либо запись %{...}, внутри которой соблюдена парность фигурных скобок, либо байт-символ "%" плюс один непробельный байт-символ, отличный от "{". БАЗОВЫЕ_ЗНАКИ и АКЦЕНТЫ бывают такие: а) один непробельный байт-символ, отличный от: HIP-5A: % \ { } < > & j J HIP-5B: % \ { } < > & j J _ б) запись вида <...>, внутри которой не используются пробелы и байты-символы < > % { } в) один или несколько символов J и (или) j, за которыми следует ПРОСТОЙ_ЗНАК вида а) или б) г) (только в HIP-5B) записи _i _I _w _W _е _Е _о _О _у _У _кс _Кс _КС _пс _Пс _ПС __ _/ д) произвольный HIP-текст в фигурных скобках е) байт-символ "\" плюс один байт-символ ж) запись вида \{...}, внутри которой допустим произвольный HIP-текст Из них АКЦЕНТАМИ являются записи е) и ж), а также байты-символы = $ ' ` ^ ~ " (все остальные суть БАЗОВЫЕ_ЗНАКИ). Примечание 3. При наличии нескольких АКЦЕНТОВ они записываются слева направо и снизу вверх. Поэтому в сочетаниях придыхания с ударением сперва пишем знак придыхания, а потом знак ударения: =' =` =^ $' $` $^ Из тех же соображений буква "от" с паерком записывается как w\т\ъ, а буква "от" с титлом -- как w\т~ Примечание 4. Сама же по себе сочетаемость АКЦЕНТОВ друг с другом и с БАЗОВЫМИ_ЗНАКАМИ представляет собой вопрос не HIP-кодировки, а орфографической и типографской корректности текста, а потому в данном документе не оговаривается. III. ТАБЛИЦА КОДИРОВКИ БАЗОВОГО HIP И НЕКОТОРЫХ РАСШИРЕНИЙ. III.1. Алфавит III.1.1. Уровень 0 АБВГД абвгд соответствующие буквы Е е есть <е> "есть якорное" в кодировке HIP-5A _е "есть якорное" в кодировке HIP-5B <Е> формальный прописной вариант для <е> _Е формальный прописной вариант для _е ЖЗИЙКЛМН жзийклмн соответствующие буквы О о он (узкое начертание) <О> <о> он (широкое начертание) в кодировке HIP-5A _О _о он (широкое начертание) в кодировке HIP-5B ПРСТ прст соответствующие буквы У у ук (гаммаобразное начертание) О<У> О<у> о<у> ук (диграф оу) в кодировке HIP-5A О_У О_у о_у ук (диграф оу) в кодировке HIP-5B <У> <у> ик (числовой знак 400) в кодировке HIP-5A _У _у ик (числовой знак 400) в кодировке HIP-5B ФХЦЧШЩЪЫЬ фхцчшщъыь соответствующие буквы Ю ю буква Ю Я я юс малый F f фита I i иже-и десятеричное (с двумя точками, которые исчезают при наличии любого акцента) "i" без точек в кодировке HIP-5A _I _i "i" без точек в кодировке HIP-5A S s зело U u юс большой V v ижица V" v" ижица с двумя штрихами W w омега омега красивая со своим акцентом в HIP-5A _W _w омега красивая со своим акцентом в HIP-5B W\т w\т буква "от" <КС>=<Кс> <кс> кси в кодировке HIP-5A _КС=_Кс _кс кси в кодировке HIP-5B <ПС>=<Пс> <пс> кси в кодировке HIP-5A _ПС=_Пс _пс кси в кодировке HIP-5B JА=Jа jа буква Я в виде "лигатуры" IА JЬ=Jь jь буква ять III.1.2. Уровни 1 и 2 самые частые символы: JЯ=Jя jя йотированный юс малый JU=Ju ju йотированный юс большой JЕ=Jе jе йотированное Е ("лигатура" IЕ) <З> <з> z-образная буква З <Ч> <ч> чашеобразное Ч <Ы> <ы> буква Ы в форме ЪI (другие варианты буквы Ы можно обозначать так: <ЬИ> <ЪИ> <ЬI_> <ЪI_>; если Ь и I еще и черточкой соединены, то тогда <Ь-I> <Ъ-I> <Ь-И> <Ъ-И> <Ь-I_> <Ъ-I_>) для глаголицы и босанчицы: <АН>=<Ан> <ан> носовое А (для глаголицы) G g дервь вариант буквы i ("i с крючком внизу"), используемый в транслитерации глаголицы <Я> <я> вариант юса малого в виде подчеркнутого А <Я_> <я_> вариант юса малого с соединенными чертой внизу ножками <Я.> <я.> вариант юса малого в виде А с "прогнутой вниз" горизонтальной линией прочие варианты букв: <ДГ>=<Дг> <дг> "д с крючком" перевернутое зело = зело в виде "z с крючком" зело в виде "z перечеркнутого" <ЛГ>=<Лг> <лг> "л с крючком" <НГ>=<Нг> <нг> "н с крючком" <О+> <о+> "о" с крестом в середине <О.> <о.> "о" с точкой в середине <О:> <о:> "о" с двумя точками в середине <ОО>=<Оо> <оо> сдвоенное "о" <О.О.>=<О.о.> <о.о.> сдвоенное "о" с точками в середине <|Т|> <|т|> m-образный вариант Т <ОV>=<Оv> <оv> форма буквы "ук" в виде "о с галочкой" (галочка=ижица) <Т> <т> высокий вариант Т <Ц> <ц> ч-(или у-)-образное Ц <Щ> <щ> вариант буквы Щ, выглядящий как Ш, где вместо 3-й палочки нарисовано <ч> <Ъ> <ъ> высокий вариант Ъ = высокий вариант ятя (перекрестие над строкой) = низкий вариант ятя (как бы склеенные гь) = вариант ятя, в котором черта загнута и слева доходит донизу JJЬ=Jjь jjь йотированный ять <Ю> <ю> перевернутое Ю = вариант буквы JА/jа с соединительной чертой по центру (а не сверху) вариант юса большого с двумя ножками вместо трех Л&Ю л&ю лигатура ЛЮ М&Ю м&ю лигатура МЮ Примечание 5. Лигатурные обозначения с символом "&" применяются в том случае, когда составной символ не является новой буквой и его можно без ущерба для орфографической правильности текста заменить последовательностью отдельно написанных букв. В противном случае применяются другие обозначения (см., например, JА, JЕ, <ЛГ>). III.2. Диакритика III.2.1. Уровень 0 ' острое ударение ` тяжелое ударение ^ облеченное ударение (оно же -- знак мягкости над согласными) = тонкое придыхание =' тонкое придыхание + острое ударение =^ тонкое придыхание + облеченное ударение =` тонкое придыхание + тяжелое ударение " два штриха (для ижицы) ~ простое титло \г = \Г г-титло \д = \Д д-титло \ж = \Ж ж-титло \з = \З з-титло \о = \О о-титло \р = \Р р-титло \с = \С с-титло \т = \Т т-титло (в том числе и как элемент буквы "от": w\т) \х = \Х х-титло \ъ = \Ъ паерок III.2.2. Уровни 1 и 2 $ густое придыхание $' густое придыхание + острое ударение $` густое придыхание + тяжелое ударение $^ густое придыхание + облеченное ударение \- покрытие (примерно то же, что титло, но оба края загнуты вниз) \. надстрочная точка \: две надстрочные точки \@ u-образный символ, употреблявшийся в смысле паерка между согласными (кавыка в качестве акцента) \^ взмет (для различения записей \с \{с} \{с}\^ -- неспецифицированное буквенное титло / выносная буква без взмета / выносная буква со взметом) \{...} произвольный надстрочный HIP-ТЕКСТ -- например, несколько выносных букв подряд или даже одна выносная буква, но кодируемая более чам одним байтом, типа \{<пс>} или \{jа} \б, \Б б-титло \в, \В в-титло \и, \И и-титло (два штриха) \к, \К к-титло \л, \Л л-титло \м, \М м-титло \н, \Н н-титло \п, \П п-титло \ц, \Ц ц-титло \ч, \Ч ч-титло \ш, \Ш ш-титло III.3. Знаки препинания III.3.1. Уровень 0 ! символ "!" ( символ "(" ) символ ")" , символ "," . символ "." (точка внизу строки) : символ ":" ; символ ";" ("удивительная") [ символ "[" ] символ "]" III.3.2. Уровни 1 и 2 <.> точка по центру строки <.:.> <.:.-> и т. п. -- различные составные знаки препинания III.4. Прочие символы III.4.1. Уровень 0 # знак для 1000 * 8-конечная звездочка (поднятая над строкой) + крестик простой 4-конечный с равными концами <+> крестик красивый <(+)> крестик в круге <\+/> крестик в нижнем полукруге - символ "-" (дефис) / символ "/" <> явный символ конца абзаца (HIP-5A) _/ явный символ конца абзаца (HIP-5B) <(:.> <.:)> "три точки, несовершенно окруженные" @ символ "кавыка" @&{...} символ "кавыка" и соответствующее ей примечание (в скобках может быть любой HIP-ТЕКСТ) III.4.1'. Уровень 0, дополнительные символы 0...9 арабские цифры _ пустое место, над коим можно ставить диакритические знаки (HIP-5A) __ пустое место, над коим можно ставить диакритические знаки (HIP-5A) {...} вставной HIP-ТЕКСТ <паралл>&{...} возможное оформление параллельных мест <сноска>&{...} возможное оформление сносок ? неясный или неоднозначный символ ?&{...} неясный или неоднозначный символ с пояснениями к нему (в скобках может быть любой HIP-ТЕКСТ) ?&{...|...|...} альтернативный тег III.4.2. Уровни 1 и 2 #& знак для 6000 (лигатура из знака для 1000 и перевернутого s) <вран> <колода> <тьма> и т. п. числовые знаки (их надо "прилигатуривать" к букве, чтобы она оказалась внутри: <тьма>&в = две тьмы = 20000) <покрытие>&{...} (многобуквенный) текст под общим покрытием <титло>&{...} (многобуквенный) текст под общим титлом III.5. Комментарии и спецкомментарии %- мягкий перенос %< переход на красный цвет (киноварь) %> переход на черный цвет (конец киновари) %{...} комментарии (внутри них символы { и } допустимы только при условии сохранения их парности) Некоторые комментарии являются "спецкомментариями", управляющими ходом работы тех или иных программ. Например: %{число} следующее "слово" является числом, которое особая программа может переводить из арабской записи в кириллицу или обратно. То есть записи "251" и "сн~а" всегда будут сохраняться "как есть", а вот "%{число}251" и "%{число}сн~а" могут переходить друг в друга. ============================================================= В Ирмологионе и других шрифтах обнаружены также разные другие значки, про которые надо решить, нужны ли они, и если нужны, то как их обозначить: 1) двойные кавычки (16-ричный код 22) -- предлагается <((> или <,,> для открывающих и <))> или <``> для закрывающих 2) крестик в круге (код 24) -- предлагается <(+)> 3) крестик в полуокружности снизу (код 26) -- предлагается <\+/> 4) там два крестика -- равноконечный (код 2b) и "красивый" (код 86); в какой-то старой Ижице были "красивый" и латинский. У нас есть как минимум два обозначения: + и <+> 5) две наклонные черточки (код 3d). Если это знак переноса, то в HIP-кодировке он не нужен; иначе, например, <=> 6) какое-то загадочное подчеркивание (код 5f) 7) вариант буквы "с", опускающийся под строку (код 63). Предлагается <с>/<С> 8) вертикальная черта (код 7c). Предлагается <|>, а простое "|" оставить как спецсимвол-разделитель в альтернативных тегах 9) знак солнышка (или непонятной валюты) (код a4). Надеюсь, что он тут по недоразумению 10) знак абзаца (перевернутое P) (код b6) -- то же самое В шрифтах от Linguist Software обнаружены сверх того такие символы (да, у них "старое И" от "нового" отличаются так же, как H и И): <:.> (3 точки треугольником) <.:.> (4 точки ромбиком) <.|.> (5 точек крестиком) <(:.> светлое <.:)> светлое <(+)> светлое М\р светлое крестик равноконечный светлый знак типа Ш\т с общей средней чертой <(.)> точка в кружочке <-> хвост (как бы для знаков <.:-> или <.:.->, которые бывают в рукописях) "о" узкое и широкое с одной и двумя точками внутри жирная точка по центру строки титла: без взмета: \д \м \т (2 варианта: с 3 и 2 ножками) \х \ж \з со взметом: \я \г \д \к \л \м \н \п \р \с \f \ц \ч \ш \щ \о =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 апр 2000 04:28:19 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: HIP-4 (s golosovaniem) -------------------------------------------------------------------------------- Доброе утро! iVSh wrote: > > И если пытаться во всех случаях с помощью подчеркивания обозначать > > сосуществующие в одном тексте варианты начертания, то "системности" > > в записи уже не будет. Потому как вариантов бывает и три, и четыре, > > а то и еще больше (даже в старопечатных книгах можно найти по три > > формы ятя или буквы Т -- на одной странице!). > > А у кого можно подробнее узнать про существующие инварианты > и про контекст, в котором они используются? (Насколько понимаю, вместо "инварианты" должно быть "варианты".) Про них пишут в любом учебнике по славянской палеографии (хотя это оносится почти исключительно к вариантам из рукописей). Могу попробовать насканировать разных картинок. Но системы -- в каком случае применяется то или иное начертание -- кроме как в стандартной ц.-сл. орфографии, вроде бы нигде больше нет (обычно упоминают о том, что при недостатке места, например, близко к концу строки, вместо обычных начертаний употребляют узкие, но высокие). В других случаях полный туман -- например, в выборе между З и Z. И, похоже, только наличие представительного корпуса текстов, набранных с воспроизведением всех особенностей графики, позволит выяснить, где написание было действительно произвольным, а где все же намечалась система. > > > А зачем нужны в) и г)? > > > > А без них трудно сконвертировать в арабские цифры текст, > > изначально набранный с кириллическими числами (...) > > Все равно не совсем понятно. > Ведь работа по разметке (в смысле трудоемкости) не проще просто > конвертации с подтверждениями по спорным словам-числам. Если по ходу работы с текстом его захочется несколько раз перекодировать, то использование разметки позволит затратить этот труд единожды, а не всякий раз при переходе к арабским числам. > > > А что, в кириллической записи где-то встречаются большие буквы? > > > > Если вся фраза набрана заглавными буквами, то и числа в ней > > тоже, наверное, должны быть такие. > > Но ведь мы акценты не разделяем для строчных и для прописных, а > используем одни и те же, оставляя нужную перекодировку на 'разумный' > конвертер. Так же можно, по моему, поступить и с числами. С акцентами проще: они определяются высотой буквы, над которой стоят. А число такой жесткой привязки не имеет. В предельном случае, если абзац состоит только из числа -- например, это год издания книги -- то и вообще ни к чему его не привяжешь. М. Г. P. S. Описание HIP-5 (оба варианта) будет готово после выходных. P. P. S. Найден некий текст с правилами дореформенного русского правописания: http://writer.newmail.ru/ortho.html =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 14 апр 2000 13:23:18 От: "iVSh" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: HIP-4 (s golosovaniem) -------------------------------------------------------------------------------- М.Г. wrote: > Стоп-стоп-стоп. Если изменение начертания есть особенность шрифта, > то мы это ВООБЩЕ НИКАК не обозначаем! (Или, если угодно, обозначаем > в спецкомментариях.) > > И если пытаться во всех случаях с помощью подчеркивания обозначать > сосуществующие в одном тексте варианты начертания, то "системности" > в записи уже не будет. Потому как вариантов бывает и три, и четыре, > а то и еще больше (даже в старопечатных книгах можно найти по три > формы ятя или буквы Т -- на одной странице!). А у кого можно подробнее узнать про существующие инварианты и про контекст, в котором они используются? > > А зачем нужны в) и г)? > > А без них трудно сконвертировать в арабские цифры текст, > изначально набранный с кириллическими числами (в том > же Word'е, например). Автоматическая посимвольная конвертация > сотворит а~, в~, г~ и так далее. Но если нам нужно перекодировать > это в арабские цифры, то сперва придется разметить -- где > слова (в), а где числа (г). Это уже не 100%-но автоматизируемая > работа, потому что есть числа, выглядящие неотличимо от > слов (сн~а = 251, w\т = 800, может и другие примеры есть). > Так что в) и г) нужны для такой разметки. Все равно не совсем понятно. Ведь работа по разметке (в смысле трудоемкости) не проще просто конвертации с подтверждениями по спорным словам-числам. > > > Между прочим, кириллическая запись числа содержит > > > больше информации, чем арабская -- потому что в ней > > > различаются маленькие и большие буквы. > > > > А что, в кириллической записи где-то встречаются большие буквы? > > Если вся фраза набрана заглавными буквами, то и числа в ней > тоже, наверное, должны быть такие. Но ведь мы акценты не разделяем для строчных и для прописных, а используем одни и те же, оставляя нужную перекодировку на 'разумный' конвертер. Также можно, по моему, поступить и с числами. иер. Владимир ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 12 апр 2000 07:28:26 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: HIP-4 (s golosovaniem) -------------------------------------------------------------------------------- Доброе утро! iVSh wrote: > Все-таки, если следовать системе (письмо от 25.03), логичней > Z-образную 'З' обозначить через _З, так как эти инварианты > встречаются внутри одного текста. То есть сделать > разделение м/у '_' и '< >' -расширениям не по уровням, > а по использованию в текстах. > > Повторюсь: > Если внутри одного текста буква имеет инварианты (подобно о или е), > то и обозначать один вариант через 'буква', а другой вариант через '_буква'. > Если же это изменение начертания есть просто особенность шрифта, > то использовать или просто 'буква', или (если нужно) <ххх>-расширение, > где 'ххх' не обязано подчиняться какой-либо системе, а должно быть только > общепринятым. Стоп-стоп-стоп. Если изменение начертания есть особенность шрифта, то мы это ВООБЩЕ НИКАК не обозначаем! (Или, если угодно, обозначаем в спецкомментариях.) И если пытаться во всех случаях с помощью подчеркивания обозначать сосуществующие в одном тексте варианты начертания, то "системности" в записи уже не будет. Потому как вариантов бывает и три, и четыре, а то и еще больше (даже в старопечатных книгах можно найти по три формы ятя или буквы Т -- на одной странице!). > > придется различать: > > > > а) арабскую запись, конвертируемую в кириллицу; > > б) арабскую запись, не конвертируемую в кириллицу; > > в) кириллическую запись, конвертируемую в арабскую; > > г) кириллическую запись, не конвертируемую в арабскую. > > > > Для отличия а) от б) можно (считая второй вариант более > > экзотическим) обозначать "перманентно арабские" цифры > > как спецсимволы, то есть <0>, <1> и так далее. > > Можно и так. Своим предложением я именно хотел разделить > арабскую и славянскую записи чисел, чтобы иметь возможность > представлять и то, и другое. > > > Для отличия в) от г) можно использовать какой-нибудь > > вариант спецкомментариев. Например, перед каждым > > кириллическим числом писать префикс %{число} или > > %{число 123}, если мы хотим продублировать числовое > > значение. > > А зачем нужны в) и г)? А без них трудно сконвертировать в арабские цифры текст, изначально набранный с кириллическими числами (в том же Word'е, например). Автоматическая посимвольная конвертация сотворит а~, в~, г~ и так далее. Но если нам нужно перекодировать это в арабские цифры, то сперва придется разметить -- где слова (в), а где числа (г). Это уже не 100%-но автоматизируемая работа, потому что есть числа, выглядящие неотличимо от слов (сн~а = 251, w\т = 800, может и другие примеры есть). Так что в) и г) нужны для такой разметки. > > Между прочим, кириллическая запись числа содержит > > больше информации, чем арабская -- потому что в ней > > различаются маленькие и большие буквы. > > А что, в кириллической записи где-то встречаются большие буквы? Если вся фраза набрана заглавными буквами, то и числа в ней тоже, наверное, должны быть такие. М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 12 апр 2000 06:16:38 От: "iVSh" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AGA" Тема: Re: Re[2]: HIP-4 (s golosovaniem) -------------------------------------------------------------------------------- > Спорили, спорили, писем написали вагон, а теперь голосуй вам - > переложили проблему на других... Не выйдет, голубчики! :-) Вы > достоинства и недостатки обеих систем сведите в эдакую понятную > табличку - а тут уж народные массы и взвесят. Иначе чесо ради было > спорить, можно было и сразу на голосование поставить. Мне представляются следующие различия: '_'-подход. +: более легкая читаемость на бОльшей части текстов -: более сложная реализация и все равно придется реализовать '< >'-механизм для расширения. '< >'-подход. +: Универсальность подхода к расширению символьного набора и облегчение труда программиста. -: Делается это в ущерб читаемости и некоторой системности. При таком подходе некоторые СТАНДАРТНЫЕ буквы ц/с печати будут выглядеть как символы расширения. иер. Владимир ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 12 апр 2000 06:06:31 От: "iVSh" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: HIP-4 (s golosovaniem) -------------------------------------------------------------------------------- Писал Mikhail Grinchuk > Не очень понятно, что этим мы выиграем (экономия памяти совершенно > копеечная, и ускорение реакции на ошибку тоже -- все равно она > обнаружится в той же строке текста). Зачем создавать себе же проблемы > из-за ограничений на длину имен? > > (Предлагается запретить использование внутри <...>-обозначений > следующих символов: пробел, EOL, <, {, }, %. При этом непарные > уголки будут обнаружены в пределах одного слова.) Хорошо > ОБРАЩЕНИЕ К НАРОДУ: выскажитесь по поводу возможных > двух систем. (А -- система без "_"-обозначений; > Б -- с оными.) Разница между ними такая: > > А Б > > Е круглое _e > I без точек _i > кси <кс> _кс > пси <пс> _пс > О широкое _o > омега красивая _w > ик _y > диграф ОУ o o_y > спецпробел _ __ (?) > конец абзаца <> _/ (?) > > (Спецпробел нужен, в частности, чтобы набирать учебные и тому > подобные тексты, когда показываются акценты "сами по себе", > не над буквами.) > > Но, вместе с тем, система Б также содержит <...>-обозначения, > в том числе и односимвольные. Например, <З> для Z-образной > буквы З или <Ы> для начертания ЪI. Я, понятно, за Б. Все-таки, если следовать системе (письмо от 25.03), логичней Z-образную 'З' обозначить через _З, так как эти инварианты встречаются внутри одного текста. То есть сделать разделение м/у '_' и '< >' -расширениям не по уровням, а по использованию в текстах. Повторюсь: Если внутри одного текста буква имеет инварианты (подобно о или е), то и обозначать один вариант через 'буква', а другой вариант через '_буква'. Если же это изменение начертания есть просто особенность шрифта, то использовать или просто 'буква', или (если нужно) <ххх>-расширение, где 'ххх' не обязано подчиняться какой-либо системе, а должно быть только общепринятым. > С ижицей ситуация несколько другая: там уникален акцент, а сама > буква совершенно "типовая". Поэтому и предложено V" -- стандартное > обозначение самой буквы и особый акцент. > > С красивой омегой не так: и буква особая, и акцент особый. Что можно > делать в принципе: > > 1) ввести единый значок для всего этого сочетания; > 2) использовать спецбукву с каким-либо стандартным акцентом; > 3) использовать стандартную омегу со спецакцентом; > 4) использовать спецбукву со спецакцентом. > > После некоторого размышления я стал склоняться к варианту > номер 1, хоть это и нарушает принцип разделения буквы и акцента. Я почти с самого начала был за это. _W -- и все. > Потому как ситуация с буквами "i" и "i без точек" довольно похожая. > Если хотеть полного единообразия, то придется считать обозначение > i/I соответствующим букве без точек, а i"/I" -- с точками. Надо ли? Зачем усложнять себе жизнь? > > Еще одно предложение. > > > > Числа в тексте, для удобства работы, представлять так: > > #{число арабскими цифрами}, а конвертируя в какой-нибудь > > формат или изображая его в окне редактора, строить > > представление автоматически. Т.е. #{125} = рк~_е > > По-моему, это излишне: цифры сами по себе служат указанием > на то, что "подразумевается" кириллическая запись. Мне это было сразу не очевидно. > Но если > учитывать все возможные варианты, то придется различать: > > а) арабскую запись, конвертируемую в кириллицу; > б) арабскую запись, не конвертируемую в кириллицу; > в) кириллическую запись, конвертируемую в арабскую; > г) кириллическую запись, не конвертируемую в арабскую. > > Для отличия а) от б) можно (считая второй вариант более > экзотическим) обозначать "перманентно арабские" цифры > как спецсимволы, то есть <0>, <1> и так далее. Можно и так. Своим предложением я именно хотел разделить арабскую и славянскую записи чисел, чтобы иметь возможность представлять и то, и другое. > Для отличия в) от г) можно использовать какой-нибудь > вариант спецкомментариев. Например, перед каждым > кириллическим числом писать префикс %{число} или > %{число 123}, если мы хотим продублировать числовое > значение. А зачем нужны в) и г)? > Между прочим, кириллическая запись числа содержит > больше информации, чем арабская -- потому что в ней > различаются маленькие и большие буквы. А что, в кириллической записи где-то встречаются большие буквы? иер. Владимир ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 12 апр 2000 04:40:09 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: HIP-4 (s golosovaniem) -------------------------------------------------------------------------------- Доброе утро! "Alexander V. Voinov" wrote: > Надо бы попробовать сначала, поэтому я и спрашивал про первую стабильную > версию ХИПа. У меня, например, нет возможности много экспериментировать, > поэтому я бы сконвертировал свои тексты в этот хип, и выложил. Чтобы > было на чем пробовать. Хотя наверное, уже и так есть, но не у меня. Получается некий порочный круг: чтобы получить "стабильную версию", нужно выбрать между А и Б, а чтобы выбрать, нужно экспериментировать... Поэтому на днях выложу сюда сразу оба варианта: HIP-5A и HIP-5B. (Причем для первого уже почти есть конверторы в RTF/Irmologion и обратно -- протестированные на всех файлах из Елисаветы; для второго их надо будет чуть-чуть подправить.) М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 12 апр 2000 00:30:22 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: HIP-4 (s golosovaniem) -------------------------------------------------------------------------------- Hi, Надо бы попробовать сначала, поэтому я и спрашивал про первую стабильную версию ХИПа. У меня, например, нет возможности много экспериментировать, поэтому я бы сконвертировал свои тексты в этот хип, и выложил. Чтобы было на чем пробовать. Хотя наверное, уже и так есть, но не у меня. Александр A A G wrote: > > > > > ОБРАЩЕНИЕ К НАРОДУ: выскажитесь по поводу возможных > > двух систем. (А -- система без "_"-обозначений; > > Б -- с оными.) Разница между ними такая: > > > > А Б > > Мне больше нравится система Б. В конце концов, система представления есть > вещь сугубо амбивалентная, кроме полноты от нее ничего другого требовать не > нужно. > > ЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪ9г83—ЭSЌ®€чrъЪ1ЁҐ.+-Іг«ѕ'ўs«¶ =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 11 апр 2000 21:09:52 От: AGA Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: HIP-4 (s golosovaniem) -------------------------------------------------------------------------------- Приветствую! Tuesday, April 11, 2000, 12:37:20 PM, рече Mikhail: MG> ОБРАЩЕНИЕ К НАРОДУ: выскажитесь по поводу возможных MG> двух систем. (А -- система без "_"-обозначений; Спорили, спорили, писем написали вагон, а теперь голосуй вам - переложили проблему на других... Не выйдет, голубчики! :-) Вы достоинства и недостатки обеих систем сведите в эдакую понятную табличку - а тут уж народные массы и взвесят. Иначе чесо ради было спорить, можно было и сразу на голосование поставить. -- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 11 апр 2000 15:29:36 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: HIP-4 (s golosovaniem) -------------------------------------------------------------------------------- > > ОБРАЩЕНИЕ К НАРОДУ: выскажитесь по поводу возможных > двух систем. (А -- система без "_"-обозначений; > Б -- с оными.) Разница между ними такая: > > А Б Мне больше нравится система Б. В конце концов, система представления есть вещь сугубо амбивалентная, кроме полноты от нее ничего другого требовать не нужно. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 11 апр 2000 12:37:20 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: HIP-4 (s golosovaniem) -------------------------------------------------------------------------------- Доброе утро! iVSh wrote: > > Резонно. Как насчет 100? > > Не многовато ли? > Если даже использовать только буквы, то получится > (32+26)^100 = 2,201908947838014146640150646494e+176 вариантов. > > м.б. 10? Не очень понятно, что этим мы выиграем (экономия памяти совершенно копеечная, и ускорение реакции на ошибку тоже -- все равно она обнаружится в той же строке текста). Зачем создавать себе же проблемы из-за ограничений на длину имен? (Предлагается запретить использование внутри <...>-обозначений следующих символов: пробел, EOL, <, {, }, %. При этом непарные уголки будут обнаружены в пределах одного слова.) > > Что можно сделать в принципе: > > > > 1) использовать только один механизм; > > 2) использовать оба, разделив их функции; > > 3) использовать оба как частичные или полные эквиваленты. > > > > В случае 1) нужна расширяемость, которую в "_"-механизм > > ввести можно, но это будет не слишком естественно: скажем, > > нечто вроде "_{...}". > > > > Вариант 2) можно использовать, например, так: с подчеркиванием > > обозначаются ВСЕ вариантные и специальные знаки > > СТАНДАРТНОГО ц.-сл. книгоиздания, И ТОЛЬКО ОНИ. > > Для этого нужна 100%-ная уверенность в том, что мы умеем > > это правильно определять. > > По моему, самый лучший -- вариант 2. > Ну а если мы что-нибудь и выпустим из виду, > то пусть оно войдет в расширенный HIP-4 (в виде ), > а затем в какой-нибудь HIP-5 или HIP-6 уже в нормальном виде. ОБРАЩЕНИЕ К НАРОДУ: выскажитесь по поводу возможных двух систем. (А -- система без "_"-обозначений; Б -- с оными.) Разница между ними такая: А Б Е круглое _e I без точек _i кси <кс> _кс пси <пс> _пс О широкое _o омега красивая _w ик _y диграф ОУ o o_y спецпробел _ __ (?) конец абзаца <> _/ (?) (Спецпробел нужен, в частности, чтобы набирать учебные и тому подобные тексты, когда показываются акценты "сами по себе", не над буквами.) Но, вместе с тем, система Б также содержит <...>-обозначения, в том числе и односимвольные. Например, <З> для Z-образной буквы З или <Ы> для начертания ЪI. (После "подсчета голосов" будет предложена очередная версия HIP-формата.) > > > Придыхание с тяжелым ударением не совсем подходит > > > (напр. слово Wле). Я бы назвал данный знак скорее 'придыхание > > > со взметом'. Можно обозначить ^\^ > > > > Нужно ли вводить новое обозначение, если специфика начертания > > в данном случае следует из особенной формы самОй буквы омега? > > Но ведь к ижице мы приставляем особый знак ", который больше > нигде не используется. > А 'придыхание со взметом' -- это, по моему, наиболее адекватное > смысловое выражение данного знака. Можно обозначить и просто \^ С ижицей ситуация несколько другая: там уникален акцент, а сама буква совершенно "типовая". Поэтому и предложено V" -- стандартное обозначение самой буквы и особый акцент. С красивой омегой не так: и буква особая, и акцент особый. Что можно делать в принципе: 1) ввести единый значок для всего этого сочетания; 2) использовать спецбукву с каким-либо стандартным акцентом; 3) использовать стандартную омегу со спецакцентом; 4) использовать спецбукву со спецакцентом. После некоторого размышления я стал склоняться к варианту номер 1, хоть это и нарушает принцип разделения буквы и акцента. Потому как ситуация с буквами "i" и "i без точек" довольно похожая. Если хотеть полного единообразия, то придется считать обозначение i/I соответствующим букве без точек, а i"/I" -- с точками. Надо ли? > Еще одно предложение. > > Числа в тексте, для удобства работы, представлять так: > #{число арабскими цифрами}, а конвертируя в какой-нибудь > формат или изображая его в окне редактора, строить > представление автоматически. Т.е. #{125} = рк~_е По-моему, это излишне: цифры сами по себе служат указанием на то, что "подразумевается" кириллическая запись. Но если учитывать все возможные варианты, то придется различать: а) арабскую запись, конвертируемую в кириллицу; б) арабскую запись, не конвертируемую в кириллицу; в) кириллическую запись, конвертируемую в арабскую; г) кириллическую запись, не конвертируемую в арабскую. Для отличия а) от б) можно (считая второй вариант более экзотическим) обозначать "перманентно арабские" цифры как спецсимволы, то есть <0>, <1> и так далее. Для отличия в) от г) можно использовать какой-нибудь вариант спецкомментариев. Например, перед каждым кириллическим числом писать префикс %{число} или %{число 123}, если мы хотим продублировать числовое значение. Итого: 251 -- число, которое можно конвертировать в кириллицу; <2><5><1> -- "вечные" арабские цифры; сн~а -- слово, а не число; %{число}сн~а -- число 251; %{число 251}сн~а -- то же. Между прочим, кириллическая запись числа содержит больше информации, чем арабская -- потому что в ней различаются маленькие и большие буквы. М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 08 апр 2000 10:42:09 От: "iVSh" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: HIP-4 -------------------------------------------------------------------------------- Добрый день! ----- Original Message ----- From: Mikhail Grinchuk Sent: Wednesday, April 05, 2000 3:19 PM Subject: Re: HIP-4 > Резонно. Как насчет 100? Не многовато ли? Если даже использовать только буквы, то получится (32+26)^100 = 2,201908947838014146640150646494e+176 вариантов. м.б. 10? > Что можно сделать в принципе: > > 1) использовать только один механизм; > 2) использовать оба, разделив их функции; > 3) использовать оба как частичные или полные эквиваленты. > > В случае 1) нужна расширяемость, которую в "_"-механизм > ввести можно, но это будет не слишком естественно: скажем, > нечто вроде "_{...}". > > Вариант 2) можно использовать, например, так: с подчеркиванием > обозначаются ВСЕ вариантные и специальные знаки > СТАНДАРТНОГО ц.-сл. книгоиздания, И ТОЛЬКО ОНИ. > Для этого нужна 100%-ная уверенность в том, что мы умеем > это правильно определять. По моему, самый лучший -- вариант 2. Ну а если мы что-нибудь и выпустим из виду, то пусть оно войдет в расширенный HIP-4 (в виде ), а затем в какой-нибудь HIP-5 или HIP-6 уже в нормальном виде. > Хотя упрек в неоднородности системы обозначений из-за > J-механизма тоже разумен. Можно J-обозначения взять > в те же уголки, и тогда останется всего два сорта знаков: > односимвольные и "нечто в уголках". Что скажете? J-обозначения очень естественны, и, кажется, нет резона от них отказываться просто ради единообразия. > > Придыхание с тяжелым ударением не совсем подходит > > (напр. слово Wле). Я бы назвал данный знак скорее 'придыхание > > со взметом'. Можно обозначить ^\^ > > Нужно ли вводить новое обозначение, если специфика начертания > в данном случае следует из особенной формы самОй буквы омега? Но ведь к ижице мы приставляем особый знак ", который больше нигде не используется. А 'придыхание со взметом' -- это, по моему, наиболее адекватное смысловое выражение данного знака. Можно обозначить и просто \^ > P. S. Если вместо U/u у нас будет <У>/<у>, то на U/u > очень естественно сажается юс большой (гораздо лучше, > чем на N/n). Соответственно, JU=Ju и ju -- йотированный > юс большой. Вот и замечательно. иер. Владимир ----------------------------------------- P.S. Еще одно предложение. Числа в тексте, для удобства работы, представлять так: #{число арабскими цифрами}, а конвертируя в какой нибудь формат или изображая его в окне редактора, строить представление автоматически. Т.е. #{125} = рк~_е ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 05 апр 2000 13:19:37 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: HIP-4 -------------------------------------------------------------------------------- Доброе утро! Orthodox Gymnasium wrote: > Если проблема только в том, на сколько символов > вперед смотреть, то можно предложить вместо п_с -- > _пс, аналогично вместо к_с -- _кс. В чем-то это лучше, хотя при обозначениях _пс и _кс (без явного символа "конца кода") становятся невозможными записи _п и _к для гипотетических вариантов букв П и К (в рукописях вроде бы попадались варианты буквы К, но не вполне уверен). > Но вообще, по-моему, лучше не заставлять человека > подлаживаться под машину, а машину заставить > подлаживаться под человека, если это человеку удобнее. Точно! Но еще надо учесть удобства для человека, который заставляет машину подлаживаться под... ;-) > Кстати, про уголки. Ведь для того, чтобы прочитать символ, > задаваемый парой уголков, все равно придется читать > несколько символов, к тому же сколько -- заранее неизвестно. > Может ограничить длину последовательности символов > внутри < > каким нибудь разумным числом? То есть, если > вы не встретили закрывающую скобку через N шагов, то > значит в записи ошибка, и нужно возвращаться к открывающей > скобке и там что-то делать. Резонно. Как насчет 100? > "_"-механизм я не хочу все же отвергать, поскольку он (по моему > субъективному мнению) может облегчить восприятие ц.с. текстов. > Всякие скобки по своей скобочной природе будут мешать > восприятию слова "в целом". Хотя, как пожелает большинство. Что можно сделать в принципе: 1) использовать только один механизм; 2) использовать оба, разделив их функции; 3) использовать оба как частичные или полные эквиваленты. В случае 1) нужна расширяемость, которую в "_"-механизм ввести можно, но это будет не слишком естественно: скажем, нечто вроде "_{...}". Вариант 2) можно использовать, например, так: с подчеркиванием обозначаются ВСЕ вариантные и специальные знаки СТАНДАРТНОГО ц.-сл. книгоиздания, И ТОЛЬКО ОНИ. Для этого нужна 100%-ная уверенность в том, что мы умеем это правильно определять. Или можно разделить так: все односимвольные обозначения оформляются с подчеркиванием, а все прочие -- в уголках. (Эта система бесконфликтно расширяется и на вариант 3, если допустить для односимвольных обе записи.) > > Эти изменения (существующие не во всех шрифтах) можно > > списать на лигатурные эффекты. (Так же можно поступить > > и с "от", но только для записи W_T, а не O_T. Или для > > записи W\т -- ведь разная форма т-титла и изменение > > начертания омеги тоже не обязаны присутствовать во всех > > шрифтах.) > > Не обязаны, или есть шрифты, где они действительно не > присутствуют? Вроде бы в Острожской Библии надстрочное Т той же формы, что в букве ОТ, применялось и в других случаях. Но сейчас проверить не могу. > > Итого: 5 вариантов вместо трех, причем по самому тексту понять, > > какой именно имеется в виду, нельзя -- нужно обращаться > > к спискам вариантов. И без этого текст даже нельзя разделить > > на буквы. А в HIP-записи сразу и однозначно выделяются > > "кандидаты в буквы", которые потом остается лишь проверить > > на допустимость. > > Для базового уровня можно было обойтись вообще одним > а)-вариантом. Но ведь мы все же ставим одной из целей > удобочитаемость и вводим, например, J-механизм. Почему > бы для удобства не ввести и "_"-механизм для изображения > одной буквы в разных начертаниях? Главная претензия была даже не по числу вариантов, а по сложности их распознавания. Хотя упрек в неоднородности системы обозначений из-за J-механизма тоже разумен. Можно J-обозначения взять в те же уголки, и тогда останется всего два сорта знаков: односимвольные и "нечто в уголках". Что скажете? > Наличие лигатуры или вязи также можно закодировать > при помощи < >. Автору текста ввести новую > <>-последовательность, а в начале текста просто сделать > комментарий по расшифровке вводимой последовательности. Категорически против введения новых <>-последовательностей по таким поводам! Потому что тогда число символов начнет неограниченно расти. > > Поскольку там [над красивой омегой] только один знак и бывает, > > его в принципе можно обозначать как угодно. В частности, по его: > > формальному значению: "апостроф", то есть придыхание с > > тяжелым ударением. > > Придыхание с тяжелым ударением не совсем подходит > (напр. слово Wле). Я бы назвал данный знак скорее 'придыхание > со взметом'. Можно обозначить ^\^ Нужно ли вводить новое обозначение, если специфика начертания в данном случае следует из особенной формы самОй буквы омега? > > Угловые скобки (точнее, пара "начало имени" и "конец имени") > > позволяют иметь систему (а) расширяемую, (б) в которой > > даже неизвестные символы совершенно формально > > "вылавливаются" из текста. > > Пусть угловые скобки и останутся для всякого расширения > множества символов. Но и в "базовом" комплекте они нужны, хотя бы для явного конца абзаца <>, значков типа <(:.> и <.:)> и других подобных случаев. В шрифтах Ирмологион есть еще несколько символов, про которые тут раньше не упоминалось, но которые, по-видимому, тоже нужны. Например, надо обозначить несколько разных символов с крестиком: крестик равноконечный крестик красивый (типа ТеХовского \dagger) крестик в круге крестик в полукруге При использовании <>-механизма разумные обозначения всегда можно подобрать, например так: + <+> <(+)> <\+/>. М. Г. P. S. Если вместо U/u у нас будет <У>/<у>, то на U/u очень естественно сажается юс большой (гораздо лучше, чем на N/n). Соответственно, JU=Ju и ju -- йотированный юс большой. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 03 апр 2000 15:01:32 От: "Orthodox Gymnasium" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: HIP-4 -------------------------------------------------------------------------------- > Все ж не система, а три исключения (система была бы в том случае, > если по некоторому общему признаку можно было бы эти ситуации > распознавать в тексте; а тут получается "если видишь подчеркивание, > то сперва посмотри список исключений"). И еще то плохо, что при > наличии этих записей текст сложнее анализировать: > > -- вижу букву "П" (ничего пока сказать нельзя) > -- вижу "_" (все еще ничего сказать нельзя) > -- вижу "С" (сейчас можно сказать, что получилась буква пси; > а если бы попалось не "С", а "Е", то сперва надо было вернуться > к "П", а потом продолжить обработку "_Е"). > > Так что для "опознания" буквы П в записи пипа П_Е придется > заглянуть на два символа вперед (которые к этой букве не > относятся). А без такой записи всегда хватает одного. Если проблема только в том, на сколько символов вперед смотреть, то можно предложить вместо п_с -- _пс, аналогично вместо к_с -- _кс. Но вообще, по моему, лучше не заставлять человека подлаживаться под машину, а машину заставить подладиваться под человека, если это человеку удобнее. > Но в любом случае надо проверять корректность записи > (в частности, наличие закрывающего уголка). А после этого легко > проверить, не образовался ли один из "типовых" именованных > символов: , , , , , <У>, <кс>, <Кс>, , > <пс>, <Пс>, <ПС>, , , , , <(:.>, <.:)>, > <> (разделитель абзацев). Остальные именованные символы > будут для редактора нулевого уровня "нерасшифровываемыми" > (но не ошибками). Кстати, про уголки. Ведь для того, чтобы прочитать символ, задаваемый парой уголков, все равно придется читать несколько символов, к тому же сколько -- заранее неизвестно. Может ограничить длину последовательности символов внутри < > каким нибудь разумным числом? То есть, если вы не встретили закрывающую скобку через N шагов, то значит в записи ошибка, и нужно возвращаться к открывающей скобке и там что-то делать. > Если же разделить "_"-механизм и "<...>"-механизм, то > редактору любого уровня все равно придется разбираться > с допустимыми и недопустимыми записями (кто сочетается > с "_", а кто нет), причем список не будет заметно короче. "_"-механизм я не хочу все же отвергать, поскольку он (по моему субъективному мнению) может облегчить восприятие ц.с. текстов. Всякие скобки по своей скобочной природе будут мешать восприятию слова "в целом". Хотя, как пожелает большинство. > Эти изменения (существующие не во всех шрифтах) можно > списать на лигатурные эффекты. (Так же можно поступить > и с "от", но только для записи W_T, а не O_T. Или для > записи W\т -- ведь разная форма т-титла и изменение > начертания омеги тоже не обязаны присутствовать во всех > шрифтах.) Не обязаны, или есть шрифты, где они действительно не присутствуют? > Итого: 5 вариантов вместо трех, причем по самому тексту понять, > какой именно имеется в виду, нельзя -- нужно обращаться > к спискам вариантов. И без этого текст даже нельзя разделить > на буквы. А в HIP-записи сразу и однозначно выделяются > "кандидаты в буквы", которые потом остается лишь проверить > на допустимость. Для базового уровня можно было обойтись вообще одним а)-вариантом. Но ведь мы все же ставим одной из целей целью удобочитаемость и вводим, например, J-механизм. Почему бы для удобства не ввести и "_"-механизм для изображения одной буквы в разных начертаниях? > > Это не так сложно. Ну а с символом & нужно делать почти > > то же самое. А вообще, зачем он нужен, если есть '<' и '>'. > > Не совсем. "_"-запись есть элемент кодировки символов, > которые должны быть в шрифте "красивой" окончательной > распечатки. А "&"-запись имеет две функции: > > 1) связь некоторых спецсимволов с фрагментом относящегося > к ним текста ("выпадающего" при этом из основного текста) -- > сноски, неясные символы и т. п. > > 2) указание на то, что в тексте-оригинале была лигатура или > вязь. В данном случае подразумевается два способа > визуализации: декоративный (пытаемся воспроизвести вязь > как таковую; если шрифтовых возможностей не хватает, > то символ "&" просто игнорируется) и "текстологический" -- > когда вместо рисования вязи просто указывается (дужкой > или хотя бы прямо самим знаком "&") факт ее наличия. Наличие лигатуры или вязи также можно закодировать при помощи < >. Автору текста ввести новую <>-последовательность , а в начале текста просто сделать комментарий по расшифровке вводимой последовательности. > > Тем более остается затруднение, как > > обозначить тот надстрочный знак, который над ней висит. > > Поскольку там только один знак и бывает, его в принципе можно > обозначать как угодно. В частности, по его формальному значению: > "апостроф", то есть придыхание с тяжелым ударением. Придыхание с тяжелым ударением не совсем подходит (напр. слово Wле). Я бы назвал данный знак скорее 'придыхание со взметом'. Можно обозначить ^\^ > Угловые скобки (точнее, пара "начало имени" и "конец имени") > позволяют иметь систему (а) расширяемую, (б) в которой > даже неизвестные символы совершенно формально > "вылавливаются" из текста. Пусть угловые скобки и останутся для всякого расширения множества символов. иер. Владимир ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 03 апр 2000 15:01:22 От: "Orthodox Gymnasium" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Nemnogo v storonu -------------------------------------------------------------------------------- Mikhail Grinchuk wrote: > Вроде бы по смыслу для множественного числа должен быть > знак "облеченное ударение с придыханием", но обычно как бы > подразумевается правило типа "в сочетании с придыханием > (в начале слова) вместо облеченного ударения пиши тяжелое". > Нельзя ли узнать, как же должно быть "на самом деле"? Есть ли > книги, в которых эти два знака используются одновременно, но их > выбор подчинен какой-то системе? Это "подразумеваемое > правило" на самом деле существует или же оно -- всего лишь > некое дозволенное упрощение типографского набора? Или вообще > на самом деле ошибка? Для себя я данное правило сформулировал несколько по-иному: стремление избежать всеми силами омографов, т.е. слов разных, но написанных одинаково. (например: Сиw'нъ и Сiw'нъ, я^зы'къ и jа^зы'къ). Если применить его, то оба приведенных варианта не выбиваются из правила и вполне допустимы, хотя вариант "тяжелое ударение с придыханием" предпочтительней (и потому чаще встречается), потому что красивее. иер. Владимир ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 31 мар 2000 09:58:06 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: HIP-4 -------------------------------------------------------------------------------- Доброе утро! iVSh wrote: > > Единство механизма было в символе "\" -- он показывает, > > что дальше идет нечто с надстрочными буквами. Обозначения > > же типа о_т нарушают единообразие. > > Все-таки 'От' лучше считать одной буквой, поскольку 'т' над 'w' здесь > приобретает особую форму. Да и W тоже изменяется. Т-титло же в общем случае > несколько иное. > Тогда получится, что буквы, дающие два звука, реализуются одинаково. > К_С, П_С, О_Т > А три случая -- это уже система. Все ж не система, а три исключения (система была бы в том случае, если по некоторому общему признаку можно было бы эти ситуации распознавать в тексте; а тут получается "если видишь подчеркивание, то сперва посмотри список исключений"). И еще то плохо, что при наличии этих записей текст сложнее анализировать: -- вижу букву "П" (ничего пока сказать нельзя) -- вижу "_" (все еще ничего сказать нельзя) -- вижу "С" (сейчас можно сказать, что получилась буква пси; а если бы попалось не "С", а "Е", то сперва надо было вернуться к "П", а потом продолжить обработку "_Е"). Так что для "опознания" буквы П в записи пипа П_Е придется заглянуть на два символа вперед (которые к этой букве не относятся). А без такой записи всегда хватает одного. > > Но "на экране" и в wysiwyg-режиме тоже порой придется > > показывать "нестандартные" (не вошедшие в стандарт на > > момент создания редактора) значки как последовательность > > типа "<" + "ы" + ">". Иначе будут возникать лишние проблемы > > из-за несовместимости. > > И поэтому хорошо бы угловые скобки вынести с уровня 0 на уровень > 1. То есть чтобы символы '<', '>' были как бы сигналом для редактора > нулевого уровня: "вот идет непонятно что". Но в любом случае надо проверять корректность записи (в частности, наличие закрывающего уголка). А после этого легко проверить, не образовался ли один из "типовых" именованных символов: , , , , , <У>, <кс>, <Кс>, , <пс>, <Пс>, <ПС>, , , , , <(:.>, <.:)>, <> (разделитель абзацев). Остальные именованные символы будут для редактора нулевого уровня "нерасшифровываемыми" (но не ошибками). Если же разделить "_"-механизм и "<...>"-механизм, то редактору любого уровня все равно придется разбираться с допустимыми и недопустимыми записями (кто сочетается с "_", а кто нет), причем список не будет заметно короче. > > все-таки > > странно обозначать, например, z-образную "з" не > > знаком "z", а вариациями на основе "з". > > Посмотрел в книгах: z-образная 'з' только наполовину напоминает 'z'. Но > точно также она похожа и на 'з'. А в некоторых реализациях она на 'z' почти > не похожа. Если эту букву ввести в нулевой уровень, то вполне естественно ее > обозначить через _з. Если же ее вводить только в расширении, то можно и . Иметь без просто z нелогично. А в целом для 1-го уровня оказывается нужно как минимум 5 "з"-подобных букв: з (стандартное "земля") s (стандартное "зело") z (вариант "земли") z с крючком (вариант "зело") s перевернутое (еще один вариант "зело") В HIP-4 они обозначались соответственно как з, s, z, , . Но если вместо z будет <з>, то что вместо ? ? Несколько странно, хотя ради единообразия можно и так. > Вопрос. А есть ли еще буквы, которые имели бы > такие вариации внутри одного текста, такие как как О, Е, З? У Ивана Федорова -- г, т, ъ, ять строчные, А прописное (из того, что помню). > > Опять критика с позиций системности: в HIP-4 символ > > (не пробельный и не надстрочный) -- это: > > > > а) один байт; > > б) нечто в угловых скобках; > > в) J/j + символ типа а) или в); > > г) символы типа а)-в), соединенные знаком "&". > > > > С учетом сносок и подобных им выделений добавляются: > > > > д) HIP-текст в фигурных скобках; > > е) символ типа а) или б) + "&" + HIP-текст в фигурных скобках. > > Ответ на критику с позиций системности. > > а) 'буква'; > %{Сюда входят А..Ь, Ю, Я, W, S, I, V, N, F (или Q)} > б) если буква имеет вариативное написание, то '_' + 'буква'; > %{Сюда входят _Е, _О, _У, _I, _W, м.б. _Z и _Ъ} > в) если буква = двум буквам, то 'буква' + '_' + 'буква'; > %{Сюда входят О_Т, К_С, П_С, хорошо бы сюда же отнести О_У, а не > рассматривать этот диграф просто как 'О' + '_У', потому что символ О > сужается еще больше, меняя свою форму, и таким образом получается как бы > единая буква}. Эти изменения (существующие не во всех шрифтах) можно списать на лигатурные эффекты. (Так же можно поступить и с "от", но только для записи W_T, а не O_T. Или для записи W\т -- ведь разная форма т-титла и изменение начертания омеги тоже не обязаны присутствовать во всех шрифтах.) > г) J/j + символ типа а) (для йотированных); > %{Сюда входят JA, JЯ, JE, JN, м.б. JЬ} > д) Все остальные символы являются дополнительными > и кодируются при помощи <нечто в угловых скобках>; Итого: 5 вариантов вместо трех, причем по самому тексту понять, какой именно имеется в виду, нельзя -- нужно обращаться к спискам вариантов. И без этого текст даже нельзя разделить на буквы. А в HIP-записи сразу и однозначно выделяются "кандидаты в буквы", которые потом остается лишь проверить на допустимость. > > А в Ваших "_" обозначениях единства не видно. Увидев > > такое "_", надо еще разбираться, какие из соседних букв > > задействованы. Примерно так: "если ПОСЛЕ знака "_" > > увидишь Т или С, то возьми и тот символ, который ДО > > этого знака". > > Это не так сложно. Ну а с символом & нужно делать почти > то же самое. А вообще, зачем он нужен, если есть '<' и '>'. Не совсем. "_"-запись есть элемент кодировки символов, которые должны быть в шрифте "красивой" окончательной распечатки. А "&"-запись имеет две функции: 1) связь некоторых спецсимволов с фрагментом относящегося к ним текста ("выпадающего" при этом из основного текста) -- сноски, неясные символы и т. п. 2) указание на то, что в тексте-оригинале была лигатура или вязь. В данном случае подразумевается два способа визуализации: декоративный (пытаемся воспроизвести вязь как таковую; если шрифтовых возможностей не хватает, то символ "&" просто игнорируется) и "текстологический" -- когда вместо рисования вязи просто указывается (дужкой или хотя бы прямо самим знаком "&") факт ее наличия. Примечание. Варианты использования записи ?&{...} а) неведомый символ с неформальным пояснением: ?&{%{...}} б) не-ц.-сл. текст (например, латинское слово в кодировке а-ля ТеХ): ?&{%TeX {\it fili%oqu%e}} HIP-визуализатор покажет здесь, например, просто вопросительный знак, а конвертор в ТЕХ вместо этого породит запись {\it filioque} (%o и %e вместо простых "о" и "е" использованы, чтобы получить именно латинские, а не кириллические буквы; "по умолчанию" подразумевается, что все неразличимые буквы конвертируются как кириллица). Аналогично используются %( и %) вместо фигурных скобок, если их надо использовать с нарушением парности, %% обозначает сам символ "%". в) неопознанный символ с однозначно предполагаемой HIP-расшифровкой: ?&{расшифровка} г) то же, но с вариантами расшифровки (альтернативный тег) ?&{расшифровка1|расшифровка2|расшифровка3|...} > > И надо ли соединять красивую омегу с ее акцентом? > > Можно и не соединять. Хотя это соединение может быть оправдано > вот чем. Эта буква не встречается в другом виде, поэтому можно > считать все, что над ней расположено, частью самой буквы (как в Й). Но Й -- это не вариант буквы И, а другая буква. Тогда как красивая омега -- вариант обычной омеги (которая, тем самым, "встречается в другом виде"). > Тем более остается затруднение, как > обозначить тот надстрочный знак, который над ней висит. Поскольку там только один знак и бывает, его в принципе можно обозначать как угодно. В частности, по его формальному значению: "апостроф", то есть придыхание с тяжелым ударением. > > > Символ подчерка в качестве служебного выбран > > > как наименее загромождающий текст. > > > > > > Символы '<' и '>' предлагается вынести на а)-расширение. > > > (и вообще всякое расширение списка отображаемых символов) > > > > Честно говоря, все же не хочется вводить два способа > > обозначений для примерно одной и той же цели, пусть > > и разделенные "уровнями расширения". Хотя в принципе > > относительно "_" и <...> можно изобрести и такой компромисс: > > Я против введения большого количества синонимов. Это без > нужды усложняет систему. Либо оставить только угловые > скобки, либо только подчерк. Угловые скобки (точнее, пара "начало имени" и "конец имени") позволяют иметь систему (а) расширяемую, (б) в которой даже неизвестные символы совершенно формально "вылавливаются" из текста. > > P. S. Вопрос: как называется линия в буквенных титлах -- > > покрытие или облечение? (Если верно "облечение", > > то надо будет исправить.) Оказывается, вообще по-другому: взмет. (Найдена ссылка на словарь др.-рус. языка.) М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 30 мар 2000 20:26:43 От: AGA Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: HIP-4 -------------------------------------------------------------------------------- Приветствую! Thursday, March 30, 2000, 4:35:08 PM, рече iVSh: >> И вопрос о "красивой омеге": если ее заменить обычной >> (c придыханием и тяжелым ударением), то это будет >> типографская погрешность или орфографическая >> ошибка? Имхо эстетическая ошибка. Я не знаю, почему в обращениях совершенно особая омега - но думаю, что это правильно. Не без смысла по крайней мере. -- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 30 мар 2000 16:35:08 От: "iVSh" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: HIP-4 -------------------------------------------------------------------------------- > Единство механизма было в символе "\" -- он показывает, > что дальше идет нечто с надстрочными буквами. Обозначения > же типа о_т нарушают единообразие. Все-таки 'От' лучше считать одной буквой, поскольку 'т' над 'w' здесь приобретает особую форму. Да и W тоже изменяется. Т-титло же в общем случае несколько иное. Тогда получится, что буквы, дающие два звука, реализуются одинаково. К_С, П_С, О_Т А три случая -- это уже система. > Но "на экране" и в wysiwyg-режиме тоже порой придется > показывать "нестандартные" (не вошедшие в стандарт на > момент создания редактора) значки как последовательность > типа "<" + "ы" + ">". Иначе будут возникать лишние проблемы > из-за несовместимости. И поэтому хорошо бы угловые скобки вынести с уровня 0 на уровень 1. То есть чтобы символы '<', '>' были как бы сигналом для редактора нулевого уровня: "вот идет непонятно что". > > А синонимы можно выделять угловыми скобками (например), > > показывая, что видимое отображение не совсем адекватное. > > Хочется, чтобы "видимое" отображение не теряло никакой > существенной информации -- чтобы нельзя было скрыть > разные символы за одним и тем же (с виду) "не совсем > адекватным" отображением. Согласен. > > Пока писал письмо (в несколько приемов), пришла > > в голову интересная мысль. > > > > А что если ввести такую систему: > > Если буква одна и та же, но начертание разное, > > то применять в записи одну и ту же современную букву. > > Если звучание одинаковое, но буквы разные, > > то писать разными буквами. > > Пока мы ограничиваемся только ц.-сл. "стандартом", > это годится (буквы e, i, w, o, y). Но уже расширение > на старопечатные книги вводит в смущение: все-таки > странно обозначать, например, z-образную "з" не > знаком "z", а вариациями на основе "з". Посмотрел в книгах: z-образная 'з' только наполовину напоминает 'z'. Но точно также она похожа и на 'з'. А в некоторых реализациях она на 'z' почти не похожа. Если эту букву ввести в нулевой уровень, то вполне естественно ее обозначить через _з. Если же ее вводить только в расширении, то можно и . ----- Вопрос. А есть ли еще буквы, которые имели бы такие вариации внутри одного текста, такие как как О, Е, З? > > _Ъ, _ъ - Ять (Опять выбивается из ряда. Ять не есть вариант > > буквы Еръ. Но JЬ -- некрасиво) > > Ну некрасиво. Но хотя бы какая-то система при этом соблюдается > (по одной из гипотез знак ятя происходит именно от i+ь). Наверно, можно оставить и jь. > Опять критика с позиций системности: в HIP-4 символ > (не пробельный и не надстрочный) -- это: > > а) один байт; > б) нечто в угловых скобках; > в) J/j + символ типа а) или в); > г) символы типа а)-в), соединенные знаком "&". > > С учетом сносок и подобных им выделений добавляются: > > д) HIP-текст в фигурных скобках; > е) символ типа а) или б) + "&" + HIP-текст в фигурных скобках. Ответ на критику с позиций системности. а) 'буква'; %{Сюда входят А..Ь, Ю, Я, W, S, I, V, N, F (или Q)} б) если буква имеет вариативное написание, то '_' + 'буква'; %{Сюда входят _Е, _О, _У, _I, _W, м.б. _Z и _Ъ} в) если буква = двум буквам, то 'буква' + '_' + 'буква'; %{Сюда входят О_Т, К_С, П_С, хорошо бы сюда же отнести О_У, а не рассматривать этот диграф просто как 'О' + '_У', потому что символ О сужается еще больше, меняя свою форму, и таким образом получается как бы единая буква}. г) J/j + символ типа а) (для йотированных); %{Сюда входят JA, JЯ, JE, JN, м.б. JЬ} д) Все остальные символы являются дополнительными и кодируются при помощи <нечто в угловых скобках>; > А в Ваших "_" обозначениях единства не видно. Увидев > такое "_", надо еще разбираться, какие из соседних букв > задействованы. Примерно так: "если ПОСЛЕ знака "_" > увидишь Т или С, то возьми и тот символ, который ДО > этого знака". Это не так сложно. Ну а с символом & нужно делать почти то же самое. А вообще, зачем он нужен, если есть '<' и '>'. > И надо ли соединять красивую омегу с ее акцентом? > Ведь это же лишнее нарушение системы, причем не > слишком полезное из-за редкости этого знака. (Тот же > аргумент и относительно нестандартных обозначений > для кси и пси -- они слишком редко встречаются, > чтобы оправдать особую форму записи.) Можно и не соединять. Хотя это соединение может быть оправдано вот чем. Эта буква не встречается в другом виде, поэтому можно считать все что над ней расположено частью самой буквы (как в Й). Тем более остается затруднение, как обозначить тот надстрочный знак, который над ней висит. Про Кси и Пси см. выше. > > Символ подчерка в качестве служебного выбран > > как наименее загромождающий текст. > > > > Символы '<' и '>' предлагается вынести на а)-расширение. > > (и вообще всякое расширение списка отображаемых символов) > > Честно говоря, все же не хочется вводить два способа > обозначений для примерно одной и той же цели, пусть > и разделенные "уровнями расширения". Хотя в принципе > относительно "_" и <...> можно изобрести и такой компромисс: > считаем, что запись _X есть синоним для , где X -- любая > байт-буква (русская или латинская) -- за исключением > символов внутри комментариев и внутри <...>-обозначений. > > При этом HIP-система (относительно 4-й версии) может > измениться так: > > "е круглое" (вместо Э/э): = _E, = _e > "o широкое" (вместо О/о): <О> = _О, <о> = _о > "ик" (вместо U/u): <У> = _У, <у> = _у > диграф "оу" (вместо OU/Ou/ou): O<У> = O_У, O = O_y, o<у> = o_у > Пустое место для акцентов (вместо "_"): < > Я против введения большого количества синонимов. Это без нужды усложняет систему. Либо оставить только угловые скобки, либо только подчерк. > P. S. Вопрос: как называется линия в буквенных титлах -- > покрытие или облечение? (Если верно "облечение", > то надо будет исправить.) > И вопрос о "красивой омеге": если ее заменить обычной > (c придыханием и тяжелым ударением), то это будет > типографская погрешность или орфографическая > ошибка? Не знаю. иер. Владимир ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 28 мар 2000 18:24:51 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Монотайп и старая орфография -------------------------------------------------------------------------------- > > > > > Не показать ли им шрифты от Паратайпа -- там уже сделан некий вариант > > > TimesET под названием Ньютон со всеми этими знаками. > > Ну хотя бы ссылку им дать, пускай напрямую запрашивают. Нет у меня моральных сил заставить Монотайп покупать у Паратайпа слизанный у них же шрифт. Может у кого есть на волшебных компактах типа "Все для Дизайнэра" и "Лучшие програмы 97 г."? Я бы набросал все что нужно в PDF и послал бы в Монотайп. Алексей ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 28 мар 2000 13:08:31 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Nemnogo v storonu -------------------------------------------------------------------------------- iVSh wrote: > Видел оное (облеченое ударение с придыханием) в Часослове, > который напечатан уже в советское время (правда это репринт). > См. последование Утрени, самое начало, Богородичен после > двупсалмия. В местоимении 'и^'мъ' употреблено облеченое > ударение с придыханием. В других источниках в похожей > ситуации употребляется тяжелое ударение с придыханием > (хоть и не конец слова). Вроде бы по смыслу для множественного числа должен быть знак "облеченное ударение с придыханием", но обычно как бы подразумевается правило типа "в сочетании с придыханием (в начале слова) вместо облеченного ударения пиши тяжелое". Нельзя ли узнать, как же должно быть "на самом деле"? Есть ли книги, в которых эти два знака используются одновременно, но их выбор подчинен какой-то системе? Это "подразумеваемое правило" на самом деле существует или же оно -- всего лишь некое дозволенное упрощение типографского набора? Или вообще на самом деле ошибка? =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 28 мар 2000 12:03:17 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: HIP-4 -------------------------------------------------------------------------------- Доброе утро! iVSh wrote: > > > Такой набор легко можно вместить > > > в пределы одного шрифта. > > > > Шрифты к HIP отношения не имеют -- они возникают только > > в форматах издательских систем. > > Но для реализации HIP-редактора какой-то шрифт все равно понадобится. Вопрос в том, как будет реализован HIP-редактор. Ниоткуда не следует, что там обязательно должен быть шрифт с ограничением объема 256 символами. Я бы завел внутреннюю двухэтажную кодировку: сами символы отдельно, а акценты -- отдельно. Ведь для такого собственно текстового редактора (не для издательской системы!) можно формально приставлять один и тот же акцент ко всем буквам, не заботясь о красивой подгонке. > > > Для его реализации не требуется создавать > > > механизма выноса буквы или слова над строкой. > > > > А что такое титла, как не "механизм выноса буквы"? > > Пусть и довольно урезанный. А потому "полный" > > механизм неплохо бы иметь как обобщение "базовых" > > титл. > > Урезанный набор титл лучше все-таки считать просто > надстрочными знаками. А настоящий вынос реализовать > отдельно. Например: > \с -- слово-титло > \{с} -- вынесенная на строкой 'с' > \{c}\^ -- вынесенная на строкой 'с' c облечением (реально это = \с) > \{ААА} -- вынесенное над строкой слово ААА Единство механизма было в символе "\" -- он показывает, что дальше идет нечто с надстрочными буквами. Обозначения же типа о_т нарушают единообразие. > > Была несколько другая идея: если встречается неопознанное > > обозначение, то визуализировать его "как есть", то есть не > > заменять <ы> (на экране) на простое "ы", а так и показывать: > > "<" + "ы" + ">". И иметь в редакторе "аварийную" возможность > > ввода спецсимволов типа "<" или "\" с клавиатуры. А при > > сохранении файла проверять корректность набранного текста > > и при наличии каких-то нарушений (скажем, непарные угловые > > или фигурные скобки) предлагать пользователю либо исправить > > эти места, либо сохранять в виде некоего "сырого" файла, в > > котором допустимы нарушения формата. > > Наверное, хорошо было бы иметь в редакторе два режима > редактирования -- WYSWYG и непосредственно HIP-текст. Но "на экране" и в wysiwyg-режиме тоже порой придется показывать "нестандартные" (не вошедшие в стандарт на момент создания редактора) значки как последовательность типа "<" + "ы" + ">". Иначе будут возникать лишние проблемы из-за несовместимости. > А синонимы можно выделять угловыми скобками (например), > показывая, что видимое отображение не совсем адекватное. Хочется, чтобы "видимое" отображение не теряло никакой существенной информации -- чтобы нельзя было скрыть разные символы за одним и тем же (с виду) "не совсем адекватным" отображением. > Пока писал письмо (в несколько приемов), пришла > в голову интересная мысль. > > А что если ввести такую систему: > Если буква одна и та же, но начертание разное, > то применять в записи одну и ту же современную букву. > Если звучание одинаковое, но буквы разные, > то писать разными буквами. Пока мы ограничиваемся только ц.-сл. "стандартом", это годится (буквы e, i, w, o, y). Но уже расширение на старопечатные книги вводит в смущение: все-таки странно обозначать, например, z-образную "з" не знаком "z", а вариациями на основе "з". > Ф, ф - Ферт > F, f - Фита > (Есть еще вариант: Q,q -- есть некая схожесть с фитой, но не > очень красиво). (Или Th, th: Theофа'нъ) "Th" плохо, потому что перевод всего слова в uppercase превратит это в TH. (А Q/q в качестве фиты используют греки, когда надо по-гречески писать латиницей. Так что и нам можно перенять, если решим переобозначить "о широкое".) > _Ъ, _ъ - Ять (Опять выбивается из ряда. Ять не есть вариант > буквы Еръ. Но JЬ -- некрасиво) Ну некрасиво. Но хотя бы какая-то система при этом соблюдается (по одной из гипотез знак ятя происходит именно от i+ь). > К_С = К_с, к_с - Кси > П_С = П_с, п_с - Пси > > W,w - Омега > _W, _w - Омега красивое (сразу с надстрочным знаком) > W\т, w\т - От Опять критика с позиций системности: в HIP-4 символ (не пробельный и не надстрочный) -- это: а) один байт; б) нечто в угловых скобках; в) J/j + символ типа а) или в); г) символы типа а)-в), соединенные знаком "&". С учетом сносок и подобных им выделений добавляются: д) HIP-текст в фигурных скобках; е) символ типа а) или б) + "&" + HIP-текст в фигурных скобках. А в Ваших "_" обозначениях единства не видно. Увидев такое "_", надо еще разбираться, какие из соседних букв задействованы. Примерно так: "если ПОСЛЕ знака "_" увидишь Т или С, то возьми и тот символ, который ДО этого знака". И надо ли соединять красивую омегу с ее акцентом? Ведь это же лишнее нарушение системы, причем не слишком полезное из-за редкости этого знака. (Тот же аргумент и относительно нестандартных обозначений для кси и пси -- они слишком редко встречаются, чтобы оправдать особую форму записи.) > Символ подчерка в качестве служебного выбран > как наименее загромождающий текст. > > Символы '<' и '>' предлагается вынести на а)-расширение. > (и вообще всякое расширение списка отображаемых символов) Честно говоря, все же не хочется вводить два способа обозначений для примерно одной и той же цели, пусть и разделенные "уровнями расширения". Хотя в принципе относительно "_" и <...> можно изобрести и такой компромисс: считаем, что запись _X есть синоним для , где X -- любая байт-буква (русская или латинская) -- за исключением символов внутри комментариев и внутри <...>-обозначений. При этом HIP-система (относительно 4-й версии) может измениться так: "е круглое" (вместо Э/э): = _E, = _e "o широкое" (вместо О/о): <О> = _О, <о> = _о "ик" (вместо U/u): <У> = _У, <у> = _у диграф "оу" (вместо OU/Ou/ou): O<У> = O_У, O = O_y, o<у> = o_у Пустое место для акцентов (вместо "_"): < > Варианты _i и _w при этом возникнут автоматически, потому что в HIP-4 уже есть и . Легко видеть, что в таком случае "_"-запись легко конвертируется в <...>-запись и обратно. М. Г. P. S. Вопрос: как называется линия в буквенных титлах -- покрытие или облечение? (Если верно "облечение", то надо будет исправить.) И вопрос о "красивой омеге": если ее заменить обычной (c придыханием и тяжелым ударением), то это будет типографская погрешность или орфографическая ошибка? =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 28 мар 2000 12:11:05 От: "iVSh" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: HIP-4 -------------------------------------------------------------------------------- > > А как выглядит ОУ, и где он встречается? > > > "Лучше" -- это сомнительный аргумент. Может ли кто-нибудь > посмотреть, какова была издательская практика в этом случае? > (То есть, как обозначали "У" в начале слова, если текст (например, > заголовок) набран заглавными буквами. Причем надо, чтобы > это был обычный текст, а не декоративный элемент.) Да, встречается и вариант ОУ. Выглядит вполне адекватно, с нижней части буквы У-большое гаммаобразное исчезает кружок. Слева появляется О-узкое. иер. Владимир ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 28 мар 2000 12:07:09 От: "iVSh" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Nemnogo v storonu -------------------------------------------------------------------------------- > > А вот автор Ирмологиона в документации к шрифту по этому > > поводу делает специальное примечание: "...придыхание > > с облеченным ударением (редко, но встречается)". > > А он приводит достаточно серьезный список источников, > > на основе которых делал шрифт. > > Интересно было бы взглянуть на примеры (в каких словах > это бывает и в книгах какого времени). Если это бывает, > но не над омегой, то проблемы не возникает (можно считать, > что над омегой знак просто изменяет свою форму); если же > бывает и над омегой, то акцент для красивой омеги надо > обозначить как-нибудь по-другому. Например, \) -- по > аналогии с буквенными титлами. Видел оное (облеченое ударение с придыханием) в Часослове, который напечатан уже в советское время (правда это репринт). См. последование Утрени, самое начало, Богородичен после двупсалмия. В местоимении 'и^'мъ' употреблено облеченое ударение с придыханием. В других источниках в похожей ситуации употребляется тяжелое ударение с придыханием (хоть и не конец слова). иер. Владимир ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 28 мар 2000 10:04:41 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Монотайп и старая орфография -------------------------------------------------------------------------------- > Паратайповцы пишут, что этот шрифт есть модифицированный Times New Roman > Монотайпа. Конечно, есть смысл показать им этот шрифт. Только у меня его > нет. > > > Не показать ли им шрифты от Паратайпа -- там уже сделан некий вариант > > TimesET под названием Ньютон со всеми этими знаками. Ну хотя бы ссылку им дать, пускай напрямую запрашивают. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 26 мар 2000 00:21:30 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: HIP-4 -------------------------------------------------------------------------------- ----- Original Message ----- From: "iVSh" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Saturday, March 25, 2000 6:26 PM Subject: Re: HIP-4 > > > Такой набор легко можно вместить > > > в пределы одного шрифта. > > > > Шрифты к HIP отношения не имеют -- они возникают только > > в форматах издательских систем. > > Но для реализации HIP-редактора какой-то шрифт все равно понадобится. Редактор - дело десятое. Главное - принять стандарт хранения и обмена текстами. Редактировать текст лучше в родной среде. которая Вам привычнее - хоть в Ворде, хоть в ТеХе, хоть в чем хотите. > Наверное, хорошо было бы иметь в редакторе два режима редактирования -- > WYSWYG и непосредственно HIP-текст. Зачем писать новый редактор WYSIWIG? Есть полно хороших редакторов, и нам за ними все равно не угнаться. У меня была другая совершенно идея, направленная в прямо противоположную сторону - сделать все же редактор, но, наооборот, полностью защищенный от дурака и нацеленный исключительно на конкретные задачи обработки ЦСл текстов. Михаил счел, что это пока не по зубам, да и есть шанс обойтись мЕньшей кровью. Хотя я с ним по-прежнему не согласен. > А синонимы можно выделять угловыми скобками (например), показывая, что > видимое отображение не совсем адекватное. > > > Может быть, разделить уровни: на первый -- то, что встречается > > в печатных книгах (начиная с самых старых) плюс знаки для > > транслитерации глаголицы. А на второй -- варианты из рукописей. > > Можно. Тем более что всех рукописей не просмотреть, и все не закодировать. > > > 2. Но ведь можно вообще без лигатур обойтись -- и в Вашей > > фонетической системе тоже. Например, обозначить так: > > > > О (узкое о) > > _О (широкое о) > > __О (омега) > > ___О (красивая омега) > > > > И ять тогда можно записать как __Е. > > Уж лучше ввести w. Мне кажется, что Вы теряете понимание смысла всей инициативы: наша задача - не создать всесовершенную ЦСл нотацию (она принципиально недостижима: на вкус и цвет товарища нет), а создать всех устраивающий стандарт обмена ЦСл текстами, которые каждый мог бы конвертировать в удобный ему формат и делать дальше с этими текстами все, что угодно. Единственное условие: в общедоступном архиве должны быть только тексты в HIP, либо тексты, набранные в достаточно стандартных нотациях и издательских системах, если тут же лежат отлаженные утилиты для двунаправленной конвертации между этими нотациями и HIP. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 25 мар 2000 19:26:23 От: "iVSh" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: HIP-4 -------------------------------------------------------------------------------- > > Такой набор легко можно вместить > > в пределы одного шрифта. > > Шрифты к HIP отношения не имеют -- они возникают только > в форматах издательских систем. Но для реализации HIP-редактора какой-то шрифт все равно понадобится. > > Для его реализации не требуется создавать > > механизма выноса буквы или слова над строкой. > > А что такое титла, как не "механизм выноса буквы"? > Пусть и довольно урезанный. А потому "полный" > механизм неплохо бы иметь как обобщение "базовых" > титл. Урезанный набор титл лучше все-таки считать просто надстрочными знаками. А настоящий вынос реализовать отдельно. Например: \с -- слово-титло \{с} -- вынесенная на строкой 'с' \{c}\^ -- вынесенная на строкой 'с' c облечением (реально это = \с) \{ААА} -- вынесенное над строкой слово ААА > Была несколько другая идея: если встречается неопознанное > обозначение, то визуализировать его "как есть", то есть не > заменять <ы> (на экране) на простое "ы", а так и показывать: > "<" + "ы" + ">". И иметь в редакторе "аварийную" возможность > ввода спецсимволов типа "<" или "\" с клавиатуры. А при > сохранении файла проверять корректность набранного текста > и при наличии каких-то нарушений (скажем, непарные угловые > или фигурные скобки) предлагать пользователю либо исправить > эти места, либо сохранять в виде некоего "сырого" файла, в > котором допустимы нарушения формата. Наверное, хорошо было бы иметь в редакторе два режима редактирования -- WYSWYG и непосредственно HIP-текст. А синонимы можно выделять угловыми скобками (например), показывая, что видимое отображение не совсем адекватное. > Может быть, разделить уровни: на первый -- то, что встречается > в печатных книгах (начиная с самых старых) плюс знаки для > транслитерации глаголицы. А на второй -- варианты из рукописей. Можно. Тем более что всех рукописей не просмотреть, и все не закодировать. > 2. Но ведь можно вообще без лигатур обойтись -- и в Вашей > фонетической системе тоже. Например, обозначить так: > > О (узкое о) > _О (широкое о) > __О (омега) > ___О (красивая омега) > > И ять тогда можно записать как __Е. Уж лучше ввести w. > > Сверх того, при такой замене усложняется алгоритм перевода > слов в upper-/lowercase. А в HIP-4 он тривиален: можно взять > слово и сделать все байты-буквы большими или маленькими; > либо первую букву большой, а все остальные -- маленькими > (конечно, сперва "синонимические" рус/лат обозначения надо > нормализовать как кириллицу). > > > > > О_Т = О_т, о_т - От > > > > > > > > ОО = Оо, оо - Омега > > > > _ОО = _Оо, _оо - Омега красивое (сразу с надстрочным > > > > знаком) > > > > > > Снова неоднозначность: "от" получится и как оо\т; > > > > т-титло можно и не заводить, потому что больше оно нигде > > не понадобится. > > Но в таком случае нарушается единообразие обозначений, > потому что уже в первом а)-расширении т-титло используется > сплошь и рядом. Ну и пусть оо\т станет синонимом для о_т. > Некоторые варианты можно и в существующий > HIP ввести. В частности, как синонимы тех букв, где > графическое соответствие плохое. А то и как основной > вариант: > > = q > <у> = u, o = ou (можно ввести и обозначение , > но тогда пропадает однозначность) > = jь > <ф> = f > <я> = ja ------------------------------------------------------ Пока писал письмо (в несколько приемов), пришла в голову интересная мысль. А что если ввести такую систему: Если буква одна и та же, но начертание разное, то применять в записи одну и ту же современную букву. Если звучание одинаковое, но буквы разные, то писать разными буквами. Получается примерно следующее. Е = _Е - Есть е - угловатое _е - округлое JЕ = Jе, jе буква 'iе' S, s - Зело З, з - Земля И, и - Иже I, i - И (десятеричное, по умолчанию с точками; если затем идет акцент, то точки автоматически снимаются) _I, _i - без точек О, о - О узкое _О, _о - О широкое У, у - У гаммаобразное _У, _у - ик, вторая часть диграфа оу (соответственно диграф будет выглядеть так: О_у, о_у) Ф, ф - Ферт F, f - Фита (Есть еще вариант: Q,q -- есть некая схожесть с фитой, но не очень красиво) (Или Th, th: Theофа'нъ) _Ъ, _ъ - Ять (Опять выбивается из ряда. Ять не есть вариант буквы Еръ. Но JЬ -- некрасиво) К_С = К_с, к_с - Кси П_С = П_с, п_с - Пси W,w - Омега _W, _w - Омега красивое (сразу с надстрочным знаком) W\т, w\т - От Я, я - Юс малый JЯ = Jя, jя йотированный юс малый А, а - А JА, jа - Я V, v -- Ижица без штрихов V", v" -- Ижица со штрихами ----------------------------------- JN = Jn, jn -- йотированный юс большой N, n -- юс большой Символ подчерка в качестве служебного выбран как наименее загромождающий текст. Символы '<' и '>' предлагается вынести на а)-расширение. (и вообще всякое расширение списка отображаемых символов) С уважением, ieр. Владимир ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 25 мар 2000 17:54:35 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Монотайп и старая орфография -------------------------------------------------------------------------------- Паратайповцы пишут, что этот шрифт есть модифицированный Times New Roman Монотайпа. Конечно, есть смысл показать им этот шрифт. Только у меня его нет. Алексей > Не показать ли им шрифты от Паратайпа -- там уже сделан некий вариант > TimesET под названием Ньютон со всеми этими знаками. > =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 25 мар 2000 05:34:28 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Монотайп и старая орфография -------------------------------------------------------------------------------- Доброе утро! AG wrote: > Кажется, Монотайп проявляет некоторое понимание в вопросе о необходимости > создания качественных шрифтов с царской орфографией. Это архиважно, так как > именно у этой компании Микрософт лицензирует самые основные шрифты, > поставляемые с Виндами. Если все пойдет хорошо, то в будущих версиях Times > New Roman будут все выведенные в расход большевиками символы. Тогда можно > будет смело делать веб-страницы в старой орфографии, просто указывая Times > New Roman как основной шрифт. А от, наверное, и так почти у всех основной. > Про Arial я пока речь не заводил, но тут лиха беда начало. Пока я стараюсь > убедить руководителя отдела Монотайпа, что старые буковки нам нужны для > восстановления национального самосознания и т.д. А разве это не так? > > Теперь меня просят прислать полный список нужных символов с образцами старых > шрифтов, сходных с Times New Roman, чтобы дизайеры Монотайпа не с пустого > места начинали рисовать контуры. Хотя, как вы знаете, работа тут нужна > минимальная. Не мог ли кто-нибудь поискать такие шрифты в старых книжках? Не показать ли им шрифты от Паратайпа -- там уже сделан некий вариант TimesET под названием Ньютон со всеми этими знаками. http://www.paratype.ru/shop/default.htm -> Typefaces -> установить Format = PC PostScript или Mac PostScript и Encoding = Cyrillic Old Russian М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 24 мар 2000 18:50:15 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Монотайп и старая орфография -------------------------------------------------------------------------------- Братья, Кажется, Монотайп проявляет некоторое понимание в вопросе о необходимости создания качественных шрифтов с царской орфографией. Это архиважно, так как именно у этой компании Микрософт лицензирует самые основные шрифты, поставляемые с Виндами. Если все пойдет хорошо, то в будущих версиях Times New Roman будут все выведенные в расход большевиками символы. Тогда можно будет смело делать веб-страницы в старой орфографии, просто указывая Times New Roman как основной шрифт. А от, наверное, и так почти у всех основной. Про Arial я пока речь не заводил, но тут лиха беда начало. Пока я стараюсь убедить руководителя отдела Монотайпа, что старые буковки нам нужны для восстановления национального самосознания и т.д. А разве это не так? Теперь меня просят прислать полный список нужных символов с образцами старых шрифтов, сходных с Times New Roman, чтобы дизайеры Монотайпа не с пустого места начинали рисовать контуры. Хотя, как вы знаете, работа тут нужна минимальная. Не мог ли кто-нибудь поискать такие шрифты в старых книжках? Алексей ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 24 мар 2000 09:32:44 От: "iVSh" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: HIP-4 -------------------------------------------------------------------------------- ----- Original Message ----- From: Alexander V. Voinov To: -=ORTHODOX-FONT=- Project Participants Sent: Friday, March 24, 2000 7:03 AM Subject: Re: HIP-4 > Mikhail Grinchuk wrote: > > Скорее не "прочитать", а "проговорить". А для читающих "глазами", > > наверное, более удобным будет использование графических > > соответствий. > > Конечно. > > Александр Не согласен, потому что графических соответствий нет. иер. Владимир =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 24 мар 2000 05:03:18 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: HIP-4 -------------------------------------------------------------------------------- Mikhail Grinchuk wrote: > Скорее не "прочитать", а "проговорить". А для читающих "глазами", > наверное, более удобным будет использование графических > соответствий. Конечно. Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 24 мар 2000 04:40:14 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: HIP-4 -------------------------------------------------------------------------------- Доброе утро! iVSh wrote: > > > 3) Стандартизированный способ набора ц.-сл. текстов. > > > > Разве что за минусом пункта 3 -- потому что набирать > > лучше специализированными средствами, видя все > > буквы в их природном облике, а не нечто зашифрованное. > > Если набирать в основном специализированными средствами, > тогда зачем вообще ставить целью "читаемость" HIP-текста? По той причине, что набор текста -- процесс одноразовый, а чтение его и использование кусочков (например, в переписке по электронной почте) -- ничем не ограничены. > Если же HIP-текст прежде всего нужно уметь легко и правильно > прочитать, то именно фонетический подход предоставляет > больше удобств в этом отношении. Скорее не "прочитать", а "проговорить". А для читающих "глазами", наверное, более удобным будет использование графических соответствий. > > при наборе книжного текста > > более-менее современной печати вариантные буквы > > попросту не понадобятся. Однако они будут уже нужны > > для точной передачи старопечатных книг (скажем, > > изданий Ивана Федорова или Мелетия Смотрицкого). > > И что плохого в возможности закодировать также и > > рукописи? > > В этом ничего плохого нет. Я не имел в виду совершенное > исключение возможности кодирования различных вариантов > одной буквы. Но хотелось бы вынести данные элементы > на первый уровень расширенного HIP (который также > можно застандартизировать) и не требовать его поддержки > от всех HIP-ориентированных редакторов. 1. Похоже, что "расширяемость" формата -- процесс по крайней мере двумерный: а) расширение набора символов; б) использование некоторых комментариев как команд разметки текста. Наверное, стоит это указать явно. 2. Не хочется, чтобы расширения в смысле а) приводили к изменению смысла текста или вносили неоднозначность (см. про букву "от" ниже). > На нулевом же уровне оставить лишь то, что реально > встречается в современных печатных тестах. Согласен. > Такой набор легко можно вместить > в пределы одного шрифта. Шрифты к HIP отношения не имеют -- они возникают только в форматах издательских систем. > Для его реализации не требуется создавать > механизма выноса буквы или слова над строкой. А что такое титла, как не "механизм выноса буквы"? Пусть и довольно урезанный. А потому "полный" механизм неплохо бы иметь как обобщение "базовых" титл. > Для того же, чтобы HIP-редактор нулевого уровня мог бы редактировать > HIP-тексты и первого уровня (без потери разметки), можно > предоставить такому редактору систему синонимов вроде: > <ы> = ы %{буква ЪI в таком редакторе будет отображаться как просто Ы. > Но разметку первого уровня этот редактор не должен уничтожать} > = I (или _И) > > В общем виде: > Последовательность <ААА> в редакторе первого уровня > отображается каким-то особым образом. В первых строках > текста редактору нулевого уровня сообщается, что > <ААА> = {HIP-текст нулевого уровня} Была несколько другая идея: если встречается неопознанное обозначение, то визуализировать его "как есть", то есть не заменять <ы> (на экране) на простое "ы", а так и показывать: "<" + "ы" + ">". И иметь в редакторе "аварийную" возможность ввода спецсимволов типа "<" или "\" с клавиатуры. А при сохранении файла проверять корректность набранного текста и при наличии каких-то нарушений (скажем, непарные угловые или фигурные скобки) предлагать пользователю либо исправить эти места, либо сохранять в виде некоего "сырого" файла, в котором допустимы нарушения формата. > На первый уровень расширения можне вынести все те символы, > которые найдутся в рукописях. Можно на этот уровень вынести > и вынесение над строкой произвольного символа, символа > с облечением и даже целого слова. Может быть, разделить уровни: на первый -- то, что встречается в печатных книгах (начиная с самых старых) плюс знаки для транслитерации глаголицы. А на второй -- варианты из рукописей. > > > 2) Будет лучше, если язык будет попроще. Имеется в виду > > > вот что. Хорошо бы иметь всего пару-тройку основных принципов, > > > зная которые, можно легко восстановить весь HIP-язык. > > > > Хорошо бы, но вряд ли реально. Ведь в любом случае > > придется зафиксировать таблицу обозначений символов > > (это самая больщая часть системы). > > Ну а предложенный подход разве не дает системы? > (за малым исключением) Не совсем. Хотя систему из него сделать можно. > > Вы предлагаете некую лигатурную систему с "символами > > для группировки". Но при этом теряется однозначность > > записи (A = {A} = {{A}} = {{}A} = ...), а также при конвертации > > в такой формат придется либо брать в скобки каждый символ, > > либо довольно деликатным способом отслеживать и разбивать > > ложные лигатуры -- причем тоже будет несколько равно > > разумных способов: O{O} = {O}O = O{}O. > > Отследить и разбить лигатуры не так и сложно, поскольку их немного. > А избыточные символы для группировки HIP-редактор может > либо игнорировать, либо использовать по своему усмотрению. 1. Для борьбы с лигатурами можно применять три системы: а) использовать символы группировки (OO и {O}O); б) использовать символ "разбить лигатуру" (ОО и О\\О); в) использовать символ "создать лигатуру" (О&O и ОО). По-моему, с точки зрения легкости реализации в конверторах и однозначности система в) лучше б), а та лучше а). 2. Но ведь можно вообще без лигатур обойтись -- и в Вашей фонетической системе тоже. Например, обозначить так: О (узкое о) _О (широкое о) __О (омега) ___О (красивая омега) И ять тогда можно записать как __Е. > > > И, и - Иже > > > _И, _и - И (десятеричное, по умолчанию с точками; если > > > затем идет акцент, то точки автоматически снимаются) Как-то надо обозначить и вариант для I без точек и без акцентов (для чисел, например). > > > У, у - У гаммаобразное > > > _У, _у - У в виде диграфа оу > > > > У диграфа "оу" три формы: ОУ, Оу, оу. А обозначений два? > > А как выглядит ОУ, и где он встречается? > > Иногда, когда есть нужда (например внутри буквицы), вместо Оу > используется У-гаммаобразное. Вообще говоря -- это не разные > буквы, а два варианта написания одного диграфа, просто > в у-гаммаобразном 'о' подписано под ножкой 'у' и сливается с ним. > > И если писать все прописными, то лучше использовать > У-гаммаобразное. "Лучше" -- это сомнительный аргумент. Может ли кто-нибудь посмотреть, какова была издательская практика в этом случае? (То есть, как обозначали "У" в начале слова, если текст (например, заголовок) набран заглавными буквами. Причем надо, чтобы это был обычный текст, а не декоративный элемент.) Сверх того, при такой замене усложняется алгоритм перевода слов в upper-/lowercase. А в HIP-4 он тривиален: можно взять слово и сделать все байты-буквы большими или маленькими; либо первую букву большой, а все остальные -- маленькими (конечно, сперва "синонимические" рус/лат обозначения надо нормализовать как кириллицу). > > > О_Т = О_т, о_т - От > > > > > > ОО = Оо, оо - Омега > > > _ОО = _Оо, _оо - Омега красивое (сразу с надстрочным > > > знаком) > > > > Снова неоднозначность: "от" получится и как оо\т; > > т-титло можно и не заводить, потому что больше оно нигде > не понадобится. Но в таком случае нарушается единообразие обозначений, потому что уже в первом а)-расширении т-титло используется сплошь и рядом. > > > Знаки 'разрыв строки без разрыва абзаца' и 'конец страницы' > > > лучше сделать другими, поскольку в современной певческой > > > практике '/' и '//' используются для разбиения стихир на строфы. > > > > Строго говоря, речь идет не о знаках для "разрыва строки" > > и "конце страницы" как о командах верстки, а лишь о том, > > что в системе обозначений есть значок "/" (так и выглядящий > > на бумаге), с помощью которого обычно в цитатах указывают > > концы строк (/) и страниц (//). Это, по-видимому, обозначения > > той же природы, что и в разбиении на строфы. > > То есть можно их использовать и не по заданнному > в HIP-стандарте назначению? Точнее, надо было сказать просто: HIP-знак "/" обозначает символ "/" в тексте. Не уточняя, для чего он может понадобиться. > Но разрыв строки, вообще говоря, мог бы > пригодиться. (Чтобы стихи набирать) В "базовом" варианте он эквивалентен концу абзаца (то есть каждая строка стиха считается отдельным абзацем); разницу можно задать в б)-расширениях. > P.S. Простите, может я не к месту встрял со своими > предложениями? Отнюдь. Некоторые варианты можно и в существующий HIP ввести. В частности, как синонимы тех букв, где графическое соответствие плохое. А то и как основной вариант: = q <у> = u, o = ou (можно ввести и обозначение , но тогда пропадает однозначность) = jь <ф> = f <я> = ja В общем, как народ скажет. (Мне-то, понятное дело, своя система ближе.) М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 23 мар 2000 17:18:16 От: "iVSh" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: HIP-4 -------------------------------------------------------------------------------- ----- Original Message ----- From: Mikhail Grinchuk To: -=ORTHODOX-FONT=- Project Participants Sent: Wednesday, March 22, 2000 4:00 AM Subject: Re: HIP-4 > > 3) Стандартизированный способ набора ц.-сл. текстов. > > Разве что за минусом пункта 3 -- потому что набирать > лучше специализированными средствами, видя все > буквы в их природном облике, а не нечто зашифрованное. Если набирать в основном специализированными средствами, тогда зачем вообще ставить целью "читаемость" HIP-текста? Если же HIP-текст прежде всего нужно уметь легко и правильно прочитать, то именно фонетический подход предоставляет больше удобств в этом отношении. > > В связи с этим несколько мыслей. > > > > 1) Базовый формат должен ориентироваться прежде всего на > > печатные ц.-сл. документы, но ни в коем случае не должен в > > себя вбирать всевозможные варианты написания одних и тех > > же букв, встречающиеся в различных рукописях. > > В общем так оно и сделано: при наборе книжного текста > более-менее современной печати вариантные буквы > попросту не понадобятся. Однако они будут уже нужны > для точной передачи старопечатных книг (скажем, > изданий Ивана Федорова или Мелетия Смотрицкого). > И что плохого в возможности закодировать также и > рукописи? В этом ничего плохого нет. Я не имел в виду совершенное исключение возможности кодирования различных вариантов одной буквы. Но хотелось бы вынести данные элементы на первый уровень расширенного HIP (который также можно застандартизировать) и не требовать его поддержки от всех HIP-ориентированных редакторов. На нулевом же уровне оставить лишь то, что реально встречается в современных печатных тестах. Такой набор легко можно вместить в пределы одного шрифта. Для его реализации не требуется создавать механизма выноса буквы или слова над строкой. Для того же, чтобы HIP-редактор нулевого уровня мог бы редактировать HIP-тексты и первого уровня (без потери разметки), можно предоставить такому редактору систему синонимов вроде: <ы> = ы %{буква ЪI в таком редакторе будет отображаться как просто Ы. Но разметку первого уровня этот редактор не должен уничтожать} = I (или _И) В общем виде: Последовательность <ААА> в редакторе первого уровня отображаеся каким-то особым образом. В первых строках текста редактору нулевого уровня сообщается, что <ААА> = {HIP-текст нулевого уровня} На первый уровень расширения можне вынести все те символы, которые найдутся в рукописях. Можно на этот уровень вынести и вынесение над строкой произвольного символа, символа с облечением и даже целого слова. > > 2) Будет лучше, если язык будет попроще. Имеется в виду > > вот что. Хорошо бы иметь всего пару-тройку основных принципов, > > зная которые, можно легко восстановить весь HIP-язык. > > Хорошо бы, но вряд ли реально. Ведь в любом случае > придется зафиксировать таблицу обозначений символов > (это самая больщая часть системы). Ну а предложенный подход разве не дает системы? (за малым исключением) > > 4) В кодировке лучше использовать принцип фонетический, > > а не визуальный. > > При этом как раз труднее отследить "вручную" ошибки > в выборе одинаково произносящихся букв. Особенно > если их больше двух. Спорный вопрос. > Вы предлагаете некую лигатурную систему с "символами > для группировки". Но при этом теряется однозначность > записи (A = {A} = {{A}} = {{}A} = ...), а также при конвертации > в такой формат придется либо брать в скобки каждый символ, > либо довольно деликатным способом отслеживать и разбивать > ложные лигатуры -- причем тоже будет несколько равно > разумных способов: O{O} = {O}O = O{}O. Отследить и разбить лигатуры не так и сложно, поскольку их немного. А избыточные символы для группировки HIP-редактор может либо игнорировать, либо использовать по своему усмотрению. (Реально лигатурой является только пара ОО). > > И, и - Иже > > _И, _и - И (десятеричное, по умолчанию с точками; если > > затем идет акцент, то точки автоматически снимаются) > > _И\:, _и\: - И десятеричное с точками > > Зачем нужен третий вариант? Это просто опечатка, оставшаяся после размышлений над тем, что же все-таки будет по умолчанию -- с точками или без точек. > > О = _О - Он > > о - узкое > > _о - широкое > > O не есть _O (представьте заголовок, набранный > заглавными буквами). Пусть так и будет О - узкая прописная _О - широкая прописная > > У, у - У гаммаобразное > > _У, _у - У в виде диграфа оу > > У диграфа "оу" три формы: ОУ, Оу, оу. А обозначений два? А как выглядит ОУ, и где он встречается? Иногда, когда есть нужда (например внутри буквицы), вместо Оу используется У-гаммаобразное. Вообще говоря -- это не разные буквы, а два варианта написания одного диграфа, просто в у-гаммаобразном 'о' подписано под ножкой 'у' и сливается с ним. И если писать все прописными, то лучше использовать У-гаммаобразное. > > О_Т = О_т, о_т - От > > > > ОО = Оо, оо - Омега > > _ОО = _Оо, _оо - Омега красивое (сразу с надстрочным знаком) > > Снова неоднозначность: "от" получится и как оо\т; т-титло можно и не заводить, потому что больше оно нигде не понадобится. > _oo смешивается с _o + o. А такой вариант встречается в текстах? Да если и встретится, то можно лигатуру разбить. > > Знаки ? и * лучше не занимать, чтобы в запросах на поиск > > они играли привычную для них роль подстановочных > > знаков: один символ, много символов. > > Знак звездочки в текстах можно представить так: \* > > Символ "?" встречается только в "недоправленных" текстах, > так что с ним проблем не возникнет; а замена "*" на "\*", > по-моему, и вообще никаких проблем не решает. Согласен. > > Знаки 'разрыв строки без разрыва абзаца' и 'конец страницы' лучше > > сделать другими, поскольку в современной певческой > > практике '/' и '//' используются для разбиения стихир на строфы. > > Строго говоря, речь идет не о знаках для "разрыва строки" > и "конце страницы" как о командах верстки, а лишь о том, > что в системе обозначений есть значок "/" (так и выглядящий > на бумаге), с помощью которого обычно в цитатах указывают > концы строк (/) и страниц (//). Это, по-видимому, обозначения > той же природы, что и в разбиении на строфы. То есть можно их использовать и не по заданнному в HIP-стандарте назначению? Но разрыв строки, вообще говоря, мог бы пригодиться. (Чтобы стихи набирать) > Боюсь, что такой способ проверки будет на порядок > утомительнее, чем честная сверка распечатки с оригиналом. > (Уже к началу второй страницы голова крУгом пойдет от > мелькающих слов, "привязанных" к одной букве -- да > еще закодированных.) Нет ничего лучше жесткой копии, но прежде чем ее выводить, всегда хочется иметь текст почище. иер. Владимир P.S. Простите, может я не к месту встрял со своими предложениями? ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 22 мар 2000 15:55:49 От: "iVSh" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: HIP-4 (from iVSh) -------------------------------------------------------------------------------- Прошу прощения, но кажется это мое письмо до рассылки не дошло. Посылаю еще раз. ----- Original Message ----- From: Alexander V. Voinov To: -=ORTHODOX-FONT=- Project Participants Sent: Tuesday, March 21, 2000 12:14 PM Subject: Re: HIP-4 (from iVSh) > Orthodox Gymnasium wrote: > > > i> 4) В кодировке лучше использовать принцип фонетический, а не > > визуальный. > > > > > > Почему? > > > > Потому что при наборе мы все равно ориентируемся на то, как слова > > произносятся. > > > > А еще, при таком подходе затем легче осуществлять проверку правильности > > написания. > > > > Например, надо проверить правильность всех вхождений звука 'о'. Можно просто > > будет простучать все 'о' в русской кодировке, и не нужно будет делать три > > прохода по тексту: по всем 'о', по всем 'w' и по всем 'q' > > Ну уж w-то тут ни при чем. Его ни в коем случае нельзя ничем заменять. И > более того, именно в ц.с., больше, чем в большинстве современных языков, > визуальное восприятие текста не менее важно, чем произношение. Поэтому > даже в таком узко-техническом представлении следует, имхо, бороться за > наиболее точные визуальные эквиваленты избыточных конструкций. Визуальную похожесть в полной мере мы не обеспечим. Реально ее дают лишь буквы wvsi. Все остальное -- достаточно условно. В результате мы имеем половинное решение (в том смысле что в половине случаев мы следуем одному принципу, в половине -- другому) и отсутствие систематичности. иер. Владимир ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 22 мар 2000 15:16:45 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: HIP-4 -------------------------------------------------------------------------------- *Welcome to the Windows NT/WS4.0, Mikhail Grinchuk*. You have new mail. *grinchuk@lsil.com $* Wednesday, March 22, 2000 0:59:01, you wrote to me: >> Имхо крюковая нотация - отдельная большая проблема. Хотя если вам >> удастся ее сюда запихать - честь и хвала. Элементов-то там в >> принципе немного, только правильно их взаимные сочетания задать. MG> Увы, про крюковую нотацию почти ничего сверх самого факта ее MG> существования не знаю. На картинках, которые когда-то попадались, MG> она была как бы вторым этажом диакритики. Есть ли какие-нибудь MG> материалы по этому поводу в сети? В общем-то, Глеб погорячился -- от его "немного" веет каким-то легкомысленным подходом. Не будем делать из себе всезнаек, тем более что не только в крюковой нотации, а, видимо, и в обычной-то разработчики (т.е. "вы" ну или "мы") -- скорее всего не достаточно ориентируются. На мой взгляд -- _не трогайте_ крюки. =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 22 мар 2000 02:00:41 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: HIP-4 -------------------------------------------------------------------------------- Доброе утро! iVSh wrote: > По некотором же размышлении очертил для > себя несколько возможных применений. > > 1) Инвариантный формат представления ц.-сл. текстов, не > зависящий от конкретной шрифтовой реализации. > 2) Язык запросов в системах различного внутритекстового > поиска. > 3) Стандартизированный способ набора ц.-сл. текстов. > 4) Пересылка без потерь по e-mail. Разве что за минусом пункта 3 -- потому что набирать лучше специализированными средствами, видя все буквы в их природном облике, а не нечто зашифрованное. > В связи с этим несколько мыслей. > > 1) Базовый формат должен ориентироваться прежде всего на > печатные ц.-сл. документы, но ни в коем случае не должен в > себя вбирать всевозможные варианты написания одних и тех > же букв, встречающиеся в различных рукописях. В общем так оно и сделано: при наборе книжного текста более-менее современной печати вариантные буквы попросту не понадобятся. Однако они будут уже нужны для точной передачи старопечатных книг (скажем, изданий Ивана Федорова или Мелетия Смотрицкого). И что плохого в возможности закодировать также и рукописи? > 2) Будет лучше, если язык будет попроще. Имеется в виду > вот что. Хорошо бы иметь всего пару-тройку основных принципов, > зная которые, можно легко восстановить весь HIP-язык. Хорошо бы, но вряд ли реально. Ведь в любом случае придется зафиксировать таблицу обозначений символов (это самая больщая часть системы). > 3) Хорошо бы ограничить алфавит HIP-языка, исключив > из него (почти) латинские буквы, чтобы минимизировать > количество переключений рус/лат. Во время набора никому не возбраняется использовать любые системы обозначений. Причем всегда можно найти такую, чтобы Вам было удобно набирать, а результат без проблем конвертировался в HIP (несложной последовательностью текстовых замен). Скорее всего, в Windows можно обойтись без большинства переключений рус/лат и таким способом: написать макрос, который бы съедал символ слева от курсора и заменял его на другой, согласно некоей таблице. А в этой таблице можно предусмотреть, например, такие замены: И -> I -> V -> И, О -> Q -> W -> О, З <-> S, Ф <-> F и тому подобное. Либо использовать клавиатурный драйвер, в котором переключение рус/лат действует не по принципу кнопки CapsLock, а подобно Shift: регистр сменен только пока кнопка нажата. (У меня такая система ввода в редакторе под DOS, причем как основной регистр стоит латинский.) > 4) В кодировке лучше использовать принцип фонетический, > а не визуальный. При этом как раз труднее отследить "вручную" ошибки в выборе одинаково произносящихся букв. Особенно если их больше двух. > Учитывая эти замечания, можно предложить следующее Вы предлагаете некую лигатурную систему с "символами для группировки". Но при этом теряется однозначность записи (A = {A} = {{A}} = {{}A} = ...), а также при конвертации в такой формат придется либо брать в скобки каждый символ, либо довольно деликатным способом отслеживать и разбивать ложные лигатуры -- причем тоже будет несколько равно разумных способов: O{O} = {O}O = O{}O. > И, и - Иже > _И, _и - И (десятеричное, по умолчанию с точками; если > затем идет акцент, то точки автоматически снимаются) > _И\:, _и\: - И десятеричное с точками Зачем нужен третий вариант? > О = _О - Он > о - узкое > _о - широкое O не есть _O (представьте заголовок, набранный заглавными буквами). > У, у - У гаммаобразное > _У, _у - У в виде диграфа оу У диграфа "оу" три формы: ОУ, Оу, оу. А обозначений два? > О_Т = О_т, о_т - От > > ОО = Оо, оо - Омега > _ОО = _Оо, _оо - Омега красивое (сразу с надстрочным знаком) Снова неоднозначность: "от" получится и как оо\т; _oo смешивается с _o + o. > Знаки ? и * лучше не занимать, чтобы в запросах на поиск > они играли привычную для них роль подстановочных > знаков: один символ, много символов. > Знак звездочки в текстах можно представить так: \* Символ "?" встречается только в "недоправленных" текстах, так что с ним проблем не возникнет; а замена "*" на "\*", по-моему, и вообще никаких проблем не решает. > Знаки 'разрыв строки без разрыва абзаца' и 'конец страницы' лучше > сделать другими, поскольку в современной певческой > практике '/' и '//' используются для разбиения стихир на строфы. Строго говоря, речь идет не о знаках для "разрыва строки" и "конце страницы" как о командах верстки, а лишь о том, что в системе обозначений есть значок "/" (так и выглядящий на бумаге), с помощью которого обычно в цитатах указывают концы строк (/) и страниц (//). Это, по-видимому, обозначения той же природы, что и в разбиении на строфы. > > i> 4) В кодировке лучше использовать принцип > > фонетический, а не визуальный. > > > > Почему? > > А еще, при таком подходе затем легче осуществлять > проверку правильности написания. > > Например, надо проверить правильность всех вхождений > звука 'о'. Можно просто будет простучать все 'о' в русской > кодировке, и не нужно будет делать три > прохода по тексту: по всем 'о', по всем 'w' и по всем 'q'. Боюсь, что такой способ проверки будет на порядок утомительнее, чем честная сверка распечатки с оригиналом. (Уже к началу второй страницы голова крУгом пойдет от мелькающих слов, "привязанных" к одной букве -- да еще закодированных.) М. Г. P. S. А что касается облегчения труда наборщика, то можно попытаться сэкономить на тех элементах обозначения, которые ВО ВСЕХ СЛУЧАЯХ восстанавливаются однозначно. Например, при наборе можно вообще не ставить придыхания и писать просто У вместо диграфа -- а потом запустить программу, которая сделает нужные уточнения автоматически. Не вполне уверен, но вроде бы и различие между широким и узким О тоже "вычисляется" без исключений. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 22 мар 2000 01:59:01 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: HIP-4 -------------------------------------------------------------------------------- Доброе утро! AGA wrote: > Имхо крюковая нотация - отдельная большая проблема. Хотя если вам > удастся ее сюда запихать - честь и хвала. Элементов-то там в принципе > немного, только правильно их взаимные сочетания задать. Увы, про крюковую нотацию почти ничего сверх самого факта ее существования не знаю. На картинках, которые когда-то попадались, она была как бы вторым этажом диакритики. Есть ли какие-нибудь материалы по этому поводу в сети? М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 21 мар 2000 16:37:43 От: AGA Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: HIP-4 (from iVSh) -------------------------------------------------------------------------------- Приветствую! Tuesday, March 21, 2000, 9:14:35 AM, рече Alexander: AVV> визуальное восприятие текста не менее важно, чем произношение. Поэтому Почему? Интуитивно чувствую, хотелось бы подробностей. -- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 21 мар 2000 10:14:35 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: HIP-4 (from iVSh) -------------------------------------------------------------------------------- Orthodox Gymnasium wrote: > > i> 4) В кодировке лучше использовать принцип фонетический, а не > визуальный. > > > > Почему? > > Потому что при наборе мы все равно ориентируемся на то, как слова > произносятся. > > А еще, при таком подходе затем легче осуществлять проверку правильности > написания. > > Например, надо проверить правильность всех вхождений звука 'о'. Можно просто > будет простучать все 'о' в русской кодировке, и не нужно будет делать три > прохода по тексту: по всем 'о', по всем 'w' и по всем 'q' Ну уж w-то тут ни при чем. Его ни в коем случае нельзя ничем заменять. И более того, именно в ц.с., больше, чем в большинстве современных языков, визуальное восприятие текста не менее важно, чем произношение. Поэтому даже в таком узко-техническом представлении следует, имхо, бороться за наиболее точные визуальные эквиваленты избыточных конструкций. Александр ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 21 мар 2000 09:26:46 От: "Orthodox Gymnasium" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AGA" Тема: Re: Re[2]: HIP-4 (from iVSh) -------------------------------------------------------------------------------- ----- Original Message ----- From: AGA To: -=ORTHODOX-FONT=- Project Participants Sent: Monday, March 20, 2000 11:28 AM Subject: Re[2]: HIP-4 > i> 4) В кодировке лучше использовать принцип фонетический, а не визуальный. > > Почему? Потому что при наборе мы все равно ориентируемся на то, как слова произносятся. А еще, при таком подходе затем легче осуществлять проверку правильности написания. Например, надо проверить правильность всех вхождений звука 'о'. Можно просто будет простучать все 'о' в русской кодировке, и не нужно будет делать три прохода по тексту: по всем 'о', по всем 'w' и по всем 'q' И, по моему, легче читать _о^'чи, чем q='чи > Только вопрос: а где в такой кодировке три точки несовершенно > окружены? И так богослужение почем зря уродуют,а если еще типиконских > знаков в цс стандарте не будет... То что я писал, относилось только к буквам. Ничего не имею против необходимых знаков препинания, символов и т.д. С уважением, иер. Владимир. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 20 мар 2000 02:29:23 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: HIP-4 -------------------------------------------------------------------------------- ----- Original Message ----- From: "iVSh" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Monday, March 20, 2000 7:02 AM Subject: Re: HIP-4 > Добрый день всем! > > Хотелось бы высказать несколько соображений по поводу HIP. Поскольку Вас не было в тот момент, когда здесь все начиналось, позволю себе поставить Вас в известность, что ответственным за выработку стандарта избран нами Михаил Гринчук, как предоставивший наиболее подробный и обоснованный проект. Мы же все в этом вопросе имеем толко совещательный голос. Частично на Ваши вопросы есть ответ в письмах Михаила, сохраняющихся в архиве списка рассылки. Думаю, чтобы не заставлять его повторяться, Вы могли бы прочесть эти письма (это буквально первые же его письма, пришедшие в список, но учтите, что первоначально были проблемы с кодировками, и он писал на воляпюке). С уважением, Лев. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 20 мар 2000 09:28:55 От: AGA Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: HIP-4 -------------------------------------------------------------------------------- Приветствую! Monday, March 20, 2000, 7:02:12 AM, рече iVSh: i> 2) Будет лучше, если язык будет попроще. Имеется в виду i> вот что. Хорошо бы иметь всего пару-тройку основных принципов, i> зная которые, можно легко восстановить весь HIP-язык. Золотые слова. i> 3) Хорошо бы ограничить алфавит HIP-языка, исключив из него (почти) i> латинские буквы, чтобы минимизировать количество переключений рус/лат. Золотые слова в квадрате! i> 4) В кодировке лучше использовать принцип фонетический, а не визуальный. Почему? Только вопрос: а где в такой кодировке три точки несовершенно окружены? И так богослужение почем зря уродуют,а если еще типиконских знаков в цс стандарте не будет... -- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 20 мар 2000 08:02:12 От: "iVSh" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: HIP-4 -------------------------------------------------------------------------------- Добрый день всем! Хотелось бы высказать несколько соображений по поводу HIP. Ознакомившись (впервые) сначала с 3-й версией вышеозначенного формата, а затем почти сразу получив по рассылке проект 4-й версии, я не совсем понял (сначала) цель создания такого стандарта, которую имели в виду его авторы. По некотором же размышлении очертил для себя несколько возможных применений. 1) Инвариантный формат представления ц.-сл. текстов, не зависящий от конкретной шрифтовой реализации. 2) Язык запросов в системах различного внутритекстового поиска. 3) Стандартизированный способ набора ц.-сл. текстов. 4) Пересылка без потерь по e-mail. В связи с этим несколько мыслей. 1) Базовый формат должен ориентироваться прежде всего на печатные ц.-сл. документы, но ни в коем случае не должен в себя вбирать всевозможные варианты написания одних и тех же букв, встречающиеся в различных рукописях. 2) Будет лучше, если язык будет попроще. Имеется в виду вот что. Хорошо бы иметь всего пару-тройку основных принципов, зная которые, можно легко восстановить весь HIP-язык. 3) Хорошо бы ограничить алфавит HIP-языка, исключив из него (почти) латинские буквы, чтобы минимизировать количество переключений рус/лат. 4) В кодировке лучше использовать принцип фонетический, а не визуальный. Учитывая эти замечания, можно предложить следующее Е = _Е - Есть е - угловатое _е - округлое _З, _з - Зело З, з - Земля И, и - Иже _И, _и - И (десятеричное, по умолчанию с точками; если затем идет акцент, то точки автоматически снимаются) _И\:, _и\: - И десятеричное с точками О = _О - Он о - узкое _о - широкое У, у - У гаммаобразное _У, _у - У в виде диграфа оу _ч - Знак 400 Ф, ф - Ферт _Ф, _ф - Фита _Ъ, _ъ - Ять (это несколько не согласуется с фонетическим принципом, но одно исключение можно оставить) К_С = К_с, к_с - Кси П_С = П_с, п_с - Пси О_Т = О_т, о_т - От ОО = Оо, оо - Омега (если надо сделать два узких о подряд, то можно использовать символы для группировки {}, написать {о}о; фигурные скобки в этой роли предлагается использовать аще в одном месте, но об этом в следующий раз) _ОО = _Оо, _оо - Омега красивое (сразу с надстрочным знаком) Я, я - Юс малый _Я, _я - Я _В, _в - Ижица без штрихов И\", и\" - Ижица со штрихами (надо продумать вариант: ижица с надстрочным знаком; может быть надстрочный знак, следующий за и\", просто будет автоматически удалять штрихи: и\"^ссоо'пъ) ' - острое ударение (оксия) ` - тяжелое ударение (вария) ^^ - облеченное ударение (камора) ^ - легкое придыхание (звательцо) ^' - легкое придыхание с острым ударением ^` - легкое придыхание с тяжелым ударением ~ - простое титло \с - слово-титло \д - добро-титло \г - глаголь-титло \о - он-титло \р - рцы-титло \ч - червь-титло и т.д. --------------------------------- Ка_ф_и'сма а~. П_саломъ дв~ду, не надпи'санъ _у^ _е^вр_е'й, а~. [а~] Бл~женъ мужъ, и^'же не и^'де на сов_ъ'тъ нечести'выхъ, и^ на пути` гр_ъ'шных не ста`, и^ на с_ъда'лищи губи'телей не с_ъ'де: [в~] Но въ зако'н_ъ гд\сни во'ля е^гоо` и^ въ зако'н_ь е^гоо` поучи'тся день и но'щь. [г~] И будетъ _я^'коо дре'во, насажде'нное при и^схо'дищихъ во'дъ, _е^'же пло'дъ сво'й да'стъ во вре'мя свое`: и^ ли'ст е^гоо` не о_тпаде'тъ, и^ вся`, ели'ка а^'ще твори'тъ, усп_ъ'етъ. ----------------------------------- Если на знаки '`^~[]# назначить горячие клавиши, то на латиницу можно не переключаться вообще!!! ___________________________________ Знаки ? и * лучше не занимать, чтобы в запросах на поиск они играли привычную для них роль подстановочных знаков: один символ, много символов. Знак звездочки в текстах можно представить так: \* ----------------------------------- Знаки 'разрыв строки без разрыва абзаца' и 'конец страницы' лучше сделать другими, поскольку в современной певческой практике '/' и '//' используются для разбиения стихир на строфы. Предлагается '\\' и '\\\'. ----------------------------------- JА=Jа, jа буква "я" в виде лигатуры iа (синоним _я) JЕ=Jе, jе буква "iе" JЭ=Jэ, jэ синоним для Jе/jе JЯ=Jя, jя йотированный юс малый JN=Jn, jn йотированный юс большой N, n юс большой Хотя в современных ц.-сл. текстах данные буквы не используются, их можно ввести в стандарт нулевого уровня. С уважением, ieр. Владимир ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 17 мар 2000 20:23:20 От: AGA Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: HIP-4 -------------------------------------------------------------------------------- Имхо крюковая нотация - отдельная большая проблема. Хотя если вам удастся ее сюда запихать - честь и хвала. Элементов-то там в принципе немного, только правильно их взаимные сочетания задать. -- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 17 мар 2000 04:52:37 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: HIP-4 -------------------------------------------------------------------------------- Доброе утро! Преставляется обещанная 4-я версия HIP. Предлагается обсуждать ее две недели, а в начале апреля по возможности "заморозить". Просьба заменить данным документом 3-ю версию на http://orthodox.tstu.ru/font-list/ и http://www.slavonic.orthodoxy.ru/ М. Г. ============================================================= ПРОЕКТ ИНВАРИАНТНОГО ПРЕДСТАВЛЕНИЯ ЦЕРКОВНОСЛАВЯНСКОГО ТЕКСТА (версия 4 системы HIP) ============================================================= I. ОБЩИЕ ПРИНЦИПЫ 1. Инвариантное представление HIP предназначено для записи в "читаемой" форме церковнославянских текстов с сохранением всех деталей правописания. Оно в своей базовой форме не обязано представлять внеязыковые элементы текста и детали верстки: размер шрифта, разного рода отступы, разбиение на строки, столбцы и страницы и т. п. Кодируются только слова (и числа) текста, знаки препинания, пробелы между словами и разбиение на абзацы. Однако базовое HIP содержит возможность отмечать часть текста как "пояснение" (сноски, параллельные места и т. п.). Также имеется возможность обозначать выделение киноварью. 2. Для использования внетекстовой информации (далее она именуется "комментариями") предлагается зарезервировать (пусть не полностью формализуя) механизмы ее возможной вставки. Любая конкретная реализация вставки внетекстовой информации далее называется "расширенным HIP". Примечание 1. Любой текст в виде базового HIP является текстом в расширенном HIP. Любой текст в расширенном HIP можно перевести в базовое HIP, удалив комментарии. Примечание 2 -- о корректности терминологии. Комментарий в "узком" смысле (некая пометка для памяти или кусок текста, "отключенный" от документа) тоже является внетекстовой информацией. 3. HIP является абстрактным 8-битовым представлением текста. Его конкретные реализации могут меняться в соответствии с различными возможными кодировками кириллицы. Поэтому в HIP-файлах разрешается использовать только символы, гарантированно присутствующие во ВСЕХ кодировках, пригодных для русского языка, а именно: 1234567890-=[]\;',./` A...Z А...Я !@#$%^&*()_+{}|:"<>?~ a...z а...я Кроме того, используются два "абстрактных белых символа": пробел и EOL (TAB, BS и проч. приравниваются к пробелу, а VT, FF, EOF и проч. -- к EOL). 4. В базовом HIP визуально неразличимые символы и сочетания символов ("е" русское и "e" латинское, например) обозначают одно и то же. Список "визуально неразличимых" букв: Аа В Ее К М Н Оо Рр Сс Т Уу Хх Aa B Ee K M H Oo Pp Cc T Yy Xx 5. По этой причине (но не только) базовое HIP не замечает пробелов рядом с EOL, рассматривает любое число соседних пробелов как один и любое число пустых строк (строк, состоящих только из пробелов) как одну -- логический конец абзаца. Одиночный символ EOL (пустая строка -- это пара EOL'ов) эквивалентен пробелу. 6. В HIP включено обозначение для явного конца абзаца (см. ниже). Оно эквивалентно паре символов EOL EOL (то есть пустой строке) и так же, как эта пара символов, взаимодействует с соседними пробелами и EOL. 7. Желательно, чтобы HIP-закодированный текст был "читабельным" и без применения каких-либо программ. 8. Также желательно, чтобы HIP-текст как можно проще переводился из uppercase в lowercase и обратно. (Из этих соображений в многобуквенных обозначениях предусмотрены синонимы типа JА и Jа.) II. ПОЧТИ ФОРМАЛЬНАЯ ГРАММАТИКА HIP HIP-ТЕКСТ есть последовательность вида Р[0] С[1] Р[1] С[2] Р[2] ... С[N-1] Р[N-1] С[N] Р[N] где С[1] ... С[N] -- СЛОВА, Р[0] ... Р[N] -- РАЗДЕЛИТЕЛИ (Р[0] и Р[N] могут отсутствовать, остальные элементы обязательны) РАЗДЕЛИТЕЛИ бывают двух сортов: РАЗДЕЛИТЕЛИ_СЛОВ и РАЗДЕЛИТЕЛИ_АБЗАЦЕВ. РАЗДЕЛИТЕЛЬ_СЛОВ есть последовательность пробелов, EOL'ов и КОММЕНТАРИЕВ, содержащая не более одного EOL и не состоящая только из КОММЕНТАРИЕВ. РАЗДЕЛИТЕЛЬ_АБЗАЦЕВ есть последовательность пробелов, EOL'ов, явных символов конца абзаца и КОММЕНТАРИЕВ, не являющаяся РАЗДЕЛИТЕЛЕМ_СЛОВ и не состоящая только из КОММЕНТАРИЕВ. СЛОВО есть последовательность ЗНАКОВ и КОММЕНТАРИЕВ, содержащее хотя бы один ЗНАК. ЗНАКИ бывают такие: ПРОСТОЙ_ЗНАК плюс НАБОР_АКЦЕНТОВ, ЛИГАТУРА плюс НАБОР_АКЦЕНТОВ. ЛИГАТУРА есть последовательность ПРОСТЫХ_ЗНАКОВ, соединенных символом "&". НАБОР_АКЦЕНТОВ может быть пустым, состоящим из одного акцента, либо же придыхание + ударение или титло + ударение. III. ТАБЛИЦА КОДИРОВКИ БАЗОВОГО HIP. 1. КОММЕНТАРИИ: %- мягкий перенос %< переход на красный цвет (киноварь) %> переход на черный цвет (конец киновари) %{...} комментарии, игнорируемые на уровне базового HIP, но могущие содержать информацию о разметке в расширенном HIP; внутри этих комментариев использовать символы { и } можно только при условии сохранения их парности. 2. ПРОСТЫЕ_ЗНАКИ и некоторые ЛИГАТУРЫ: ! символ "!" # знак для 1000 $ (зарезервировано) ( символ "(" ) символ ")" * 8-конечная звездочка (поднятая над строкой) + крестик , символ "," - символ "-" (дефис) . символ "." (точка внизу строки) / символ "/" (обозначение раздела на строки в оригинале при точной передаче цитат) // символ "//" (конец страницы/листа в оригинале при точной передаче цитат) 0..9 арабские цифры : символ ":" ; символ ";" ("удивительная") , "i десятиричное" без точек , "омега красивая" (для "о!" и "оле!") <кс>, <Кс>=<КС> кси <пс>, <Пс>=<ПС> кси ? неясный или неоднозначный символ ?&{...} неясный или неоднозначный символ с пояснениями к нему (в скобках может быть любой HIP-ТЕКСТ) ?&{...|...|...} альтернативный тег @ символ "кавыка" @&{...} символ "кавыка" и соответствующее ей примечание (в скобках может быть любой HIP-ТЕКСТ) ABCEHKMOPTXY синонимы кириллических букв той же формы aceopxy синонимы кириллических букв той же формы DGLR (зарезервировано; про G и Z см. п. IV) bdghklmrt (зарезервировано; про g и z см. п. IV) F, f фита I, i "i десятиричное" (с двумя точками, если нет акцентов) JА=Jа, jа буква "я" в виде лигатуры iа JЕ=Jе, jе буква "iе" JЬ=Jь, jь ять JЭ=Jэ, jэ синоним для Jе/jе JЯ=Jя, jя йотированный юс малый JN=Jn, jn йотированный юс большой N, n юс большой Q, q "о широкое" S, s зело U, u "ик" (знак для 400 или вторая часть диграфа "оу") V, v ижица V", v" ижица с двумя штрихами W, w омега W\т, w\т буква "от" [ символ "[" ] символ "]" _ пустое место, над коим можно ставить диакритические знаки А...Я, а...я соответствующие буквы, с такими только уточнениями: 1) е и э -- угловатое и круглое начертания буквы "е"; 2) Е и Э -- визуально синонимы, но рекомендуется использовать их сообразно с различием в начертании строчного варианта; 3) О, о -- "о узкое"; широкое -- это Q/q; 4) У, у -- гамма-образное начертание (диграф передается как ОU/Оu/оu, буква "ик" -- как U/u); 5) Щ, щ -- слитное начертание, а не диграф (он так и будет: ШТ/Шт/шт); 6) Ы, ы -- начертание Ы, а не ЪI; 7) Я, я -- юс малый. ОU, Оu, оu диграф "оу" (с точки зрения HIP это даже не один символ и даже не лигатура, а просто два знака подряд) 3. АКЦЕНТЫ: " два штриха (для ижицы) ' острое ударение = придыхание тонкое =' острое ударение с придыханием =` тяжелое ударение с придыханием (оно же -- акцент для красивой омеги) \г г-титло \д д-титло \ж ж-титло \з з-титло \о о-титло \р р-титло \с с-титло \т т-титло (в том числе и как элемент буквы "от") \х х-титло \ъ паерок ^ облеченное ударение ` тяжелое ударение ~ простое титло Примечание: \Г = \г, \Д = \д и т. п. 4. Спецсимволы: пробел EOL % начало комментария (см. п. III.1) & лигатурная склейка (см. п. I.8) <...> формат записи именованных символов (список см. в п. II.2; он будет пополняться) <> явный символ конца абзаца {...} вставной HIP-ТЕКСТ (например, сноска или указание параллельного места) IV. ВОЗМОЖНЫЕ ДОПОЛНИТЕЛЬНЫЕ ОБОЗНАЧЕНИЯ (пока в стандарт не входят!): =^ облеченное ударение с придыханием <=> густое придыхание \{...} произвольный надстрочный HIP-ТЕКСТ (например, несколько выносных букв подряд или даже одна выносная буква, но кодируемая более чам одним байтом, типа \{<пс>} или \{jа}) <сноска>&{...} возможное оформление сносок <паралл>&{...} возможное оформление параллельных мест Z, z z-образная буква З , перевернутое зело <Ы>, <ы> буква Ы в форме ЪI Ъ&I, ъ&i то же, но с соединительной черточкой JJЬ, jjь йотированный ять G, g дервь , вариант буквы i ("i с крючком внизу"), используемый в транслитерации глаголицы <Ы_>, <ы_> вариант буквы ы, когда второй элемент -- это "i с крючком" <ЪИ>, <ъи> ЪИ-вариант буквы Ы <ЬИ>, <ьи> ЬИ-вариант буквы Ы <А_>, <а_> вариант юса малого в виде подчеркнутого А <Я.>, <я.> вариант юса малого в виде А с "прогнутой вниз" горизонтальной линией <Я_>, <я_> вариант юса малого с соединенными чертой внизу ножками , вариант юса большого с двумя ножками , зело в виде "z с крючком" <НГ>, <нг> "н с крючком" <ЛГ>, <лг> "л с крючком" <ДГ>, <дг> "д с крючком" Л&Ю, л&ю лигатура ЛЮ М&Ю, м&ю лигатура МЮ <АН>, <ан> носовое А (для глаголицы) <Ч>, <ч> стигма <Ю>, <ю> перевернутое ю О\u, о\u форма буквы "ук" в виде "о с галочкой" <ЦЧ>, <цч> ч-образное "ц" <ШЧ>, <шч> вариатный глиф для "щ" (см. у Востокова) #& знак для 6000 (лигатура из знака для 1000 и перевернутого s) I&А, i&а лигатура iа с соединительной чертой посреди строки (а не сверху, как в JА/jа) <Ъ>, <ъ> высокий вариант Ъ <Т>, <т> высокий вариант Т , высокий вариант ятя I&Ь, i&ь низкий вариант ятя (как бы лигатура ПЬ, а не "стандартное" перечеркнутое Ь) ^ над согласными -- знак мягкости (по начертанию совпадает с облеченным ударением) \v u-образный символ, употреблявшийся в смысле паерка между согласными (конфликта с титлами вроде бы не будет, потому что надстрочной ижицы вробе бы не бывает (а если и бывает, то чем она отличается от надстрочного же ика?) <.:.> <.:.-> и т. п. -- различные составные знаки препинания <(:.> <.:)> "три точки, несовершенно окруженные" <вран>, <колода>, <тьма>, ... крюковая нотация (???) <титло>&{абв} несколько букв (абв) под общим титлом Для точного различения выносных букв с покрытиями и без оных можно изобрести систему такого рода (буква "с" взята только для примера): \с выносная буква в начертании "по умолчанию" (наличие покрытия зависит, вообще говоря, от шрифта) \{с} выносная буква без покрытия \^ покрытие как таковое \{с\^} выносная буква с покрытием [* конец текста *] =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 10 мар 2000 07:07:16 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Forward -------------------------------------------------------------------------------- > Я предлагаю дублировать на ортодоксии те ресурсы, который мы копим, а не > просто давать на них ссылки. > Абыдно будет, если что-то, из того, что мы мнили имети, вдруг исчезнет... > > Левъ. А я так и делаю, в принципе. Алексей =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 10 мар 2000 05:42:43 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Forward -------------------------------------------------------------------------------- ----- Original Message ----- From: "A A G" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Friday, March 10, 2000 4:07 AM Subject: Re: Forward > С Зингером я связывался месяца два назад. Может еще ему напомню о себе. > Чтобы продублировать сайт нужен какой-то провайдер бесплатного хостинга с > поддержкой ASP. Я одного такого нашел, но не опробовал. Но молчание в сетях, Да я не ортодоксию предлагаю дублировать: скорее всего, у нее проблемы временные или хакнули сатанисты в связи с Конгрессом православной прессы ( Высясню. Я предлагаю дублировать на ортодоксии те ресурсы, который мы копим, а не просто давать на них ссылки. Абыдно будет, если что-то, из того, что мы мнили имети, вдруг исчезнет... Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 10 мар 2000 05:07:09 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Forward -------------------------------------------------------------------------------- С Зингером я связывался месяца два назад. Может еще ему напомню о себе. Чтобы продублировать сайт нужен какой-то провайдер бесплатного хостинга с поддержкой ASP. Я одного такого нашел, но не опробовал. Но молчание в сетях, я надеюсь, все-таки будет нам не так часто грозить. Вот, кстати, у меня стал канал нормальный до orthodoxy.ru. Только и проблем, что он совсем не работает. > > > Так вроде я дал ссылку на Зингера. > > > А Зингер не сгинет как-нибудь? Паутина штука переменчивая. > Вот ортодокси ру наш сейчас глухо висит уже много часов. > > Так не стоит ли продублировать у себя (в данном случае это означает на > ортодоксии и - прототип - у Вас как у вебмастера) все важные ресурсы, > расклассифицировав их с нашей точки зрения? > > Кстати, насчет Зингера. Он знает о нашем существовании? Я вот залез к нему, > поглядел; в общем, те же проблемы его волнуют, форум там у него (сообщений > десятка полтора), в Юникоду ходить ходоками намереваются...... > > Левъ. > > > ---------------------------------------------------------------------- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru > > =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 10 мар 2000 05:01:01 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AG" Тема: Re: Forward -------------------------------------------------------------------------------- ----- Original Message ----- From: "AG" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Thursday, March 09, 2000 9:22 PM Subject: Re: Forward > Так вроде я дал ссылку на Зингера. А Зингер не сгинет как-нибудь? Паутина штука переменчивая. Вот ортодокси ру наш сейчас глухо висит уже много часов. Так не стоит ли продублировать у себя (в данном случае это означает на ортодоксии и - прототип - у Вас как у вебмастера) все важные ресурсы, расклассифицировав их с нашей точки зрения? Кстати, насчет Зингера. Он знает о нашем существовании? Я вот залез к нему, поглядел; в общем, те же проблемы его волнуют, форум там у него (сообщений десятка полтора), в Юникоду ходить ходоками намереваются...... Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 09 мар 2000 22:22:17 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Forward -------------------------------------------------------------------------------- Так вроде я дал ссылку на Зингера. > Hola DTPeople! > > Может кому интересно. Нашел сайт по сабжу. > http://www.ccss.de/slovo/aksrus.htm > > Цитата: > > > Для старой русской орфографии я создал шрифт "XSerif Old > > Russian" (Информация о шрифтах "XSerif"). Это шрифт по кодировке 1251 > > (WindowsCyrillic), но дополнительно содержит ять, фиту, ижицу. > > Пример такого шрифта: > http://homepages.uni-tuebingen.de/student/christoph.singer/slovo/images/kiri > llcy.jpg > > _____________ > Serg G. BABICH > babich@chance.ru > > > > > Алексей! Может, ссылку на сайт, а лучше - скопировать и держать под рукой > сам шрифт? - Левъ. > > > > > ---------------------------------------------------------------------- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru > > ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 09 мар 2000 21:26:23 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Forward -------------------------------------------------------------------------------- Hola DTPeople! Может кому интересно. Нашел сайт по сабжу. http://www.ccss.de/slovo/aksrus.htm Цитата: > Для старой русской орфографии я создал шрифт "XSerif Old > Russian" (Информация о шрифтах "XSerif"). Это шрифт по кодировке 1251 > (WindowsCyrillic), но дополнительно содержит ять, фиту, ижицу. Пример такого шрифта: http://homepages.uni-tuebingen.de/student/christoph.singer/slovo/images/kiri llcy.jpg _____________ Serg G. BABICH babich@chance.ru Алексей! Может, ссылку на сайт, а лучше - скопировать и держать под рукой сам шрифт? - Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 09 мар 2000 16:07:21 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: =^ i KS, a takzhe jat' -------------------------------------------------------------------------------- > А нельзя ли с этим Дорошем связаться? > Тогда бы мы всё из первых рук и узнали. Человек, который во время создания Ирмологиона жил в одной общажной комнате с Дорошем, сделал мне зеркало сайта "Елисавета". Он же поведал, что Дорош сейчас работает сисадмином в налоговой инспекции и по каким-то причинам не хочет или не может выходить в Интернет. Алексей =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 09 мар 2000 13:42:40 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: *** azamoam@club-internet.fr -------------------------------------------------------------------------------- *Welcome to the Windows NT/WS4.0, postmaster*. You have new mail. *postmaster@des-nt.tstu.ru $* Tuesday, March 07, 2000 10:04:19, you wrote to me: p> На лист рассылки подписался на днях вот такой человек: p> AZAM Olivier et Anne-Marie p> От него письмо до меня каким-то образом дошло, p> а вот до него сендмэйл пробиться не может. :-( p> DNS failed! p> Что предложите? Поскольку никто ничего не предложил, и все статьи, начиная с 7 марта, лежат в аутбаунде и напрягают smtpsend, письма For: azamoam@club-internet.fr я удаляю, а его самого отписываю. =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 09 мар 2000 13:27:39 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: *** font-list-arc2.txt -------------------------------------------------------------------------------- *Welcome to the Windows NT/WS4.0, Mikhail Grinchuk*. You have new mail. Начат второй файл архива списка рассылки. Доступен по тому же адресу, название -- font-list-arc2.txt и font-list-arc2.rar =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 09 мар 2000 09:34:18 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Shrifty dlja staroobrjadcev -------------------------------------------------------------------------------- По адресу http://info.ee/rda/veruyu.shtml лежит засканированное откуда-то <<И=сповjь'данiе правосла'вныя вjь'ры, пе'рваго собо'ра>>. Там употребляется з-титло (во\зше'дшаго), а также м-титло (живы\м и= ме'ртвы\м). Кроме того, там используется буква "от" с ударением (w\т' дх~а ст~а). По-моему, такого ни в одном компьютерном славянском шрифте не было. Знак переноса отсутствует, но (похоже на то) вместо него порой используется паерок (при_пон\ъ/тi'йстjьмъ, собо'р\ъ/ную). =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 09 мар 2000 08:52:14 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: =^ i KS, a takzhe jat' -------------------------------------------------------------------------------- > > Да не предназначен HIP для набора - только в исключительных случаях. > > > > Это формат хранения и обмена текстами. > > Нет, вначале была - вроде даже твоя - идея использовать это также и при > наборе в простом текстовом редакторе, типа emacs'a. Я даже тогда стал > подумывать о соответствующем наборе настроек для emacs'а. Они и под дос > есть. Зато очень быстро я сэволюционировал к пониманию того, что это все - жалкие полумеры. На самом деле, нужна защищенная среда, совершенно не позволяющая испортить текст. И совершенно необязательна, например, человекочитаемость. И если не создать такую защищенную среду, процесс собирания _всех_ ЦСл текстов в HIP протянется, по моей оценке, как минимум, раза в три, а скорее - еще значительно дольше, чем если бы начать именно со среды. Но тут уж ничегь не поделаешь: коллективное сознание инерционно и требует немедленных результатов. А там - хоть трава не расти, даже если _последние_ результаты гарантированно окажутся безнадежно отдаленными при избранном подходе..... Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 09 мар 2000 07:06:30 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: =^ i KS, a takzhe jat' -------------------------------------------------------------------------------- Lev Tikhonov wrote: > > > Но простите, jь - это же сдуреешь переключаться. Хотелось бы все ж > > попроще. Может еь :-))) > > Да не предназначен HIP для набора - только в исключительных случаях. > > Это формат хранения и обмена текстами. Нет, вначале была - вроде даже твоя - идея использовать это также и при наборе в простом текстовом редакторе, типа emacs'a. Я даже тогда стал подумывать о соответствующем наборе настроек для emacs'а. Они и под дос есть. Александр ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 09 мар 2000 06:29:41 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: =^ i KS, a takzhe jat' -------------------------------------------------------------------------------- > Но простите, jь - это же сдуреешь переключаться. Хотелось бы все ж > попроще. Может еь :-))) Да не предназначен HIP для набора - только в исключительных случаях. Это формат хранения и обмена текстами. Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 09 мар 2000 06:10:32 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: =^ i KS, a takzhe jat' -------------------------------------------------------------------------------- AGA wrote: > Дорош говорит, что базой для ирмологиона были > книги начала нашего века. В первую очередь > ирмологий, и еще Типикон и что-то не помню другое. А нельзя ли с этим Дорошем связаться? Тогда бы мы всё из первых рук и узнали. > Но простите, jь - это же сдуреешь переключаться. > Хотелось бы все ж попроще. Может еь :-))) Так и так переключаться придется часто -- на латинице сидят q/Q, w/W, ou/Ou/OU, i/I, s/S, ja/Ja/JA, f/F, v/V -- это только для самой базовой графики. Плюс часть диакритики. Так что одна буква погоды не сделает. Да и, насколько помню, в Windows можно задать множество клавиатурных макросов -- так посадите ять на что-нибудь типа F12/Shift-F12 -- и никаких проблем с переключением. (И вообще эта проблема возникает, только если нечто длинное набирается непосредственно в HIP "стандартными средствами". Но ведь никто не запрещает при наборе использовать любые переобозначения -- хоть бы и это ЕЬ -- а потом проделать глобальную замену. А еще лучше -- иметь соответственно настроенный редактор.) =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 09 мар 2000 04:33:19 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: =^ i KS, a takzhe jat' -------------------------------------------------------------------------------- > Интересно было бы взглянуть на примеры (в каких словах Там их не было, а сам я не встречал. > это бывает и в книгах какого времени). Если это бывает, Дорош говорит что базой для ирмологиона были книги начала нашего века. В первую очередь ирмологий, и еще Типикон и что-то не помню другое. > 5) либо то же самое, но вместо &...& использовать <...> > (угловые скобки пока свободны); > Это симпатичнее в части читабельности. Правда вместо одного символа занимаем два - но может это и лучше, двусмысленностей меньше будет. > 6) сверх того, в последнем случае можно разумно использовать > и символ & -- пусть это будет именно "склейщик лигатур". > То есть л&г -- это "л с крючком". При таком подходе можно > чуть ли не вязь кодировать; > Тоже верно. > 7) а если одновременно искать и краткости, и визуальной > похожести -- то можно, например, кси обозначить через &з/&З, > а пси -- через &ш/&Ш. > Имхо тут приобретение в краткости не окупается потерей в удобопонятности и удобопомнимости (что Кс есть кси очень трудно забыть). > на ять похоже -- t/L или jь/Jь/JЬ -- еще вопрос. (И, собственно, Но простите, jь - это же сдуреешь переключаться. Хотелось бы все ж попроще. Может еь :-))) ------------- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 09 мар 2000 04:01:55 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: =^ i KS, a takzhe jat' -------------------------------------------------------------------------------- > Про ять. В принципе обозначение t/L использовать можно. > Неудобно только, что стандартная смена lower-/uppercase > при этом перестает действовать. И что визуально больше > на ять похоже -- t/L или jь/Jь/JЬ -- еще вопрос. (И, собственно, > почему именно t? Символ b тоже пока не занят.) Можно > было бы и iь/Iь/IЬ использовать (с позиций читаемости это > лучше), но тут снова возникает проблема с лигатурами. > (А для jь не возникает, так как символ j сам по себе не > употребляется.) Что народ скажет? Мне нравится t, но возражение о lower-/uppercase очень весомо. Алексей =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 09 мар 2000 02:23:12 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: =^ i KS, a takzhe jat' -------------------------------------------------------------------------------- Доброе утро! >> (по неподтвержденным сведениям надстрочный знак >> здесь называется "великий апостроф", но поскольку >> сочетания придыхания с облеченным ударением не >> бывает, оставляем обозначение без изменения). >> > А вот автор Ирмологиона в документации к шрифту по этому > поводу делает специальное примечание: "...придыхание > с облеченным ударением (редко, но встречается)". > А он приводит достаточно серьезный список источников, > на основе которых делал шрифт. Интересно было бы взглянуть на примеры (в каких словах это бывает и в книгах какого времени). Если это бывает, но не над омегой, то проблемы не возникает (можно считать, что над омегой знак просто изменяет свою форму); если же бывает и над омегой, то акцент для красивой омеги надо обозначить как-нибудь по-другому. Например, \) -- по аналогии с буквенными титлами. Про KS vs. &{КС}: 1) "упрощенный" вариант типа &кс не очень хорош, потому что предлагаемая система обозначений "хитрых" символов такая: & плюс либо один знак, либо нечто в фигурных скобках. Чтобы не могло получиться так, что одно обозначение целиком "вкладывается" в другое, причем "хвост" тоже есть нечто осмысленное -- та же проблема, что и в любой лигатурной системе; 2) вариант {кс еще хуже -- фигурные скобки у нас уже заняты и должны быть парными, если же написать {кс}, то это будет маленькая странная сноска; 3) LT: > Мое возражение относилось к случаю, когда ТеХовский > комментарий разбивал такую лигатуру, но она, тем не > менее, продолжала оставаться лигатурой. Это соглашение > я считал и продолжаю считать извращением - > наследием строчного принципа. ТеХ и строчный принцип тут не виноваты. Если было написано нечто такое: В_лjь\т #sцк%{знак титла пропущен}s великiй кн~zъ... а потом мы применяем заурядную операцию удаления комментариев, то дата портится -- возникает кси, которого не было. Или идем на то, что удаление комментариев тоже должно быть "задумчивым"? Чтобы порой вставлялось обозначение для разбиения лигатур? 4) можно пойти на некий компромиссный вариант -- для всех дополнительных знаков использовать единый синтаксис &...&: &i& и &I& -- i/I без точек &кс&, &Кс& и &КС& -- кси &пс&, &Пс& и &ПС& -- пси &=& -- разделитель абзацев (впрочем, его тогда можно сократить до "&&"); 5) либо то же самое, но вместо &...& использовать <...> (угловые скобки пока свободны); 6) сверх того, в последнем случае можно разумно использовать и символ & -- пусть это будет именно "склейщик лигатур". То есть л&г -- это "л с крючком". При таком подходе можно чуть ли не вязь кодировать; 7) а если одновременно искать и краткости, и визуальной похожести -- то можно, например, кси обозначить через &з/&З, а пси -- через &ш/&Ш. Про ять. В принципе обозначение t/L использовать можно. Неудобно только, что стандартная смена lower-/uppercase при этом перестает действовать. И что визуально больше на ять похоже -- t/L или jь/Jь/JЬ -- еще вопрос. (И, собственно, почему именно t? Символ b тоже пока не занят.) Можно было бы и iь/Iь/IЬ использовать (с позиций читаемости это лучше), но тут снова возникает проблема с лигатурами. (А для jь не возникает, так как символ j сам по себе не употребляется.) Что народ скажет? М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 08 мар 2000 21:35:42 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Re: статус инв. представления -------------------------------------------------------------------------------- AGA wrote: > Я тоже не понимаю. Если набирать что-то вручную (в ситуациях типа > таких, когда ученые в доисторические времена в электронной переписке > передавали формулы в теховском формате), то латинский вариант > значительно приятнее (тем более что для первого варианта на латиницу > переключаться все равно придется, причем вдвое больше раз). Прецедент > был в ру литургике, и кстати вполне реальная область применения формата > - публикация там славянских текстов не в виде атташей, а прямо так. У > кого конвертер есть - переделает, у кого нет - с грехом пополам, но > прочитает. И читабельность латинского варианта как раз значительно > выше. > Или хотя бы ограничиться значком попроще, типа &Кс, или {Кс. Зачем &Кs. Если не пройдет обычная лигатура, голосую за &Ks. (Если это действительно соответствует общей практике употребления &). Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 06 мар 2000 16:08:44 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Raznoje -------------------------------------------------------------------------------- Дефисное написание в слове "церковнославянский" встречается в упоминавшейся мной книге совершенно последовательно, включая предисловие Н.И. Толстого. А книжка сама по себе неплохая. К тому же, в нашем деле брезговать ничем не следует. В вопросе о норме я придерживаюсь того мнения, что норма есть, но она двойная. Алексей =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 08 мар 2000 15:05:54 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: статус инв. представления -------------------------------------------------------------------------------- > > Да, я конечно, не все просматривал и многое пропустил. Но это > странно. > > Чем плохи упомянутые лигатуры? > > > Или хотя бы ограничиться значком попроще, типа &Кс, или {Кс. Зачем > огороды-то городить? > ------------- Согласен. Мое возражение относилось к случаю, когда ТеХовский комментарий разбивал такую лигатуру, но она, тем не менее, продолжала оставаться лигатурой. Это соглашение я считал и продолжаю считать извращением - наследием строчного принципа. Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 08 мар 2000 03:51:38 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: статус инв. представления -------------------------------------------------------------------------------- > Mikhail Grinchuk wrote: > > 3. Буква кси -- &{КС} и &{Кс} (заглавная), &{кс} > > (строчная), лигатурный вариант КS/Кs/кs отменяется. > > Для буквы пси аналогично. > > Да, я конечно, не все просматривал и многое пропустил. Но это странно. > Чем плохи упомянутые лигатуры? > Я тоже не понимаю. Если набирать что-то вручную (в ситуациях типа таких, когда ученые в доисторические времена в электронной переписке передавали формулы в теховском формате), то латинский вариант значительно приятнее (тем более что для первого варианта на латиницу переключаться все равно придется, причем вдвое больше раз). Прецедент был в ру литургике, и кстати вполне реальная область применения формата - публикация там славянских текстов не в виде атташей, а прямо так. У кого конвертер есть - переделает, у кого нет - с грехом пополам, но прочитает. И читабельность латинского варианта как раз значительно выше. Или хотя бы ограничиться значком попроще, типа &Кс, или {Кс. Зачем огороды-то городить? ------------- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 08 мар 2000 03:43:40 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: статус инв. представления -------------------------------------------------------------------------------- > (по неподтвержденным сведениям надстрочный знак > здесь называется "великий апостроф", но поскольку > сочетания придыхания с облеченным ударением не > бывает, оставляем обозначение без изменения). > А вот автор Ирмологиона в документации к шрифту по этому поводу делает специальное примечание: "...придыхание с облеченным ударением (редко, но встречается)". А он приводит достаточно серьезный список источников, на основе которых делал шрифт. ------------- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 08 мар 2000 08:20:09 От: "Kirill Khroustalev" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: мои две копейки:) -------------------------------------------------------------------------------- Можно было бы маленькую "ять" обозначить "t", FR, например, очень легко научить ее распознавать таким образом, но это лирика, конечно, но просто нехорошо что одной, довольно простой букве соответствует две. А t на ять довольно похожа. А заглавную "ять" (никогда, кстати, не видал, но могу представить) можно обозначить "L", она вроде не занята еще и тоже похожа(относительно). Правда, это может плохо отразиться на читабельности, но может и нормально будет. Как вам такая идея? Кирилл ----- Original Message ----- From: Mikhail Grinchuk To: -=ORTHODOX-FONT=- Project Participants Sent: Tuesday, March 07, 2000 7:27 PM Subject: Re: статус инв. представления > "Alexander V. Voinov" wrote: > > > > > Да, я конечно, не все просматривал и многое пропустил. > > > > Но это странно. Чем плохи упомянутые лигатуры? > > > > > > Основное возражение такое: если буквы К (или П) и S просто > > > стоят рядом (а это изредка бывает), то между ними приходится > > > втискивать некий разделитель (например, записывать как К\\S > > > или П\\S). > > > > И примеры приводились, именно с "зело"? Их, по-моему, > > всего-то несколько штук. > > Примеры обнаружились в записи чисел: 1) в тексте Codex > Suprasliensis (текст в 7-битовой кодировке водится в сети); > 2) в Новгородской харатейной летописи (на одной из первых > страниц факсимильного издания). Причем в первом случае > язык именно церковнославянский (хотя в старом и > неформализованном варианте орфографии). > > Реально проблема может возникнуть с теми же числами, если > мы работаем с текстом, в котором отсутствует диакритика. > > Технически запись без лигатур чуть проще для конвертации > в HIP: не надо отслеживать сочетания символов, можно > просто кодировать каждый символ (знакоместо) независимо > от соседей. > > > > ЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪ9г83—ЭSЌ®€чrъЪ1ЁҐ.+-Іг «ѕ'ўs«¶ёМІшЪ > =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 08 мар 2000 04:27:28 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: статус инв. представления -------------------------------------------------------------------------------- "Alexander V. Voinov" wrote: > > > Да, я конечно, не все просматривал и многое пропустил. > > > Но это странно. Чем плохи упомянутые лигатуры? > > > > Основное возражение такое: если буквы К (или П) и S просто > > стоят рядом (а это изредка бывает), то между ними приходится > > втискивать некий разделитель (например, записывать как К\\S > > или П\\S). > > И примеры приводились, именно с "зело"? Их, по-моему, > всего-то несколько штук. Примеры обнаружились в записи чисел: 1) в тексте Codex Suprasliensis (текст в 7-битовой кодировке водится в сети); 2) в Новгородской харатейной летописи (на одной из первых страниц факсимильного издания). Причем в первом случае язык именно церковнославянский (хотя в старом и неформализованном варианте орфографии). Реально проблема может возникнуть с теми же числами, если мы работаем с текстом, в котором отсутствует диакритика. Технически запись без лигатур чуть проще для конвертации в HIP: не надо отслеживать сочетания символов, можно просто кодировать каждый символ (знакоместо) независимо от соседей. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 08 мар 2000 04:05:02 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Re: статус инв. представления -------------------------------------------------------------------------------- Mikhail Grinchuk wrote: > > Да, я конечно, не все просматривал и многое пропустил. > > Но это странно. Чем плохи упомянутые лигатуры? > > Основное возражение такое: если буквы К (или П) и S просто > стоят рядом (а это изредка бывает), то между ними приходится > втискивать некий разделитель (например, записывать как К\\S > или П\\S). И примеры приводились, именно с "зело"? Их, по-моему, всего-то несколько штук. Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 08 мар 2000 03:55:36 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: статус инв. представления -------------------------------------------------------------------------------- "Alexander V. Voinov" wrote: > > 3. Буква кси -- &{КС} и &{Кс} (заглавная), &{кс} > > (строчная), лигатурный вариант КS/Кs/кs отменяется. > > Для буквы пси аналогично. > > Да, я конечно, не все просматривал и многое пропустил. > Но это странно. Чем плохи упомянутые лигатуры? Основное возражение такое: если буквы К (или П) и S просто стоят рядом (а это изредка бывает), то между ними приходится втискивать некий разделитель (например, записывать как К\\S или П\\S). Было и такое мнение: "Насколько милы Вашему глазу все эти игры с к+с = кси, настолько они удивительны для любого не-ТеХовца, а для меня, для Хозяинова и тем более для подавляющей массы людей, оторвавшихся от Лексикона, но не знающих ничего, кроме Ворда - просто дики". =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 08 мар 2000 03:07:26 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Re: статус инв. представления -------------------------------------------------------------------------------- Hi, Mikhail Grinchuk wrote: > 3. Буква кси -- &{КС} и &{Кс} (заглавная), &{кс} > (строчная), лигатурный вариант КS/Кs/кs отменяется. > Для буквы пси аналогично. Да, я конечно, не все просматривал и многое пропустил. Но это странно. Чем плохи упомянутые лигатуры? Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 08 мар 2000 02:59:24 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: статус инв. представления -------------------------------------------------------------------------------- Доброе утро! "Alexander V. Voinov" wrote: > Стабилизировался ли субж? Можно уже в него все > перекодировать, или еще рано? По крайней мере двое участников данной дискуссии грозились прислать списки предложений и замечаний. Но пока не прислали. Поэтому ждем. На всякий случай еще раз привожу основные спорные моменты кодировки. 1. Комментарии: %{...}, внутри фигурные скобки запрещены. (Синтаксис %%...EOL отменяется.) 2. Буква ять -- JЬ и Jь (два варианта заглавной) и jь (строчная). Вариант R/r отменяется. 3. Буква кси -- &{КС} и &{Кс} (заглавная), &{кс} (строчная), лигатурный вариант КS/Кs/кs отменяется. Для буквы пси аналогично. 4. I/i без точек -- &I и &i вместо I\\ и i\\. (Обозначение \\ при этом вообще отменяется за ненадобностью.) 5. Разделитель абзацев -- и пустая строка, и &= 6. "Красивая омега" для слов О! и Оле! -- W=^ / w=^ (по неподтвержденным сведениям надстрочный знак здесь называется "великий апостроф", но поскольку сочетания придыхания с облеченным ударением не бывает, оставляем обозначение без изменения). 7. Переключение цвета -- %< и %> (красный и черный). 8. Мягкий перенос -- %- Остальные темные места вроде бы не так актуальны. Конкретное предложение такое: в любом случае через неделю объявляется 4-я версия HIP (в ней не будет списка вопросов, в отличие от 3-й), и если в течение 2 недель не появятся возражения, то ее будем считать принятой. Согласны? М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 07 мар 2000 16:10:34 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: *** http://www.slavonic.orthodoxy.ru -------------------------------------------------------------------------------- Надо подождать чуток. У меня сейчас нет времени все до ума довести. Может, кто займется? Алексей P.S. Что-то моя почта стала плохо доходить до рассылки. > > Что мне ответить? > > ------------ > Date: Tue, 7 Mar 2000 12:15:03 +0300 > From: Mrezha Administrator > To: postmaster@orthodox.tstu.ru > > Привет! > > Можно ли вынести ссылку http://www.slavonic.orthodoxy.ru на зглавную > страницу и если можно, то как назвать ее? > > Если надо поднимать популярность, рекомендую сделать банер и отправить > на banner@orthodoxy.ru. По статистике сильно поднимает посещаемость - > народ интересуется. > > Саша > mailto:admin@mrezha.ru > ------------ > > =postmaster > > > > ---------------------------------------------------------------------- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru > > =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 07 мар 2000 14:24:33 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: *** http://www.slavonic.orthodoxy.ru -------------------------------------------------------------------------------- *Welcome to the Windows NT/WS4.0, postmaster*. You have new mail. Что мне ответить? ------------ Date: Tue, 7 Mar 2000 12:15:03 +0300 From: Mrezha Administrator To: postmaster@orthodox.tstu.ru Привет! Можно ли вынести ссылку http://www.slavonic.orthodoxy.ru на зглавную страницу и если можно, то как назвать ее? Если надо поднимать популярность, рекомендую сделать банер и отправить на banner@orthodoxy.ru. По статистике сильно поднимает посещаемость - народ интересуется. Саша mailto:admin@mrezha.ru ------------ =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 07 мар 2000 11:04:19 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: *** azamoam@club-internet.fr -------------------------------------------------------------------------------- *Welcome to the Windows NT/WS4.0, Mikhail Grinchuk*. You have new mail. На лист рассылки подписался на днях вот такой человек: AZAM Olivier et Anne-Marie От него письмо до меня каким-то образом дошло, а вот до него сендмэйл пробиться не может. :-( DNS failed! Что предложите? =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru