=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 27 дек 1999 21:32:22 От: postmaster Кому: font-list@des-nt.tstu.ru Тема: Итак, майллист уже работает. -------------------------------------------------------------------------------- Приветствую, font-list. HELP: no valid commands found To SUBSCRIBE to the mailing list send a message to robot@des-nt.tstu.ru with Subject=subscribe maillistname To POST you message to the list, send a message to maillistname@des-nt.tstu.ru To UNSUBSCRIBE from the mailing list send a message to robot@des-nt.tstu.ru with Subject=unsubscribe maillistname AVAILABLE lists: font-list PS Лева, ты уже понял, что к чему? Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 27 дек 1999 21:42:20 От: postmaster Кому: font-list@des-nt.tstu.ru Тема: Re: Итак, майллист уже работает. -------------------------------------------------------------------------------- Привет postmaster, 27 декабря 1999 г., 21:32:22, ты писал: p> Приветствую, font-list. p> HELP: no valid commands found p> To SUBSCRIBE to the mailing list send a message p> to robot@des-nt.tstu.ru p> with Subject=subscribe maillistname p> To POST you message to the list, send a message p> to maillistname@des-nt.tstu.ru p> To UNSUBSCRIBE from the mailing list send a message p> to robot@des-nt.tstu.ru p> with Subject=unsubscribe maillistname p> AVAILABLE lists: p> font-list p> PS Лева, ты уже понял, что к чему? p> Всего хорошего, p> postmaster пишите:postmaster@des-nt.tstu.ru Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 27 дек 1999 21:45:12 От: postmaster Кому: postmaster Тема: Re[2]: Итак, майллист уже работает. -------------------------------------------------------------------------------- Привет postmaster, 27 декабря 1999 г., 21:42:20, ты писал: p> Reply-To: "-=ORTHODOX-FONT=- Project Participants" p> Received: from des-NT.tstu.ru ([62.76.177.41]) by des-nt.tstu.ru with ESMTP id 40 for ; Mon, 27 Dec 1999 21:42:20 +0300 p> X-Mail-Server: Eserv/2.7 /EPE Labs. p> Date: Mon, 27 Dec 1999 21:42:20 +0300 p> From: postmaster p> X-Mailer: The Bat! (v1.34a) UNREG / CD5BF9353B3B7091 p> Reply-To: postmaster p> Organization: TSTU DES p> X-Priority: 3 (Normal) p> Message-ID: <17904.991227@des-nt.tstu.ru> p> To: font-list@des-nt.tstu.ru p> Subject: =?koi8-r?B?UmU6IOnUwcssIM3ByszMydPUINXWxSDSwcLP1MHF1C4=?= p> In-reply-To: <14897.991227@des-nt.tstu.ru> p> References: <14897.991227@des-nt.tstu.ru> p> Mime-Version: 1.0 p> Content-Type: text/plain; charset=koi8-r p> Content-Transfer-Encoding: 8bit Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 28 дек 1999 16:50:15 От: "Lev Tikhonov" Кому: Тема: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- Привет, Владимир! Чтобы не повторяться в репликах, заранее объясню позицию. Прежде всего, у нас тут православныя конфа, а не группа любителей... того или иного софта. Поэтому раскрутить меня на "религиозную войну" тебе вряд ли удастся ;) И вряд ли удастся убедить меня согласиться с такой организацией работы, чтобы все желающие иметь отношение к священному процессу верстки славянского текста должны были бы предварительно освоить ТеХ, SGML, Вентуру, и т. д. и прочие идеи Чучхэ, да хотя бы и Ворд. В то же время фоновая интеллектуальная работа может быть поручена любой программе - я даже согласен на ТеХ, если он действительно лучше всех. Но это не означает, что наборщик должен быть обязательно принуждаем работать в нем, а не может обойтись Вордом, лексиконом или чем угодно еще. А что, если православная тетушка давно набрала, допустим Триодь - в лексиконе, потому что другого не знает. Что - выкинуть теперь ее труд или посоветовать ей срочно изучить ТеХ и все перенабрать? С другой стороны, даже для нас - высоколобых программистов и организаторов - такие тетушки, страдающие от неприкаянности, могли бы оказаться существенным подспорьем. Я считаю, что надо организовать модульный принцип обработки текста, так, чтобы он никого не стеснял и в то же время был легко настраиваем под конкретные нужды. Для этого предлагаю развести процедуру на несколько стадий. 1) этап неточного "русского" набора. 2) этап инвариантного хранения текста, когда он хранится как последовательность символов или глифов и может быть автоматически преобразован для любой системы верстки. 3) текст, уже адаптированный для конкретной системы с утратой возможности автоматической обратной конвертации. Кстати, все существующие набранные тексты хорошо было бы маркировать в соответствии с той категорией, куда они попадают. И постепенно формулировать для текстов категории 3 правила, по которым их следует преобразовывать обратно в инвариантное состояние. А само инвариантное состояние может быть специфицировано путем сравнивания разных видов текстов из группы 2. > понял. обратное соответствие неоднозначно, и требует некоего > конвертера и ручной доработки. это отдельный вопрос, не имеющий > непосредственного отношения к верстке ц-сл текстов. т.е. это некий > подготовительный этап, вызванный ттем фактом, что уже существует много > набранных документов *не* на ц-сл, и их хотелось бы малой кровью > перевести в ц-сл. Угу. > вопрос в том, --- будет ли этот конвертер позволять передавать любые > детали типографики, т.е. можно ли будет с его помощью получить все, > что может потребоваться для качественной верстки на ц-сл (всевозможные > варианты глифов, титла, ударения, придыхания, и т.п.). и как Надо сделать его модульным. См. ниже. > предполагается его использовать, --- как универсальное средство в > т.ч. для верстки новых текстов, или только для перевода уже Конечно, и для этого тоже, ибо сэкономит массу усилий. Большинство правил ц-слав. набора успешно алгоритмизуемо. Даже если ты начнешь спорить с этим утверждением, я скажу, что даже ради 10% алгоритмизуемых правил следовало бы начинать с русского набора, потому как это существенно сэкономит время. Я не говорю о времени, затраченном на обучение в партшколе ;-) > что понимать под стандартами -- unicode, напр., -- это стандарт? ну > так в нем уже поддерживаются ц-сл символы. вопрос imho в том, чтобы > обеспечить удобную и мощную (с типографской точки зрения) систему > набора на ц-сл в какой-либо среде (скажем, в TeX или в word), и потом > использовать эту систему набора. _Не надо_ создавать множство таких систем набора. Надо создать максимально интеллектуальную систему преобразования plain slavic volapuk в _инвариант_, а также множество систем преобразования этого инварианта к требуемым системам верстки, что существенно проще. Кстати, мне вот надоело каждый раз выдумывать новые слова: псевдокод, теперь вот инвариант.... Может быть, мы создадим словарик технических терминов, которым и будем пользоваться? Я вот предлагаю "ц-слав инвариант", или сокр. "инвариант" - может быть, народ подскажет что-нибудь лучшее? > LT> Это, извини, просто от неграмотности: Ворд, в отличие от ТеХа - > во-первых, не все "тонкости" удастся набрать таким образом, а > во-вторых, это было бы неудобно (если бы была необходимость запоминать > местоположение экзотических символов). лучше разработать логичную и > удобную систему набора, в которой бы определенные "естественные" > комбинации символов соответствовали ц-сл глифам. Если ты о необходимости инварианта - то я двумя руками "за", а если ты о том, что Ворд - сакс сравнительно с ТеХом - то skip. > какие будут предложения по поводу стандартов? (что следует > стандартизировать, и есть ли идеи, как это следует стандартизировать; > какая роль в этом отволится уже существующим стандартам для ц-сл в > unicode?) Тебе они известны? Можешь запостить статью о них? Сколь они полны и сильно ли различаются между собой (если различаются)? Желательно только не сюда, а в список рассылки, и не ранее, чем я подпишу Смирнова и Параграф. > LT> "Как слышишь, так и пишешь!" - разве что жи и ши пиши с и - то > вот это уже плохо. писать следует сразу так, чтобы вся информация, > необходимая для верстки, была в документе. И тем самым отгородиться труднопроходимой стеной от большинства потенциальных помощников.... А если не отгораживаться, то вся необходимая для верстки информация в документе появится - но только после того, как он будет преобразован в категорию 2) Преобразование это - полуавтоматическое: сначала конвертер, потом, конечно же, ручная вычитка в любой из издательских систем (но без преобразования текста в категорию 3) > LT> все равно потребуется вычитка. > > что делать в процессе вычитки? редактировать _исходный_ документ (с > "русским набором", набранным по принципу "как слышишь, так и пишешь"), > или некий сконвертированный для верстки текст? Первоначально набранный документ особого смысла редактировать нет, посколько все равно предполагается вычитка на след. этапе. > если исходный документ, то, как ты сам заметил, принцип "как слышишь, > так и пишешь" не достаточен для создания качественно сверстанных > документов, -- в нем недостаточно информации для верстки (набор должен > быть немного более "сложным"). В нем не только для верстки недостаточно информации, в нем недостаточно даже информации для того, чтобы он считался текстом славянским: например, неразличимы "е" и "ять". Ну и что? Максимальное количество правил для "яти" следует реализовать в конвертере, а оставшиеся непредусмотренные яти - выставить вручную при вычитке. > если сконвертированный текст -- то это имеет недостатки: нет основного > документа, приходится вручную заморачиваться с промежуточными > форматами (т.е. хранить придется именно эти промежуточные документы в > неизвестно каком формате), и предполагает некоторую ориентацию на word > (в TeX нет смысла заморачиваться с промежуточной кодировкой, -- > исходный документ должен содержать всю информацию). Абсолютно неверно. Хочешь - храни все в ТеХе, но изволь обеспечить, чтобы хранимый текст оставался внутри "пространства инвариантов" и не перешел в категорию 3) Тогда для себя за пару дней накропаю макрос для перевода всего в Ворд или за пару часов переведу вручную любой текст глобальными заменами. > LT> Но алгоритм можно и нужно совершенствовать, чтобы ее > LT> минимизировать. > > если входной формат набора не будет допускать задания любых тонкостей > набора, то этот формат бесполезен, т.к. при верстке придется работать > не с ним, а с неким промежуточным форматом, в который конвертирует эта > самая конвертилка. Ценность этого формата состоит в полном отсутствии начальных требований к квалификации работающих с ним людей. Эта ценность перевешивает все остальное. > кстати, не пришлет ли мне кто-нибудь эту конвертилку, чтобы понять, о > чем там идет речь, и что она из себя представляет? Какой-то первый опыт конвертилки есть у Глеба. Целевой формат - шрифт "Ирмологион". Кстати, является ли Ирмологион инвариантом, а если нет, то что ему недостает? - Это не тебе, это знатокам оного. > в некоторых виденных мной шрифтах и кодировках для ц-сл не все > логично, и есть избыточные глифы (а есть недостающие); нужно смотреть > конкретно на каждый шрифт или кодировку. Вот для этого и нужна маркировка всех сочетаний шрифтов и кодировок в соответствии с приведенной мною классификацией (которую, пожалуй, стоит сделать более подробной). Вот еще предложение: "вид набора", или "набор" - различимое сочетание шрифта и кодировки Неплохо также для всех наборов типов 1) и 3) начать описывать правила преобразования к инварианту. (Обратное - каждый сумеет реализовать для своих типографских нужд сам или скооперировавшись.) А также хорошо бы описать все имеющиеся наборы типа 2) - то есть инварианты, сравнить их по степени удобства и соответствия стандартам, выбрать из них 1-2 кандидатов и для начала также написать конвертилки всех остальных "инвариантных" наборов в избранные нами. > LT> Для тебя удобна теховая кодировка, для меня - Вордовая (одна > LT> из). Что - будем бодаться или искать общий стандарт? > > Хорошо. тогда давайте хранить и набирать тексты на ц-сл в > _стандартной_ кодировке Unicode! (она включает все нужные для набора > ц-сл символы!) тут есть сектантство? наверное, нет. а удобно ли Вам > это будет? есть ли у Вас ц-сл клавиатуры? как Вы будете вводить тексты > на ц-сл? Набирать IMHO не стоит, а вот хранить - стоит. В Unicode или в любом другом инварианте. Возможно, что ради удобства ручного редактирования инварианта следует все же предпочесть Уникоду ТеХовский принцип. Самое главное, чтобы, ТеХ, выбранный в качестве стандарта, не выводил бы нас за пределы "пространства инвариантов". > вот поэтому я говорю, что нужно разработать помимо кодировки шрифтов > (и на бора глифов) еще и удобный метод набора. тогда хранить тексты > можно будет либо в этом представлении, либо в unicode. > LT> Я бы все же предложил различать правила орфографии и правила > LT> типографики (если следование первым абсолютная необходимость, то > LT> вторые "по бедности" могут быть проигнорированы). > > "по бедности" можно набирать и на русском. наша же задача -- верстка с > наивысшим возможным качеством. :-) Ты когда-нибудь видел чересстрочные GIFы? Очень правильное изобретение. Позволяет не раньше времени не отчаиваться в конечном результате, и всегда иметь хоть что-то перед глазами. > ну во-первых, хотел бы посмотреть на упоминавшийся тут конвертер (или > конвертеры) -- что он из себя представляет. потом и выскажусь. Так его писать надо и совершенствовать. И я постулирую, что усилия, затраченные на его создание и отладку, окупятся сторицею, по сравнению с ручным набором в любой системе. > LT> на мой (и мой! - Левъ) нам нужно проработать следующие вопросы: > > LT> 1) набор (множество) глифов (символов шрифов, во всех нужных > LT> вариантных начертаниях, но без дублирования стилей символов а > LT> одном шрифте), нужный для набора Ц-Сл > > LT> 2) кодировка для этих глифов (это расширение Unicode, которая > LT> содержит Ц-Сл символы, но не содержит всех нужных глифов) > > 3) удобный и полный (т.е. содержащий всю информацию, необходимую для > однозначного перевода в множество ц-сл глифов) метод набора с > использованием русских букв. Вот это лишнее, потому что с тем же успехом можно сразу набирать в Лексиконе текст, годный, скажем, для скармливания ТеХу. Этот вариант требует знания наборщиком формата и провоцирует его на множество трудноуловимых ошибок. В моем же варианте знание формата требуется только от корректора. Левъ. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 28 дек 1999 17:17:15 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- Привет Lev, 28 декабря 1999 г., 16:50:15, ты писал: LT> Привет, Владимир! Дык, его тута нет. Тут только я сейчас и два тебя. Одного тебя я занес, второго - ты сам подписался. :-) Хорошо хоть тоссер умный: 16:47:13 853 leva@orthodox.tstu.ru!85372654361!1 16:47:13 853 For: font-list@des-nt.tstu.ru 16:47:13 853 Local user: font-list 16:47:13 853 Expand maillist: font-list 16:47:13 853 Local user: leva 16:47:13 853 Local user: postmaster 16:47:13 853 Local user: leva 16:47:13 853 Already in rcpt list. 16:47:13 853 Expand maillist OK Понял, что ты Already in rcpt list. Стер тебя с des-nt, остался ортодоксальный. Ну как, работает лист? Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 28 дек 1999 17:35:39 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" , "postmaster" Тема: Re: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- Подпиши, пожалуйста, hamster@lgg.ru а затем - повтори анонс списка. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 28 дек 1999 17:54:44 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- Привет -=ORTHODOX-FONT=- Project Participants, 28 декабря 1999 г., 17:35:39, ты писал: LT> Подпиши, пожалуйста, hamster@lgg.ru а затем - повтори анонс списка. HELP: no valid commands found To SUBSCRIBE to the mailing list send a message to robot@des-nt.tstu.ru with Subject=subscribe maillistname To POST you message to the list, send a message to maillistname@des-nt.tstu.ru To UNSUBSCRIBE from the mailing list send a message to robot@des-nt.tstu.ru with Subject=unsubscribe maillistname AVAILABLE lists: font-list Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 28 дек 1999 17:57:13 От: Lev Tikhonov Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- Привет, Владимир! Чтобы не повторяться в репликах, заранее объясню позицию. Прежде всего, у нас тут православныя конфа, а не группа любителей... того или иного софта. Поэтому раскрутить меня на "религиозную войну" тебе вряд ли удастся ;) И вряд ли удастся убедить меня согласиться с такой организацией работы, чтобы все желающие иметь отношение к священному процессу верстки славянского текста должны были бы предварительно освоить ТеХ, SGML, Вентуру, и т. д. и прочие идеи Чучхэ, да хотя бы и Ворд. В то же время фоновая интеллектуальная работа может быть поручена любой программе - я даже согласен на ТеХ, если он действительно лучше всех. Но это не означает, что наборщик должен быть обязательно принуждаем работать в нем, а не может обойтись Вордом, лексиконом или чем угодно еще. А что, если православная тетушка давно набрала, допустим Триодь - в лексиконе, потому что другого не знает. Что - выкинуть теперь ее труд или посоветовать ей срочно изучить ТеХ и все перенабрать? С другой стороны, даже для нас - высоколобых программистов и организаторов - такие тетушки, страдающие от неприкаянности, могли бы оказаться существенным подспорьем. Я считаю, что надо организовать модульный принцип обработки текста, так, чтобы он никого не стеснял и в то же время был легко настраиваем под конкретные нужды. Для этого предлагаю развести процедуру на несколько стадий. 1) этап неточного "русского" набора. 2) этап инвариантного хранения текста, когда он хранится как последовательность символов или глифов и может быть автоматически преобразован для любой системы верстки. 3) текст, уже адаптированный для конкретной системы с утратой возможности автоматической обратной конвертации. Кстати, все существующие набранные тексты хорошо было бы маркировать в соответствии  с той категорией, куда они попадают. И постепенно формулировать для текстов категории 3 правила, по которым их следует преобразовывать обратно в инвариантное состояние. А само инвариантное состояние может быть специфицировано путем сравнивания разных видов текстов из группы 2. > понял. обратное соответствие неоднозначно, и требует некоего > конвертера и ручной доработки. это отдельный вопрос, не имеющий > непосредственного отношения к верстке ц-сл текстов. т.е. это некий > подготовительный этап, вызванный ттем фактом, что уже существует много > набранных документов *не* на ц-сл, и их хотелось бы малой кровью > перевести в ц-сл. Угу. > вопрос в том, --- будет ли этот конвертер позволять передавать любые > детали типографики, т.е. можно ли будет с его помощью получить все, > что может потребоваться для качественной верстки на ц-сл (всевозможные > варианты глифов, титла, ударения, придыхания, и т.п.). и как Надо сделать его модульным. См. ниже. > предполагается его использовать, --- как универсальное средство в > т.ч. для верстки новых текстов, или только для перевода уже Конечно, и для этого тоже, ибо сэкономит массу усилий. Большинство правил ц-слав. набора успешно алгоритмизуемо. Даже если ты начнешь спорить с этим утверждением, я скажу, что даже ради 10% алгоритмизуемых правил следовало бы начинать с русского набора, потому как это существенно сэкономит время. Я не говорю о времени, затраченном на обучение в партшколе ;-) > что понимать под стандартами -- unicode, напр., -- это стандарт? ну > так в нем уже поддерживаются ц-сл символы. вопрос imho в том, чтобы > обеспечить удобную и мощную (с типографской точки зрения) систему > набора на ц-сл в какой-либо среде (скажем, в TeX или в word), и потом > использовать эту систему набора. _Не надо_ создавать множство таких систем набора. Надо создать максимально интеллектуальную систему преобразования plain slavic volapuk в _инвариант_, а также множество систем преобразования этого инварианта к требуемым системам верстки, что существенно проще. Кстати, мне вот надоело каждый раз выдумывать новые слова: псевдокод, теперь вот инвариант.... Может быть, мы создадим словарик технических терминов, которым и будем пользоваться? Я вот предлагаю "ц-слав инвариант", или сокр. "инвариант" - может быть, народ подскажет что-нибудь лучшее? >  LT> Это, извини, просто от неграмотности: Ворд, в отличие от ТеХа - > во-первых, не все "тонкости" удастся набрать таким образом, а > во-вторых, это было бы неудобно (если бы была необходимость запоминать > местоположение экзотических символов). лучше разработать логичную и > удобную систему набора, в которой бы определенные "естественные" > комбинации символов соответствовали ц-сл глифам. Если ты о необходимости инварианта - то я двумя руками "за", а если ты о том, что Ворд - сакс сравнительно с ТеХом - то skip. > какие будут предложения по поводу стандартов? (что следует > стандартизировать, и есть ли идеи, как это следует стандартизировать; > какая роль в этом отволится уже существующим стандартам для ц-сл в > unicode?) Тебе они известны? Можешь запостить статью о них? Сколь они полны и сильно ли различаются между собой (если различаются)? Желательно только не сюда, а в список рассылки,  и не ранее, чем я подпишу Смирнова и Параграф. >  LT> "Как слышишь, так и пишешь!" - разве что жи и ши пиши с и - то > вот это уже плохо. писать следует сразу так, чтобы вся информация, > необходимая для верстки, была в документе. И тем самым отгородиться труднопроходимой стеной от большинства потенциальных помощников.... А если не отгораживаться, то вся необходимая для верстки информация в документе появится - но только после того, как он будет преобразован в категорию 2) Преобразование это - полуавтоматическое: сначала конвертер, потом, конечно же, ручная вычитка в любой из издательских систем (но без преобразования текста в категорию 3) >  LT> все равно потребуется вычитка. > > что делать в процессе вычитки? редактировать _исходный_ документ (с > "русским набором", набранным по принципу "как слышишь, так и пишешь"), > или некий сконвертированный для верстки текст? Первоначально набранный документ особого смысла редактировать нет, посколько все равно предполагается вычитка на след. этапе. > если исходный документ, то, как ты сам заметил, принцип "как слышишь, > так и пишешь" не достаточен для создания качественно сверстанных > документов, -- в нем недостаточно информации для верстки (набор должен > быть немного более "сложным"). В нем не только для верстки недостаточно информации, в нем недостаточно даже информации для того, чтобы он считался текстом славянским: например, неразличимы "е" и "ять". Ну и что? Максимальное количество правил для "яти" следует реализовать в конвертере, а оставшиеся непредусмотренные яти - выставить вручную при вычитке. > если сконвертированный текст -- то это имеет недостатки: нет основного > документа, приходится вручную заморачиваться с промежуточными > форматами (т.е. хранить придется именно эти промежуточные документы в > неизвестно каком формате), и предполагает некоторую ориентацию на word > (в TeX нет смысла заморачиваться с промежуточной кодировкой, -- > исходный документ должен содержать всю информацию). Абсолютно неверно. Хочешь - храни все в ТеХе, но изволь обеспечить, чтобы хранимый текст оставался внутри "пространства инвариантов" и не перешел в категорию 3) Тогда для себя за пару дней накропаю макрос для перевода всего в Ворд или за пару часов переведу вручную любой текст глобальными заменами. >  LT> Но алгоритм можно и нужно совершенствовать, чтобы ее >  LT> минимизировать. > > если входной формат набора не будет допускать задания любых тонкостей > набора, то этот формат бесполезен, т.к. при верстке придется работать > не с ним, а с неким промежуточным форматом, в который конвертирует эта > самая конвертилка. Ценность этого формата состоит в полном отсутствии начальных требований к квалификации работающих с ним людей. Эта ценность перевешивает все остальное. > кстати, не пришлет ли мне кто-нибудь эту конвертилку, чтобы понять, о > чем там идет речь, и что она из себя представляет? Какой-то первый опыт конвертилки есть у Глеба. Целевой формат - шрифт "Ирмологион". Кстати, является ли Ирмологион инвариантом, а если нет, то что ему недостает? - Это не тебе, это знатокам оного. > в некоторых виденных мной шрифтах и кодировках для ц-сл не все > логично, и есть избыточные глифы (а есть недостающие); нужно смотреть > конкретно на каждый шрифт или кодировку. Вот для этого и нужна маркировка всех сочетаний шрифтов и кодировок в соответствии с приведенной мною классификацией (которую, пожалуй, стоит сделать более подробной). Вот еще предложение: "вид набора", или "набор" - различимое сочетание шрифта и кодировки Неплохо также для всех наборов типов 1) и 3) начать описывать правила преобразования к инварианту. (Обратное - каждый сумеет реализовать для своих типографских нужд сам или скооперировавшись.) А также хорошо бы описать все имеющиеся наборы типа 2) - то есть инварианты, сравнить их по степени удобства и соответствия стандартам, выбрать из них 1-2 кандидатов и для начала также написать конвертилки всех остальных "инвариантных" наборов в избранные нами. >  LT> Для тебя удобна теховая кодировка, для меня - Вордовая (одна >  LT> из). Что - будем бодаться или искать общий стандарт? > > Хорошо. тогда давайте хранить и набирать тексты на ц-сл в > _стандартной_ кодировке Unicode! (она включает все нужные для набора > ц-сл символы!) тут есть сектантство? наверное, нет. а удобно ли Вам > это будет? есть ли у Вас ц-сл клавиатуры? как Вы будете вводить тексты > на ц-сл? Набирать IMHO не стоит, а вот хранить - стоит. В Unicode или в любом другом инварианте. Возможно, что ради удобства ручного редактирования инварианта следует все же предпочесть Уникоду ТеХовский принцип. Самое главное, чтобы, ТеХ, выбранный в качестве стандарта, не выводил бы нас за пределы "пространства инвариантов". > вот поэтому я говорю, что нужно разработать помимо кодировки шрифтов > (и на бора глифов) еще и удобный метод набора. тогда хранить тексты > можно будет либо в этом представлении, либо в unicode. >  LT> Я бы все же предложил различать правила орфографии и правила >  LT> типографики (если следование первым абсолютная необходимость, то >  LT> вторые "по бедности" могут быть проигнорированы). > > "по бедности" можно набирать и на русском. наша же задача -- верстка с > наивысшим возможным качеством. :-) Ты когда-нибудь видел чересстрочные GIFы? Очень правильное изобретение. Позволяет не раньше времени не отчаиваться в конечном результате, и всегда иметь хоть что-то перед глазами. > ну во-первых, хотел бы посмотреть на упоминавшийся тут конвертер (или > конвертеры) -- что он из себя представляет. потом и выскажусь. Так его писать надо и совершенствовать. И я постулирую, что усилия, затраченные на его создание и отладку, окупятся сторицею, по сравнению с ручным набором в любой системе. >  LT> на мой (и мой! - Левъ) нам нужно проработать следующие вопросы: > >  LT> 1) набор (множество) глифов (символов шрифов, во всех нужных >  LT> вариантных начертаниях, но без дублирования стилей символов а >  LT> одном шрифте), нужный для набора Ц-Сл > >  LT> 2) кодировка для этих глифов (это расширение Unicode, которая >  LT> содержит Ц-Сл символы, но не содержит всех нужных глифов) > > 3) удобный и полный (т.е. содержащий всю информацию, необходимую для >    однозначного перевода в множество ц-сл глифов) метод набора с >    использованием русских букв. Вот это лишнее, потому что с тем же успехом можно сразу набирать в Лексиконе текст, годный, скажем, для скармливания ТеХу. Этот вариант требует знания наборщиком формата и провоцирует его на множество трудноуловимых ошибок. В моем же варианте знание формата требуется только от корректора. Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 28 дек 1999 18:07:27 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: к сведению -------------------------------------------------------------------------------- Привет -=ORTHODOX-FONT=- Project Participants, Да, забыл сразу сказать - в настройках мэйлера лучше всего убрать поле reply-to (как это было у меня - только что заметил), т.е. обратный адрес, тогда при ответе на ваши письма автоматически будет подставляться адрес мэйл-листа, иначе по невниманию вы будете отвечать не в мэйл-лист, а нетмайлом тому, кто туда написал. В любом случае, при написании в мэйл-лист нужно ставить в поле To: адрес font-list@des-nt.tstu.ru Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 28 дек 1999 18:07:58 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Fw: de typographica multilingua et de praescriptionum varium doctrina -------------------------------------------------------------------------------- ----- Original Message ----- From: "Lev Tikhonov" Newsgroups: fido7.ru.liturgica Sent: Thursday, December 23, 1999 3:39 AM Subject: Re: de typographica multilingua et de praescriptionum varium doctrina > > "Vladimir Volovich" wrote in message > news:eyr9gfkti2.fsf@video.uic.vsu.ru... > > "LT" == Lev Tikhonov writes: > > > > >> Стандартизация цсл-кодировки, безусловно, нужна. Hо при чем здесь > > >> юникод? > > [...] > > LT> Даже если такие шрифты еще нескоро появятся, эта стандартная > > LT> кодировка запросто могла бы служить таким вот псевдокодом, в > > LT> котором можно хранить славянские тексты. Степень полезности > > LT> такого решения напрямую зависит от степени _стандартности_ > > LT> избранной кодировки. > > > > на мой взгляд, нам нужно проработать следующие вопросы: > > > > 1) набор (множество) глифов (символов шрифов, во всех нужных > > вариантных начертаниях, но без дублирования стилей символов а одном > > шрифте), нужный для набора Ц-Сл > > > > 2) кодировка для этих глифов (это расширение Unicode, которая содержит > > Ц-Сл символы, но не содержит всех нужных глифов) > > > > 3) удобный МЕТОД ВВОДА Ц-Сл текстов. это один из наиболее важных > > пунктов. Т.е. способ набора текстов на клавиатуре с использованием > > обычных русских и латинских букв и др. символов (т.к. едва ли > > придется расчитывать на появление Ц-Сл клавиатур -- не хватит > > кнопок :). > > Что ты скажешь по поводу написания некего конвертера (разумеется, неточного, > но неточность эту можно и нужно уменьшать) для преобразования русского > набора в славянский текст? > Тем более, что есть уже масса текстов набраных и изданных таким образом: их > надо будет только отсканировать, да и набирать удобнее, чем с постоянно > переключая раскладки. > > > Это, по существу, способ отображения входного потока, состоящего из > > русских (и возможно английских) символов, на множество глифов, > > нужных для представления букв и знаков в Ц-Сл текстах. > > Вот это множество, несомненно, можно и нужно уточнить. Надо, чтобы > кто-нибудь взялся свести воедино все варианты, количество которых, > наверняка, перевалило за десяток. > Либо - игнорировать предыдущий опыт человечества и создавать все заново > (может быть, с привлечением людей, набивших уже себе шишки на этой затее). > По какому пути пойдем? > > > На мой взгляд, было бы удобно хранить тексты на Ц-Сл именно в этом > > представлении. При этом не так важно, как именно будут расположены > > Возможно, но если набирать по-русски, а потом конвертить - то конвертим в > что-нибудь удобное для быстрого отображения и правки, но непременно полное > по набору глифов. > > > (закодированы) глифы в конкретном шрифте (тем более, что в Unicode > > все равно не включат все, что нужно --- Unicode это входная > > кодировка, состоящая из символов, а не из глифов и их вариантов). > > Поясни, что ты называешь символом, глифом и вариантом глифа, и чем оно > различается. > > > Если будет разработан и принят такой удобный метод ввода, то им > > можно будет пользоваться и в Word (при помощи макросов), и в TeX. > > А документы были бо портабельными: при их хранении нужны были бы > > Точнее, предлагается двух- (а может быть и более многослойная система). > > Первый этап - русский набор по современной орфоргафии. > Второй этап (а для некоторых, уже набранных текстов - первый) - то, что ты > предлагаешь.ъ > > Нужно в таком случае необходимо как минимум две раб. группы - 1) по > конвертеру из русского в "ц-слав." и 2) собственно по стандарту "ц-слав." > Необходимое условие для начала работы той и другой группы - утверждение > ц-сл. набора глифов. > > Мои два пункта совпали с твоими пп. 1 и 2 (я о твоих уже успел забыть), > следовательно, между нами наблюдается полное единодушие по этому вопросу. > > > только русские буквы. Впрочем, можно пользоваться для хранения уже > > сейчас Unicode, в котором есть Ц-Сл символы. > > Это в каком-таком Unicode уже сейчас есть Ц-Сл символы, помимо fake-Cyrillic > Ижицы, полученной ttfconv.exe? > > > Kind regards, > Левъ. > > Я вот в христианосе предлагал устраивать конференции в чате, но сейчас вот > подумал, что, может быть, менее обременительной для народа и для всех > приемлемой была бы организация списка рассылки по вопросам Ц-Сл. стандарта. > У меня есть знакомый, которого я очень надеюсь на этот список подписать (а у > него знакомые в Параграфе), а в конференции участвовать его наверняка > заломало бы. > > 2Андрей Волков. Возьмешься ли организовать список рассылки? > > > ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 28 дек 1999 19:13:44 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Fw: de typographica multilingua et de praescriptionum varium doctrina -------------------------------------------------------------------------------- ----- Original Message ----- From: "Lev Tikhonov" Newsgroups: fido7.ru.liturgica Sent: Friday, December 24, 1999 11:12 PM Subject: Re: de typographica multilingua et de praescriptionum varium doctrina > Привет Vladimir! > > > под "русским набором" ты подразумеваешь способ представления (набора) > > ц-сл текстов при помоши (исключительно) русских букв (и возможно > > некоторых латинских и др. знаков)? > > под "русским набором" я подразумеваю именно русский набор без всяких чуждых > символов - то, что печатается в молитвословах "гражданского шрифта" и в > зеленой Минее. > Там нет никаких глифов, и однозначное соответствие со славянским, конечно > же, только в одну - ненужную - сторону: славянскому тексту однозначно > соответствует такой текст. > > А вот к такому набору нужно применять некий интеллектуальный лингвистический > препроцессор, к результату работы которого, после вычитки, уже будет > применимо то, о чем ты пишешь ниже. > Для тех же текстов, что _уже набраны_ по-славянски (в чем угодно, а кроме > ворда и теха есть еще герои, набиравшие во 2-й вентуре - например, сретенцы, > да и в ПСТБИ кое-что) эта первая стадия заменится стадией конвертирования их > в такое согласованное состояние, причем для каждого варианта набора придется > создать свою уникальную таблицу перекодировки. > > > Имеется несколько разных возможностей. Если речь идет о MS Word, то > > можно воспользоваться макросами на word basic -- меня этот способ > > почти не интересует. я наиболее заинтересован в создании системы для > > работы в TeX. Там возможны подходы, связанные с набором на стандартном > > TeX (при этом придется для преобразования использовать лигатуры и > > активные символы), а также Omega -- расширение TeX; там гораздо > > интересней и больше возможностей по созданию действительно удобной для > > пользователя системы набора (Omega Translation Processes -- OTP). > > А ты абстрагируйся от набора, замени этот этап правкой того, что выдаст > конвертер: много времени и усилий сэкономишь! Тогда и система набора будет > неважна: набирай хоть в лексиконе, хоть в ноутпэде. Да и результат твоего > набора будет более совместим со всеми остальными, до тех по крайней мере > пор, пока не существует перекодировщика из твоей Омеги в "ст. набор глифов", > да и самого этого "стандартного набора глифов". > > Лучше пока усиливаться создать эти стандарты, а не прямо и непосредственно > кидаться набирать в какой-нибудь из самодостататочных систем. > > > В подходе с MS Word, транслятор представляет собой отдельную > > программу, но органично взаимодействующую с Word; при использовании > > TeX/Omega, преобразования по существу встроены в саму программу > > верстки. Необходимости писать внешний перекодировщик (скажем, на C) > > при этом нет. > > Это, извини, просто от неграмотности: Ворд, в отличие от ТеХа - визивиг, и, > если замыкаться в его тесном мирке, как ты предполагаешь замкнуться в своей > Омеге, - все прекрасно можно набирать в один этап (именно переключаясь по > нужде на "латиницу" и зная местоположение всех экзотических символов). > Для того-то и заведена речь о стандартах, чтобы эти объединить эти тесные > мирки компьютерных сектантов, хотя бы в отношении церковнославянского > набора. > > > Кстати, TeX и Omega имеются в готовом и работающем виде практически > > подо все платформы, в т.ч. под win32 (см., напр., > > ftp://ftp.dante.de/tex-archive/systems/win32/miktex/). > > А Ворд продается у каждого метро ;-) > > > LT> Тем более, что есть уже масса текстов набраных и изданных таким > > LT> образом: их надо будет только отсканировать, да и набирать > > LT> удобнее, чем с постоянно переключая раскладки. > > > > Согласен. А есть ли где-то список правил набора, использующихся в этих > > текстах? > > "Как слышишь, так и пишешь!" - разве что жи и ши пиши с и - то есть обычные > правила русского языка. Конечно же, однозначного "со стопроцентным > попаданием" конвертера из этого набора в текст, состоящий из славянских > глифов, создать невозможно, все равно потребуется вычитка. > Но алгоритм можно и нужно совершенствовать, чтобы ее минимизировать. > > > >> Это, по существу, способ отображения входного потока, состоящего > > >> из русских (и возможно английских) символов, на множество глифов, > > >> нужных для представления букв и знаков в Ц-Сл текстах. > > > > LT> Вот это множество, несомненно, можно и нужно уточнить. Надо, > > LT> чтобы кто-нибудь взялся свести воедино все варианты, количество > > LT> которых, наверняка, перевалило за десяток. Либо - игнорировать > > LT> предыдущий опыт человечества и создавать все заново (может быть, > > LT> с привлечением людей, набивших уже себе шишки на этой затее). По > > LT> какому пути пойдем? > > > > Неплохо было бы попытаться "свести воедино", но с разумной коррекцией, > > т.е., напр., удалить избыточные глифы. > > Какие глифы ты считаешь избыточными? > > > >> На мой взгляд, было бы удобно хранить тексты на Ц-Сл именно в этом > > >> представлении. При этом не так важно, как именно будут расположены > > > > LT> Возможно, но если набирать по-русски, а потом конвертить - то > > LT> конвертим в что-нибудь удобное для быстрого отображения и правки, > > LT> но непременно полное по набору глифов. > > > > В подходе с TeX/Omega, огромным преимуществом является то, что > > НИКАКОГО ПРОМЕЖУТОЧНОГО ПРЕДСТАВЛЕНИЯ нет (кроме как в памяти самого > > TeX), и соответственно не нужно конвертировать и хранить тексты в > > Это не преимущество, а сектантство. То же самое я тебе могу петь про Ворд, с > не меньшим вдохновением. > > > промежуточной кодировке. Вся работа с документом ведется в удобной для > > пользователя кодировке. Рабочие файлы -- обычные текстовые файлы, > > Для тебя удобна теховая кодировка, для меня - Вордовая (одна из). Что - > будем бодаться или искать общий стандарт? > > > которые можно набирать где угодно. Из них с помощью TeX можно получить > > качественно сверстанные документы в различных выходных форматах, в > > т.ч. postscript и PDF. > > Аналогично. > > > >> (закодированы) глифы в конкретном шрифте (тем более, что в Unicode > > >> все равно не включат все, что нужно --- Unicode это входная > > >> кодировка, состоящая из символов, а не из глифов и их вариантов). > > > > LT> Поясни, что ты называешь символом, глифом и вариантом глифа, и > > LT> чем оно различается. > > > > символы -- это _логически_ различные буквы, которые могут встретиться > > при наборе. глифы -- это то, что может встретиться на бумаге (то, во > > что могут превратиться символы в результате верстки). классический > > пример глифов, не являющихся символами -- латинские лигатуры ff, fi, > > fl, ffi, ffl (и некоторые другие) -- в качественных программах верстки > > эти последовательности символов заменяются на цельный глиф, т.к. он > > выглядит лучше, чем просто последовательность символов. > > Так. Вот это - действительно, новое слово в нашем мирке. Я лично об этой > проблеме доселе не задумывался. > В таком случае тем более необходимо срочно привлекать шрифтовиков из > Паратайпа, которые - мне это доподлинно известно - давно занимаются > славянским. > > > в ц-сл алфавите имеется ряд "форм представления" одной и той же буквы > > в зависимости, скажем, от ее положения в слове. т.е. логически мы > > имеем один символ (букву), а на принтере она может выглядеть > > по-разному. > > Я бы все же предложил различать правила орфографии и правила типографики > (если следование первым абсолютная необходимость, то вторые "по бедности" > могут быть проигнорированы). > А иначе - и ять можно считать лишь одним из глифов символа "е", и считать > зеленую минею набранной по-славянски. > > > варианты глифов -- это когда некоторая буква (или глиф) могут > > выглядеть по-разному в зависимости от стилевых или других > > обстоятельств. > > > > >> Если будет разработан и принят такой удобный метод ввода, то им > > >> можно будет пользоваться и в Word (при помощи макросов), и в TeX. > > >> А документы были бо портабельными: при их хранении нужны были бы > > > > LT> Точнее, предлагается двух- (а может быть и более многослойная > > LT> система). > > > > LT> Первый этап - русский набор по современной орфоргафии. > > > > т.е., с использованием только русских букв (а также некоторых > > латинских и др. символов из ASCII таблицы). > > Ты совершенно не понял. Сажаешь девочку-машинистку и диктуешь ей > молитвослов. В Лексиконе ;) Без всякой компьютерной премудрости и познаний в > славянской письменности. > Или распознаешь файнридером зеленую Минею. Результат тот же. > > > LT> Второй этап (а для некоторых, уже набранных текстов - первый) - > > LT> то, что ты предлагаешь. > > > > этот этап в случае TeX будет незаметен для пользователя -- > > преобразование набранных текстов в сверстанный документ будет > > осуществляться без промежуточного преобразования самим TeX'ом (или > > Omaga). > > Ты сперва оцени непонятую идею, а потом выскажешься пояснее, как это > смотрится из теховского заповедника. > > > LT> Нужно в таком случае необходимо как минимум две раб. группы - 1) > > LT> по конвертеру из русского в "ц-слав." и 2) собственно по > > LT> стандарту "ц-слав." Необходимое условие для начала работы той и > > LT> другой группы - утверждение ц-сл. набора глифов. > > > > Совершенно верно. В случае с TeX я готов таким конвертером заняться. > > Каждый любитель своего болота в результате будет вынужден создать таблицу > перекодировки из "стандартного набора глифов", "мета-славянского", > "псевдокода" (обозначение выбрать по вкусу) в свою, пахнущую родными, а не > чуждыми лягушками, кодировку. ;-) > > При разумной реализации общей части работы - именно стандартизации этого > "метаславянского языка" и создания всех сопутствующих программ - > приделывание такой таблицы будет делом крайне простым и для всех в равной > мере незатруднительным. А "общий" прекодировщик уже есть (даже две штуки: > Хозяиновский в Ворде и standalone на с++ от Димы Смирнова). > > > Уже есть с чего начать: есть две разные готовые системы для ц-сл для > > TeX, созданные Андреем Слепухиным и Михаилом Гринчуком. Есть также > > статья И.Гаслова (ftp://ftp.vsu.ru/pub/tex/docs/slav_1.pdf.gz), а > > также некоторые ц-сл шрифты. > > А почему не с Ворда-Ирмологиона, не с Вентуры и не еще с доброго десятка > существующих самопальных вариантов? > > > LT> Мои два пункта совпали с твоими пп. 1 и 2 (я о твоих уже успел > > LT> забыть), следовательно, между нами наблюдается полное единодушие > > LT> по этому вопросу. > > > > :-) > > на мой (и мой! - Левъ) нам нужно проработать следующие вопросы: > > 1) набор (множество) глифов (символов шрифов, во всех нужных > вариантных начертаниях, но без дублирования стилей символов а одном > шрифте), нужный для набора Ц-Сл > > 2) кодировка для этих глифов (это расширение Unicode, которая содержит > Ц-Сл символы, но не содержит всех нужных глифов) > > > Этот сухой остаток, тем не менее, продолжает быть инвариантом - и это радует > ;-) > > > > >> только русские буквы. Впрочем, можно пользоваться для хранения уже > > >> сейчас Unicode, в котором есть Ц-Сл символы. > > > > LT> Это в каком-таком Unicode уже сейчас есть Ц-Сл символы, помимо > > LT> fake-Cyrillic Ижицы, полученной ttfconv.exe? > > > > Собственно, Unicode никак не связан с конкретными шрифтами. Unicode > > (www.unicode.org) лишь стандартизирует набор символов (не глифов), > > т.е. логически разных единиц, которые могут встретиться при наборе > > текстов на многих языках. Таблицу Unicode в текстовом виде можно взять > > на их сайте ftp.unicode.org. Там уже давно зарегистрированы многие > > символы, нужные для ц-сл. > > Мне кажется, что настала пора дать возможность высказаться Параграфовцам, > которые давно этой проблемой занимаются. > > > LT> Я вот в христианосе предлагал устраивать конференции в чате, но > > LT> сейчас вот подумал, что, может быть, менее обременительной для > > LT> народа и для всех приемлемой была бы организация списка рассылки > > LT> по вопросам Ц-Сл. стандарта. У меня есть знакомый, которого я > > LT> очень надеюсь на этот список подписать (а у него знакомые в > > LT> Параграфе), а в конференции участвовать его наверняка заломало > > LT> бы. > > > > я бы тоже мог создать такой список, если не найдутся другие желающие. > > Ну так определитесь с Волковым поскорее. > > И подпишите на список сразу же вот этого ханурика, который никак не вышлет > мне давно написанный обещанный перекодировщик: hamster@cityline.ru - ему я > это письмо также дублирую ;-) > > Best regards, > Левъ > > > > > ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 29 дек 1999 00:49:18 От: "Lev Tikhonov" Кому: Тема: По поводу FontLab -------------------------------------------------------------------------------- ----- Original Message ----- From: "Dima A. Smirnov" To: Sent: Tuesday, December 28, 1999 6:11 PM Subject: Re: Re[2]: Ответ: Шрифты. Разработка и использование. > Салют, Пахом. > > > > Дока ко 2 му Лабу вещь стоящая > поскольку 3-й и 2-й лаб -- две разные (в чем-то похожие) программы. Они > очень хорошо друг друга дополняют. > > > 3-й лаб настроен на тру-тайп шрифты. В нем можно использовать всю мощь > хинтов трутайпа. Также работает поддержка MultiplyMaster, но это уже к тайп > 1 шрифтам. Полноценный инструментарий для юникодных шрифтов. > > > > 2-й лаб -- для разработки шрифтов тайп 1. К тому же имеет встроенный > макроязык, котороге нет в 3-й версии. Ну постскрипт подпрограммы, > действительно наверное излишество -- вряд ли их кто-то использовал, для > уменьшения размеров шрифтового файла, но их тоже нет в 3-й версии > > > > > На сайте pyros`a (я так понимаю нового хозяина Фонтлаба) > > > Пирус -- дистрибьюьтер, а не хозяин. Паратайп тоже только дистрибьютер. > Хозяин и разработчик -- FontLab developer's group www.fontlab.com > > Best wishes, > Dima A. Smirnov > smirnov@astelit.ru > > ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 29 дек 1999 02:15:02 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Fw: Re[2]: Ответ: Шрифты. Разработка и использование. -------------------------------------------------------------------------------- ----- Original Message ----- From: "Andrey Janishewskiy" To: "RuDTP@mospravda.ru" Sent: Tuesday, December 28, 1999 11:53 PM Subject: Re[2]: Ответ: Шрифты. Разработка и использование. > To: "RuDTP@mospravda.ru" > > Привет RuDTP@mospravda.ru! > > 28 декабря 1999 18:11, hamster@lgg.ru -> Andrey Janishewskiy: > > h> Дока ко 2 му Лабу вещь стоящая > h> поскольку 3-й и 2-й лаб -- две разные (в чем-то похожие) программы. > h> Они очень хорошо друг друга дополняют. > > Дока ко 2му Лабу вещь совершенно бесполезная т.к. между 2.0 и 2.5 имеется куча > крайне существенных отличий. Вообще последняя версия была 2.51. > > h> 3-й лаб настроен на тру-тайп шрифты. В нем можно использовать всю мощь > h> хинтов трутайпа. Также работает поддержка MultiplyMaster, но это уже к > h> тайп 1 шрифтам. Полноценный инструментарий для юникодных шрифтов. > > h> 2-й лаб -- для разработки шрифтов тайп 1. > > 2.5. фотнтлаб вообще для разработки шрифтов. > Он под это более заточен, чем 3.0 (более удобен). > > 3.0. Лучше пригоден для различных правок по причине поддержки Unicode и TTF > хинтов. > > h> К тому же имеет встроенный > h> макроязык, котороге нет в 3-й версии. Hу постскрипт подпрограммы, > h> действительно наверное излишество -- вряд ли их кто-то использовал, > h> для уменьшения размеров шрифтового файла, но их тоже нет в 3-й версии > > Hу, приятно посмотреть что он там нагенерил и полезно. > > Кстати для сведения... > Существует некая версия 3.5 (промежуточная), которая имеет встроенное API для > PYTHON'а. Т.е. скрипты очень сильно навороченные. > > > С уважением, Andrey > ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 31 дек 1999 17:08:27 От: "A A G" Кому: "font-list@des-nt.tstu.ru" Тема: веб-сайт списка рассылки -------------------------------------------------------------------------------- Приветствую всех! Нет ли у этого списка рассылки веб-страницы? Я готов сделать ссылки на нее. Алексей Гришин http://elisaveta.hypermart.net http://chslav.hypermart.net =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 03 янв 2000 16:57:09 От: "AG" Кому: Тема: веб-страница списка рассылки -------------------------------------------------------------------------------- Приветствую всех! Нет ли у этого списка рассылки веб-страницы? Я готов сделать ссылки на нее. Алексей Гришин http://elisaveta.hypermart.net http://chslav.hypermart.net =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 04 янв 2000 13:13:14 От: "postmaster" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AG" Тема: Ответ: веб-страница списка рассылки -------------------------------------------------------------------------------- Приветствую. > От: AG > Дата: 3 января 2000 г. 17:13 > Тема: веб-страница списка рассылки > Приветствую всех! > Нет ли у этого списка рассылки веб-страницы? Я готов сделать ссылки на нее. Если это нужно, в принципе можно было бы сделать, хотя бы просто одну страничку с краткой инструкцией как подписаться и участвовать в списке рассылки. Если это нужно. Народ, нужно это? =Андрей ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 04 янв 2000 17:09:07 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ответ: веб-страница списка рассылки -------------------------------------------------------------------------------- Это можно сделать. Кто бы написал такой текст с инструкциями и с правилами? Но еще бы хотелось иметь некий архив. Алексей > Приветствую. > > > От: AG > > Дата: 3 января 2000 г. 17:13 > > Тема: веб-страница списка рассылки > > > Приветствую всех! > > Нет ли у этого списка рассылки веб-страницы? Я готов сделать ссылки на > нее. > > Если это нужно, в принципе можно было бы сделать, хотя бы просто одну > страничку с краткой инструкцией как подписаться и участвовать в списке > рассылки. Если это нужно. Народ, нужно это? > > =Андрей > > > -------------------------------------------------------------------------- ----- > -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru > ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 04 янв 2000 21:40:07 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AG" Тема: Re: веб-страница списка рассылки -------------------------------------------------------------------------------- Очень похожими вещами занимается Дима Смирнов www.lgg.ru/~hamster Я его подписал на список, и он обещал подписать своих знакомых из Паратайпа, но пока что (перед новым годом) был крепко занят. ----- Original Message ----- From: AG To: font-list@des-nt.tstu.ru Sent: Monday, January 03, 2000 4:57 PM Subject: веб-страница списка рассылки Приветствую всех! Нет ли у этого списка рассылки веб-страницы? Я готов сделать ссылки на нее. Алексей Гришин http://elisaveta.hypermart.net http://chslav.hypermart.net =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 08 янв 2000 14:07:56 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- "Wladislaw Tchernov" wrote in message news:947284737@p91.f2.n5025.z2.ftn... > *** Ответ на мессагу из арии RU.LITURGICA (RU.LITURGICA). > > Ave Leo! > > 22:32 Sabbato 01 Januarii 2028 a.D., > Lev Tikhonov scripsit ad All: > > LT> проблема: филолог-славист тебе сразу назовет несколько сот корней, > LT> которые покроют 99% текста. > > Да, но что ты будешь _программно_ делать со всякими там чередованиями, беглыми > и изменяющимися корневыми гласными и проч.? Все случаи употребления этих корней делятся - как всегда 80 на 20 - на совершенно регулярные ряды, которые следует алгоритмизовать и неправильные основы, которые просто следует запомнить. Если тупая прога не понимает, чтО видит перед собой - она должна предложить коректору все возможные интерпретации. Самое главное - смириться с принципиальной нечеткостью конвертера и не стремиться сделать его идеально безгрешным. Мы ведь не стараемся написать программу для филологической экспертизы, наша цель - лишь вспомогательная утилита. Но почему мы должны совершенно отказываться от достижений этой самой филологии? с уважением левъ ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 08 янв 2000 16:55:07 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- Поясните, конвертор из чего в чего имеется в виду. В любом случае, было бы крайне полезно создать грамматический модуль для работы с церковно-славянским языком. Благо, язык этот охраняем от морфологических изменений самой своей природой. Но не нужно ли нам сначала со шрифтами разобраться? Жду появления страницы с информацией об этом списке рассылки. Много ли людей уже подписалось? Присоединились ли к нам господа из одной известной шрифтовой конторы? Вообще, в нашем деле необходимо создание этакого всенародного движения за древлее языковое благочестие с участием лучших умов Отечества. Есть у меня одна задумка... Поделюсь, как появится кворум. Архива же нету. И совсем было бы здорово иметь независимый веб-интерфейс, чтобы желающие могли обойтись без почты. Алексей Гришин > > Ave Leo! > > > > 22:32 Sabbato 01 Januarii 2028 a.D., > > Lev Tikhonov scripsit ad All: > > > > LT> проблема: филолог-славист тебе сразу назовет несколько сот корней, > > LT> которые покроют 99% текста. > > > > Да, но что ты будешь _программно_ делать со всякими там чередованиями, > беглыми > > и изменяющимися корневыми гласными и проч.? > > Все случаи употребления этих корней делятся - как всегда 80 на 20 - на > совершенно регулярные ряды, которые следует алгоритмизовать и неправильные > основы, которые просто следует запомнить. > Если тупая прога не понимает, чтО видит перед собой - она должна предложить > коректору все возможные интерпретации. > > Самое главное - смириться с принципиальной нечеткостью конвертера и не > стремиться сделать его идеально безгрешным. Мы ведь не стараемся написать > программу для филологической экспертизы, наша цель - лишь вспомогательная > утилита. Но почему мы должны совершенно отказываться от достижений этой > самой филологии? > > > с уважением > левъ > > > > > -------------------------------------------------------------------------- ----- > -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru > > =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 08 янв 2000 19:47:15 От: "S. M. Hozainov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- ----- Original Message ----- From: A A G To: -=ORTHODOX-FONT=- Project Participants Sent: Saturday, January 08, 2000 4:55 PM Subject: Re: de typographica slavonica, de glyphea convertenda et de invariantia > Но не нужно ли нам сначала > со шрифтами разобраться? Думаю, что шрифт это первое что надо сделать. И уже на нем строить остальное. Надо стремиться к полному решению проблемы: шрифт, набор, верстка, модули проверки орфографии и переносов. Посмотрите поддержку скольких и каких языков включил Microsoft в свой Word! У меня есть опыт написания макросов на VBA для MSWord. Хочу участвовать в этой части проекта. Есть несколько задумок по набору и верстке. Работаю системщиком в издательстве. Прошу пояснить формат инварианта о котором идет речь, и как мыслится его использовать. С уважением, Сергей Михайлович Хозяинов. smh@mail.ru http://stop.at/smh ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 08 янв 2000 20:42:09 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- > > Прошу пояснить формат инварианта о котором идет речь, > и как мыслится его использовать. Пока никто ничего более подробного не предложил. Вот повтор моего декабрьского письма. Привет, Владимир! Чтобы не повторяться в репликах, заранее объясню позицию. Прежде всего, у нас тут православныя конфа, а не группа любителей... того или иного софта. Поэтому раскрутить меня на "религиозную войну" тебе вряд ли удастся ;) И вряд ли удастся убедить меня согласиться с такой организацией работы, чтобы все желающие иметь отношение к священному процессу верстки славянского текста должны были бы предварительно освоить ТеХ, SGML, Вентуру, и т. д. и прочие идеи Чучхэ, да хотя бы и Ворд. В то же время фоновая интеллектуальная работа может быть поручена любой программе - я даже согласен на ТеХ, если он действительно лучше всех. Но это не означает, что наборщик должен быть обязательно принуждаем работать в нем, а не может обойтись Вордом, лексиконом или чем угодно еще. А что, если православная тетушка давно набрала, допустим Триодь - в лексиконе, потому что другого не знает. Что - выкинуть теперь ее труд или посоветовать ей срочно изучить ТеХ и все перенабрать? С другой стороны, даже для нас - высоколобых программистов и организаторов - такие тетушки, страдающие от неприкаянности, могли бы оказаться существенным подспорьем. Я считаю, что надо организовать модульный принцип обработки текста, так, чтобы он никого не стеснял и в то же время был легко настраиваем под конкретные нужды. Для этого предлагаю развести процедуру на несколько стадий. 1) этап неточного "русского" набора. 2) этап инвариантного хранения текста, когда он хранится как последовательность символов или глифов и может быть автоматически преобразован для любой системы верстки. 3) текст, уже адаптированный для конкретной системы с утратой возможности автоматической обратной конвертации. Кстати, все существующие набранные тексты хорошо было бы маркировать в соответствии с той категорией, куда они попадают. И постепенно формулировать для текстов категории 3 правила, по которым их следует преобразовывать обратно в инвариантное состояние. А само инвариантное состояние может быть специфицировано путем сравнивания разных видов текстов из группы 2. > понял. обратное соответствие неоднозначно, и требует некоего > конвертера и ручной доработки. это отдельный вопрос, не имеющий > непосредственного отношения к верстке ц-сл текстов. т.е. это некий > подготовительный этап, вызванный ттем фактом, что уже существует много > набранных документов *не* на ц-сл, и их хотелось бы малой кровью > перевести в ц-сл. Угу. > вопрос в том, --- будет ли этот конвертер позволять передавать любые > детали типографики, т.е. можно ли будет с его помощью получить все, > что может потребоваться для качественной верстки на ц-сл (всевозможные > варианты глифов, титла, ударения, придыхания, и т.п.). и как Надо сделать его модульным. См. ниже. > предполагается его использовать, --- как универсальное средство в > т.ч. для верстки новых текстов, или только для перевода уже Конечно, и для этого тоже, ибо сэкономит массу усилий. Большинство правил ц-слав. набора успешно алгоритмизуемо. Даже если ты начнешь спорить с этим утверждением, я скажу, что даже ради 10% алгоритмизуемых правил следовало бы начинать с русского набора, потому как это существенно сэкономит время. Я не говорю о времени, затраченном на обучение в партшколе ;-) > что понимать под стандартами -- unicode, напр., -- это стандарт? ну > так в нем уже поддерживаются ц-сл символы. вопрос imho в том, чтобы > обеспечить удобную и мощную (с типографской точки зрения) систему > набора на ц-сл в какой-либо среде (скажем, в TeX или в word), и потом > использовать эту систему набора. _Не надо_ создавать множство таких систем набора. Надо создать максимально интеллектуальную систему преобразования plain slavic volapuk в _инвариант_, а также множество систем преобразования этого инварианта к требуемым системам верстки, что существенно проще. Кстати, мне вот надоело каждый раз выдумывать новые слова: псевдокод, теперь вот инвариант.... Может быть, мы создадим словарик технических терминов, которым и будем пользоваться? Я вот предлагаю "ц-слав инвариант", или сокр. "инвариант" - может быть, народ подскажет что-нибудь лучшее? > LT> Это, извини, просто от неграмотности: Ворд, в отличие от ТеХа - > во-первых, не все "тонкости" удастся набрать таким образом, а > во-вторых, это было бы неудобно (если бы была необходимость запоминать > местоположение экзотических символов). лучше разработать логичную и > удобную систему набора, в которой бы определенные "естественные" > комбинации символов соответствовали ц-сл глифам. Если ты о необходимости инварианта - то я двумя руками "за", а если ты о том, что Ворд - сакс сравнительно с ТеХом - то skip. > какие будут предложения по поводу стандартов? (что следует > стандартизировать, и есть ли идеи, как это следует стандартизировать; > какая роль в этом отволится уже существующим стандартам для ц-сл в > unicode?) Тебе они известны? Можешь запостить статью о них? Сколь они полны и сильно ли различаются между собой (если различаются)? Желательно только не сюда, а в список рассылки, и не ранее, чем я подпишу Смирнова и Параграф. > LT> "Как слышишь, так и пишешь!" - разве что жи и ши пиши с и - то > вот это уже плохо. писать следует сразу так, чтобы вся информация, > необходимая для верстки, была в документе. И тем самым отгородиться труднопроходимой стеной от большинства потенциальных помощников.... А если не отгораживаться, то вся необходимая для верстки информация в документе появится - но только после того, как он будет преобразован в категорию 2) Преобразование это - полуавтоматическое: сначала конвертер, потом, конечно же, ручная вычитка в любой из издательских систем (но без преобразования текста в категорию 3) > LT> все равно потребуется вычитка. > > что делать в процессе вычитки? редактировать _исходный_ документ (с > "русским набором", набранным по принципу "как слышишь, так и пишешь"), > или некий сконвертированный для верстки текст? Первоначально набранный документ особого смысла редактировать нет, посколько все равно предполагается вычитка на след. этапе. > если исходный документ, то, как ты сам заметил, принцип "как слышишь, > так и пишешь" не достаточен для создания качественно сверстанных > документов, -- в нем недостаточно информации для верстки (набор должен > быть немного более "сложным"). В нем не только для верстки недостаточно информации, в нем недостаточно даже информации для того, чтобы он считался текстом славянским: например, неразличимы "е" и "ять". Ну и что? Максимальное количество правил для "яти" следует реализовать в конвертере, а оставшиеся непредусмотренные яти - выставить вручную при вычитке. > если сконвертированный текст -- то это имеет недостатки: нет основного > документа, приходится вручную заморачиваться с промежуточными > форматами (т.е. хранить придется именно эти промежуточные документы в > неизвестно каком формате), и предполагает некоторую ориентацию на word > (в TeX нет смысла заморачиваться с промежуточной кодировкой, -- > исходный документ должен содержать всю информацию). Абсолютно неверно. Хочешь - храни все в ТеХе, но изволь обеспечить, чтобы хранимый текст оставался внутри "пространства инвариантов" и не перешел в категорию 3) Тогда для себя за пару дней накропаю макрос для перевода всего в Ворд или за пару часов переведу вручную любой текст глобальными заменами. > LT> Но алгоритм можно и нужно совершенствовать, чтобы ее > LT> минимизировать. > > если входной формат набора не будет допускать задания любых тонкостей > набора, то этот формат бесполезен, т.к. при верстке придется работать > не с ним, а с неким промежуточным форматом, в который конвертирует эта > самая конвертилка. Ценность этого формата состоит в полном отсутствии начальных требований к квалификации работающих с ним людей. Эта ценность перевешивает все остальное. > кстати, не пришлет ли мне кто-нибудь эту конвертилку, чтобы понять, о > чем там идет речь, и что она из себя представляет? Какой-то первый опыт конвертилки есть у Глеба. Целевой формат - шрифт "Ирмологион". Кстати, является ли Ирмологион инвариантом, а если нет, то что ему недостает? - Это не тебе, это знатокам оного. > в некоторых виденных мной шрифтах и кодировках для ц-сл не все > логично, и есть избыточные глифы (а есть недостающие); нужно смотреть > конкретно на каждый шрифт или кодировку. Вот для этого и нужна маркировка всех сочетаний шрифтов и кодировок в соответствии с приведенной мною классификацией (которую, пожалуй, стоит сделать более подробной). Вот еще предложение: "вид набора", или "набор" - различимое сочетание шрифта и кодировки Неплохо также для всех наборов типов 1) и 3) начать описывать правила преобразования к инварианту. (Обратное - каждый сумеет реализовать для своих типографских нужд сам или скооперировавшись.) А также хорошо бы описать все имеющиеся наборы типа 2) - то есть инварианты, сравнить их по степени удобства и соответствия стандартам, выбрать из них 1-2 кандидатов и для начала также написать конвертилки всех остальных "инвариантных" наборов в избранные нами. > LT> Для тебя удобна теховая кодировка, для меня - Вордовая (одна > LT> из). Что - будем бодаться или искать общий стандарт? > > Хорошо. тогда давайте хранить и набирать тексты на ц-сл в > _стандартной_ кодировке Unicode! (она включает все нужные для набора > ц-сл символы!) тут есть сектантство? наверное, нет. а удобно ли Вам > это будет? есть ли у Вас ц-сл клавиатуры? как Вы будете вводить тексты > на ц-сл? Набирать IMHO не стоит, а вот хранить - стоит. В Unicode или в любом другом инварианте. Возможно, что ради удобства ручного редактирования инварианта следует все же предпочесть Уникоду ТеХовский принцип. Самое главное, чтобы, ТеХ, выбранный в качестве стандарта, не выводил бы нас за пределы "пространства инвариантов". > вот поэтому я говорю, что нужно разработать помимо кодировки шрифтов > (и на бора глифов) еще и удобный метод набора. тогда хранить тексты > можно будет либо в этом представлении, либо в unicode. > LT> Я бы все же предложил различать правила орфографии и правила > LT> типографики (если следование первым абсолютная необходимость, то > LT> вторые "по бедности" могут быть проигнорированы). > > "по бедности" можно набирать и на русском. наша же задача -- верстка с > наивысшим возможным качеством. :-) Ты когда-нибудь видел чересстрочные GIFы? Очень правильное изобретение. Позволяет не раньше времени не отчаиваться в конечном результате, и всегда иметь хоть что-то перед глазами. > ну во-первых, хотел бы посмотреть на упоминавшийся тут конвертер (или > конвертеры) -- что он из себя представляет. потом и выскажусь. Так его писать надо и совершенствовать. И я постулирую, что усилия, затраченные на его создание и отладку, окупятся сторицею, по сравнению с ручным набором в любой системе. > LT> на мой (и мой! - Левъ) нам нужно проработать следующие вопросы: > > LT> 1) набор (множество) глифов (символов шрифов, во всех нужных > LT> вариантных начертаниях, но без дублирования стилей символов а > LT> одном шрифте), нужный для набора Ц-Сл > > LT> 2) кодировка для этих глифов (это расширение Unicode, которая > LT> содержит Ц-Сл символы, но не содержит всех нужных глифов) > > 3) удобный и полный (т.е. содержащий всю информацию, необходимую для > однозначного перевода в множество ц-сл глифов) метод набора с > использованием русских букв. Вот это лишнее, потому что с тем же успехом можно сразу набирать в Лексиконе текст, годный, скажем, для скармливания ТеХу. Этот вариант требует знания наборщиком формата и провоцирует его на множество трудноуловимых ошибок. В моем же варианте знание формата требуется только от корректора. Левъ. > > -------------------------------------------------------------------------- ----- > -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 08 янв 2000 20:47:40 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- ----- Original Message ----- From: "A A G" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Saturday, January 08, 2000 4:55 PM Subject: Re: de typographica slavonica, de glyphea convertenda et de invariantia > Поясните, конвертор из чего в чего имеется в виду. > В любом случае, было бы крайне полезно создать грамматический модуль для > работы с церковно-славянским языком. Благо, язык этот охраняем от > морфологических изменений самой своей природой. Но не нужно ли нам сначала > со шрифтами разобраться? Попытка разбить задачу на подзадачи изложена в моем постинге, который я только что повторил. Жду комментариев. > Жду появления страницы с информацией об этом списке рассылки. Много ли людей > уже подписалось? Присоединились ли к нам господа из одной известной > шрифтовой конторы? Об этом следует спросить Диму Смирнова AKA Hamster. Этого гражданина я подписывал. ;-) > Вообще, в нашем деле необходимо создание этакого всенародного движения за > древлее языковое благочестие с участием лучших умов Отечества. Есть у меня > одна задумка... Поделюсь, как появится кворум. Архива же нету. И совсем было > бы здорово иметь независимый веб-интерфейс, чтобы желающие могли обойтись > без почты. Это, кстати, опять же к Смирнову, который по жизни вебмастер. У него и страница есть по нашей тематике: www.lgg.ru/~hamster > > -------------------------------------------------------------------------- > ----- > > -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru > > > > > > ДSЮн\SЌLў7·Ъj)Љк±Й‰гќв5;¶Й ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 09 янв 2000 01:30:26 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- Для затравки предлагаю обсудить Юникод и его кириллическую часть на предмет пригодности к нашему делу. На мой взгляд, при незначительной доработке этот формат можно считать очень многообещающим. Беда в том, что места для кириллических глифов осталось очень мало. Нужно с умом использовать его, а затем оборатиться к пользовательским кодам для сугубой диакритики. > У меня есть опыт написания макросов на VBA для MSWord. > Хочу участвовать в этой части проекта. Есть несколько задумок > по набору и верстке. Работаю системщиком в издательстве. Сделайте доброе дело, Сергей, - почините макросы, прилагаемые к Ирмологиону. Он отказывается проставлять диакритики если после гласных стоят р, ж,ю. Ужасно неудобно. Вот тут можно найти сам Ирмологион, если не имеете такового. http://chslav.hypermart.net Алексей =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 09 янв 2000 02:14:25 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: нашел сайт -------------------------------------------------------------------------------- Долго думал писать о сем или нет. Ну уж коль бумага все стерпит, то мэйл-лист и подавно. Нашел я страничку сотрудника IBM, изучающего церковно-славянский язык. Я и до этого дивился, кто это ходит ко мне с корпоративного сайта Большого Голубого. Если бы еще такие люди лоббировали наши интересы в Микрософте, то скоро все стоящие перед нами задачи решались бы установкой очередного апдейта к Виндам. Страничка не ахти, но как казус сойдет. http://justin.zamora.com/slavonic/ =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 09 янв 2000 03:23:04 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- ----- Original Message ----- From: "A A G" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Sunday, January 09, 2000 1:30 AM Subject: Re: de typographica slavonica, de glyphea convertenda et de invariantia > Для затравки предлагаю обсудить Юникод и его кириллическую часть на предмет > пригодности к нашему делу. На мой взгляд, при незначительной доработке этот > формат можно считать очень многообещающим. Беда в том, что места для > кириллических глифов осталось очень мало. Нужно с умом использовать его, а > затем оборатиться к пользовательским кодам для сугубой диакритики. А не лучше ли все-таки ориентироваться в идеале на отдельную славянскую страницу? Есть же, помимо монотонической Greek, еще и Сoptic-OldGreek..... Вот бы и кириллический такого бы побратима. Ведь наверняка для глаголицы оттдельная страница зарезервирована - усилиями эстетов и хорватских националистов. ;( С уважением, Лев ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 09 янв 2000 04:48:34 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- А что Вы имеете в виду под отдельной славянской страницей? Шрифт в котором обе половины ASCII заняты под славянщину? Верхней половины точно недостаточно будет. А если и с обоими половинами места не хватит? Наконец, не оберешься проблем с совместимостью. Они, конечно, будут и с Юникодом, но зато при этом налицо ориентация на прогрессивный стандарт. ----- Original Message ----- From: Lev Tikhonov To: -=ORTHODOX-FONT=- Project Participants Sent: Saturday, January 08, 2000 7:23 PM Subject: Re: de typographica slavonica, de glyphea convertenda et de invariantia > > ----- Original Message ----- > From: "A A G" > To: "-=ORTHODOX-FONT=- Project Participants" > Sent: Sunday, January 09, 2000 1:30 AM > Subject: Re: de typographica slavonica, de glyphea convertenda et de > invariantia > > > > Для затравки предлагаю обсудить Юникод и его кириллическую часть на > предмет > > пригодности к нашему делу. На мой взгляд, при незначительной доработке > этот > > формат можно считать очень многообещающим. Беда в том, что места для > > кириллических глифов осталось очень мало. Нужно с умом использовать его, а > > затем оборатиться к пользовательским кодам для сугубой диакритики. > > А не лучше ли все-таки ориентироваться в идеале на отдельную славянскую > страницу? > Есть же, помимо монотонической Greek, еще и Сoptic-OldGreek..... > Вот бы и кириллический такого бы побратима. Ведь наверняка для глаголицы > оттдельная страница зарезервирована - усилиями эстетов и хорватских > националистов. ;( > > С уважением, > Лев > > > > > -------------------------------------------------------------------------- ----- > -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru > =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 09 янв 2000 06:36:59 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- ----- Original Message ----- From: "A A G" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Sunday, January 09, 2000 4:48 AM Subject: Re: de typographica slavonica, de glyphea convertenda et de invariantia > А что Вы имеете в виду под отдельной славянской страницей? Шрифт в котором Как раз уникодный "Script" я и имею в виду. Конечно, уникод и только уникод, но одно дело расширять страницу с 204 смещением - обычную кириллическую, где как раз не должно хватить знакомест, а другое совсем - пробивать некий стандарт отдельной _славянской_ страницы. Впрочем в этом вопросе я полный ламер, а вот я точно знаю, что Дима Смирнов, которому эти письма должны капать на мозги ;-) - может достаточо подробно прокомментировать все варианты, связанные с шрифтами и кодировками. Бум надеяться, что он отвлечется на часок от зарабатывания хлеба насущного и накропает нам сюда что-нибуть, да и Паратайп подписать не забудет. > обе половины ASCII заняты под славянщину? Верхней половины точно > недостаточно будет. А если и с обоими половинами места не хватит? Наконец, > не оберешься проблем с совместимостью. Они, конечно, будут и с Юникодом, но > зато при этом налицо ориентация на прогрессивный стандарт. > > > ----- Original Message ----- > From: Lev Tikhonov > To: -=ORTHODOX-FONT=- Project Participants > Sent: Saturday, January 08, 2000 7:23 PM > Subject: Re: de typographica slavonica, de glyphea convertenda et de > invariantia > > > > > > ----- Original Message ----- > > From: "A A G" > > To: "-=ORTHODOX-FONT=- Project Participants" > > Sent: Sunday, January 09, 2000 1:30 AM > > Subject: Re: de typographica slavonica, de glyphea convertenda et de > > invariantia > > > > > > > Для затравки предлагаю обсудить Юникод и его кириллическую часть на > > предмет > > > пригодности к нашему делу. На мой взгляд, при незначительной доработке > > этот > > > формат можно считать очень многообещающим. Беда в том, что места для > > > кириллических глифов осталось очень мало. Нужно с умом использовать его, > а > > > затем оборатиться к пользовательским кодам для сугубой диакритики. > > > > А не лучше ли все-таки ориентироваться в идеале на отдельную славянскую > > страницу? > > Есть же, помимо монотонической Greek, еще и Сoptic-OldGreek..... > > Вот бы и кириллический такого бы побратима. Ведь наверняка для глаголицы > > оттдельная страница зарезервирована - усилиями эстетов и хорватских > > националистов. ;( > > > > С уважением, > > Лев > > > > > > > > > > -------------------------------------------------------------------------- > ----- > > -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru > > > > ДSЮн\SЌLў7·Ъj)Љк±Й‰гќв5;¶Й ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 09 янв 2000 11:55:15 От: "S. M. Hozainov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- > Сделайте доброе дело, Сергей, - почините макросы, прилагаемые к Ирмологиону. > Он отказывается проставлять диакритики если после гласных стоят р, ж,ю. > Ужасно неудобно. Вот тут можно найти сам Ирмологион, если не имеете > такового. > http://chslav.hypermart.net > > Алексей Алексей, в это письмо вложен Irmologion2000.zip -- архив шаблона Irmologion2000.dot. Его можно использовать в MSWord 97 и 2000. Помимо редакции макросов я убрал лишние панели и дублированные кнопки. Надеюсь, не перемудрил. С уважением, Сергей Михайлович Хозяинов. smh@mail.ru http://stop.at/smh =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 09 янв 2000 12:23:33 От: "S. M. Hozainov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- Только что отправил письмо Алексею с вложенным архивом Irmologion2000.zip (27Kb). Теперь он видимо попадет ко всем подписчикам. Это моя оплошность. Недосмотрел за адресом. Прошу прощения у всех кому доставил неудобство. С уважением, Сергей Михайлович Хозяинов. smh@mail.ru http://stop.at/smh ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 09 янв 2000 13:33:19 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: ***from postmaster -------------------------------------------------------------------------------- Привет AAG, 8 января 2000 г., 16:55:07, ты писал: AAG> Жду появления страницы с информацией об этом списке рассылки. Хорошо, не долго думая - http://orthodox.tstu.ru/font-list Любой из вас, кто захочет нарисовать нормальную страничку, сможет сформулировать цели и задачи этого майл-листа, если появятся какие-то программы или нужно будет поставить какие-то ссылки и т.п. и т.д. делайте и присылайте мне - я размещу. AAG> Много ли людей уже подписалось? Размещаю конф-циальную информацию: --- отрезано --- postmaster@des-nt.tstu.ru leva@orthodox.tstu.ru hamster@lgg.ru avv@quasar.ipa.nw.ru vag@metrocom.ru lux@bigfoot.com smh@mail.ru donlan@aaanet.ru vvv@vsu.ru vvv@vvv.vsu.ru ioafet@mail.ru --- отрезано --- AAG> Присоединились ли к нам господа из одной известной шрифтовой конторы? Это уж не знаю. AAG> Архива же нету. И совсем было бы здорово иметь независимый AAG> веб-интерфейс, чтобы желающие могли обойтись без почты. Хорошо, буду думать об этом. Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 09 янв 2000 17:15:13 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- Как раз уникодный "Script" я и имею в виду. Конечно, уникод и только уникод, > но одно дело расширять > страницу с 204 смещением - обычную кириллическую, где как раз не должно > хватить знакомест, а другое совсем - пробивать некий стандарт отдельной > _славянской_ страницы. Впрочем в этом вопросе я полный ламер, а вот я точно > знаю, что Дима Смирнов, которому эти письма должны капать на мозги ;-) - > может достаточо подробно прокомментировать все варианты, связанные с > шрифтами и кодировками. > Бум надеяться, что он отвлечется на часок от зарабатывания хлеба насущного и > накропает нам сюда что-нибуть, да и Паратайп подписать не забудет. Это тоже сгодится. Я в Юникоде тоже не великий знаток, но усвоил, что для включения чего-либо в этот стандарт нужно добиться поддержки со стороны хотя бы одного из членов ассоциации. При наличии проработанного скрипта это возможно. Я уже связывался с конторой, которая, кстати, предоставила картинки кириллических глифов для сайта www.unicode.org. Там мне сказали, что если в чем какое упущение было, то они готовы восполнить, надо только сказать, что именно. Да и Паратайп, наверное, входит в ассоциацию. Думаю, что если даже "Линейное Письмо Б" уже получило свой стандарт, то церковно-славянский мы всяко пробьем. Может имеет смысл скопировать для начала всю кириллицу, повыкидывать лишнее и начать вставлять недостающее? Вот здесь-то нам и пригодится сайт нашего проекта. Мне, правда, совершенно неясно как выделяется нужный кусок Юникода для каждого нового разрабатываемого скрипта. Но ведь для данного этапа это и не так важно. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 09 янв 2000 23:26:19 От: "S. M. Hozainov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- Лев пишет: > Для этого предлагаю развести процедуру на несколько стадий. > > 1) этап неточного "русского" набора. > 2) этап инвариантного хранения текста, когда он хранится как > последовательность символов или глифов и может быть автоматически > преобразован для любой системы верстки. > 3) текст, уже адаптированный для конкретной системы с утратой возможности > автоматической обратной конвертации. > _Не надо_ создавать множество таких систем набора. Надо создать максимально > интеллектуальную систему преобразования plain slavic volapuk в _инвариант_, > а также множество систем преобразования этого инварианта к требуемым > системам верстки, что существенно проще. > Ценность этого формата состоит в полном отсутствии начальных требований к > квалификации работающих с ним людей. Эта ценность перевешивает все > остальное. Лев, а не может ли RTF формат играть роль инварианта? RTF очень популярный формат и понимается большинством редакторов с систем верстки и способен хранить любые знаки. Под неточным "русским" набором, я предполагаю, подразумевается текст набранный, например, в Лексиконе, где вместо славянских используются русские буквы без диакритики. Далее по некоему хитрому алгоритму, этот текст преобразуется в славянский UNICODE текст (например RTF или др. инвариант), а уже он грузится в систему верстки. Для такого набора людьми с "отсутствием начальных требований к квалификации" можно сделать двухоконный редактор (он же конвертер). В одном окне можно делать "неточный "русский" набор", а в другом видеть результат конвертирования его к славянскому или сразу набирать на славянском. Следовательно и прочие конвертер(ы) делать для конвертирования в RTF, а RTF достаточно универсален. С уважением, Сергей Михайлович Хозяинов. smh@mail.ru http://stop.at/smh ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 10 янв 2000 04:17:36 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- > Лев пишет: > > > Для этого предлагаю развести процедуру на несколько стадий. > > > > 1) этап неточного "русского" набора. > > 2) этап инвариантного хранения текста, когда он хранится как > > последовательность символов или глифов и может быть автоматически > > преобразован для любой системы верстки. > > 3) текст, уже адаптированный для конкретной системы с утратой возможности > > автоматической обратной конвертации. > > > _Не надо_ создавать множество таких систем набора. Надо создать максимально > > интеллектуальную систему преобразования plain slavic volapuk в _инвариант_, > > а также множество систем преобразования этого инварианта к требуемым > > системам верстки, что существенно проще. > > Ценность этого формата состоит в полном отсутствии начальных требований к > > квалификации работающих с ним людей. Эта ценность перевешивает все > > остальное. > > Лев, а не может ли RTF формат играть роль инварианта? RTF очень популярный > формат и понимается большинством редакторов с систем верстки и способен > хранить любые знаки. Насколько я понимаю, RTF зависит от шрифта - то есть там просто задается ссылка на некий шрифт, а с кодировкой независимо от шрифта он не работает. Поэтому, если будет стандартизован дюбой шрифт - то он сам по себе, скорее всего, будет инвариантом. RTF же хранит массу избыточной для наших пока что чисто текстологических целей информации о стилях оформления текста. Если мы впоследствии решим, что нам нужен некоторый "расширенный" инвариант, помнящий еще и оформление - то RTF очевидный кандидат. Хотя все равно он окажется избыточным, и, работая с RTF, очень легко будет инвариантный текст перевести в неинвариантное состояние. Например, заменив в некоторых местах шрифт, обеспечивающий инвариантное представление текста, на какую-нибудь ижицу. > Под неточным "русским" набором, я предполагаю, подразумевается текст набранный, > например, в Лексиконе, где вместо славянских используются русские буквы без > диакритики. Далее по некоему хитрому алгоритму, этот текст преобразуется в славянский > UNICODE текст (например RTF или др. инвариант), а уже он грузится в систему верстки. В целом это как раз моя идея и есть, только насчет RTF по вышеописанным причинам я сомневаюсь. Еще крайне неудобна его непредназначенность для ручной правки: есть ли у Вас гарантия, что если в двух разных программах обработать одинаковым образом один файл RTF , на выходе получится двоичное одно и то же? Собственно, я не сомневаюсь, что в рамках Ворда можно все эти трудности преодолеть, но поймите, что есть много людей, для которых Ворд не более приемлем, чеми для нас с Вами ТеХ ;-) > Для такого набора людьми с "отсутствием начальных требований к квалификации" > можно сделать двухоконный редактор (он же конвертер). В одном окне можно > делать "неточный "русский" набор", а в другом видеть результат конвертирования его > к славянскому или сразу набирать на славянском. Идея хорошая. Но прежде надо четко очертить круг инвариантов, чтобы быть увереным в том, что мы не созидаем такую программу на песке неинвариантного формата. > Следовательно и прочие конвертер(ы) делать для конвертирования в RTF, > а RTF достаточно универсален. Хранить информацию о форматировании - это явно лишнее, или это некое четвертое состояние текста: "расширенный инвариант" или "инвариант с форматированием". Насколько я понимаю, кое-кто тут может в качестве альтернативы Вашему подходу предложить для этих же целей ТеХ. Думаю, что для этого четвертого состояния текста характерный признак - возможность однозначного программного возвращения текста в "просто инвариантное" состояние. А уж желающие пускай пишут конвертилки из ТеХ в RTF и наоборот ;) Но боюсь также, что с "четвертым состоянием" - одна беда: крайняя его неустойчивость. Вряд ли существует такой формат, который помогал бы удерживаться в рамках этого состояния и не позволял с легкостью и неосознанно перевести текст в состояние 3), в котором текст заточен для какой-то издательской технологии и уже не сможет быть однозначно автоматически конвертирован назад к инварианту. С уважением, Левъ > > -------------------------------------------------------------------------- ----- > -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 10 янв 2000 04:26:25 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: de typographica slavonica, de glyphea convertenda et de invariantia -------------------------------------------------------------------------------- ----- Original Message ----- From: "A A G" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Sunday, January 09, 2000 5:15 PM Subject: Re: de typographica slavonica, de glyphea convertenda et de invariantia > Как раз уникодный "Script" я и имею в виду. Конечно, уникод и только > уникод, > > но одно дело расширять > > страницу с 204 смещением - обычную кириллическую, где как раз не должно > > хватить знакомест, а другое совсем - пробивать некий стандарт отдельной > > _славянской_ страницы. Впрочем в этом вопросе я полный ламер, а вот я > точно > > знаю, что Дима Смирнов, которому эти письма должны капать на мозги -) - > > может достаточо подробно прокомментировать все варианты, связанные с > > шрифтами и кодировками. > > Бум надеяться, что он отвлечется на часок от зарабатывания хлеба насущного > и > > накропает нам сюда что-нибуть, да и Паратайп подписать не забудет. > > Это тоже сгодится. Я в Юникоде тоже не великий знаток, но усвоил, что для > включения чего-либо в этот стандарт нужно добиться поддержки со стороны хотя > бы одного из членов ассоциации. При наличии проработанного скрипта это > возможно. Я уже связывался с конторой, которая, кстати, предоставила Мало того, при наличии проработанного скрипта мы сможем продолжить нашу работу вне зависимости от состояния длительного процесса его регистрации. При наличии проработанного скрипта у нас будет готовый инвариант, в котором можно будет хранить текст, а впоследствии этот текст с легкостью сможет быть сконвертирован в любой принятый стандарт, даже если он окажется не таким, каким мы предполагали. > картинки кириллических глифов для сайта www.unicode.org. Там мне сказали, > что если в чем какое упущение было, то они готовы восполнить, надо только > сказать, что именно. Да и Паратайп, наверное, входит в ассоциацию. > > Думаю, что если даже "Линейное Письмо Б" уже получило свой стандарт, то > церковно-славянский мы всяко пробьем. Этим совершенно точно занимались в Паратайпе: помнится, Смирнов мне на эту тему что-то говорил еще год-полтора назад. Может быть, усовестится-таки и изречет сюда в список рассылки какю-нибудь ценную инфу... ;) > Может имеет смысл скопировать для начала всю кириллицу, повыкидывать лишнее > и начать вставлять недостающее? Вот здесь-то нам и пригодится сайт нашего Я уверен в том, что Паратайповцы значительно продвинулись именно на этом направлении. > проекта. Мне, правда, совершенно неясно как выделяется нужный кусок Юникода > для каждого нового разрабатываемого скрипта. Но ведь для данного этапа это и > не так важно. > > Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 10 янв 2000 04:55:29 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Д. Смирнову AKA Hamster-у -------------------------------------------------------------------------------- Дима, дарагой! Если тебе таже влом по-каким-нибудь причинам самому сюда писать, пожалуйста, подпиши, как общал, Паратайповцев. Нам это сильно нужно. Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 10 янв 2000 05:08:51 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RFC: GLOSSARY -------------------------------------------------------------------------------- Я вот предлагаю "ц-слав инвариант", или сокр. "инвариант" - может быть, народ подскажет что-нибудь лучшее? ==================================== Вот для этого и нужна маркировка всех сочетаний шрифтов и кодировок в соответствии с приведенной мною классификацией (которую, пожалуй, стоит сделать более подробной). Вот еще предложение: "вид набора", или "набор" - различимое сочетание шрифта и кодировки ====================================== > Следовательно и прочие конвертер(ы) делать для конвертирования в RTF, > а RTF достаточно универсален. Хранить информацию о форматировании - это явно лишнее, или это некое четвертое состояние текста: "расширенный инвариант" или "инвариант с форматированием". ======================================= Предлагаемая маркировка всех существующих видов набора: 1) этап неточного "русского" набора. 2) этап инвариантного хранения текста, когда он хранится как последовательность символов или глифов и может быть автоматически преобразован для любой системы верстки. 3) текст, уже адаптированный для конкретной системы с утратой возможности автоматической обратной конвертации. 4) или 2plus) - "расширенный инвариант" или "инвариант с форматированием". ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 10 янв 2000 20:52:52 От: "S. M. Hozainov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: GLOSSARY -------------------------------------------------------------------------------- > ======================================= > > Предлагаемая маркировка всех существующих видов набора: > > 1) этап неточного "русского" набора. > 2) этап инвариантного хранения текста, когда он хранится как > последовательность символов или глифов и может быть автоматически > преобразован для любой системы верстки. > 3) текст, уже адаптированный для конкретной системы с утратой возможности > автоматической обратной конвертации. > > 4) или 2plus) - "расширенный инвариант" или "инвариант с > форматированием". > > ======================================== Предлагаю формат инварианта и набросок технологии работы с ним. ------------------------------------------------------------------------------ Обыкновенный текстовой файл следующего вида: <Аз><Буки><Веди> и т.п. Диакритика описывается аналогично. + несколько спец. знаков для обозначения конца абзаца и пр. Структура очевидна. Или вместо названия букв использовать их номера в алфавите. Инвариант содержит всю информацию о славянском тексте в виде последовательности имен знаков или их номеров. Он не зависит от шрифтов. Да, его нельзя (просто неудобно) править впрямую, но об этом ниже. > 1) этап неточного "русского" набора. Если я правильно понял идею Льва, то неточный набор это когда человек далекий от славянского, но знающий русский, набирает текст так: видит букву "Аз", а набирает русскую "А" и т.п. Диакритику игнорирует. Так можно набирать в любом редакторе. Например, в Лексиконе. > 2) этап инвариантного хранения текста, когда он хранится как > последовательность символов или глифов и может быть автоматически > преобразован для любой системы верстки. Думаю, это можно сделать так: 1. Если железо позволяет установить MSWord. -------------------------------------------------------------------- Файл с неточным набором открываем в MSWord'е как текстовой DOS файл. Жмём на кнопку и запускаем макрос перекодировки. Макрос знает соответствие славянской буквы её коду в том славянском шрифте, который есть в системе и, главное, реализует алгоритм преобразования неточного набора к настоящему славянскому. В результате видим славянский текст. Печатаем, читаем, правим. Далее сохраняем текст в DOC и/или RTF файл для передачи на верстку. Используя другой макрос перекодируем документ обратно к формату инварианта и сохраняем как текстовой файл. Т.е. получаем три файла, один из которых -- инвариант. 2. Если железо не позволяет установить MSWord. ------------------------------------------------------------------------- Придется писать программу. Обыкновенный простой редактор на VB. Можно найти готовый в примерах. Открываем им файл с неточным набором, конвертируем в славянский, преобразуем в RTF, который и показываем в окне. Видим славянский текст. Печатаем, читаем, правим. Далее сохраняем RTF файл для передачи на верстку и сохраняем файл инвариант как текстовой файл. Т.е. получаем два файла, один из которых -- инвариант. > 3) текст, уже адаптированный для конкретной системы с утратой возможности > автоматической обратной конвертации. Думаю, текст должен быть тщательно вычитан до верстки. Так, кстати, и положено по нормальной технологии, но на практике не получается. Русская натура слишком широка чтобы умещаться в рамки технологий :)). Но если следовать этому правилу, то не будет необходимости извлекать текст из верстки, т.к. он будет равен тексту до верстки. Дело в том, что верстальщик может легко нарушить структуру текста, т.е. разложить его по окнам (frames, text boxes, tables . . .). Иногда это просто необходимо, иногда нужно просто для удобства. Вот простой пример -- буквица. Делаем окно и помещаем в него первую букву абзаца. Теперь эта буква и абзац разлучены. Ну и т.п. Так что извлечь текст из верстки можно, но иногда только по кускам, которые потом придется собирать воедино. Можно просто перебросить текст через clipboard в Word и макросами его к инварианту. Т.е. во многих случаях извлечь текст из верстки будет можно, но трудоемко. > 4) или 2plus) - "расширенный инвариант" или "инвариант с > форматированием". Я вчера погорячился с предложением использовать RTF как инвариант, и сегодня, думаю, это лишнее. Слишком сложно, да и повтор RTF формата. Разве что добавить в инвариант еще две команды: <киноварь> и <черный>. С уважением, Сергей Михайлович Хозяинов. smh@mail.ru http://stop.at/smh =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 12 янв 2000 11:43:47 От: Mikhail Grinchuk Кому: font-list@des-nt.tstu.ru Тема: Ob invariante -------------------------------------------------------------------------------- Sm. prilozhennyj fajl (zazipovano odno i to zhe v neskol'kih raznyh kodirovkah). =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 12 янв 2000 21:17:24 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Ob invariante -------------------------------------------------------------------------------- Hi All, Mikhail Grinchuk wrote: > Sm. prilozhennyj fajl (zazipovano odno i to > zhe v neskol'kih raznyh kodirovkah). > > ------------------------------------------------------------------------ > Name: TEXT1.ZIP Мне кажется, что эти предложения близки к оптимальным. Я согласен, в частности, с тем, что надстрочные знаки надо ставить _после_ буквы, а не так, как это обычно делается в ТеХе. Вопрос к ТеХовцам: можно ли написать такой стиль, который бы "на лету" превращал это в SlavTex? Единственное, что можно было бы добавить, это "скобки" для киновари. Насколько я понимаю, выделение текста киноварью не относится деталям верстки, а имеет семантическое значение. Мои "ответы" на вопросы: 1. Не надо. 2. А что это такое? 3. Что имеется в виду: вопросительный знак _в принципе_, как грамматический элемент, или гражданский вариант "?" вместо ";"? 4. Да. 5. Нет. 6. Да. В любом случае "враны" можно ввести позднее, не нарушая уже принятого стандарта. 7. Насколько я помню Гамановича, в ц.с. "тире" не используется (т.е. "дай кровь - прими дух" передается как "даждь кровь, приими дух" или даже вообще без запятой). Прошу прощения, если это не так. В тех текстах, которые я набирал лично, никаких тире не было, насколько я помню. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 12 янв 2000 22:15:00 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: -------------------------------------------------------------------------------- И Вам тоже, доброго здоровья, Александр! :) > SGkgQWxsLA0KDQpNaWtoYWlsIEdyaW5jaHVrIHdyb3RlOg0KDQo+IFNtLiBwcmlsb3poZW5u > eWogZmFqbCAoemF6aXBvdmFubyBvZG5vIGkgdG8NCj4gemhlIHYgbmVza29sJ2tpaCByYXpu > eWgga29kaXJvdmthaCkuDQo+DQo+ICAgLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0t > LS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tDQo+ICAgICAgICAg > ICAgICAgICBOYW1lOiBURVhUMS5aSVANCg0K7c7FIMvB1sXU09EsIN7UzyDc1Mkg0NLFxMzP > 1sXOydEgwszJ2svJIMsgz9DUyc3BzNjO2c0uDQoNCvEg08/HzMHTxc4sINcg3sHT1M7P09TJ > LCDTINTFzSwg3tTPIM7BxNPU0s/eztnFINrOwcvJIM7BxM8g09TB18nU2CBf0M/TzMVfDQrC > 1cvX2SwgwSDOxSDUwcssIMvByyDc1M8gz8LZ3s7PIMTFzMHF1NPRINcg9MXoxS4NCg0K98/Q > 0s/TIMsg9MXoz9fDwc06IM3P1s7PIMzJIM7B0MnTwdTYINTBy8/KINPUyczYLCDLz9TP0tnK > IMLZICLOwSDMxdTVIg0K0NLF19LB3cHMINzUzyDXIFNsYXZUZXg/DQoNCuXEyc7T1NfFzs7P > xSwg3tTPIM3P1s7PIMLZzM8gwtkgxM/CwdfJ1NgsINzUzyAi08vPwsvJIiDEzNEgy8nOz9fB > 0skuIO7B08vPzNjLzw0K0SDQz87JzcHALCDX2cTFzMXOycUg1MXL09TBIMvJzs/XwdLYwCDO > xSDP1M7P08nU09EgIMTF1MHM0c0g18XS09TLySwgwSDJzcXF1A0K08XNwc7Uyd7F08vPxSDa > zsHexc7JxS4NCg0K7c/JICLP1NfF1NkiIM7BINfP0NLP09k6DQoNCjEuIO7FIM7BxM8uDQoy > LiDhIN7UzyDc1M8g1MHLz8U/DQozLiD+1M8gyc3FxdTT0SDXINfJxNU6INfP0NLP08nUxczY > ztnKINrOwcsgX9cg0NLJzsPJ0MVfLCDLwcsgx9LBzc3B1MnexdPLycoNCtzMxc3FztQsIMnM > ySDH0sHWxMHO08vJyiDXwdLJwc7UICI/IiDXzcXT1M8gIjsiPw0KNC4g5MEuDQo1LiDuxdQu > DQo2LiDkwS4g9yDMwMLPzSDTzNXewcUgItfSwc7ZIiDNz9bOzyDX18XT1Mkg0M/axM7FxSwg > zsUgzsHS1dvB0SDV1sUg0NLJztHUz8fPDQrT1MHOxMHS1MEuDQo3LiDuwdPLz8zYy88g0SDQ > z83OwCDnwc3Bzs/Xyd7BLCDXIMMu0y4gItTJ0sUiICDOxSDJ09DPzNja1cXU09EgKNQuxS4g > IsTByg0Ky9LP19ggLSDQ0snNySDE1cgiINDF0sXEwcXU09Egy8HLICLEwdbE2CDL0s/X2Cwg > 0NLJyc3JIMTVyCIgyczJIMTB1sUg18/Pwt3FDQrCxdog2sHQ0dTPyikuIPDSz9vVINDSz93F > zsnRLCDF08zJINzUzyDOxSDUwcsuIPcg1MXIINTFy9PUwcgsIMvP1M/S2cUg0Q0KzsHCydLB > zCDMyd7OzywgzsnLwcvJyCDUydLFIM7FIMLZzM8sIM7B08vPzNjLzyDRINDPzc7ALg0KDQrz > INXXwdbFzsnFzQ0KDQrhzMXL08HOxNINCg0KDQo= > > ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 00:04:22 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ob invariante -------------------------------------------------------------------------------- > Mikhail Grinchuk wrote: > > > Sm. prilozhennyj fajl (zazipovano odno i to > > zhe v neskol'kih raznyh kodirovkah). А нельзя ли повторить? А то у меня пропала почти вся почта за 12 января. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 00:59:44 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ob invariante -------------------------------------------------------------------------------- А до меня это сообщение не дошло. И не в том смысле, что я его не понял :) Не пора ли нам назначить некоторый срок до которого мы будем дожидаться отчета о работе, проделанной профессиональными шрифтописателями? Алексей > > > Mikhail Grinchuk wrote: > > > > > Sm. prilozhennyj fajl (zazipovano odno i to > > > zhe v neskol'kih raznyh kodirovkah). > > А нельзя ли повторить? А то у меня пропала почти вся почта за 12 января. > > > -------------------------------------------------------------------------- ----- > -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru > > ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 02:14:27 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RFC2: Ob invariante - Mikhail Grinchuk -------------------------------------------------------------------------------- Привет всей честной компании! Представляю вам на суд ========================================== СООБРАЖЕНИЯ ПО ИНВАРИАНТНОМУ ПРЕДСТАВЛЕНИЮ ЦЕРКОВНОСЛАВЯНСКОГО ТЕКСТА ========================================== I. ОБЩИЕ ПРИНЦИПЫ 0. Инвариантное представление (ИП) не обязано представлять внеязыковые элементы текста и детали верстки: размер шрифта, разного рода отступы, разбиение на строки, столбцы и страницы, цвет и т. п. Кодируются только слова (и числа) текста, знаки препинания, пробелы между словами и разбиение на абзацы. В противном случае придется изобретать еще одно всеобъемлющее внутреннее представление -- но только под несуществующую издательскую систему. Однако должна быть возможность отмечать часть текста как "пояснение" (сноски, параллельные места, просто вопросы и комментарии наборщика и т. п.). 1. ИП должно быть ASCII-файлом. 2. Нельзя использовать ASCII-символы, для которых нет гарантии присутствия во ВСЕХ кодировках, пригодных для русского языка. Тем самым разрешены только такие символы: 1234567890-=[]\;',./` A...Z А...Я !@#$%^&*()_+{}|:"<>?~ a...z а...я 3. ИП не должно различать пробел, табуляцию, конец строки, конец страницы и другие "белые" символы. Любое их количество подряд должно рассматриваться как один пробел. 4. С единственным исключением: пустая строка (т. е. строка, состоящая только из "белых" символов) должна восприниматься как конец абзаца. Несколько пустых строк подряд эквивалентны одной. 5. ИП не должно упрощать текст. (Например, должны различаться узкое и широкое "о" и поддерживаться все нужные акценты.) 6. Нельзя, чтобы визуально неразличимые символы ("е" русское и "e" латинское, например) обозначали не одно и то же. Поэтому, если "главный" алфавит -- кириллица, то из латиницы можно использовать только b Dd Ff Gg h Ii Jj k Ll m Nn Qq Rr Ss t Uu Vv Ww Zz 7. Желательно, чтобы закодированный текст был "читабельным" и без применения каких-либо программ. II. ЧТО НАДО КОДИРОВАТЬ? 1. Алфавит (названия упорядочены как слова в словаре, звездочкой (*) помечены буквы, которые в "строго" ц.-сл. систему кодировки можно и не включать): аз буки веди глаголь добро ер еры ерь есть есть йотированное (*) живете зело земля и 10-ричное и краткое иже ижица ик (вторая часть диграфа оу) како кси люди мыслете наш омега он покой пси рцы слово твердо ук ферт фита хер цы червь ша ща ю юс большой юс большой йотированный (*) юс малый юс малый йотированный (*) я (лигатура iа) ять Комментарии: 1) еры -- для "строгой" системы только начертание Ы, но не ЪI 2) есть -- два начертания для строчной буквы 3) зело -- не различаем s-образное и z-образное (с хвостом) начертание, а также начертание в виде зеркального s 4) земля -- не различаем з-образное и z-образное начертание 5) и 10-ричное -- "базовый" символ без точек 6) ижица -- "базовый" символ без надстрочных знаков 7) омега -- символы "красивая омега" и "от" рассматриваются как сочетания "базовой" омеги с диакритикой 8) он -- два варианта: широкий и узкий 9) ук -- как "базовый" элемент рассматриваем гамма-образное начертание. Диграф "оу" идет как два символа: узкое "о" + "ик". Обоснования: а) этот диграф имеет три вида: ОУ, Оу, оу; б) акценты ставятся не над "о", а над "у" в) при наборе вразрядку между "о" и "у" тоже вставляется пробел 10) цы -- не различаем ц-образное и ч-образное начертания 11) червь -- не различаем ч-образное и Y-образное начертания 12) ща -- единая буква, а не диграф "шт" 13) я (iа) -- только начертание с соединительной чертой поверху 2. Акценты / (ударение) \ (ударение) ^ (ударение) ) (придыхание) )/ (придыхание+ударение) )\ (придыхание+ударение) )^ (придыхание+ударение -- используется только с омегой) " (две точки над i или два штриха над ижицей) титло простое паерок титла буквенные и выносные буквы Комментарии: 1) не различаем просто выносную букву и выносную букву с покрытием 2) из выносных букв необходимы: Г Д О Р С Т Х (Т -- для "от", Х -- для слова "стих") В "расширенной" кодировке можно разрешить любой букве быть выносной 3) акценты ставим только НАД буквами, но не МЕЖДУ 4) над одной буквой не может стоять два акцента 5) титло простое стоит только над одной буквой, но не над парой букв или словом 3. Знаки препинания и спецзнаки: . , : ; ( ) - ! кавыка знак для 1000 крест звездочка 4. Пояснения/сноски/параллельные места, комментарии наборщика III. КАК КОДИРОВАТЬ? 1. Алфавит аз А а буки Б б веди В в глаголь Г г добро Д д ер Ъ ъ еры Ы ы ерь Ь ь есть Е е э (круглое начертание) есть йотированное JЕ = Jе jе = jэ живете Ж ж зело S s земля З з Z z (z-образное начертание) и 10-ричное I i и краткое Й й иже И и ижица V v ик (вторая часть диграфа оу) U u како К к кси КS = Кs кs люди Л л мыслете М м наш Н н омега W w он О о (узкое начертание) Q q (широкое начертание) покой П п пси ПS = Пs пs рцы Р р слово С с твердо Т т ук У у ферт Ф ф фита F f хер Х х цы Ц ц червь Ч ч ша Ш ш ща Щ щ ю Ю ю юс большой N n (?) юс большой йотированный (*) JN = Jn jn (?) юс малый Я я юс малый йотированный (*) JЯ = Jя jя я (лигатура iа) JА = Jа jа ять JЬ = Jь jь (либо R r) Примечания: 1) если сочетание кs или пs должно обозначать не кси/пси, а пару букв (это встречается, вроде бы, только в числах), то между ними ставим "пустой акцент" (см. ниже). 2) в этой кодировке меня меньше всего удовлетворяют "о широкое", ять и большой юс. Есть ли идеи по этому поводу? 2. Акценты ударение / ' ударение \ ` ударение ^ ^ придыхание = придыхание+ударение / =' или '= придыхание+ударение \ =` или `= придыхание+ударение ^ =^ или ^= две точки или два штриха " титло простое ~ паерок | титла буквенные и выносные буквы \г \д \о \р \с \т \х и т. п. Комментарии: 1) По-видимому, акценты лучше ставить после буквы, а не до нее: а) в случае ОУ/Оу/оу не придется вставлять акцент между "о" и "у" б) в числах с парами букв кs и пs акцент (титло) разделит две буквы: к~s, п~s; не придется особо заботиться о несовпадении с кси/пси: кs~, пs~ в) буквенные титла и выносные буквы окажутся в большинстве случаев на своем естественном месте: w\т пр\орока (акцент после) \тw п\оррока (акцент до) г) может быть, рассматривать паерок как выносной ер? (Без\ъ проблемъ.) д) более естественный (как при письме) порядок набора: сперва буква, а потом ее "украшения" е) может быть, стоит пойти на некоторое усложнение набора, но зато сделать его более универсальным: не просто \о, но \о/ или <о> -- это позволит задавать многобуквенный выносной текст (или просто, скажем, выносной диграф) 2) В качестве "пустого акцента" (разбивающего кs или пs на две буквы) можно использовать сочетание \\ 3) По-видимому, буква "i" по умолчанию должна быть с двумя точками; но при наличии явно указанного акцента (в том числе и пустого) эти точки исчезают. Для ижицы же по умолчанию никаких акцентов не подразумевается. 3. Знаки препинания и спецзнаки: . , : ; ( ) - ! (так и задаем) кавыка @ знак для 1000 # крест + звездочка * Примечания (точнее, здесь вопросы): 1) Надо ли различать точку внизу строки и точку в середине строки? 2) Надо ли регламентировать сочетания типа .:. .:- и т. п.? 3) Нужен ли вопросительный знак? 4) Достаточно ли одного вида скобок? 5) Нужны ли кавычки? 6) Достаточно ли иметь с ц.-сл. "стандарте" только символ для тысяч, или же надо предусмотреть все эти тьмы/легионы/враны/колоды и проч.? 7) Нужно ли различать дефис (знак переноса) и тире? 4. Пояснения/сноски/параллельные места Текст сноски/пояснения любого рода ставится непосредственно после поясняемого места в фигурных скобках. Текст, который наборщик хочет использовать только для своих пометок (и не предназначенный для сохранения при конвертации в "типографские" форматы), начинается со знака % и идет до конца строки. ========================================================== Вскоре после того, как возникнет некий консенсус по поводу такого ИП, можно было бы предложить почтеннейшей публике: 1) простой DOS-редактор, работающий непосредственно с ИП и не требующий вообще никаких шрифтов; 2) конвертор из ИП в формат RTF (адаптированный под использование шрифтов Ирмологион); 3) конвертор из ИП в ТеХ системы Слепухина; 4) конвертор из RTF (с Ирмологионом) в ИП; 5) некие программы восстановления отсутствующей диакритики и частичной формальной проверки текста. (Сейчас все это в разной степени готовности у меня уже существует и ждет в основном только стандартизации ИП.) ========================================================== Вопрос ко всем: в каких конкретно видах существуют компьютерные ц.-сл. тексты? Можно ли посмотреть на примеры текстов, набранных разными шрифтами (с разными раскладками)? Потому что несложно для каждого такого варианта сделать соответствующий вариант конверторов. Используются ли представления, отличающиеся от ТеХа и не конвертируемые в RTF стандартными средствами? (Word, например, умеет читать и писать RTF.) ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 02:27:16 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AG" Тема: Re: Ob invariante -------------------------------------------------------------------------------- ----- Original Message ----- From: "AG" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Thursday, January 13, 2000 12:59 AM Subject: Re: Ob invariante > А до меня это сообщение не дошло. И не в том смысле, что я его не понял :) А свое предыдущее Вы не могли бы повторить? Вот это >И Вам тоже, доброго здоровья, Александр! :) > >> SGkgQWxsLA0KDQpNaWtoYWlsIEdyaW5jaHVrIHdyb3RlOg0KDQo+IFNtLiBwcmlsb3poZW5u >> eWogZmFqbCAoemF6aXBvdmFubyBvZG5vIGkgdG8NCj4gemhlIHYgbmVza29sJ2tpaCByYXpu >> eWgga29kaXJvdmthaCkuDQo+DQo+ICAgLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0t > Не пора ли нам назначить некоторый срок до которого мы будем дожидаться > отчета о работе, проделанной профессиональными шрифтописателями? Мне кажется, что абсолютный предел можно установить до конца января. А пока что я стану теребить Смирнова голосом. Пускай хотя бы нас с ними свяжет, если уж самому влом участвовать в проекте. Просто жалко было бы проигнорировать достижения Паратайпа: они доподлинно есть, и немалые. С уважением, Лев. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 03:56:33 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC2: Ob invariante - Mikhail Grinchuk -------------------------------------------------------------------------------- > ========================================== > > СООБРАЖЕНИЯ ПО ИНВАРИАНТНОМУ ПРЕДСТАВЛЕНИЮ > > ЦЕРКОВНОСЛАВЯНСКОГО ТЕКСТА > > ========================================== Все ли согласны с необходимостью представления инварианта в ASCII? В этом есть известная целесообразность. Главное только не оставлять идею создания ц.с. кодовой страницы. Собственно, попутно мы выясняем, какие глифы должны быть представлены в новом стандарте. В предложенный ИП считаю нужным добавить квадратные скобки, густое придыхание и малую точку. Также предлагаю ввести некоторую ESC-последовательность для комментариев, служебных помет и всего прочего. Ведь иначе даже заголовок к файлу не оформить. Я знаю, все здесь люди занятые. Тем не менее, предлагаю подумать над возможностью периодических встреч участников проекта в режиме online. Технических средств для этого много, было бы желание. Между прочим, в Паратайп, или как там его, я писал полгода назад. Мне отвели, что проект как неясно кому нужный заглох. Остается только подивиться тому, что некие люди сделали даже упоминавшийся мной скрипт для Линейного Письма Б. Вряд ли эта проблема была насущнее проблемы ц.с. стандарта. Алексей =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 04:21:24 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC2: Ob invariante - Mikhail Grinchuk -------------------------------------------------------------------------------- > Все ли согласны с необходимостью представления инварианта в ASCII? В этом > есть известная целесообразность. Главное только не оставлять идею создания > ц.с. кодовой страницы. Собственно, попутно мы выясняем, какие глифы должны > быть представлены в новом стандарте. Вот-вот. Стопроцентно согласен. > В предложенный ИП считаю нужным добавить квадратные скобки, густое > придыхание и малую точку. Также предлагаю ввести некоторую > ESC-последовательность для комментариев, служебных помет и всего прочего. > Ведь иначе даже заголовок к файлу не оформить. Предлагаю избрать Михаила ответственным за реализацию этой части проекта (создания базового инварианта), а всем остальным - всячески ему помогать советом и делом. Кстати, пускай еще что-нибудь поскорее сюда напишет, чтобы зафиксировался его email. > Я знаю, все здесь люди занятые. Тем не менее, предлагаю подумать над > возможностью периодических встреч участников проекта в режиме online. > Технических средств для этого много, было бы желание. Так у нас и так практически онлайн ;) > Между прочим, в Паратайп, или как там его, я писал полгода назад. Мне > отвели, что проект как неясно кому нужный заглох. Остается только подивиться Даже если он заглох, у паратайповцев есть конкретные, пусть незавершенные, наработки и некоторые профессиональные представления о путях решения проблемы. В любом случае стоит из них это вытрясти, а не изобретать велосипед с самого начала. Кстати, не исключено, что проект заглох именно потому, что пропал заказчик: Дима занялся личной жизнью, а такого вот списка рассылки вроде нашего не существовало. Может быть, еще и реанимировать его получится... > тому, что некие люди сделали даже упоминавшийся мной скрипт для Линейного > Письма Б. Вряд ли эта проблема была насущнее проблемы ц.с. стандарта. Скрипт-то может быть и не обязательно для начала стандартизированный, но вот даже относительно его базового смещения хорошо было бы тщательно посоветоваться с теми ребятами. С уважением, Лев. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 07:06:53 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Программное обеспечение -------------------------------------------------------------------------------- > Вскоре после того, как возникнет некий консенсус по поводу такого ИП, можно > было бы предложить почтеннейшей публике: > > 1) простой DOS-редактор, работающий непосредственно с ИП и не требующий > вообще никаких шрифтов; Имеется в виду редактор, помогающий вводить принятые комбинации символов? Тогда это, конечно, осмысленно. Неплохо было бы обсудить список требуемых фич, хотя лично я скорее всего сам напишу всю поддержку ввода в Ворде. А вот для ТеХнарей, для которых Ворд - масдай.... а не захотят ли они в своем любимом техе набирать? > 2) конвертор из ИП в формат RTF (адаптированный под использование шрифтов > Ирмологион); Великолепно. Прямо за RTF я бы не взялся, а вот Вордовский макро - импортер текста - полагаю, что мы с Хозяиновым с радостью бы поделили. Годится ли rtf, сохраненный Вордом? Вроде бы, у 97-го непатченого Ворда были особенности, делавшие его RTF несовместимым со многими системами... > 3) конвертор из ИП в ТеХ системы Слепухина; Я думаю, что тоже будет масса желающих ТеХнарей. > 4) конвертор из RTF (с Ирмологионом) в ИП; Аналогично, я думаю, что я или Сергей Хозяинов сможем это взять на себя. Но только в среде Ворда. Писать standalone-утилиту для этой цели мне представляется бессмысленным. > 5) некие программы восстановления отсутствующей диакритики и частичной > формальной проверки текста. Вот это нужно расписать подробно. Возможно, нам требуется не единый конвертер, а последовательная серия преобразований текста и утилит, реализующих эти преобразования. В этом случае реализацию этой задачи тоже можно распараллелить, частично доверясь макрозаменам, а частично - используя специально написанные утилиты. Боюсь, правда, что даже для нахождения такой оптимальной серии замен по-хорошему непременно потребуется консультация профессиональных филологов. Кстати, если вот так поставить задачу - IMHO, мне наверняка удастся привлечь консультантом Камчатнова. В качестве очевидных промежуточных состояний могу назвать: 1) текст с добавленными ударениями 2) текст, набранный по старой орфографии. (Вот еще кстати пара сопутствующих задач - конвертилки из ИП старой орфографии в какую-нибудь Академию с ударениями и ятями и наоборот) > (Сейчас все это в разной степени готовности у меня уже существует и ждет в > основном только стандартизации ИП.) Если действительно готово, то, может быть, это и взять за основу? А если на самом деле у Вас лишь черновые наброски, то можно распараллелить работу - см. выше... Решайте сами, Михаил! С уважением, Левъ ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 07:19:04 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RFC1.1: GLOSSARY - давайте все-таки определимся со словарем -------------------------------------------------------------------------------- Я вот предлагаю "ц-слав инвариант", или сокр. "инвариант" - может быть, народ подскажет что-нибудь лучшее? Альтернативно - "инвариантное представление" (С) М. Гринчук ==================================== Вот для этого и нужна маркировка всех сочетаний шрифтов и кодировок в соответствии с приведенной мною классификацией (которую, пожалуй, стоит сделать более подробной). Вот еще предложение: "вид набора", или "набор" - различимое сочетание шрифта и кодировки Альтернативно - "представление" (С) М. Гринчук ====================================== > Следовательно и прочие конвертер(ы) делать для конвертирования в RTF, > а RTF достаточно универсален. Хранить информацию о форматировании - это явно лишнее, или это некое четвертое состояние текста: "расширенный инвариант" или "инвариант с форматированием". ======================================= Предлагаемая маркировка всех существующих видов набора: 1) этап неточного "русского" набора. 2) этап инвариантного хранения текста, когда он хранится как последовательность символов или глифов и может быть автоматически преобразован для любой системы верстки. 3) текст, уже адаптированный для конкретной системы с утратой возможности автоматической обратной конвертации. 4) или 2plus) - "расширенный инвариант" или "инвариант с форматированием". Лично мне моя терминология кажется более "ламерской", но и более семантически нагруженной, чем терминология Михаила, где между двумя разнородыми понятиями разница лишь в прилагательном "инвариантный". С уважением, Левъ. ---------------------------------------------------------------------------- --- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 09:55:51 От: Mikhail Grinchuk Кому: "font-list@des-nt.tstu.ru" Тема: Otvety i voprosy -------------------------------------------------------------------------------- Dobroje utro! Proshu proshchenija za latinicu -- prosto ja mogu otsylat' kirillicu lish' kak prilozhennyje fajly, a s etim, kak okazalos', vozmozhny problemy. Naskol'ko ja ponjal, povtorjat' "Soobrazhenija..." uzhe ne nado. ========================= A. Voinov: > Vopros k TeXovcam: mozhno li napisat' takoj stil', kotoryj by > "na letu" prevrashchal eto v SlavTeX? Mozhno (TeX -- universal'naja sistema, i jejo mozhno nauchit' chemu ugodno: hotja by i srazu v RTF perevodit', hot' i dolgij eto budet trud). No, po-mojemu, ne nuzhno. Potomu chto pri rabote v TeXe dlja dovedenija teksta do "ideal'nogo" sostojanija izredka prihoditsja nechto slegka shevelit' rukami -- skazhem, poroj razreshat' ili zapreshchat' perehod k novoj stroke v tom ili inom meste. Vstavljat' special'nyje sredstva dlja etogo v IP ja by ne stal -- po toj zhe prichine: ne sozdavat' novyj universal'nyj vnutrennij format dlja "umozritel'noj" izdatel'skoj sistemy. > "skobki" dlja kinovari Soglasen. Predlagaju uglovyje skobki. >> 2) Nado li reglamentirovat' sochetanija .:. .:- i t. p.? > 2. A chto eto takoje? Eto imenno takije sochetanija iz tochek i chjortochek (v konce abzaca). Vstrechajutsja v staryh letopisjah, naprimer. > 3. Chto imejetsja v vidu: voprositel'nyj znak kak > grammaticheskij element ili grazhdanskij variant "?" vmesto ";"? Vtoroje -- "grazhdanskij variant". ========================= Aleksej (A A G): > Schitaju nuzhnym dobavit' kvadratnyje skobki, gustoje pridyhanije > i maluju tochku. Kvadratnyje skobki -- net problem. Gustoje pridyhanije: 1) vstrechajetsja li ono imenno v c.-sl. tekstah? 2) togda i jego nado sochetat' s udarenijami Malaja tochka: pros'ba pojasnit', chem ona "visual'no" otlichajetsja ot obyknovennoj. (Jesli raznica togo zhe urovnja, kak mezhdu defisom i znakom perenosa -- to jest' tol'ko smyslovaja -- to raznyje oboznachenija vvodit' ne stoit.) > Takzhe predlagaju vvesti nekotoruju ESC-posledovatel'nost' dlja > kommentarijev, sluzhebnyh pomet i vsego prochego Eto v mojom predlozhenii uzhe zalozheno: tekst mezhdu znakom procenta i koncom stroki -- kommentarij. Vnutrennij format kommentarijev na urovne IP fiksirovat' ne stoit. Pust' eto budet elementom vhodnogo jazyka konvertorov. Chto-nibud' v takom duhe: kommentarii vida %%FontSize=12 mogut oboznachat' izmenenije razmera shrifta. > ...nekije ljudi sdelali dazhe upominavshijsja mnoj > skript dlja Linejnogo Pis'ma B A chego Vy zhdali? Sravnite, skol'ko ssylok dajot "AltaVista" na raznyje zaprosy: liber+linteus (20), slavonic+bible (48), slavonic+alphabet (71), glagolitic+alphabet (108), phaistos+disk (143), voynich+manuscript (539), latin+bible (1037), greek+bible (1068), linear+b (2335), russian+bible (3376), cyrillic+alphabet (4246), english+bible (11082), hebrew+bible (13577). Tak chto jeshchjo horosho, chto "Linear B" vstrechajetsja rezhe kirillicy! ========================= Lev Tihonov: "Invariant" vs. "invariantnoje predstavlenije": po obshchemu smyslu slova "invariant" -- eto tol'ko nekaja funkcija ot ob'jekta, a ne sam ob'jekt (v nashem sluchaje -- tekst). Togda kak "invariantnoje predstavlenije" -- eto takaja zapis' teksta, kotoraja "sohranjajet vse invarianty" (sushchestvennyje svojstva), abstragirujas' ot detalej vjorstki v konkretnyh uslovijah. Otnositel'no klassifikacii "vseh sushestvujushchih vidov nabora": nado by razlichat' dva aspekta: 1) naskol'ko polno i tochno zapisan sam tekst 2) jest' li chto-nibud' sverh teksta (elementy formatirovanija) (potomu chto tekst, nabrannyj v uproshchjonnoj orfografii, tozhe mozhno zapisat' v Word'e shriftami "Irmologion" i prevratit' v kakoj-nibud' PostScript ili GIF -- to jest' poluchit' nechto "adaptirovannoje dlja konkretnoj sistemy s utratoj vozmozhnosti avtomaticheskoj obratnoj konvertacii") Slovo "predstavlenije" ja ispol'zoval v samom obshchem smysle, a vovse ne kak "razlichimoje sostojanije shrifta i kodirovki". V mojom ponimanii razlichnymi predstavlenijami javljajutsja zapisi odnogo i togo zhe teksta v vide DOC-fajla, RTF-fajla, CHI-fajla i TeX-fajla. A kakije tam vnutri ispol'zujutsja (ili podrazumevajutsja) shrifty i kodirovki -- eto-to kak raz detali. Termin zhe (s chjotkim znachenijem) u menja byl vsego odin -- IP. ========================= Itogo: dobavljajem k IP takije elementy: [ ] (prosto dva simvola) < > (vydelenije kinovar'ju) Pod voprosom: malaja tochka i gustoje pridyhanije (hotelos' by uslyshat' bol'she argumentov). Poka "svobodny" simvoly $&_?/bDdGghLlmt (i cifry; no ih, navernoje, luchshe tak arabskimi ciframi i schitat'). Mozhet byt', stoit zafiksirovat' "?" kak simvol dlja nejasnostej pri vvode ili isporchennyh mest teksta. M. G. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 10:43:22 От: "S. M. Hozainov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Программное обеспечение -------------------------------------------------------------------------------- ----- Original Message ----- From: Lev Tikhonov To: -=ORTHODOX-FONT=- Project Participants Sent: Thursday, January 13, 2000 7:06 AM Subject: Программное обеспечение > > 2) конвертор из ИП в формат RTF (адаптированный под использование шрифтов > > Ирмологион); > > Великолепно. Прямо за RTF я бы не взялся, а вот Вордовский макро - импортер > текста - полагаю, что мы с Хозяиновым с радостью бы поделили. Годится ли > rtf, сохраненный Вордом? Вроде бы, у 97-го непатченого Ворда были > особенности, делавшие его RTF несовместимым со многими системами... А что, если о нем забыть и переходить на 2000? Читал я, что 2000 называют исправленным 97. > > 4) конвертор из RTF (с Ирмологионом) в ИП; > > Аналогично, я думаю, что я или Сергей Хозяинов сможем это взять на себя. Но > только в среде Ворда. Писать standalone-утилиту для этой цели мне > представляется бессмысленным. Такой макрос для MSWord 2000 уже есть. Переделать его для MSWord 97 -- пара пустяков. Я имею ввиду макрос для выполнения множественных замен, список которых хранится в виде таблицы в файле Word'а. Макрос писался для др. целей, но прямо попадает и в эту. Надо только выполнить рутинную работу по заполнению таблицы замен. Можно сделать несколько таблиц под разные шрифты. Удобство в том, что все наглядно и легко изменяется. Можно использовать как для конвертирования из ИП в формат Word'а (а далее сохранить в любом из многих форматов), так и для обратного конвертирования. С уважением, Сергей Михайлович Хозяинов. smh@mail.ru http://stop.at/smh ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 11:12:13 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC2: Ob invariante - Mikhail Grinchuk -------------------------------------------------------------------------------- "LT" == Lev Tikhonov writes: >> Все ли согласны с необходимостью представления инварианта в ASCII? замечание: ASCII -- это вполне конкретная 7-битная кодировка, и поэтому более правильно (и более понятно) было бы называть представление ТЕКСТОВЫМ. LT> Предлагаю избрать Михаила ответственным за реализацию этой части LT> проекта (создания базового инварианта), а всем остальным - LT> всячески ему помогать советом и делом. по TeXовской части я с удовольствием помогу. Кстати, почему Михаил упоминал пакет SlavTeX Слепухина, но не упомянул свой пакет (кодировку и шрифты) для набора ц.-сл. в TeX? LT> Кстати, пускай еще что-нибудь поскорее сюда напишет, чтобы LT> зафиксировался его email. это часом не обо мне? :-) Best regards, -- Vladimir. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 11:10:21 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: GLOSSARY -------------------------------------------------------------------------------- > Дело в том, что верстальщик может легко нарушить структуру текста, т.е. разложить его > по окнам (frames, text boxes, tables . . .). Иногда это просто необходимо, иногда > Т.е. во многих случаях извлечь текст из верстки будет можно, но трудоемко. Это-то понятно, только я не имел в виду, что такая ситуация должна быть нормальной: такие конвертеры из 3) в 2) понадобятся для доставания из издательстких систем уже сверстанного текста и конвертации его в инвариант, в целях дальнейшего употребления. Разумеется, что до тех пор, пока наше ИП не станет фактическим стандартом, такой обратной конвертацией заниматься бессмысленно. С уважением, Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 12:16:52 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC1.1: GLOSSARY - предлагайте ответы, увеличивая десятичный номер версии -------------------------------------------------------------------------------- 2All. Мне кажется, что для писем, подобным этому, можно делать Re: и сохранять старый номер версии Но каждое законченное предложение должно увеличивать номер версии RFC, при условии, что 1) в тексте письма хорошо различимы текст документа и авторские комментарии, 2) вопросы содержатся только во вступлении или в примечании и отделяются от документа разделитетем. 2Михаил Гринчук: Однако, в русском языке еще не отменена субстантивация прилагательных ;-) Впрочем, если Вы не настаиваете на термине "представление" для видов набора, наверное, можно выработать формулу согласия? Итак, "Инвариантное представление", сокр. "инвариант", "ИП" - основное понятие, означает базовую систему хранения ЦСл текста, которую мы создаем на основе предложенной Михаилом. Мне кажется, чтот термин слишком широк. Как же тогда именовать эквивалентные инварианту представления, взаимно-однозначно конвертируемые в наше ИП? Все-таки, IMHO, следует добавить прилагательное: "Стандартное ИП" и именовать этим термином разрабатываемую систему. Тогда термин ИП будет относиться к любому эквивалентному представлению. Можно пойти и по другому пути, оставив термин ИП за системой Михаила, а любую эквивалентную систему называть "эквивалентной трансформацией ИП". Третий путь гениально прост: "система Михаила Гринчука" и "ИП" для любой ее эквивалентной трансформации. ;-) Или даже Система Г... Красивее бы в латинице, да регистр переключать замучаемся. Впрочем, автору разрешается писать в латинице ;))) ------------------------------------------- "вид набора", или "набор" - различимое сочетание шрифта и кодировки ---------------------------- Не забудем о классификации текстов. Предлагаю сокращенно называть: "текст категории N", где: > Предлагаемая маркировка всех существующих видов набора: > > 1) этап неточного "русского" набора. > 2) этап инвариантного хранения текста, когда он хранится как > последовательность символов или глифов и может быть автоматически > преобразован для любой системы верстки. > 3) текст, уже адаптированный для конкретной системы с утратой возможности > автоматической обратной конвертации. > > 4) или 2plus) - "расширенный инвариант" или "инвариант с > форматированием". > Кстати, с точки зрения этой классификации, SystemG является не инвариантом, а расширенным инвариантом и сводится к инварианту путем удаления служебных тэгов вида %%FontSize=12 А вот предложенное Михаилом Otnositel'no klassifikacii "vseh sushestvujushchih vidov nabora": nado by razlichat' dva aspekta: 1) naskol'ko polno i tochno zapisan sam tekst - опечатки есть опечатки. А вот если в тексте присутствуют, допустим, яти, но систематически отсутствуют ударения - это очевидная особенность, которая должна быть отмечена, как дисквалифицирующая текст. Возможно, это и не ЦСлав текст вовсе, а просто набранный по дореволюц. орфографии ;-) 2) jest' li chto-nibud' sverh teksta (elementy formatirovanija) (potomu chto tekst, nabrannyj v uproshchjonnoj orfografii, tozhe mozhno zapisat' v Word'e shriftami "Irmologion" i prevratit' v kakoj-nibud' PostScript ili GIF -- to jest' poluchit' nechto "adaptirovannoje dlja konkretnoj sistemy s utratoj vozmozhnosti avtomaticheskoj obratnoj konvertacii") по-моему, замечание Михаила менее конкретно, чем ранее предложенная мною классификация. "Элементы форматирования" являются расширениями для любой эквивалентной трансформации ИП и поддерживаться стандартом системы Гринчука не должны. Желающие могут писать конвертеры расширенного инварианта Гринчука, но для начала хорошо бы обеспечить конвертацию собственно текста. Вот кстати еще парочка терминов к рассмотрению: 1) "расширенная CистемаГ" - то, что предлагает Михаил, с тэгами форматирования. 2) "строгая CистемаГ" или просто "СистемаГ" - это остаток от текста в расширенной системе после удаления тэгов форматирования. С уважением, Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 12:57:05 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC2: Ob invariante - Mikhail Grinchuk -------------------------------------------------------------------------------- ----- Original Message ----- From: "Vladimir Volovich" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Thursday, January 13, 2000 11:12 AM Subject: Re: RFC2: Ob invariante - Mikhail Grinchuk > LT> Предлагаю избрать Михаила ответственным за реализацию этой части > LT> проекта (создания базового инварианта), а всем остальным - > LT> всячески ему помогать советом и делом. > > по TeXовской части я с удовольствием помогу. Все ли согласны? Если возражений нет, то принимаем СистемуГ или как там она назовется и назначаем Михаила ответственным за поддержание RFC2 в актуальном состоянии! Мне кажется, что уточнения следует маркировать десятичным номером версии. Если все согласны, то мы ждем исправленного документа от Михаила под сабжем "RFC2.1: SystemG" (или как там она назовется ;) Все вопросы и уточнения по системе, не снятые Михаилом в текущей версии RFC, помимо там же вынесенных Михаилом на всеобщее обсуждение, следует адресовать лично ему. Михаил Гринчук является конечным авторитетом в данном вопросе. Если возражений в ближайшие дни не последует, решение считается принятым консенсусом. > Кстати, почему Михаил упоминал пакет SlavTeX Слепухина, но не упомянул > свой пакет (кодировку и шрифты) для набора ц.-сл. в TeX? По смирению, надо полагать ;-) > LT> Кстати, пускай еще что-нибудь поскорее сюда напишет, чтобы > LT> зафиксировался его email. > > это часом не обо мне? :-) Нет, о Михаиле, но он уже написал сюда утром. Best regards, -- Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 15:13:08 От: Mikhail Grinchuk Кому: "font-list@des-nt.tstu.ru" Тема: (Re) Hozjainovu, Volovichu, Tihonovu -------------------------------------------------------------------------------- S. M. Hozjainovu: 1. Schitaju, chto imet' "standalone" utility dlja konvertacii IP <-> RTF luchshe, chem makrosy v Word'e, ibo: 1) net privjazki k Word'u kak takovomu, Windows i PC-compatible tehnike (ili, skazhete, sushchestvujet Word dlja Sun? Da chtob vse eti makrosy podderzhival?) 2) gorazdo bystreje rabotajet. Komu kak, no mne ochen' ne nravitsja zhdat' 20 sekund, poka Word, radostno shursha HDD, vsego lish' startujet, potom stol'ko zhe, poka on fajl prochitajet. Prichjom po hodu dela nado vsjo vremja kakije-to menjushki otkryvat', myshku djorgat' i voobshche... Ili jest' jestestvennyj i udobnyj sposob (ne vyhodja iz Word'a) prochitat' 20 fajlov DOC (ili RTF), skonvertirovat' ih v IP, sravnit' s raneje imevshimisja IP teh zhe tekstov i poluchit' svodku raznochtenij? Mne dlja etogo dostatochno za paru minut napisat' BAT-fajl, kotoryj minut za pjat' vsjo sdelajet. (Jestestvenno, vremja na sozdanije konvertora -- ravno kak i makrosa v Word'e -- tut ne uchteno.) (P. S. A kogda ja iz nego, Worda etogo, sejchas vyhodil -- tak i vovse vsja sistema zavisla.) Konechno, eto vsjo ne oznachajet, chto makrosy bespolezny ili vredny. Pust' budet vybor. 2. Kak format zapisi RTF luchshe DOC, potomu chto v RTF-fajle ne v primer proshche razbirat'sja. ===================== V. Volovichu: > Pochenu Mihail upominal paket SlavTeX Slepuhina, no ne upomjanul > svoj paket (kodirovku i shrifty) dlja nabora c.-sl. v TeX? Tri prichiny (vpolne prozaicheskije): 1) sobirajus' sil'no vsjo peredelat' (naprimer, stavit' akcenty posle bukv, a ne do); 2) osobo ne reklamiruju svoju sistemu, poka ona derzhitsja na programmah prosmotra i pechati iz kommercheskogo paketa (a paket Slepuhina i sam besplatnyj, i s besplatnym TeXom rabotajet); 3) chestno govorja, shrifty Slepuhina posimpatichneje moih budut (primerno kak "Irmologion" v sravnenii s "Izhicej") ===================== L. Tihonovu: 1. Chtoby identificirovat' "moj" variant IP, mozhno nazvat' jego GIP ili HIP (jesli ispol'zovat' ukrainskuju transkripciju, ja budu Mykhailo Hrynchuk). Sootvetstvenno, versija 2 budet HIP-HIP i tak daleje. ;-) No vsjo zhe predpochjol by "bezlichnoje" nazvanije. A potomu poka ostavljaju "IP". 2. "Tegi formatirovanija" -- ne element sistemy, a vozmozhnoje ispol'zovanije kommentarijev. Sistema sama po sebe dolzhna tol'ko predusmatrivat' kommentarii kak takovyje. "Bazovyje" konvertory vprave vse kommentarii prosto ignorirovat'. Inache govorja: IP soderzhit kommentarii, no nikak ne reglamentirujet ih smysl. 3. Novaja versija gde-to cherez chas budet vyslana (snova kak ZIP tekstovogo fajla v 5 russkih kodirovkah). 4. Ja kak-to propustil: chto takoje sistema oboznachenij "RFC..."? M. G. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 17:26:08 От: Mikhail Grinchuk Кому: "font-list@des-nt.tstu.ru" Тема: RFC2.1: Projekt IP -------------------------------------------------------------------------------- Obeshchannyj dokument: ZIP-arhiv s odnim i tem zhe tekstom v 5 kodirovkah. M. G. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 17:39:17 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Igor Gaslov's article on c.-sl. character/glyph set -------------------------------------------------------------------------------- Hi, Igor Gaslov довольно давно присылал мне свою статью про набор символов для ц.-сл. Если кто желает ознакомиться, то: ftp://ftp.vsu.ru/pub/tex/docs/slav_1.pdf.gz Best, v. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 17:53:47 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC2: Ob invariante - Mikhail Grinchuk -------------------------------------------------------------------------------- > "LT" == Lev Tikhonov writes: > > >> Все ли согласны с необходимостью представления инварианта в ASCII? > > замечание: ASCII -- это вполне конкретная 7-битная кодировка, и > поэтому более правильно (и более понятно) было бы называть > представление ТЕКСТОВЫМ. Справедливо. Только SystemG все-таки уже 8-битная. Таким образом, мы параллельно будем работать на 8-битной и 16-битной системами. Если наша любовь к терминологии и к сокращениям зайдет достаточно далеко можно их даже окрестить чем то вроде CS-8 и CS-16. Удобно произносится и по-русски в алгебраической традиции (ЦС), и по-английски. В обоих языках сокращение сохраняет смысл. Но это - дело вкуса. Может быть, имеет смысл и расширить названия систем. Наверняка есть омонимичные термины. Наверное, я пустое говорю. Алексей ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 18:05:14 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AG" Тема: UNICODE guidelines -------------------------------------------------------------------------------- Вот тут юникодовцы советуют, как нужно проводить в жизнь утверждение новых скриптов. Рекомендуют возпользоваться поддержкой академических сообществ. Неужели мы никого не найдем в Институте Русского Языка? http://www.unicode.org/pending/proposals.html ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 19:57:04 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Программное обеспечение -------------------------------------------------------------------------------- "S. M. Hozainov" wrote: > Такой макрос для MSWord 2000 уже есть. Переделать его для MSWord 97 -- > пара пустяков. Я имею ввиду макрос для выполнения множественных замен, > список которых хранится в виде таблицы в файле Word'а. Макрос писался > для др. целей, но прямо попадает и в эту. Надо только выполнить > рутинную работу по заполнению таблицы замен. Можно сделать несколько > таблиц под разные шрифты. Удобство в том, что все наглядно и легко > изменяется. Можно использовать как для конвертирования из ИП в формат > Word'а (а далее сохранить в любом из многих форматов), так и для обратного > конвертирования. Дайте это мне, пожалуйста. А если есть уже страница для "эхотага", то можно и туда выложить. Я с удовольствием свой stuff туда перенесу, а то на сайте языка Питон все это, мягко говоря, оффтопик. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 20:05:42 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: (Re) Hozjainovu, Volovichu, Tihonovu -------------------------------------------------------------------------------- Mikhail Grinchuk wrote: > > S. M. Hozjainovu: > > 1. Schitaju, chto imet' "standalone" utility dlja konvertacii IP <-> RTF > luchshe, chem makrosy v Word'e, ibo: > > 1) net privjazki k Word'u kak takovomu, Windows i PC-compatible tehnike (ili, > skazhete, sushchestvujet Word dlja Sun? Da chtob vse eti makrosy podderzhival?) СтарОфис многое поддерживает, а теперь его пропихивает именно Сан. > 2) gorazdo bystreje rabotajet. Для Юниксов давно есть утилита mswordview (или типа того), которая выводит в стандартный выходной поток чистый текст из дока (не RTF, насколько я помню). Т.к. это freeware, то, наверное, не составит проблемы договориться с авторами, чтобы добавить вывод ИП, например, при задании определенного ключика. > > Komu kak, no mne ochen' ne nravitsja zhdat' 20 sekund, poka Word, radostno > shursha HDD, vsego lish' startujet, potom stol'ko zhe, poka on fajl > prochitajet. Prichjom po hodu dela nado vsjo vremja kakije-to menjushki > otkryvat', Вот именно, а с утилитой командной строки можно организовать автоматическое зеркалирование директории из формата ворда в ИП (и складирование на ftp-сервере). С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 20:48:59 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: (Re) Hozjainovu, Volovichu, Tihonovu -------------------------------------------------------------------------------- ----- Original Message ----- From: "Mikhail Grinchuk" To: Sent: Thursday, January 13, 2000 3:13 PM Subject: (Re) Hozjainovu, Volovichu, Tihonovu > S. M. Hozjainovu: > > 1. Schitaju, chto imet' "standalone" utility dlja konvertacii IP <-> RTF > luchshe, chem makrosy v Word'e, ibo: > > 1) net privjazki k Word'u kak takovomu, Windows i PC-compatible tehnike (ili, > skazhete, sushchestvujet Word dlja Sun? Da chtob vse eti makrosy podderzhival?) > > 2) gorazdo bystreje rabotajet. > > Komu kak, no mne ochen' ne nravitsja zhdat' 20 sekund, poka Word, radostno > shursha HDD, vsego lish' startujet, potom stol'ko zhe, poka on fajl > prochitajet. Prichjom po hodu dela nado vsjo vremja kakije-to menjushki > otkryvat', myshku djorgat' i voobshche... Ili jest' jestestvennyj i udobnyj > sposob (ne vyhodja iz Word'a) prochitat' 20 fajlov DOC (ili RTF), > skonvertirovat' ih v IP, sravnit' s raneje imevshimisja IP teh zhe tekstov i > poluchit' svodku raznochtenij? Mne dlja etogo dostatochno za paru minut > napisat' BAT-fajl, kotoryj minut za pjat' vsjo sdelajet Это, Миша, вопрос религиозный ;). Конечно, есть способ сделать то же самое не выходя из Ворда в консоли VBA. Или написать макрос из десятка строчек (аналог батника) и запускать его по нужде. Можно - скажу Вам по секрету - и Ворд запускать с параметром, так что он запустится даже без окна просто как виртуальная машина для исполнения макроса. Наконец, можно эту виртуальную машину загружать при первой потребности и вовсе ее не выгружать: она будет постепенно вытесняться в своп и там ждать своего часа. . (Jestestvenno, vremja > na sozdanije konvertora -- ravno kak i makrosa v Word'e -- tut ne uchteno.) Вот-вот, а это затраченное время несравнимо выше по сравнению с временем, теряющемся на открытие документа в Ворде и вообще всеми следствиями Вордовой навороченности. По крайней мере, для тех непрофессиональных программистов, кто и так сидит на Wintel и работает с Вордом, нет никакого смысла изучать какие-либо инструменты программирования, пока они не изучили в совершенстве VBA и не освоились в мире уже инсталлированных реализованных COM-интерфейсов, которых в любой системе десятки и сотни и которые можно подключать и использовать одной строчкой. Практически все, что угодно можно сделать, не выходя из Ворда, например, использовать Ваши unix/dos-style standalone утилиты, хотя для естественности лучше написать для них VB-оболочки в виде ActiveX dll. [Другое дело если вы заядлый ТеХнарь и Perlовый кашевар - тогда неясно, зачем Вам вообще Ворд? ;-) Если только для конвертации doc-ов, то зачем Вы жалуетесь на Ворд? Формат давно раскрыт: напишите себе на перле конвертер, только вряд ли Вы за всю жизнь откроете в Ворде столько документов, чтобы оправдать написание такого конвертера. ;)] В частности, парсер наподобие перловского с регулярными выражениями - это просто ActiveX dll, которая, кстати, IMHO устанавливается вместе с VB6. До сих пор мне не доводилось ее использовать, но точно знаю, что она создавалась именно как "ответ Чемберленам"-юниксистам-перловикам. ;-) Предваряя вопрос об ActiveX dll скажу, что ее отличие от просто dll - в простоте использования из Васика, в том числе встроенного в Ворд. Для ее безопасного использования с ранним, заметим, связыванием, вовсе не нужно уметь декларировать ее функции, в отличие от обычной dll. Интерфейс любой функции просто будет подсказан средой во время проектирования. А имена обычно даются длинные и содержательные... Для Вордовиков проблема не столько даже в программировании, сколько в нахождении актуальной документации и выборе уже готовых компонентов, которые можно подключать к среде. Все необходимое для большинства задач уже присутствует в системе, и если макрос длиннее нескольких десятков строк - значит, его создатель неэффективно потратил время, заново изобретая реализацию уже реализованных и наверняка имеющихся в системе компонент. Мне кажется, что я залез в офтопик. Предлагаю объявить сравнение платформ офтопиком, просто помнить, что все, что мы создаем, должно обладать достаточной гибкостью, чтобы быть полезным всем, а не только братьям по компьютерной вере ;-). > (P. S. A kogda ja iz nego, Worda etogo, sejchas vyhodil -- tak i vovse vsja > sistema zavisla.) > > Konechno, eto vsjo ne oznachajet, chto makrosy bespolezny ili vredny. Pust' > budet vybor. Вот ради этого и стоит четко специфицировать уровни (состояния) текста (кстати, опять нужен термин)! Для того, чтобы весь софт характеризовался четырьмя параметрами - начальной и конечной платформой и начальным и конечным состоянием текста. Кстати, я бы четко поделил софт на две категории - вертикальный и горизонтальный. Чтобы не было неразберихи, надо, несмотря на большой творческий соблазн, весь "официальный" софт писать только либо для конвертации между платформами в рамках одного уровня текста, либо для изменения уровня текста в рамках одной платформы. При наличии такой библиотеки каждый сможет выбирать, что ему проще: использовать готовый инструмент или изобретать велосипед на любимой платформе. > L. Tihonovu: > > 1. Chtoby identificirovat' "moj" variant IP, mozhno nazvat' jego GIP ili HIP > (jesli ispol'zovat' ukrainskuju transkripciju, ja budu Mykhailo Hrynchuk). > Sootvetstvenno, versija 2 budet HIP-HIP i tak daleje. ;-) > > No vsjo zhe predpochjol by "bezlichnoje" nazvanije. A potomu poka ostavljaju > "IP". Короче - предлагайте свою версию RFC1. Необходимо зафиксировать терминологию, чтобы не тратить каждый раз время на изучение словаря собеседника. > 2. "Tegi formatirovanija" -- ne element sistemy, a vozmozhnoje ispol'zovanije > kommentarijev. Sistema sama po sebe dolzhna tol'ko predusmatrivat' kommentarii > kak takovyje. "Bazovyje" konvertory vprave vse kommentarii prosto ignorirovat'. > Inache govorja: IP soderzhit kommentarii, no nikak ne reglamentirujet ih smysl. Тогда Ваша IP будет содержать, помимо собственно инварианта, некие инструкции препроцессора, которые делают текст неинвариантом в строгом смысле слова. Все-таки IMHO следует даже терминологически зафиксировать эту разницу. Все же логически Ваша система ничем не выделена в пространстве инвариантов, помимо того, что она избрана нами - довольно тесным пока кружком - в качестве стандартной. Если мы будем навязывать остальным Ваш препроцессор, то им будет психологически труднее нашу систему принять. А для нас, уже ее принявших - это вопрос только терминологии и ничего не меняет по существу. Еще один аргумент: Вы предлагаете "базовость" - "небазовость" сделать характеристикой софта, а мне кажется, что лучше это сделать характеристикой системы. Потому что, как пока что представляется, софт и так будет перегружен характеристиками, к тому же характеристику по "базовости" в применении к софту всегда будет нужно расшифровывать описательно, а системы с соответствующими характеристиками можно просто описать в RFC. > 3. Novaja versija gde-to cherez chas budet vyslana (snova kak ZIP tekstovogo > fajla v 5 russkih kodirovkah). > > 4. Ja kak-to propustil: chto takoje sistema oboznachenij "RFC..."? Это я по ходу дела изобрел, чтобы не теряться в бесконечных тредах, все актуальные документы оформлять как RFC (по аналогии с интернетом). Отличие от интернета - IMHO лучше использовать доли версии, чем использовать инкремент целого номера и поддерживать индекс актуальных документов. Предлагаемые принципы оформления - см. в моем утреннем постинге. Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 20:47:10 От: postmaster@des-nt.tstu.ru Кому: font-list@des-nt.tstu.ru, Тема: Re: Программное обеспечение -------------------------------------------------------------------------------- From: "Alexander V. Voinov" > Дайте это мне, пожалуйста. А если есть уже страница для "эхотага", то > можно и туда выложить. Я с удовольствием свой stuff туда перенесу, а > то на сайте языка Питон все это, мягко говоря, оффтопик. Теоретически место выделенно - http://orthodox.tstu.ru/font-list/ кто желает оформить и поддерживать эту страничку - вперед! =Андрей ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 21:51:01 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC2: Ob invariante - Mikhail Grinchuk -------------------------------------------------------------------------------- AG wrote: > > > "LT" == Lev Tikhonov writes: > > > > >> Все ли согласны с необходимостью представления инварианта в ASCII? > > > > замечание: ASCII -- это вполне конкретная 7-битная кодировка, и > > поэтому более правильно (и более понятно) было бы называть > > представление ТЕКСТОВЫМ. > > Справедливо. Только SystemG все-таки уже 8-битная. Таким образом, мы > параллельно будем работать на 8-битной и 16-битной системами. Если наша > любовь к терминологии и к сокращениям зайдет достаточно далеко можно их даже > окрестить чем то вроде CS-8 и CS-16. Согласен. А СнстемГ и СистемЖе неблагозвучно, имхо. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 23:32:01 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RFC3: Text Leveling -------------------------------------------------------------------------------- ================================================= Предлагаемые "уровни текста". Впоследствии каждый вид набора должен быть маркирован, в частности, подходящим ему обозначением уровня текста ================================================= Первоначально для обозначения уровней текста будут использоваться простая цифро-буквенная нумерация, впоследствии, вероятно, для их представления придется перейти к ориентированному графу, где стрелки будут обозначать возможность автоматической конвертации текста в указанном направлении. 1) этап неточного "русского" набора. 1A) - русский набор с ударениями; 1Б) - набор по старой орфографии; 1С) - старая орфография с ударениями. 2) этап инвариантного хранения текста, когда он хранится как последовательность символов или глифов и может быть автоматически преобразован для любой системы верстки. 2-basicHIP, 2-Unicode, 2-Word-Irmologion-Purified, ..... 2plus) - "расширенный инвариант" или "инвариант с форматированием". Разновидности: 2plus-HIP, 2plus-HIP-Word.... и т. п. [Относительно последнего - это то, чем я грозился: такое представление в Ворде, в котором будут визуализированы все Мишины комментарии, имеющие отношение к форматированию. Вероятно, ТеХовцы могут поступить аналогично.] 3) текст, уже адаптированный для конкретной издательской системы с утратой возможности автоматической обратной конвертации. Разновидности: 3-Word-Irmologion, 3-ТеХ-Slepuhin, 3-Ventura-Lavra Все тексты, кроме того, маркируются платформой (или в бывшей Мишиной терминологии "представлением"), например: 1а/WinText, 1a/DosText, 1a/TeX, 1a/Word, 1a/ChiWriter, 1a/Ventura и т. д. 2-basicHIP/DosText, 2-basicHIP/Word... 2-Unicode/WinText, 2-Unicode/Word.... Наверное, 2-Word-Irmologion-Purified/Word или 3-ТеХ-Slepuhin/ТеХ - это плеоназмы, и без знаменателя в таком случае можно обходиться. Соответственно, элементы ориентированного графа (см. RFC4) пока что таковы: 2plus -> 2 2 -> 3 2plus -> 3 2 -> 1 2 -> 1* 1* -> 1 1С -> 1А 1С -> 1Б ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 23:32:08 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RFC 4: Vertical Software -------------------------------------------------------------------------------- Софт, занимающийся переводом текста между уровнями, именуется "вертикальным". "Вертикальный софт" делится на две группы. Программы первой группы называются "тривиальными" - они реализуют автоматическое преобразование текста в напрвлении, задаваемом ориентированным графом, определенным в RFC 3. Программы второй группы - "нетривиальные" - создаются для обеспечения прочих преобразований между уровнями текста. Нетривиальные программы делятся на ассистирующие, тэгогенерирующие и программы утилизации тэгов. Ассистирующие программы используются в интерактивном режиме, предлагая оператору выбор между альтернативнами заменами. Тэгогенерирующие программы используются в пакетном режиме, вставляя в текст "альтернативные тэги", описывающие возможные в каждом конкретном месте замены. Программы утилизации тэгов - это интерактивные утилиты, позволяющие редактировать исключительно имеющиеся в тексте "альтернативные тэги" и выбирать желательный вариант заменяя им исходный "альтернативный тег". Несложно заметить, что после утверждения стандарта "альтенативных тэгов" понадобится одна и только программа утилизации тэгов (для каждой платформы, впоследствии это не оговаривается). Программы других типов должны маркироваться начальным и конечным уровнями текста. Любая ассистирующая программа состоит из двух компонент - интерфейсной компоненты, общей с программой утилизации тэгов и логической компоненты, общей с соответствующей программой-тэгогенератором К написанию интерфейсной части - утилизатора тэгов - можно приступать сразу же после того, как мы придем к соглашению относительно формата этих "альтернативных тэгов". Алгоритмы же тэгогенерирующих программ подлежат созданию и длительному совершенствованию после того, как мы разработаем достаточно подробную систему уровней текста. Некоторые из них должны обладать устойчивостью к ошибкам ручного ввода и к некоторым элементам конечного состояния, уже присутствующим во входном потоке. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 13 янв 2000 23:34:17 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: OFFTOPIC -------------------------------------------------------------------------------- > > 1) net privjazki k Word'u kak takovomu, Windows i PC-compatible tehnike (ili, > > skazhete, sushchestvujet Word dlja Sun? Da chtob vse eti makrosy podderzhival?) > > СтарОфис многое поддерживает, а теперь его пропихивает именно Сан. Не знаю, как на Солярисе, а под Win32 StarOfice запускается и открывает/сохраняет документы далеко не 20 секунд, а несколько минут ;( Я читал несколько отзывов в разных источниках, сводящиеся к тому, что сей офис был снесен серез полчаса после установки по указанной причине. > > 2) gorazdo bystreje rabotajet. > > Для Юниксов давно есть утилита mswordview (или типа того), которая > выводит в стандартный выходной поток чистый текст из дока (не RTF, > насколько я помню). Т.к. это freeware, то, наверное, не составит > проблемы договориться с авторами, чтобы добавить вывод ИП, например, при > задании определенного ключика. Вот и классно - не надо будет "врагам" запускать наш Ворд, чтобы потом его злобно хаять ;) > > > > Komu kak, no mne ochen' ne nravitsja zhdat' 20 sekund, poka Word, radostno > > shursha HDD, vsego lish' startujet, potom stol'ko zhe, poka on fajl > > prochitajet. Prichjom po hodu dela nado vsjo vremja kakije-to menjushki > > otkryvat', > > Вот именно, а с утилитой командной строки можно организовать > автоматическое зеркалирование директории из формата ворда в ИП (и > складирование на ftp-сервере). Да и из Ворда HIP запросто можно сохранять в формате "Только текст". Другое дело, что, работая _только_ с вордом, внутри, так сказать, религиозного лагеря, возможно, удобнее будет иметь дело не с текстовым инвариантом HIP, а с эквивалентным расширенным инвариантом типа 2plus), предоставляющим все удобства вордовской визуализации. Конечно, прежде, чем вводить такой "внутриплатформенный" стандарт, нужно будет обеспечить его туда-сюда-конвертируемость в HIP. Конечно, это мы с Хозяиновым гарантируем. Вероятно, что и ТеХовцы могут пойти по тому же пути. Такая вот приверженность платформам, которая неизбежно проявится - основание для согласования и документации общеприемлемых "уровней форматирования текста". Но это не самое актуальное, конечно.... Вероятно, что текст в некоторой стадии готовности просто обидно будет конвертировать в HIP. В терминологии Гринчука такие согласованные уровни форматирования - это просто версии языка комментариев. Соответственно - это уже не сабж - появляется еще один перспективный топик и тема для RFC: "уровни форматирования текста". Это помимо уже предложенных мной просто "уровней текста" С уважением Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 14 янв 2000 10:25:58 От: Mikhail Grinchuk Кому: "font-list@des-nt.tstu.ru" Тема: (Re) Grishinu, Voinovu, Tihonovu -------------------------------------------------------------------------------- Sam tekst snova v ZIP-arhive v 5 kodirovkah. Vsem: Polucheno li mojo pis'mo "RFC2.1: Projekt IP"? A to chto-to na nego nikakih otklikov... M. G. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 14 янв 2000 19:24:25 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: TO: Mikhail Grinchuk -------------------------------------------------------------------------------- Привет Mikhail, 13 января 2000 г., 9:55:51, ты писал: MG> Mozhno (TeX -- universal'naja sistema, i jejo mozhno nauchit' chemu ugodno: MG> hotja by i srazu v RTF perevodit', hot' i dolgij eto budet trud). No, MG> po-mojemu, ne nuzhno. Potomu chto pri rabote v TeXe dlja dovedenija teksta do MG> "ideal'nogo" sostojanija izredka prihoditsja nechto slegka shevelit' rukami -- Какой ужас... Может попробуешь, все-таки, кириллицей? Почему она не проходит? Ты откуда пишешь? Может тебе взять емайл где-нибудь на mail.ru, zmail.ru. Хочешь, _я_ тебе выделю ящик, если связь будет более-менее? Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 14 янв 2000 19:43:30 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: *** техническая информация о службе рассылки -------------------------------------------------------------------------------- Привет -=ORTHODOX-FONT=- Project Participants. Дамы и господа!!! Гххмм... Хорошо, только господа! На днях я сменил smtpsend, поставил классический. Раньше он у меня занимался тем, что отсылал _все_ провайдеру, а провайдер уже занимался рассылкой по серверам. Теперь я прикрутил к есерву smtpsend3.exe, который, как и положено, смотрит MX в DNS и рассылает по серверам и адресатам самостоятельно. Так вот, так как раньше этим занимался провайдер - я не знал, что доходит успешно, а что нет. Теперь все отказы валятся мне на postmaster-а, итак, докладываю: --- 1 ----------------------------------------------------------- Your message was not delivered to the following recipients: grinchuk@mvmail.lsil.com: 554 /etc/mail/aliases: line 6900: gfong@lsil.com... cannot alias non-local names: Bad file number (original address: grinchuk@lsil.com) Original-Recipient: rfc822;grinchuk@lsil.com Final-Recipient: rfc822;grinchuk@mvmail.lsil.com Action: failed Status: 5.5.0 Remote-MTA: dns;mvmail.lsil.com Diagnostic-Code: smtp;554 /etc/mail/aliases: line 6900: gfong@lsil.com... cannot alias non-local names: Bad file number От: "Lev Tikhonov" > Вскоре после того, как возникнет некий консенсус по поводу такого ИП, можно > было бы предложить почтеннейшей публике: > > 1) простой DOS-редактор, работающий непосредственно с ИП и не требующий > вообще никаких шрифтов; Имеется в виду редактор, помогающий вводить принятые комбинации символов? Тогда это, конечно, осмысленно. ............ --- 2 ----------------------------------------------------------- The message could not be delivered because of the privacy settings of the recepient The first 100 lines of the original message... Received: from bigfoot.com ([192.168.4.192]) by bftoemail30.bigfoot.com (Bigfoot Toe Mail v1.0 with message handle 000113_093142_1_bftoemail30_smtp; Thu, 13 Jan 2000 09:31:42 -0500 for lux@bigfoot.com Received: from bigfoot.com ([192.168.4.193]) by BFLITEMAIL2.bigfoot.com (LiteMail v1.3 (2)) with SMTP id 13Jan2000_BFLITEMAIL2_23139_29533367; Thu, 13 Jan 2000 09:31:41 -0500 EST Received: from des-nt.tstu.ru ([62.76.177.41]) by BFLITEMAIL3.bigfoot.com (LiteMail v1.3 (1)) with SMTP id 13Jan2000_BFLITEMAIL3_23329_88576478; Thu, 13 Jan 2000 09:31:41 -0500 EST Reply-To: "-=ORTHODOX-FONT=- Project Participants" Received: from lsi.lsil.com ([147.145.40.2]) by des-nt.tstu.ru with ESMTP id 1210 for ; Thu, 13 Jan 2000 17:25:33 +0300 X-Mail-Server: Eserv/2.7 /EPE Labs. Received: from mhbs.lsil.com ([147.145.31.100]) by lsi.lsil.com (8.9.3+Sun/8.9.1) with ESMTP id GAA00021 for ; Thu, 13 Jan 2000 06:27:01 -0800 (PST) Received: from [147.145.99.37] by mhbs.lsil.com with ESMTP for font-list@des-nt.tstu.ru; Thu, 13 Jan 2000 06:26:55 -0800 Received: from lsil.com (localhost [127.0.0.1]) by mvst10.adl (8.8.8+Sun/8.8.8) with ESMTP id GAA08924 for ; Thu, 13 Jan 2000 06:26:09 -0800 (PST) Sender: grinchuk@mvst10.adl.lsil.com Message-Id: <387DE080.807D2824@lsil.com> Date: Thu, 13 Jan 2000 06:26:08 -0800 From: Mikhail Grinchuk X-Mailer: Mozilla 4.06 [en] (X11; I; SunOS 5.7 sun4u) MIME-Version: 1.0 To: "font-list@des-nt.tstu.ru" Subject: RFC2.1: Projekt IP Content-Type: multipart/mixed; boundary="------------67ECCF203D813466AE13639D" --- 3 ----------------------------------------------------------- ERROR: Can't deliver. Fatal error. Original message follows: For: hamster@lgg.ru Reply-To: "-=ORTHODOX-FONT=- Project Participants" Received: from lsi.lsil.com ([147.145.40.2]) by des-nt.tstu.ru with ESMTP id 1210 for ; Thu, 13 Jan 2000 17:25:33 +0300 X-Mail-Server: Eserv/2.7 /EPE Labs. Received: from mhbs.lsil.com ([147.145.31.100]) by lsi.lsil.com (8.9.3+Sun/8.9.1) with ESMTP id GAA00021 for ; Thu, 13 Jan 2000 06:27:01 -0800 (PST) Received: from [147.145.99.37] by mhbs.lsil.com with ESMTP for font-list@des-nt.tstu.ru; Thu, 13 Jan 2000 06:26:55 -0800 Received: from lsil.com (localhost [127.0.0.1]) by mvst10.adl (8.8.8+Sun/8.8.8) with ESMTP id GAA08924 for ; Thu, 13 Jan 2000 06:26:09 -0800 (PST) Sender: grinchuk@mvst10.adl.lsil.com Message-Id: <387DE080.807D2824@lsil.com> Date: Thu, 13 Jan 2000 06:26:08 -0800 From: Mikhail Grinchuk X-Mailer: Mozilla 4.06 [en] (X11; I; SunOS 5.7 sun4u) MIME-Version: 1.0 To: "font-list@des-nt.tstu.ru" Subject: RFC2.1: Projekt IP Content-Type: multipart/mixed; boundary="------------67ECCF203D813466AE13639D" This is a multi-part message in MIME format. --------------67ECCF203D813466AE13639D Content-Type: text/plain; charset=koi8-r Content-Transfer-Encoding: 7bit Obeshchannyj dokument: ZIP-arhiv s odnim i tem zhe tekstom v 5 kodirovkah. M. G. --- 4 ----------------------------------------------------------- ERROR: Can't deliver. Fatal error. Original message follows: For: hamster@lgg.ru Reply-To: "-=ORTHODOX-FONT=- Project Participants" Received: from shaker.exelixis.com ([209.0.11.254]) by des-nt.tstu.ru with ESMTP id 1437 for ; Thu, 13 Jan 2000 19:56:04 +0300 X-Mail-Server: Eserv/2.7 /EPE Labs. Received: by shaker.exelixis.com; id IAA04046; Thu, 13 Jan 2000 08:51:51 -0800 (PST) Received: from dhcp-172-29-64-62.exelixis.com(172.29.64.62) by shaker.exelixis.com via smap (4.1) id xma004016; Thu, 13 Jan 00 08:51:17 -0800 Message-ID: <387E03DF.9837869B@quasar.ipa.nw.ru> Date: Thu, 13 Jan 2000 08:57:04 -0800 From: "Alexander V. Voinov" X-Mailer: Mozilla 4.7 [en] (WinNT; I) X-Accept-Language: en MIME-Version: 1.0 To: -=ORTHODOX-FONT=- Project Participants Subject: Re: =?koi8-r?Q?=F0=D2=CF=C7=D2=C1=CD=CD=CE=CF=C5=20=CF=C2=C5=D3=D0=C5=DE=C5=CE=C9=C5?= References: <387C3EC3.3E3B007A@lsil.com> <387CC533.3A5037AF@quasar.ipa.nw.ru> <02ae01bf5d52$c89d0ba0$01befea9@WINNT2KPROF> <040801bf5d7b$a463d5b0$01befea9@WINNT2KPROF> <00a301bf5d9d$468a9880$0b3822c3@smh> Content-Type: text/plain; charset=koi8-r Content-Transfer-Encoding: base64 X-MIME-Autoconverted: from 8bit to base64 by shaker.exelixis.com id IAA04046 --- 5 ----------------------------------------------------------- ERROR: Can't deliver. Fatal error. Original message follows: For: hamster@lgg.ru Reply-To: "-=ORTHODOX-FONT=- Project Participants" Received: from shaker.exelixis.com ([209.0.11.254]) by des-nt.tstu.ru with ESMTP id 1443 for ; Thu, 13 Jan 2000 20:05:07 +0300 X-Mail-Server: Eserv/2.7 /EPE Labs. Received: by shaker.exelixis.com; id JAA05158; Thu, 13 Jan 2000 09:00:51 -0800 (PST) Received: from dhcp-172-29-64-62.exelixis.com(172.29.64.62) by shaker.exelixis.com via smap (4.1) id xma005104; Thu, 13 Jan 00 08:59:55 -0800 Message-ID: <387E05E6.786674E@quasar.ipa.nw.ru> Date: Thu, 13 Jan 2000 09:05:42 -0800 From: "Alexander V. Voinov" X-Mailer: Mozilla 4.7 [en] (WinNT; I) X-Accept-Language: en MIME-Version: 1.0 To: -=ORTHODOX-FONT=- Project Participants Subject: Re: (Re) Hozjainovu, Volovichu, Tihonovu References: <387DC154.8E09C970@lsil.com> Content-Type: text/plain; charset=koi8-r Content-Transfer-Encoding: base64 X-MIME-Autoconverted: from 8bit to base64 by shaker.exelixis.com id JAA05158 --- 6 ----------------------------------------------------------- ERROR: Can't deliver. Fatal error. Original message follows: For: hamster@lgg.ru Reply-To: "-=ORTHODOX-FONT=- Project Participants" Received: from WINNT2KPROF ([193.233.223.18]) by des-nt.tstu.ru with SMTP id 1495 for ; Thu, 13 Jan 2000 20:46:13 +0300 X-Mail-Server: Eserv/2.7 /EPE Labs. Message-ID: <000001bf5dee$c37b71b0$01befea9@WINNT2KPROF> From: "Lev Tikhonov" To: "-=ORTHODOX-FONT=- Project Participants" References: <387DC154.8E09C970@lsil.com> Subject: Re: (Re) Hozjainovu, Volovichu, Tihonovu Date: Thu, 13 Jan 2000 20:48:59 +0300 MIME-Version: 1.0 Content-Type: text/plain; charset="koi8-r" Content-Transfer-Encoding: 8bit X-Priority: 3 X-MSMail-Priority: Normal X-Mailer: Microsoft Outlook Express 5.00.2919.4200 X-MimeOLE: Produced By Microsoft MimeOLE V5.00.2919.4200 ----------------------------------------------------------------- Как видно, много чего не доходит до хамстера. Его емайл вообще-то жив? Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 14 янв 2000 20:59:19 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: *** техническая информация -------------------------------------------------------------------------------- Привет -=ORTHODOX-FONT=- Project Participants. Плавно перевожу "Mail Lists service on des-NT.tstu.ru" на "Mail Lists service on Orthodox.tstu.ru" Вы никаких изменений фактически почувствовать не должны. Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 14 янв 2000 21:07:53 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: *** техническая информация -------------------------------------------------------------------------------- Привет postmaster, 14 января 2000 г., 20:59:19, ты писал: p> Плавно перевожу "Mail Lists service on des-NT.tstu.ru" на "Mail Lists p> service on Orthodox.tstu.ru" Готово! ЗРИ: Вы никаких изменений почувствовать не должны - пишите, как и писали, можно на оба адреса, со временем они сами заменятся и des-NT исчерпается. Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 14 янв 2000 22:25:52 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: *** техническая информация о службе рассылки - HAMSTERу -------------------------------------------------------------------------------- ----- Original Message ----- From: "postmaster" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Friday, January 14, 2000 7:43 PM Subject: *** техническая информация о службе рассылки > Привет -=ORTHODOX-FONT=- Project Participants. > > Дамы и господа!!! Гххмм... Хорошо, только господа! На днях я сменил > smtpsend, поставил классический. Раньше он у меня занимался тем, что > отсылал _все_ провайдеру, а провайдер уже занимался рассылкой по > серверам. Теперь я прикрутил к есерву smtpsend3.exe, который, как и > положено, смотрит MX в DNS и рассылает по серверам и адресатам > самостоятельно. Так вот, так как раньше этим занимался провайдер - я > не знал, что доходит успешно, а что нет. Теперь все отказы валятся мне > на postmaster-а, итак, докладываю: > > Как видно, много чего не доходит до хамстера. > Его емайл вообще-то жив? Я с ним связался голосом. Емайл жив, письма он видит, но читать не успевает из-за запарки. Жаль, я потерял его письмо с указанием рабочего емайла, а переспросить забыл. Дима, позвони мне или напиши, пожалуйста, с рабочего емайла, и скажи, надо ли повторить тебе те письма, которые до тебя не дошли - может быть, ты все же соберешься с духом поучаствовать.... Он сказал, что, действительно, ц-сл. занимались не столько собственно в Паратайпе, сколько их affiliate коллега некто Шевцов, с которым Дима обещал связаться. Только он сомневается, что у того есть емейл. Так что придется его приглашать ко мне и устраивать встречу online, > -------------------------------------------------------------------------- ----- > -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 14 янв 2000 22:44:42 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RFC2.1: Projekt IP - From Mikhail Grinchuk -------------------------------------------------------------------------------- ПРОЕКТ ИНВАРИАНТНОГО ПРЕДСТАВЛЕНИЯ ЦЕРКОВНОСЛАВЯНСКОГО ТЕКСТА (версия вторая, уточненная и дополненная) 0. В качестве рабочего названия (пока не придумали хорошего) в данном документе используется "инвариантное представление" или ИП. 1. ИП является текстовым файлом, содержащим символы первой части кодовых таблиц плюс 64 символа кириллицы. 2. Предварительная нормализация ИП (нормализация пробелов и алфавита) описывается цепочкой последовательных шагов 2.1-2.9. 2.1. Символы пробела и табуляции не различаются. (Заменяем все табуляции на пробелы). 2.2. Несколько подряд идущих символов пробела равноценны одному пробелу. (Убираем повторяющиеся пробелы.) 2.3. Символы конца строки (я здесь считаю, что в конце строки стоит некое абстрактное EOL, хотя "физически" это может быть и пара типа CR-LF), конца страницы и конца файла не различаются. (Заменяем их все на EOL.) 2.4. Пробелы, стоящие до или после EOL, а также в самом начале текста, игнорируются. (Убираем их.) 2.5. Знак % обозначает начало комментария. Комментарием является последовательность символов от символа % до ближайшего справа символа EOL, ВКЛЮЧАЯ их оба. (Убираем комментарии -- при этом число строк, ясное дело, уменьшается на число бывших комментариев, даже если комментарии были не во всю строку.) 2.6. Символы EOL в самом начале и в самом конце текста игнорируются. (Удаляем.) 2.7. Два, три или большее число символов EOL подряд, то есть одна или более пустых строк, не различаются и обозначают конец одного абзаца и начало другого. (Сокращаем число подряд идущих символов EOL до двух.) 2.8. Одиночный символ EOL эквивалентен пробелу. (Заменяем.) В результате этих преобразований убраны комментарии, из всех "белых" символов остались только простые пробелы и EOL, причем пробелы стоят только поодиночке и не рядом с EOL, а EOL стоят только по два, причем текст начинается и оканчивается не пробелом и не EOL. 2.9. Не различаются символы латинского и русского алфавита, имеющие одинаковое начертание: Аа В Ее К М Н Оо Рр Сс Т Уу Хх (заменяем на кириллический вариант). 3. Элементы кодировки (сперва "русская" часть, потом "латинская", а в конце -- спецзнаки; каждый раз в порядке кодов таблицы 866). А, а (аз) Б, б (буки) В, в (веди) Г, г (глаголь) Д, д (добро) Е=Э, е, э (есть: "э" -- круглое начертание) Ж, ж (живете) З, з (земля: в виде "з", см. также Z/z) И, и (иже) Й, й (иже краткое) К, к (како) КS=Кs, кs (кси) Л, л (люди) М, м (мыслете) Н, н (наш) Ъ, ъ (ер) Ы, ы (еры: начертание Ы, а не ЪI) Ь, ь (ерь) О, о (он -- узкое начертание) ОU, Оu, оu ("ук" как диграф) П, п (покой) ПS=Пs, пs (пси) Р, р (рцы) С, с (слово) Т, т (твердо) У, у (ук: гамма-образное начертание) Ф, ф (ферт) Х, х (хер) Ц, ц (цы) Ч, ч (червь) Ш, ш (ша) Щ, щ (шта: слитный знак, а диграф "шт" так и остается "шт") Э, э (см. Е/е) Ю, ю (ю) Я, я (юс малый) F, f (фита) I, i (и десятиричное, по умолчанию с двумя точками) JА=Jа, jа (я как лигатура iа) JЕ=Jе=JЭ=Jэ, jе, jэ (лигатура iе; jе и jэ различаются так же, как "е" и "э") JЬ=Jь, jь (ять: см. также R/r) JЯ=Jя, jя (юс малый йотированный) JN=Jn, jn (юс большой йотированный) N, n (юс большой) Q, q (он -- широкое начертание) R, r (ять: см. также JЬ) S, s (зело: "z с крючком" и "s зеркальное" как особые знаки не предусмотрены) U, u ("ик" -- вторая часть диграфа оу, а также числовой знак для 400) V, v (ижица, по умолчанию без надстрочных знаков) W, w (омега: "от" рассматривается как "омега с т-титлом", а "омега красивая" -- как омега с придыханием и облегченным ударением) Z, z (земля: в виде "z", см. также З/з) ! (восклицательный знак) " (два штриха для ижицы) # (знак для тысяч) % (начало комментария, см. пункт 2.5) ' (острое ударение) ( (скобка открывающая) ) (скобка закрывающая) * (8-конечная звездочка) + (крест) , (запятая) - (дефис, он же знак переноса) . (точка) 0 ... 9 (арабские цифры) : (двоеточие) ; ("удивительная") < (начало выделения киноварью) = (придыхание) =' или '= (придыхание + острое ударение) =^ или ^= (придыхание + облегченное ударение) =` или `= (придыхание + тяжелое ударение) > (конец выделения киноварью) ? (обозначение для неясного символа) @ (кавыка) [ (скобка квадратная открывающая) \\ ("пустой акцент" для ситуаций к\\s или п\\s, когда не надо "склеивать" в кси/пси; кроме того, i\\ дает "i без точек") \а ... \я (выносные буквы и буквенные титла -- вариант 1) \а/ ... \я/ (выносные буквы и буквенные титла -- вариант 2) ] (скобка квадратная закрывающая) ^ (облегченное ударение) ` (тяжелое ударение) { (начало текста сноски или примечания) | (паерок) } (конец текста сноски или примечания) ~ (титло простое) 4. Спорные места и вопросы 1) наличие Зз и Zz, но только одно Ss 2) отсутствие густого придыхания 3) Qq как широкое "о" 4) Nn как юс большой 5) ять: R/r, или JЬ=Jь/jь, или оба варианта как равноправные (почему бы и нет?), или что-нибудь еще. (Мне оба мало нравятся, но JЬ вроде бы все же несколько лучше.) 6) что делать с "невозможными" комбинациями? В частности: 6.0) символ или комбинация символов, не предусмотренные в этом списке 6.1) акцент не сразу после буквы 6.2) ударения/придыхания не над гласными 6.3) " не после ижицы 6.4) =^ не после омеги 6.5) "нестандартная" выносная буква (в том числе \т не после омеги) 6.6) непарные {...} или <...> 6.7) пробел или EOL с внутренней стороны {...} или <...> 7) паерок: "|" или "\ъ"? 8) отсутствие малой точки 9) что лучше для выносных букв: "\г" или "\г/"? Первое короче, но второе "обобщается" на многобуквенный случай (в частности, "\оu/" или "\jа/") 10) новая идея: иметь графические синонимы Е и Э как формальные прописные соответствия "угловатого" и "круглого" начертаний буквы "есть" (это даст возможность автоматических превращений lowercase <-> uppercase) 5. Прочие примечания 1) надстрочные знаки и титла ставятся над предыдущей буквой 2) из вариантных начертаний, не имеющих орфографического смысла, поддерживаются только Зз/Zz 3) не различаются точка внизу строки и точка в середине строки 4) в сочетаниях .:. .:- .:.- .: :.- подразумеваются точка и дефис, располагающиеся по высоте на уровне середины двоеточия 5) кавычек нет 6) тьмы/легионы/враны/колоды и проч. отсутствуют 7) Нужно ли различать дефис (знак переноса) и тире? 8) текст сноски/пояснения любого рода ставится непосредственно после поясняемого места (в фигурных скобках) 9) предлагаемая система удаления комментариев (ровно та же, что в ТеХе) имеет такой неожиданный, но объяснимый эффект: фрагмент Алек%%%% комментарий!!! sандръ (даже с пробелами в начале строк) даст слово "Александръ" с буквой кси. Но если перед первым знаком % оставить пробел: Алек %%%% комментарий!!! sандръ то получится "Алек sандръ" -- мало того, что без "кси", но и с пробелом посреди. 6. Незадействованные ASCII-символы $ & (можно использовать как базовый префикс для ввода нестандартных символов: например, &{лг} или &лг& может обозначать "л с крючком", а-ля HTML) / (можно использовать как символ, обозначающий конец строки в оригинальном документе; сочетание // может обозначать конец страницы или листа) _ (можно использовать как "неигнорируемый" пробел; а также для того, чтобы поставить акцент над пустым местом -- в учебнике ц.-сл. языка, например) BackSpace (код 127: можно просто игнорировать или рассматривать как еще один синоним для пробела; то же относится и к символам с кодами 0...31, отличным от EOL, EOF, TAB, FF) b Dd Gg (дервь?) h (густое придыхание?) k Ll m P. S. А вот под малую точку никакого разумного символа не осталось... Неужто "$"? ;-) Мнw'га и=мjь'хъ писа'ти: мнw'жайшая написа'хъ. Оu=тружде'нъ sелw`, и= воздрема'ти хощу`. А=ми'нь. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 00:23:14 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk -------------------------------------------------------------------------------- Некие замечания. 1) Где знаки для шестеричных святых? В ирмологионе они есть (правый и левый), и имхо надо иметь - вдруг Типикон издавать вздумаем? Или, что более вероятно, календарь. (Кстати, я тут Волкову предложил уже в его календаре типиконские знаки ставить, а он сумлевается о рангах. Я такой алгоритм предлагаю: > А вот это тяжелее. В каком смысле - не ясно, какие помещать. Те, что в pепpинте > типикона, как бы устаpели, новые как бы не пpоpаботаны - один так считает, > дpугой иначе. Вот и не ясно, что pазмещать... > Что за чертой - забыть кроме совсем уж явных типа Сергия. Новых - вообще никаких не писать. Т.е. скорее недодать - тогда кто-то за кого-то обидится, возмутится - и начнем думать. А если лишнего дать, то никто не возмутится и мы оплошности не заметим. Так? 2) Сдается мне, что ударение называется "облеченное", а не "облеГченное". 3) Перенос, тире и дефис. Насколько я себе представляю, перенос и дефис в старых текстах (не постмодернистских начала века :-) находятся внизу строки, а не в середине. Я правда когда верстал текст Введения, сделал посреди, но токмо из-за ворды, которая дурында не понимает, что по такому знаку _ тоже переносить можно. :-) А хорошо бы все же научить как-то. 4) Точка посреди строки - может все же стоит сделать? Вообще хорошо бы этот стандарт работал и на древнерусские тексты - там по моему не так много букв и надо добавить-то. Чтоб уж стандарт, так уж стандарт. Это вообще говоря вопрос - насколько славянский по Смотрицкому ушел от древнерусского: два стандарта нужны или один? ИМ скромнейшее О - один. Вы мне еще скажите - когда автор нашего конвертера досюда доберется, ему можно будет все им пропущенное скопом прислать? Архангельский Г.А. СПб ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 04:27:02 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk -------------------------------------------------------------------------------- Вообще хорошо бы этот > стандарт работал и на древнерусские тексты - там по моему не так много букв > и надо добавить-то. Чтоб уж стандарт, так уж стандарт. Это вообще говоря > вопрос - насколько славянский по Смотрицкому ушел от древнерусского: два > стандарта нужны или один? ИМ скромнейшее О - один. Это тема для серьезного разговора. Дело ведь не просто в символах, а в их графике. Не принято набирать старославянские тексты шрифтами для церковнославянского языка, хотя теоретически первый представляет собой подмножество второго. Я не могу с ходу сообразить, какие особенные буквы могут быть в древнерусских текстах. Но даже если таких букв нет, нельзя использовать церковнославянский шрифт для древнерусских текстов. Наконец, если уж мы возьмемся за древнерусский, то придется и все славянские языки учитывать (из тех, что кириллицу используют) И, между прочим, не только славянские. А здесь нам прямая дорога обратно к юникодовой кириллической странице. Это, господа, еще не факт, что нас не развернут в этом направлении, сказав, что ц.славянский не дорос до того, чтобы для него заводили отдельную страницу. Я все ищу определение термина script для стандарта Юникода, но не могу ничего обрести. Но вот такую фразу я выудил - A script is any system of related characters. На мой взгляд, важным доводом в пользу отдельного скрипта для ц.-славянского является обширная и во многом уникальная система диакритиков. > Вы мне еще скажите - когда автор нашего конвертера досюда доберется, ему > можно будет все им пропущенное скопом прислать? И я о том давно прошу. Надо солидный сайт заиметь. Чтобы всяк желающий мог поставить на свою страницу кнопочку. Алексей Гришин. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 06:40:34 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: О древнерусском алфавите -------------------------------------------------------------------------------- Хотел назвать письмо "О древнерусском и об уникоде", но хочу предложить писать, может быть, больше писем, но достаточно атомарных, чтобы по названию можно было представить себе содержание письма. > Вообще хорошо бы этот > > стандарт работал и на древнерусские тексты - там по моему не так много > букв > > и надо добавить-то. Чтоб уж стандарт, так уж стандарт. Это вообще говоря > > вопрос - насколько славянский по Смотрицкому ушел от древнерусского: два > > стандарта нужны или один? ИМ скромнейшее О - один. > > Это тема для серьезного разговора. Дело ведь не просто в символах, а в их > графике. Не принято набирать старославянские тексты шрифтами для > церковнославянского языка, хотя теоретически первый представляет собой Кстати, а не является ли это изобретением советских лихачевских времен, когда стремились оторвать древнерусскую культуру от Церкви? Как дело обстояло до революции? Кто видел тогдашние издания древнерусских текстов? Может, если это все новоизобретенное в советские времена - не стесняться и насаждать единую гарнитуру для ЦСл и Дрр? Левъ ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 06:40:43 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Unicode - нужно ли стандартизировать? -------------------------------------------------------------------------------- > подмножество второго. Я не могу с ходу сообразить, какие особенные буквы > могут быть в древнерусских текстах. Но даже если таких букв нет, нельзя > использовать церковнославянский шрифт для древнерусских текстов. Наконец, > если уж мы возьмемся за древнерусский, то придется и все славянские языки > учитывать (из тех, что кириллицу используют) И, между прочим, не только > славянские. А здесь нам прямая дорога обратно к юникодовой кириллической > странице. Это, господа, еще не факт, что нас не развернут в этом > направлении, сказав, что ц.славянский не дорос до того, чтобы для него > заводили отдельную страницу. Дело в том, что мы прекрасно можем создать свою личную страницу - ну хоть в пространстве, отведенном линейному письму Б, понаделать для нее шрифтов или даже добавить скрипт с соотв. символами в Times New Roman и спокойно ею пользоваться. Может быть, не стоит и особенно начинать бороться за такой стандарт, а сразу начинать с создания шрифтов. А если когда-нибудь стандарт будет принят, нетрудно будет конвертировать (однозначно!) и шрифты, и набранные тексты. Вот уж в чем я уверен абсолютно - что не существует такой публикации, где понадобились бы одновременно древнекритский и церковнославянский алфавиты. > Я все ищу определение термина script для стандарта Юникода, но не могу > ничего обрести. Но вот такую фразу я выудил - A script is any system of > related characters. На мой взгляд, важным доводом в пользу отдельного > скрипта для ц.-славянского является обширная и во многом уникальная система > диакритиков. > > > Вы мне еще скажите - когда автор нашего конвертера досюда доберется, ему > > можно будет все им пропущенное скопом прислать? > > И я о том давно прошу. Надо солидный сайт заиметь. Чтобы всяк желающий мог > поставить на свою страницу кнопочку. Нужно искать соответственный серверный софт для сайта, чтобы не линейно сваливал все в кучу, а группировал обсуждения по тредам. В вебмастерстве я лично - полный ламер. А пока что - у меня все письма из этого списка складываются в отдельную папочку, так что я могу их переслать желающим в любой момент. 2Волков: А не позволяет ли eserv копить digest списка? Я вот знаю списки с накопительными двойниками, рассылающимися пачками по сотне писем, или письма, скажем, за неделю. Левъ ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 07:15:53 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re RFC3 и 5: Text Leveling & Classifying - М. Гринчуку -------------------------------------------------------------------------------- I. >> 2) этап инвариантного хранения текста, когда он хранится как >>последовательность символов или глифов и может быть автоматически >>преобразован для любой системы верстки. >> >> 2-basicHIP, 2-Unicode, 2-Word-Irmologion-Purified, ..... > >Что такое Unicode как система хранения текста? Существуют ли файлы Unicod'а подобно тому, как существуют DOC-файлы? Существуют, и при просмотре файлы, содержащие только первые из 256 символов Unicode видны как "разреженные" Null-ами. Например, Notepad в NT правильно интерпретирует такие файлы и умеет не показывать Null-ы в указаном случае. Также и сохранять он умеет - на выбор - в Unicode или в ANSI, причем расширение по умолчанию одно - txt :-( Помимо - и параллельно - HIP мы здесь собираемся заняться также стандартизацией Уникодного представления ЦСл и созданием соответствующих фонтов. II. >> [Относительно последнего - это то, чем я грозился: такое представление в >> Ворде, в котором будут визуализированы все Мишины комментарии, имеющие >> отношение к форматированию. Вероятно, ТеХовцы могут поступить >> аналогично.] >Не понял. Я это все представлял себе так: допустим, есть у нас >Вордовский файл. В нем зафиксированы разные параметры: размер Миша, я понимаю Вашу идею, не надо было столько писать. Мы просто с разных сторон смотрим на одну и ту же проблему. И мне кажется, что, приступив к ее решению с моей стороны, можно, пусть не так скоро, но получить гораздо более гибкую и расширяемую систему. Например, Вы отказываетесь специфицировать язык комментариев, оставляя эту проблему разработчикам "продвинутых" конвертеров. Это разумно, но в то же время Вы предлагаете совершенно определенный и не очень-то человечный синтаксис для этих комментариев. И предлагаете этот синтаксис включить в _стандарт_. На самом этот синтаксис совершенно чужероден Вордовской идеологии, которая вообще не мыслит строками. И если еще простые EOL можно стерпеть, интерпретируя их как пробелы единственной глобальной заменой (кстати, в таком случае в HIP надо различать истинный абзац от простого EOL, хотя бы путем маркирования абзаца путем удвоения EOL, как это сделано в Вентуре - это чрезвычайно важно!!!), то вот с комментариями чужеродность просто зашкаливает, на взгляд любого виндузятника. Насколько милы Вашему глазу все эти игры с к+с = кси, настолько они удивительны для любого не-ТеХовца, а для меня, для Хозяинова и тем более для подавляющей массы людей, оторвавшихся от Лексикона, но не знающих ничего, кроме Ворда - просто дики. Потому я и предлагаю все же HIP с комментариями считать расширением стандартного ИП, а проблему взаимной конвертации разных расширенных ИП считать самостоятельной частью проекта. Можно также стандартизировать и ваше расширение. Тогда станет возможна система, не учитывающая этот второй стандарт, но полностью соответствующая стандарту basicHIP. Вот такой-то подход - с маркировкой софта по стандартам, которым он соответствует - я и считаю более перспективным и гибким, чем Ваш подход, классифицирующий софт на "базовый" и "умный". Хотя бы потому, что мой подход более точен: вместо описательных характеристик употребляются точные названия стандартов. Хотя, для того, чтобы мой подход использовать - нужно, естественно, потрудиться над стандартизацией, а не оставлять проблему на потом и на усмотрение несозданных еще "умных" конвертеров. А представьте себе разные версии языка комментариев. Как вы будете маркировать софт - "полуумный", "сверхумный"? Не лучше ли иметь возможность впоследствии описать эти языки и присвоить соответствующую квалификацию тем текстам, где они употребляются? И чтобы идеология этого описания была не вновь изобретенной для вновь возникшей нужды, а той же самой, которую мы используем для создания базового стандарта... III. >> 3) текст, уже адаптированный для конкретной издательской системы с >> утратой возможности автоматической обратной конвертации. >Тоже можно уточнять, насколько эта конвертация утрачена. Из Word'а или ТеХа >исходный текст почти всегда извлекается (но он может потребовать некоторой >правки, если, скажем, вручную проставлены переносы или двухколоночный >набор записан "по строками"). Вот все эти варианты впоследствии желательно было бы классифицировать, подобно тому, как мы это сделали с наборами группы 1). Смысл нашей классификации - в упрощении повторного использования текстов, в том числе и в неродных им издательских средах. Понятно, что ради небольших массивов текста, порядка одной страницы, нет смысла стараться: проще будет их перенабрать. Но если система кем-то когда-то активно использовалась, и существует конечный вычитанный и выверенный издательский продукт - грешно было бы не попытаться (полу)автоматически сконвертировать такой текст в ИП. > В других случаях (DVI, PostScript, в пределе -- >какой-нибудь графический формат) текст как таковой может полностью >исчезнуть. Тогда это просто дисквалифицирует такой текст для нашей системы, ибо его просто невозможно использовать (ну разве только Файнридер научить, но это неизвестно, сподобится ли кто и когда). IV. >> Разновидности: >> 3-Word-Irmologion, 3-ТеХ-Slepuhin, 3-Ventura-Lavra >> Все тексты, кроме того, маркируются платформой (или в бывшей Мишиной >> терминологии "представлением"), например: >> 1а/WinText, 1a/DosText, 1a/TeX, 1a/Word, 1a/ChiWriter, 1a/Ventura и т. д. >> 2-basicHIP/DosText, 2-basicHIP/Word... >> 2-Unicode/WinText, 2-Unicode/Word.... > > Мильон замечаний: > > 1) Чем разница между Word-Irmologion и Word-Izhica отличается от разницы > между /WinText и /DosText? И там, и там -- дело, по большому счету, в > кодировке. Тем, что Word-Izhica, вообще говоря, относится к категории 1), а не 3), в связи с отсутствием там диакритики и некоторых букв. А если Вы имеете в виду какую-то "расширенную" ижицу и соответствующий полноценный вид набора - то, если его голый текст, им порождаемый, совпадает с Word-Irmologion - можно не считать его отдельно, а если отличается - следует добавить Word-Izhica(Plus) Насчет же /WinText и /DosText - я, видимо, погорячился. Смысла их различать, конечно, нет. В то же время следует добавить для текстовых представлений отдельную характеристику - "кодировка", отличную от "платформы". > 2) TeX бывает под разную кодировку кириллицы (та же система Слепухина > настраивается под разные кодировки). И бывает разный TeX (просто TeX, LaTeX, > AMS-TeX и проч.) Про кодировки см. выше, а разные ТеХи - добавляем. > 3) ChiWriter может использовать разные шрифты или разные кодировки (в > данном случае это одно и то же). Существуют разные версии CW -- с разным > форматом файлов. А нужно оно нам? Много ли набрано в CW и еще не конвертировано куда-нибудь еще или не перенабрано вновь? > 4) Word'ов тоже прорва (под DOS, под Win, под Mac, и в каждом случае > несколько разных версий) Вот Ворды-то как раз абсолютно взаимопонимаемы (сверху вниз, естественно), по крайней мере в рамках Wintel, с Маками были какие-то проблемы, но я думаю, что и их можно разрешить, оставаясь в рамках Ворда. Разумеется, не имеет никакого смысла создавать расширенное ИП для Досовского Ворда, потому что вряд ли в нем существует много сверстаннных текстов. В тоже время все, набранное в нем, можно забрать в 6-й Виндовый Ворд, а оттуда - в любой более старший. > 5) Куда отнести DOC-файл, если в нем используется Unicode-шрифт? Это тоже проблема внутривордовская. Вордовики берутся выдать вам любой doc-текст в любом из форматов, в которые умеет сохранять Ворд, хотя я признаю, что неспециалист имеете шанс наткнуться на проблемы при открытии или сохранении таких файлов. > И так далее. > > Если уж классифицировать, то в дополнение к "точности" записи самого текста можно было бы различать такое: > -- тип файла: .HIP, .TXT, .TEX, .DOC, .RTF, .CHI, ... (это не обязательно расширение) .... в т. ч. (Unicode)TXT? > -- тип или версия программ, умеющих обрабатывать данный файл (например, версия/платформа Word'а или уточнение, какой именно TeX имеется в виду) Исходя из сказанного мною несколько выше, для Ворда это свойство несущественно. 6-я версия более универсальна, а 97 и выше - более издательская система, так как только теперь верстка не зависит от драйвера принтера. Хотя для справки, конечно, желательно было бы приводить и этот параметр. Непонятно, можете ли Вы сказать про ТеХ то же, что я сказал выше про Ворд? Любой ли ТеХнарь может без особых проблем сконвертировать слав. набор между любыми версиями ТеХ, или этой премудрости даже специалистам-ТеХовцам следует специально учиться и запасаться спец. софтом или настройками? > -- конкретная кодировка (имеет смысл для .HIP, .TXT и .TEX) > -- набор шрифтов (не имеет смысла для .HIP и .TXT) > -- если в принципе данный формат конвертируется в HIP, то указание на возможность конвертации к HIP данного конкретного файла --------------------------------------------------------------------------- - --- -=ORTHODOX-FONT=- Project // Mail Lists service on des-NT.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 07:26:06 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RFC5: Text Classifying -------------------------------------------------------------------------------- Принципы технологической классификации ЦСл текстов -- тип файла: .HIP, .TXT, .TEX, .DOC, .RTF, .CHI, ... (это не обязательно расширение) -- тип или версия программ, умеющих обрабатывать данный файл (например, версия/платформа Word'а или уточнение, какой именно TeX имеется в виду) -- конкретная кодировка (имеет смысл для .HIP, .TXT и .TEX) -- набор шрифтов (не имеет смысла для .HIP и .TXT) -- если в принципе данный формат конвертируется в HIP, то указание на возможность конвертации к HIP данного конкретного файла (с) М. Гринчук ------------------------------------------------------------------------- Примечание: последний абзац подлежит расшифровке, а предмет его - отдельному рассмотрению, так как эта характеристика относится, очевидно, к иному предмету (к файлу, а не к формату), сравнительно со остальными четырьмя характеристиками. - Л. Тихонов ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 07:36:00 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RFC3.1: Text Leveling -------------------------------------------------------------------------------- "Уровни текста" или Принципы формальной классификации церковнославянских текстов. Первоначально для обозначения уровней текста будут использоваться простая цифро-буквенная нумерация, впоследствии, вероятно, для их представления придется перейти к ориентированному графу, где стрелки будут обозначать возможность автоматической конвертации текста в указанном направлении. 1) этап неточного "русского" набора. Все тексты этого уровня характеризуются тремя числами (координаты а, б, в). Тексты, попадающие по этой системе в начало координат (а0, б0, в0*), относятся ко второй категории, тексты же, имеющие хотя бы одну отличную от нуля координату - к первой. а - уровень воспроизведения диакритики: а0) надстрочные знаки воспроизведены а1) надстрочные знаки и титла отсутствуют а2) ударения/придыхания отсутствуют, титла раскрыты б - уровень славянизации набора: б0) правильно используется ц.-сл. алфавит б1) используется славянский алфавит, но не полностью различаются варианты начертания букв "е", "о", "у", "я" б2) используется дореформенный гражданский алфавит (36 или 37 букв) б3) используется современный алфавит, но упрощения сводятся к замене упраздненных букв современными эквивалентами б4) используется современный алфавит, правописание приближено к нынешней норме (нет ъ, -ого вместо -аго и проч.) в - воспроизведение чисел: в01) числа записаны кириллицей в02) числа записаны арабскими цифрами в1) числа (номера глав и стихов) отсутствуют При этом "точным набором" можно считать комбинации а0-б0-в01 и а0-б0-в02, а все остальные - "неточный набор". 2) этап инвариантного хранения текста, когда он хранится как последовательность символов или глифов и может быть автоматически преобразован для любой системы верстки. 2-basicHIP, 2-Unicode, 2-Word-Irmologion-Purified, ..... 2plus) - "расширенный инвариант" или "инвариант с форматированием". Разновидности: 2plus-HIP, 2plus-HIP-Word.... и т. п %%(Пока, до завершения дискуссии, оставлено как в версии 3.0). 3) текст, уже адаптированный для конкретной издательской системы с утратой возможности автоматической обратной конвертации. Разновидности: 3-Word-Irmologion, 3-Word-Izhitsa(Plus), 3-ТеХ-Slepuhin, 3-Ventura-Lavra, 3-ТеХ-LaTeX, 3-ТеХ-просто и т. д. Соответственно, элементы ориентированного графа (см. RFC4) пока что таковы: 2plus -> 2 2 -> 3 2plus -> 3 2 -> 1 2 -> 1* Внутри же вариантов 1) от любого элемента стрелки направлены ко всем тем элементам, ни одна из трех координат которых (а, б, в) не ниже, чем соотв. координата исходного элемента. Л. Тихонов, М. Гринчук ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 07:47:28 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Ответ Глебу Архангельскому -------------------------------------------------------------------------------- > Некие замечания. > 1) Где знаки для шестеричных святых? В ирмологионе они есть (правый и > левый), и имхо надо иметь - вдруг Типикон издавать вздумаем? Или, что более > вероятно, календарь. Думаю, что это проблема ЦСл шрифта и конкретной издательской системы. Вряд ли имеет смысл пытаться хранить эти знаки в нашем стандартном формате: их всегда можно выставить при верстке. Кстати, они даже не обязаны принадлежать шрифту, а могут вставляться как рисунки. > (Кстати, я тут Волкову предложил уже в его календаре типиконские знаки > ставить, а он сумлевается о рангах. Я такой алгоритм предлагаю: > > > А вот это тяжелее. В каком смысле - не ясно, какие помещать. Те, что в > pепpинте > > типикона, как бы устаpели, новые как бы не пpоpаботаны - один так > считает, > > дpугой иначе. Вот и не ясно, что pазмещать... > > > Что за чертой - забыть кроме совсем уж явных типа Сергия. Новых - вообще > никаких не писать. Т.е. скорее недодать - тогда кто-то за кого-то обидится, > возмутится - и начнем думать. А если лишнего дать, то никто не возмутится и > мы оплошности не заметим. Так? Глеб, здесь это офтопик пока что. Обсуждай это в литургике. Со временем, может быть мы и до этого доберемся, но пока.... > 2) Сдается мне, что ударение называется "облеченное", а не "облеГченное". Правильно тебе сдается. ;-) > 3) Перенос, тире и дефис. Насколько я себе представляю, перенос и дефис в > старых текстах (не постмодернистских начала века :-) находятся внизу > строки, а не в середине. Я правда когда верстал текст Введения, сделал > посреди, но токмо из-за ворды, которая дурында не понимает, что по такому > знаку _ тоже переносить можно. :-) А хорошо бы все же научить как-то. А разрыв строки ты не догадался использовать? Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 07:56:28 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC1.1: GLOSSARY -------------------------------------------------------------------------------- LT> Вероятно, что текст в некоторой LT> стадии готовности просто обидно будет конвертировать в HIP. Скорее не текст, а конкрентую верстку. Если же текст может нечто потерять при конвертации в HIP -- надо совершенствовать HIP. Не пора ли подумать, как терминологически различать 1) текст как последовательность символов/глифов и 2) текст как технологическую издательскую единицу: файл в некотором формате, содержимое которого содержательно является ЦСл текстом. Люди, предлагайте термины: я теряюсь, истощил фантазию. Разве что для 2) - использовать "документ" или "ЦС-документ"? Самое главное, сразу начать использовать точную терминологию, тогда и запощенные мною сегодня RFC надо будет переписать с использованием нового термина. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 08:04:53 От: Mikhail Grinchuk Кому: "font-list@des-nt.tstu.ru" Тема: Re:Programmnoe obespechenie -------------------------------------------------------------------------------- (Otvet na pis'mo L. Tihonova, kotoroje do menja "zhiv'jom" ne dobralos', no najdeno v arhive) > > 1) prostoj DOS-redaktor, rabotajushchij neposredstvenno s IP i ne trebujushchij > > voobshche nikakikh shriftov; > > Imejetsja v vidu redaktor, pomogajushchij vvodit' prinjatyje kombinacii simvolov? > Togda eto, konechno, osmyslenno. Da. V celom eto tekstovyj redaktor, v kotorom "prostejshije" komandy -- ne tol'ko postavit' simvol, no i postavit/ubrat'/smenit' diakritiku nad predydushchim simvolom. Mozhno sdelat' tak, chtoby pri etom "nevozmozhnyje" sochetanija (tipa udarenija nad soglasnoj) prosto v principe nel'zja bylo vvesti. Korvertory iz/v RTF u menja vpolne uspeshno rabotajut s fajlami, vylozhennymi v "Elisavete". Nado ih tol'ko slegka peredelat' pod novyj HIP (sperva ja ispol'zoval nechto boleje pohozheje na zapis' dlja TeXa). > > 5) nekie programmy vosstanovlenija otsutstvujushchej diakritiki i chastichnoj > > formal'noj proverki teksta. > > Vot eto nuzhno raspisat' podrobno. Naprimer: 1) proverka nalichija jera i pajerka v konce slov 2) proverka napisanija "izhe" i "i" 3) proverka "o uzkoje" / "o shirokoje" 4) proverka ia/jus 5) vstavka pridyhanij, jesli slovo nachinajetsja s glasnoj 6) proverka zelo/zemlja 7) vstavka titl, prostyh i bukvennyh V celom pytajus' dejstvovat' tak: beru "pravil'nyj" tekst, zatem "uproshchaju" jego (naprimer, ubiraju vse titla). Potom pytajus' podobrat' nabor formal'nyh zamen, kotoryj by ih obratno vstavil. (Kogda-to davnym-davno ja proboval takim metodom sdelat' perevod iz novoj orfografii v staruju. V principe ideja rabotajet, chislo oshibok udalos' dovesti do 1-2 na stranicu. Dal'she delo upjorlos' v otsutstvije dostatochnogo kolichestva "obuchajushchego materiala" -- tekstov, nabrannyh v staroj orfografii.) > Jesli dejstvitel'no gotovo, to, mozhet byt', eto i vzjat' za osnovu? A esli na > samom dele u Vas lish' chernovye nabroski, to mozhno rasparallelit' rabotu Situacija gde-to posredine. Poprobuju za eti vyhodnyje vsjo peredelat' pod novyj HIP (prezhde vsego konvertory HIP <-> RTF-Irmologion). ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 08:30:57 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC4 - Ответ М. Гринчуку -------------------------------------------------------------------------------- LT> Нетривиальные программы делятся на ассистирующие, тэгогенерирующие и LT> программы утилизации тэгов. Ассистирующие программы используются в LT> интерактивном режиме, предлагая оператору выбор между альтернативнами LT> заменами. Тэгогенерирующие программы используются в пакетном режиме, LT> вставляя в текст "альтернативные тэги", описывающие возможные в каждом LT> конкретном месте замены. Программы утилизации тэгов - это интерактивные LT> утилиты, позволяющие редактировать исключительно имеющиеся в тексте LT> "альтернативные тэги" и выбирать желательный вариант заменяя им исходный LT> "альтернативный тег". LT> LT> Несложно заметить, что после утверждения стандарта "альтенативных тэгов" LT> понадобится одна и только программа утилизации тэгов (для каждой платформы, LT> впоследствии это не оговаривается). Правильно ли я понимаю, что в принципе вместо всего этого хозяйства достаточно иметь один редактор с хорошей проверкой правописания и разумными подсказками? ---------------------------------------------------------------------------- ------- Это если 1) Вы собираетесь работать в одиночку, подобно Гераклу, целиком конвертируя текст за сеанс работы, 2) если Вы намерены править все за один проход и 3) если Вы благодушно уверены в том, что такой стиль работы устроит всех остальных На самом деле я попытался применить к этой задаче объектную декомпозицию и, по-моему, мне это удалось. Во-первых, "альтернативные тэги" необходимы для того, чтобы избежать смешанных состояний текста, когда начало уже приближено к HIP, а конец остается таким, как был. На текст напускается тэгогенератор, после чего его уже можно считать текстом следующего уровня. По крайней мере, неформально - до тех пор, пока его не просмотрят и не удалят теги с помощью утилизатора тегов. Во-вторых, этот Ваш "один редактор" естественным образом разбивается на компоненты, вполне осмысленные сами по себе, которые в других сочетаниях используются для конструирования осмысленных программ, решающих задачу по частям. Мало того, эти компоненты вполне могут быть разноплатформенными, написанными разными людьми и ничего не подозревать о внутреннем устройстве друг дружки. В третих, таким образом достигается дополнительная технологическая гибкость, позволяющая предявлять меньше требований к персоналу: одно дело - расставить (или завизировать автоматически сгенерированные) ударения - это можно поручить десятикласснику, другое дело - варианты е - тут уже нужна студентка-филологиня, третье дело - яти, где желателен специалист. С другой стороны, вся эта теплая компания сотрудников перестает быть привязанной к одной платформе, может быть, им глубоко чуждой и "почучхэйной", и появляется возможность без особого напряга для особо тупой, допустим, филологини, долженствующей решить конкретную мелкую задачу, сварганить интерфейс, основанный на двух-трех кнопках. Собственно, я своим предложением даже и не вношу никакой сложности, помимо необходимости определить "альтернативные тэги", которая и так возникает по условиям задачи (см. "Во-первых"). Во всех остальных отношениях - это корретное разбиение задачи на сумму менее сложных подзадач. Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 08:41:55 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk -------------------------------------------------------------------------------- AGA wrote: > Nekije zamechanija. > 1) Gde znaki dlja shesterichnyh svjatyh? V irmologione oni jest' Prosvetite: chto eto takoje? (Ne prishljote li kusochek teksta s etimi znakami? -- DOC/Word6, DOC/Word97, ili sootvetstvujushchij RTF) > 2) Sdajotsja mne, chto udarenije nazyvajetsja "oblechennoje", a ne > "obleGchennoje". Doma proverju. (Jesli i v samom dele tak -- ispravim.) > 3) (...) Naskol'ko ja sebe predstavljaju, perenos i defis v staryh tekstah (...) > > nahodjatsja vnizu stroki, a ne v seredine. Eto vopros k razrabotchikam shrifta. V HIP ja by ostavil "-". > 4) Tochka posredi stroki - mozhet vsjo zhe stoit sdelat'? a) Jesli nuzhno, chtoby VSE tochki byli v seredine stroki -- eto snova vopros k shriftu. Ili mozhno imet' opciju v konvertore: kak translirovat' "." iz HIP. b) jesli odnovremenno nuzhny oba vida tochek -- pridjotsja dobavit'. > Voobshche horosho by etot standart rabotal i na drevnerusskije teksty - > tam po-mojemu ne tak mnogo bukv i nado dobavit'-to. V polnom ob'jome trudno. Pochti u kazhdoj bukvy jest' neskol'ko variabtov nachertanija (a filologi inogda ljubjat vsjo eto tochno vosproizvodit'). Ligatury, plavno perehodjashchije v vjaz', opjat' zhe. I chto delat', jesli v ocherednoj berestjanoj gramote kakaja-nibud' novaja zagogulina obnaruzhitsja? Davajte uzh (po krajnej mere sperva) sdelajem horoshuju sistemu dlja "formalizovannogo" jazyka -- c.-sl. po pechatnym knigam 19 veka. > Kogda avtor nashego konvertera dosjuda doberjotsja, jemu mozhno > budet vsjo im propushchennoje skopom prislat'? Konechno. M. G. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 10:00:59 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RFC4.1: Validators & Vertical software -------------------------------------------------------------------------------- Дополнения к документу выделены восклицательными знаками. ------------------------------------------------------------------------- !!! > Программы и программные компоненты, занимающиеся проверкой текста на соответствие некоторому уровню, называются "валидаторами". < !!! Софт, занимающийся переводом текста между уровнями, именуется "вертикальным". "Вертикальный софт" делится на две группы. Программы первой группы называются "тривиальными" - они реализуют автоматическое преобразование текста в напрвлении, задаваемом ориентированным графом, определенным в RFC 3. Программы второй группы - "нетривиальные" - создаются для обеспечения прочих преобразований между уровнями текста. Нетривиальные программы делятся на ассистирующие, тэгогенерирующие и программы утилизации тэгов. "Ассистирующие программы" используются в интерактивном режиме, предлагая оператору выбор между альтернативнами заменами. "Тэгогенерирующие программы" используются в пакетном режиме, вставляя в текст "альтернативные тэги", описывающие возможные в каждом конкретном месте замены. Программы утилизации тэгов - это интерактивные утилиты, позволяющие редактировать исключительно имеющиеся в тексте "альтернативные тэги" и выбирать желательный вариант заменяя им исходный "альтернативный тег". Несложно заметить, что после утверждения стандарта "альтенативных тэгов" понадобится одна и только программа утилизации тэгов (для каждой платформы, впоследствии это не оговаривается). Программы других типов должны маркироваться начальным и конечным уровнями текста. Любая ассистирующая программа состоит из двух компонент - интерфейсной компоненты, общей с программой утилизации тэгов и логической компоненты, общей с соответствующей программой-тэгогенератором !!! > Эта логическая компонента называется "грамматическим анализатором перехода" (ГАП) между определенными уровнями текста. Каждый ГАП четко привязан к начальному и конечному уровням текста, переход между которыми он должен помогать осуществлять. Если этот ГАП достаточно интеллектуален, чтобы ранжировать предлагаемые альтернативы замен по их вероятности, то такая компонента называется "суггестивной" ("суггестивный ГАП"), а построенные на ее основе тэгогенераторы и ассистенты назваются "суггестивными тэгогенераторами" и "суггестивными ассистентами" соответственно. < !!! К написанию интерфейсной части - утилизатора тэгов - можно приступать сразу же после того, как мы придем к соглашению относительно формата этих "альтернативных тэгов". Алгоритмы же тэгогенерирующих программ подлежат созданию и длительному совершенствованию после того, как мы разработаем достаточно подробную систему уровней текста. Некоторые из них должны обладать устойчивостью 1) к ошибкам ручного ввода и 2) к некоторым элементам конечного состояния, уже присутствующим во входном потоке. !!! > Первое трудноформализуемое требование может быть устранено путем эффективного использования валидаторов. Второе требование есть дополнительное требование к функциональности каждого конкретного ГАП. Реализация этих требований обусловлена последовательной декомпозицией задачи изменения уровня текста на подзадачи, работающие с конкретными, максимально подробными уровнями текста.< !!! ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 10:04:25 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Re:Programmnoe obespechenie -------------------------------------------------------------------------------- > > > 1) prostoj DOS-redaktor, rabotajushchij neposredstvenno s IP i ne > trebujushchij > > > voobshche nikakikh shriftov; > > > > Imejetsja v vidu redaktor, pomogajushchij vvodit' prinjatyje kombinacii > simvolov? > > Togda eto, konechno, osmyslenno. > > Da. V celom eto tekstovyj redaktor, v kotorom "prostejshije" komandy -- ne > tol'ko > postavit' simvol, no i postavit/ubrat'/smenit' diakritiku nad predydushchim > simvolom. > Mozhno sdelat' tak, chtoby pri etom "nevozmozhnyje" sochetanija (tipa udarenija > > nad soglasnoj) prosto v principe nel'zja bylo vvesti. Такой редактор, несомненно, хорошо бы иметь (особенно вот с этим последним свойством). И все равно я убежден, что имеет смысл создавать компонентный софт по моей или аналогичной модели, для того, чтобы снизить количество ошибок и максимизировать количество и качество автоматизированных замен. Софт, написанный по моей модели, может просто изолировать оператора от текста, в принципе не допуская опечаток, помимо неверного выбора альтернативы (опять же, желателен многоуровневый откат). > Korvertory iz/v RTF u menja vpolne uspeshno rabotajut s fajlami, vylozhennymi > v "Elisavete". Nado ih tol'ko slegka peredelat' pod novyj HIP (sperva ja > ispol'zoval > nechto boleje pohozheje na zapis' dlja TeXa). > > > > 5) nekie programmy vosstanovlenija otsutstvujushchej diakritiki i > chastichnoj > > > formal'noj proverki teksta. > > > > Vot eto nuzhno raspisat' podrobno. > > Naprimer: > > 1) proverka nalichija jera i pajerka v konce slov > 2) proverka napisanija "izhe" i "i" > 3) proverka "o uzkoje" / "o shirokoje" > 4) proverka ia/jus > 5) vstavka pridyhanij, jesli slovo nachinajetsja s glasnoj > 6) proverka zelo/zemlja > 7) vstavka titl, prostyh i bukvennyh Вот-вот, это, пожалуй, еще одна категория софта - валидаторы, позволяющая убедиться, что текст принадлежит конкретному уровню. После того, как валидатор "даст добро", к тексту становится применимой целая категория программ, осуществляющая те формальные и суггестивные замены, которые требуют определенного состояния текста. "Суггестивная замена" - это "альтернативный тэг", в котором альтернативы расположены в порядке, задаваемой некоторой эвристикой: наиболее вероятные - сначала, маловероятные - в конце. Для тэгогенераторов, осуществляющих суггестивные замены, вполне могут подойти некоторые из ваших алгоритмов, реализованных в валидаторах. Собственно, алгоритмы имеет смысл пихать в dll, чтобы использовать и в валидаторах, и в "суггестивных тэгогенераторах". > V celom pytajus' dejstvovat' tak: beru "pravil'nyj" tekst, > zatem "uproshchaju" jego (naprimer, ubiraju vse titla). > Potom pytajus' podobrat' nabor formal'nyh zamen, kotoryj > by ih obratno vstavil. Короче, изображаете из себя нейронную сеть ;-) Ох, подозреваю, что через годик, когда наш проект исполнится жизненными соками, станут доступными эмуляторы нейронных сетей, которые, действительно, сделают ненужными всю мою классификацию и "суггестивные тэгогенераторы". Уже сейчас в инете можно украсть некие обучаемые ActiveX-компоненты, которые могут быть встроены в обученном состоянии в любую программу. Только, боюсь, сам процесс познания исскуства их обучать и использовать займет у нас тот же год, если не более...... > (Kogda-to davnym-davno ja proboval takim metodom > sdelat' perevod iz novoj orfografii v staruju. V principe > ideja rabotajet, chislo oshibok udalos' dovesti do 1-2 > na stranicu. Dal'she delo upjorlos' > v otsutstvije dostatochnogo kolichestva "obuchajushchego > materiala" -- tekstov, nabrannyh v staroj orfografii.) Это мы Вам предоставим в неограниченном количестве. Главное - доведите дело до конца. Хотя даже такой результат - очевидное достижение, особенно в условиях отсутствия "карманного" филолога. Глебушка, видишь? (это я ему, а не Вам ;). > > Jesli dejstvitel'no gotovo, to, mozhet byt', eto i vzjat' za osnovu? A esli > na > > samom dele u Vas lish' chernovye nabroski, to mozhno rasparallelit' rabotu > > Situacija gde-to posredine. Poprobuju za eti vyhodnyje vsjo peredelat' > pod novyj HIP (prezhde vsego konvertory HIP <-> RTF-Irmologion). Это опять же Глебу на заметку. Возможно, он тут же возьмется протестировать Ваши конвертеры на реальном материале. А вот валидаторы и вертикальный софт, в т. ч. "суггестивные тэгогенераторы" мы вполне можем поделить. Даже если Вы откажетесь этим заниматься - мне бы очень пригодились Ваши алгоритмы в виде dll. Для начала надо четко специфицировать уровни текста, наличные исходные материалы и потребные последовательности преобразований каждого исходного текста в HIP (максимально подробно разбив эти преобразования по уровням). А потом - написать спецификацию на каждое атомарное преобразование и попытаться максимально использовать для ее реализации готовые компоненты и алгоритмы. > -------------------------------------------------------------------------- ----- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 10:33:45 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: ПО - пример применения моей терминологии к Мишиной ситуации -------------------------------------------------------------------------------- Hello, Mikhail! > (Kogda-to davnym-davno ja proboval takim metodom > sdelat' perevod iz novoj orfografii v staruju. V principe > ideja rabotajet, chislo oshibok udalos' dovesti do 1-2 > na stranicu. Dal'she delo upjorlos' > v otsutstvije dostatochnogo kolichestva "obuchajushchego > materiala" -- tekstov, nabrannyh v staroj orfografii.) Если этот алгоритм будет Вами доведен до ума - у нас будет готовый ГАП, повышающий подуровень текста 1-го уровня с (а2, б4, в02) до (а2, б2, в02). Это очень важное преобразование, и в таком случае можно будет обойтись без использования текстов подуровня б3: все встречающиеся тексты ниже подуровня б2 можно будет конвертировать в этот уровень путем использования Вашего ГАП, предварительно откорректировав "тривиальным" конвертером б3 -> б4. Если же Вы на пути реализации Вашего конвертера столкнетесь с ситуацией, когда он будет производить гиперкоррекцию (образую "лишние", например, яти) - возможно, не нужно его дальше совершенствовать, а просто придать ему элемент суггестивности и оставить окончательное решение эксперту-оператору. Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 10:37:36 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Re: Re RFC3 и 5: Text Leveling & Classifying - М. Гринчуку -------------------------------------------------------------------------------- Dobroje utro! Po povodu kommentarijev. > My prosto s raznyh storon smotrim na odnu i tu zhe problemu. I mne kazhetsja, > chto, pristupiv k jejo > resheniju s mojej storony, mozhno, pust' ne tak skoro, no poluchit' gorazdo > boleje > gibkuju i rasshirjajemuju sistemu. Jesli mozhno, napishite pro Vash podhod popodrobneje. > v to zhe vremja Vy predlagajete sovershenno opredeljonnyj i ne ochen'-to > chelovechnyj > sintaksis dlja etih kommentarijev. I predlagajete etot sintaksis vkljuchit' v > _standart_. 1) V ljubom sluchaje kakoj-to sintaksis dlja kommentarijev nuzhen. 2) Sintaksis mozhno i pomenjat' (kakije budut predlozhenija?) > Na samom dele etot sintaksis sovershenno chuzheroden Wordovskoj ideologii, > kotoraja voobshche ne myslit strokami. Voobshche govorja, eto uzhe privjazka k konkretnomu softu! Pochemu Vy nastaivajete, chto HIP v Word nado konvertirovat' SPERVA chitaja kak tekstovyj fajl i tol'ko POTOM preobrazuja? Ved' vsegda mozhno sperva propuskat' cherez nekij fil'tr, kororyj iz HIP sdelajet to, chto Vam udobneje. > V HIP nado razlichat' istinnyj abzac ot prostogo EOL, hotja by putjom > (...) udvojenija EOL Rovno eto i sdelano. > Naskol'ko mily Vashemu glazu vse eti igry s k+s = ksi, nastol'ko oni > udivitel'ny dlja ljubogo ne-TeXovca, a (...) dlja > podavljajushchej massy ljudej (...) ne znajushchih nichego, > krome Worda - prosto diki. Nikto ne sporit -- reshenije ne ideal'noje. No chto zhe vzamen, jesli na klaviature slishkom malo bukv? > Potomu ja i predlagaju vse zhe HIP s kommentarijami schitat' rasshireniem > standartnogo IP, a problemu vzaimnoj konvertacii raznykh rasshirennyh IP > schitat' samostojatel'noj chast'ju proekta. Ne to zhe li samoje: imejetsja HIP, v kotorom zadan format tol'ko kommentarijev kak takovyh. A pod "rasshirennym HIP" ponimajetsja kakaja-libo konkretnaja semantika VNUTRI kommentarijev. > Mozhno takzhe standartizirovat' i vashe rasshirenie. Togda stanet vozmozhna > sistema, ne uchityvajushchaja etot vtoroj standart, no polnost'ju > sootvetstvujushchaja > standartu basicHIP. > Vot takoj-to podkhod - s markirovkoj softa po standartam, kotorym on > sootvetstvuet - ja i schitaju bolee perspektivnym i gibkim, chem Vash podkhod, > > klassificirujushchij soft na "bazovyj" i "umnyj". Khotja by potomu, chto moj > podkhod > bolee tochen: vmesto opisatel'nykh kharakteristik upotrebljajutsja tochnye > nazvanija > standartov. > > Khotja, dlja togo, chtoby moj podkhod ispol'zovat' - nuzhno, estestvenno, > potrudit'sja nad standartizaciej, a ne ostavljat' problemu na potom i na > usmotrenie nesozdannykh eshche "umnykh" konverterov. Bojus', chto sejchas my ne smozhem vsjo vperjod uvidet' i predusmotret'. Otsjuda i mojo "na potom". > A predstav'te sebe raznye > versii jazyka kommentariev. Kak vy budete markirovat' soft - "poluumnyj", > "sverkhumnyj"? O markirovke rech' ne shla. V harakteristike softa, jestestvenno, nado ukazyvat', kakije kommentarii on ponimajet. (A neponjatnyje kommentarii on OBJAZAN ignorirovat'.) > Ne luchshe li imet' vozmozhnost' vposledstvii opisat' eti > jazyki i prisvoit' sootvetstvujushchuju kvalifikaciju tem tekstam, > gde oni upotrebljajutsja? I chtoby ideologija etogo opisanija byla ne vnov' > izobretennoj dlja vnov' voznikshej nuzhdy, a toj zhe samoj, kotoruju my > ispol'zuem dlja sozdanija bazovogo standarta... Vot! Raznyje-to vsjo zhe ne versii HIP, a versii jazyka kommentarijev. S etim polnost'ju soglasen. No kak objazatel'noje trebovanije k softu ja by postavil -- chtenije HIP-fajlov s ljubymi kommentarijami. Kak pozhelanije k jazykam kommentarijev -- ne oboznachat' po-raznomu odno i to zhe. Togda voobshche ne potrebujetsja konvertorov mezhdu raznymi vozmozhnymi jazykami kommentarijev. Prosto soft "ponjatnyje" mesta budet kak-to interpretirovat', a neponjatnyje -- propuskat'. A chto kasajetsja konvertorov v HIP -- to chem bol'she oni informacii smogut iz vjorstki izvlech' -- tem, navernoje, luchshe. > > 1) Chem raznica mezhdu Word-Irmologion i Word-Izhica otlichaetsja ot raznicy > > mezhdu /WinText i /DosText? I tam, i tam -- delo, po bol'shomu schetu, v > > kodirovke. > > Tem, chto Word-Izhica, voobshche govorja, otnositsja k kategorii 1), a ne 3), > v > svjazi s otsutstviem tam diakritiki i nekotorykh bukv. A esli Vy imeete v vidu > > kakuju-to "rasshirennuju" izhicu i sootvetstvujushchij polnocennyj vid nabora > - to, > esli ego golyj tekst, im porozhdaemyj, sovpadaet s Word-Irmologion - mozhno ne > > schitat' ego otdel'no, a esli otlichaetsja - sleduet dobavit' > Word-Izhica(Plus) "Rasshirennaja" Izhica (vrode by ja chto-to takoje videl, no ruchat'sja ne mogu). Chto takoje "golyj tekst sovpadajet s..." -- ne ponjal. Chto imejetsja v vidu: odinakovaja raskladka shriftov? Tot zhe nabor glifov? Ili jeshcjo chto-to? Ja podrazumeval vot chto: v Worde my imejem slova, sostevlennyje iz simvolov. Raznyje shrifty mogut dlja nabora togo zhe teksta ispol'zovat' raznyje kody simvolov, raznuju ih posledovatel'nost' i raznoje chislo (bukva s akcentom mozhe byt' predstavlena kak minimum tremja sposobami: kak jedinyj znak, kak akcent pered bukvoj i kak akcent posle bukvy). Na moj vzgljad, v ljubom sluchaje eta raznica togo zhe urovnja, kak raznica mezhdu 8-bitovymi kodirovkami tekstovyh fajlov. > Naschet zhe /WinText i /DosText - ja, vidimo, pogorjachilsja. Smysla ikh > razlichat', > konechno, net. > V to zhe vremja sleduet dobavit' dlja tekstovykh predstavlenij otdel'nuju > kharakteristiku - "kodirovka", otlichnuju ot "platformy". Vrode by polnyje "fizicheskije" opisanija: TXT/DOS TXT/Win DOC.Word97/Irmologion DOC.Word97/Izhica+ > > 3) ChiWriter mozhet ispol'zovat' raznye shrifty ili raznye kodirovki (v > > dannom sluchae eto odno i to zhe). Sushchestvujut raznye versii CW -- s > raznym > > formatom fajlov. > > A nuzhno ono nam? Mnogo li nabrano v CW i eshche ne konvertirovano kuda-nibud' > > eshche ili ne perenabrano vnov'? Eto bylo tol'ko k tomu, chto prosto "CW" -- harakteristika nepolnaja. Jesli vsjo zhe pridjotsja komu-to delat' konvertor CW -> HIP, to budut nuzhny utochnenija. > > 4) Word'ov tozhe prorva (pod DOS, pod Win, pod Mac, i v kazhdom sluchae > > neskol'ko raznykh versij) > > Vot Vordy-to kak raz absoljutno vzaimoponimaemy (sverkhu vniz, estestvenno), > po krajnej mere v ramkakh Wintel, s Makami byli kakie-to problemy, no ja > dumaju, chto i ikh mozhno razreshit', ostavajas' v ramkakh Vorda. Nu a raz tol'ko "sverhu vniz", to versiju ukazuvat' vsjo zhe nado: chtoby ne podsovyvat' konvertoram DOC -> ??? fajly iz slishkom novyh Word'ov i ne zhdali ot konvertorov ??? -> DOC sovmestimosti so starymi versijami Word'a. > Razumeetsja, ne imeet nikakogo smysla sozdavat' rasshirennoe IP dlja Dosovskogo > Worda, potomu chto vrjad li v nem sushchestvuet mnogo sverstannnykh tekstov. V > > tozhe vremja vse, nabrannoe v nem, mozhno zabrat' v 6-j Vindovyj Word, a > ottuda - v ljuboj bolee starshij. "IP dlja Worda" ne sushchestvujet po opredeleniju. Eto kak "TeX dlja Worda". > > 5) Kuda otnesti DOC-fajl, esli v nem ispol'zuetsja Unicode-shrift? > > Eto tozhe problema vnutriwordovskaja. Wordoviki berutsja vydat' vam ljuboj > doc-tekst v ljubom iz formatov, v kotorye umeet sokhranjat' Word, khotja ja > priznaju, chto nespecialist imeete shans natknut'sja na problemy pri otkrytii > ili sokhranenii takikh fajlov. Pravil'no li ja ponjal, chto Word smozhet pravil'no sohranit' fajl, nabrannyj kak Unicode, v takoj format, gde dopustimy tol'ko 8-bitovyje shrifty? > > -- tip fajla: .HIP, .TXT, .TEX, .DOC, .RTF, .CHI, ... (eto ne objazatel'no > rasshirenie) > > .... v t. ch. (Unicode)TXT? Tochneje budet TXT/Unicode (kak TXT/DOS). > 6-ja versija [Word] bolee universal'na, a 97 i vyshe - bolee > izdatel'skaja sistema, tak kak tol'ko teper' verstka ne zavisit ot drajvera > printera. TeX ne zavisit ot drajvera printera uzhe bol'she 20 let. :-) > Neponjatno, mozhete li Vy skazat' pro TeX to zhe, chto ja skazal vyshe pro Word? > > Ljuboj li TeXnar' mozhet bez osobykh problem skonvertirovat' slav. nabor > mezhdu > ljubymi versijami TeX, ili etoj premudrosti dazhe specialistam-TeXovcam > sleduet > special'no uchit'sja i zapasat'sja spec. softom ili nastrojkami? Raznica mezhdu TeXami takaja, kak mezhdu raznymi "bibliotekami standartnyh programm" vnutri odnogo jazyka. Poka chto dlja slav. nabora oni sovershenno ne standartizovany. Poetomy, znaja ustrojstvo konkretnogo slavjanskogo paketa dlja TeXa, legko napisat' konvertor v nego; no dlja obratnoj konvertacii (avtomaticheskoj) dopolnitel'no nuzhno, chtoby v nabrannom tekste tol'ko "vyzyvalis' standartnyje funkcii", no ne bylo "vstavok na assemblere". Itogo: 1) gotovy li my sejchas vsjo-vsjo-vsjo klassificirovat' na veki vechnyje vperjod? 2) Mozhet byt', kak-to oboznacit' te formaty, kotoryje sejchas real'no ispol'zujutsja ili nesomnenno potrebujutsja dlja raboty, -- i ogranichimsja imi? M. G. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 10:48:05 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC5: Text Classifying -------------------------------------------------------------------------------- Lev Tikhonov wrote: > -- esli v principe dannyj format konvertiruetsja v HIP, to ukazanie na > vozmozhnost' konvertacii k HIP dannogo konkretnogo fajla > > (s) M. Grinchuk > > ------------------------------------------------------------------------- > Primechanie: poslednij abzac podlezhit rasshifrovke, a predmet ego - > otdel'nomu > rassmotreniju, tak kak eta kharakteristika otnositsja, ochevidno, k inomu > predmetu (k fajlu, a ne k formatu), sravnitel'no so ostal'nymi chetyr'mja > kharakteristikami. Naprimer, RTF "v principe" konvertirujetsja v HIP, no jesli v RTF-fajle popadajutsja znaki chuzhdyh shriftov, vstavlennyje kartinki ili formuly -- to avtomaticheskoj konvertacii uzhe ne budet. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 10:54:28 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC3.1: Text Leveling -------------------------------------------------------------------------------- Lev Tikhonov wrote: > "Urovni teksta" K urovnjam vosproizvedenija diakritiki mozhno dobavit' i takoj (real'no soshchestvujushchij): a?) pridyhanij net, titla raskryty, no udarenija postavleny -- odnogo risunka i, mozhet byt', za iskljuchenijem odnoslozhnyh slov ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 11:11:19 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC1.1: GLOSSARY -------------------------------------------------------------------------------- Lev Tikhonov wrote: > LT> Verojatno, chto tekst v nekotoroj > LT> stadii gotovnosti prosto obidno budet konvertirovat' v HIP. > > Skoree ne tekst, a konkrentuju verstku. Esli zhe tekst mozhet nechto poterjat' > > pri konvertacii v HIP -- nado sovershenstvovat' HIP. > > Ne pora li podumat', kak terminologicheski razlichat' > > 1) tekst kak posledovatel'nost' simvolov/glifov i 2) tekst kak > tekhnologicheskuju izdatel'skuju edinicu: fajl v nekotorom formate, > soderzhimoe > kotorogo soderzhatel'no javljaetsja CSl tekstom. > > Ljudi, predlagajte terminy: ja terjajus', istoshchil fantaziju. Razve chto > dlja 2) - > ispol'zovat' "dokument" ili "CS-dokument"? > > Samoe glavnoe, srazu nachat' ispol'zovat' tochnuju terminologiju, togda i > zaposhchennye mnoju segodnja RFC nado budet perepisat' s ispol'zovaniem novogo > > termina. Mozhet byt', "tekst" i "fajl"? Tekst, hranjashchijsja v fajle, mozhet boleje ili meneje tochno vosproizvodit' pervoistochnik (fizicheskuju knigu, naprimer). No v fajle mozhet byt' i informacija, k tekstu ne otnosjashchajasja. Konvertory rabotajut s fajlami -- sohranjaja tekst. HIP -- prostejshaja forma zapisi (v fajle) c.-sl. tekstov. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 11:13:08 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RFC6: Expert Software Shell -------------------------------------------------------------------------------- Умная программная оболочка (УПО) УПО - это программа или комплекс программ, обеспечивающая информационную поддержку для человека-диспетчера ЦСл набора. УПО хранит формализованную информацию о текущем уровне набора и всех поддающихся формализации существенных его особенностях, важных для правильной конвертации в HIP. УПО хранит информацию о расположении и об истории текста, то есть о всех преобразованиях, которым он подвергался. По запросу диспетчера УПО предоставляет полную информацию о состоянии конкретного ЦСл текста. УПО является промежуточным программным обеспечением, помимо которого диспетчер не может вызывать низкоуровневые модули, диспетчер не может также вносить никакие изменения в текст помимо УПО. (Возможно, сам текст следует хранить в зашифрованном виде, чтобы не было искушения поправить его "ручками"). УПО выполняет роль одно- (а в перспективе - многопользовательской) системы контроля версий, блокируя несанкционированное внесение изменений в текст и предупреждая рассинхронизацию версий Роль УПО как однопользовательской системы контроля версий состоит в том, что она выдает текст в комплекте с с нетривиальными программами преобразования текста и переходит из стабильного состояние в состояние checked-out. В состоянии checked-out УПО ожидает получения текста нового уровня, соответствие которому она проверяет соответствующим валидатором. Если проверка завершается успешно, УПО возвращается в стабильное состояние и маркирует текст новым уровнем. В противном случае, либо по непосредственной команде диспетчера, УПО возвращается в стабильное состояние и запоминает неудачную попытку конвертации в новый уровень УПО также выполняет роль интеллектуального ассистента диспетчера, в каждый момент по его запросу предоставляя ему полную справку о допустимых, обеспеченных существующим низкоуровневым вертикальным софтом преобразованиях, которым можно подвергнуть данный текст, и так - на много "ходов" вперед, выделяя перспективные и тупиковые пути преобразования, а также пути отката в перспективные состояния в случае неудачи. В случае поступления команды на откат УПО самостоятельно находит и запускает соответствующий тривиальный конвертер. (с) Лев Тихонов ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 11:33:42 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Tegi i kommentarii -------------------------------------------------------------------------------- Predlozhenija: 1) "alternativnyje tegi" mozhno oformljat' kak "neizvestnyj simvol" s primechanijem/snoskoj, naprimer: ?{e } Eto oboznachajet, chto v dannom meste chelovek dolzhen vybrat' odno iz dvuh, no programma (sotvorivshaja takuju zapis') "rekomendujet" e; zdes' -- oboznachenije simvola, a ne nechto kinovar'ju. ;-) Ili d?{v~ v}a (To li "deva" -- s titlom (dv~a), to li "dva" -- bez (dva); vozmozhnyj rezul'tat raboty programmy vosstanovlenija titl.) 2) kommentarii mozhno oformljat' po tomu zhe principu kak %{.....} No togda vnutri kommentarija nel'zja upotrebljat' simvol "}". (A kommentarii "otsjuda i do konca stroki" -- pochti jedinstvenno vozmozhnyj vid zapisi bez etogo ogranichenija. Vtoroj -- a-la Holleritovy konstanty: "sledyjushchije N bajt -- kommentarij".) ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 11:43:35 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC6: Expert Software Shell -------------------------------------------------------------------------------- Lev Tikhonov wrote: > Umnaja programmnaja obolochka (UPO) > > UPO - eto programma ili kompleks programm, obespechivajushchaja... Dajosh' Vsemirnyj Nauchto-Issledovatel'skij i Proektnyj Institut Sovershenstvovanija Standartivacii Specifikacij Sredstv Razrabotki Programm Avtomatizacii Kontrolja i Podderzhki Cerkovnoslavjanskih Tekstov! (mil' pardon) Poshjol domoj peredelyvat' konvertory. Do ponedel'nika. M. G. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 11:49:22 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC1.1: GLOSSARY -------------------------------------------------------------------------------- ----- Original Message ----- From: "Mikhail Grinchuk" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Saturday, January 15, 2000 11:11 AM Subject: Re: RFC1.1: GLOSSARY > Lev Tikhonov wrote: > > > LT> Verojatno, chto tekst v nekotoroj > > LT> stadii gotovnosti prosto obidno budet konvertirovat' v HIP. > > > > Skoree ne tekst, a konkrentuju verstku. Esli zhe tekst mozhet nechto poterjat' > > > > pri konvertacii v HIP -- nado sovershenstvovat' HIP. > > > > Ne pora li podumat', kak terminologicheski razlichat' > > > > 1) tekst kak posledovatel'nost' simvolov/glifov i 2) tekst kak > > tekhnologicheskuju izdatel'skuju edinicu: fajl v nekotorom formate, > > soderzhimoe > > kotorogo soderzhatel'no javljaetsja CSl tekstom. > > > > Ljudi, predlagajte terminy: ja terjajus', istoshchil fantaziju. Razve chto > > dlja 2) - > > ispol'zovat' "dokument" ili "CS-dokument"? > > > > Samoe glavnoe, srazu nachat' ispol'zovat' tochnuju terminologiju, togda i > > zaposhchennye mnoju segodnja RFC nado budet perepisat' s ispol'zovaniem novogo > > > > termina. > > Mozhet byt', "tekst" i "fajl"? Tekst, hranjashchijsja v fajle, > mozhet boleje ili meneje tochno vosproizvodit' pervoistochnik > (fizicheskuju knigu, naprimer). No v fajle mozhet byt' i > informacija, k tekstu ne otnosjashchajasja. Konvertory > rabotajut s fajlami -- sohranjaja tekst. HIP -- prostejshaja > forma zapisi (v fajle) c.-sl. tekstov. ИМХО "файл", конечно, вариант, но это слишком многозначное слово. в конце концов, не собираемся же мы отказаться от его обыденного употребления, перйдя на язык, доступный лишь посвященным? ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 12:48:53 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC6: Expert Software Shell -------------------------------------------------------------------------------- ----- Original Message ----- From: "Mikhail Grinchuk" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Saturday, January 15, 2000 11:43 AM Subject: Re: RFC6: Expert Software Shell > Lev Tikhonov wrote: > > > Umnaja programmnaja obolochka (UPO) > > > > UPO - eto programma ili kompleks programm, obespechivajushchaja... > > Dajosh' Vsemirnyj Nauchto-Issledovatel'skij i Proektnyj Institut > Sovershenstvovanija Standartivacii Specifikacij Sredstv Razrabotki > Programm Avtomatizacii Kontrolja i Podderzhki Cerkovnoslavjanskih > Tekstov! > > (mil' pardon) Миша! Что Вам не нравится? Допустим, Вы устали, и не уверены в том, что после долгого, допустим, недосыпа не испортите текст. Вы можете пойти отдыхать, ожидая момента, когда с новыми силами сможете приступить к работе (заметьте: квалифицированной работе, которую едва ли кто-то кроме Вас сможет сделать). В случае же принятия моей идеологии программного репозитория Вы сможете выбрать иную стратегию - скажем, поправить только ударения. УПО сообщит Вам, будет ли такое изменение перспективным (то есть - реализованы ли конвертеры, переводящие новое, получающееся после правки только ударений, состояние в HIP) и сгенерирует для Вас "рабочее место выставляльщика ударений", где Вы ничем не сможете испортить другие элементы текста - попросту не будете иметь к ним доступа. Или того лучше: Вы уйдете спать, а ударения выставлять оставите смышленого десятиклассника, который тоже ничего в тексте испортить не сможет даже в приступе игривости... А по возвращении вы запускаете сравнивалку версий (вариант: ту самую программу утилизации тэгов, если разрешить безальтернативные тэги как разновидность "альтернативных") и проходитесь по всем изменениям, внесенным школьником, утверждая их. Результат - существенное, абсолютно выигрышное повышение надежности и производительности труда, хотя, конечно, бОльшие начальные затраты на планирование и бОльший риск неуспеха проекта. > Poshjol domoj peredelyvat' konvertory. Do ponedel'nika. > > M. G. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 13:11:31 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC6: Expert Software Shell -------------------------------------------------------------------------------- > В случае же принятия моей идеологии программного репозитория Вы сможете > выбрать иную стратегию - скажем, поправить только ударения. УПО сообщит Вам, > будет ли такое изменение перспективным (то есть - реализованы ли конвертеры, > переводящие новое, получающееся после правки только ударений, состояние в > HIP) А если, например, эти конвертеры не реализованы еще как самостоятельные утилиты в Вашем стиле, зато существуют, допустим в Ворде - УПО предупредит Вас об этом и в случае Вашего согласия обеспечит дальнейший маршрут текста. То есть сконвертирует результат деятельности школьника "горизонтальным" конвертером в Ворд, запустит в Ворде соотв. макрос, а затем вернет текст в исходное представление). Вот зачем, с моей точки зрения, нужно подробнейшее описание "узловых точек" - уровней текста и классификация софта по тем точкам, маршрут между которыми он обеспечивает. Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 13:40:12 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Unicode - нужно ли стандартизировать? -------------------------------------------------------------------------------- ---------- > От: Lev Tikhonov > Кому: -=ORTHODOX-FONT=- Project Participants > Тема: Unicode - нужно ли стандартизировать? > Дата: 15 января 2000 г. 6:40 > > Вот уж в чем я уверен абсолютно - что не существует такой публикации, где > понадобились бы одновременно древнекритский и церковнославянский алфавиты. > Скажем тот же словарь Дьяченко (если мы задумаем переиздать его, а не сделать что-нибудь получше, а впрочем и там разные шрифты потребуются) - там 3 разных шрифта для разных подмножеств славянского языка. > > Нужно искать соответственный серверный софт для сайта, чтобы не линейно > сваливал все в кучу, а группировал обсуждения по тредам. В вебмастерстве я Во!!! Это же кошмар - вынимаю почту, а в ней 25 писем - ну что за нафиг? :-))))) Хотя с другой стороны дешевше выходит - так пока еще всю эту кучу в инете прочитаешь... Архангельский Г.А. СПб ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 13:47:43 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: О древнерусском алфавите -------------------------------------------------------------------------------- ---------- > От: Lev Tikhonov > Кому: -=ORTHODOX-FONT=- Project Participants > Тема: О древнерусском алфавите > Дата: 15 января 2000 г. 6:40 > > > > Это тема для серьезного разговора. Дело ведь не просто в символах, а в их > > графике. Не принято набирать старославянские тексты шрифтами для > > церковнославянского языка, хотя теоретически первый представляет собой > > Кстати, а не является ли это изобретением советских лихачевских времен, > когда стремились оторвать древнерусскую культуру от Церкви? Как дело > обстояло до революции? Кто видел тогдашние издания древнерусских текстов? > > Может, если это все новоизобретенное в советские времена - не стесняться и > насаждать единую гарнитуру для ЦСл и Дрр? > А что вы оба имеете под этим в виду? Лев, кажется, набор их гражданкой, а Алексей - ненабор их смотрицким шрифтом (предлагаю такой термин от слова Мелетий Смотрицкий :-). Можно еще - синодальный. Дорев. издания древнерусских - ну напр. Иосифа Волоцкого "Послание иконописцу" было в серед. прош. века издано шрифтом середины 17, как в Иосифовской Кормчей (я ее упоминаю т.к. сейчас наверно самый доступный источник с этим шрифтом ознакомиться). В принципе тот же синодальный, только чуть другое начертание, есть живете-титло (может еще пара такого рода -не помню) и буква З случается в виде этакой хитрой загогулины над строкой. Во что я подумал-то!!! А ведь это хозяйство тоже надо учесть. Т.к. даже для элементарного воспроизведения старообрядческого текста без этих добавок не обойтись, а в ирмологионе их нету (З-загогулины про кр. мере). А старообр. тексты надо весьма учитывать, т.к. ближайшее стратегическое направление возможного развития ц-сл. Вернее возвращения к отчему дому. :-) Мне бы все же кто-нибудь популярно объяснил бы, чем отличается шрифт как совокупность букв определенного начертания от стандарта, о котором тут идет речь. Архангельский Г.А. СПб ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 13:50:00 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk -------------------------------------------------------------------------------- ---------- > От: A A G > Кому: -=ORTHODOX-FONT=- Project Participants > Тема: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk > Дата: 15 января 2000 г. 4:27 > > Это тема для серьезного разговора. Дело ведь не просто в символах, а в их > графике. Не принято набирать старославянские тексты шрифтами для > церковнославянского языка, хотя теоретически первый представляет собой > подмножество второго. Я не могу с ходу сообразить, какие особенные буквы > могут быть в древнерусских текстах. Но даже если таких букв нет, нельзя > использовать церковнославянский шрифт для древнерусских текстов. Наконец, Бесспорно, о том и речь. Я вот и не понимаю, чем же шрифт отличается от стандарта. > если уж мы возьмемся за древнерусский, то придется и все славянские языки > учитывать (из тех, что кириллицу используют) И, между прочим, не только > славянские. А здесь нам прямая дорога обратно к юникодовой кириллической > странице. Это, господа, еще не факт, что нас не развернут в этом > направлении, сказав, что ц.славянский не дорос до того, чтобы для него > заводили отдельную страницу. > Остальные славянские а не в баню ли их ну? А что за страница такая? А может и стОит? Архангельский Г.А. СПб ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 14:02:31 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Re:Programmnoe obespechenie -------------------------------------------------------------------------------- ---------- > От: Mikhail Grinchuk > Кому: font-list@des-nt.tstu.ru > Тема: Re:Programmnoe obespechenie > Дата: 15 января 2000 г. 8:04 > > 1) проверка наличия ера и паерка в конце слов А как ерок можно вычислить вообще - не понимаю? Наш конвертер его ставит только в конце предлогов над, без и еще каких-то пары штук, указанных вручную в базе. > 2) проверка написания "иже" и "и" > 3) проверка "о узкое" / "о широкое" > 4) проверка иа/юс > 5) вставка придыханий, если слово начинаетща с гласной > 6) проверка зело/земля > 7) вставка титл, простых и буквенных > Это есть все (хотя титлы небезошибочны - если недлинное слово титлуется, случается такое титло увидеть в середине какого-то большого слова, где такое же сочетание букв прилучилось). > сделать перевод из новой орфографии в старую. В принципе > идея работает, число ошибок удалось довести до 1-2 А яти как????!!!!!!!! Это ж круто!!!!!! > на страницу. Дальше дело упёрлось > в отсутствие достаточного количества "обучаюшчего > материала" -- текстов, набранных в старой орфографии.) > Рекомендую компакт - толковый словарь Даля. Он весь в старой орфографии, и материалу предостаточно. Только где вы территориально находитесь, не знаю - есть ли у вас такой. Архангельский Г.А. СПб ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 14:10:45 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk -------------------------------------------------------------------------------- ---------- > От: Mikhail Grinchuk > Кому: -=ORTHODOX-FONT=- Project Participants > Тема: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk > Дата: 15 января 2000 г. 8:41 > Prosvetite: chto eto takoje? (Ne prishljote li kusochek teksta s > etimi znakami? -- DOC/Word6, DOC/Word97, ili sootvetstvujushchij RTF) > Три точки несовершенно окружены, как Типикон это определяет. :-) В ирмологионе символы, соответствующие < > (соотв. левый и правый знак). А если у вас ирмологиона нету, то присылать РТФ смысла нет. > b) jesli odnovremenno nuzhny oba vida tochek -- pridjotsja dobavit'. > Одновременно. Правда это если с древнерусскостью связываться - я в синодальных текстах такой точки не припомню. КСТАТИ: а звездочку для канонарханья предусмотрели???!!!!! Это уже не шестеричный знак, ее картинкой не вклеишь! > > Davajte uzh (po krajnej mere sperva) sdelajem horoshuju sistemu > dlja "formalizovannogo" jazyka -- c.-sl. po pechatnym knigam 19 veka. > Возможно это и правильно. Но как минимум старообрядческие особенности включить надо - тогда парой-тройкой символов мы расширяем область действия до 16-17 веков, что полезно. Да даже тут не столько во времени дело, сколько в пространстве, сиречь старообрядчестве. Архангельский Г.А. СПб ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 14:18:48 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Re:Programmnoe obespechenie -------------------------------------------------------------------------------- ---------- > От: Lev Tikhonov > Кому: -=ORTHODOX-FONT=- Project Participants > Тема: Re: Re:Programmnoe obespechenie > Дата: 15 января 2000 г. 10:04 > до конца. Хотя даже такой результат - очевидное достижение, особенно в > условиях отсутствия "карманного" филолога. Глебушка, видишь? (это я ему, а > не Вам ;). > Хе-хе, вот когда пошшупаю, тогда убедюсь. :-))) А пока не верится мне что-то....Хотя конечно русский гений безграничен... > > Это опять же Глебу на заметку. Возможно, он тут же возьмется протестировать > Ваши конвертеры на реальном материале. > Не понял? В смысле на моих гражданкой набранных текстах? Это можно в принципе. Кстати, Левушка, ты в своих классификациях текстов вот такой вариантец не учел, а я тебя предупредить забыл. У меня многие богосл. тексты так набраны: берется старый текст отконверченный, текст вырезается и набирается гражданкой, а уставные указания только подправляются (т.к. там много одинакового во всех службах). Наш конвертер это дело отлично кушает и славянское не гадит, работая с гражданкой (как уж он это умудряется я не знаю -к Кириллу вопрос, который упорно тут пока не желает появиться халявщик и оболтус, ну да я ж ему по башке :-). Вот это дело не вредно бы учесть.Поставим задачу более общо: не просто различать степень готовности текста, но учитывать при этом _неоднородную_ готовность оного текста. Возможно это где-то еще актуально,скажем когда кто-то в современный текст вставляет цитаты в старой орфографии итп. Архангельский Г.А. СПб ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 14:25:34 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC6: Expert Software Shell -------------------------------------------------------------------------------- ---------- > От: Mikhail Grinchuk > Кому: -=ORTHODOX-FONT=- Project Participants > Тема: Re: RFC6: Expert Software Shell > Дата: 15 января 2000 г. 11:43 > Dajosh' Vsemirnyj Nauchto-Issledovatel'skij i Proektnyj Institut > Sovershenstvovanija Standartivacii Specifikacij Sredstv Razrabotki > Programm Avtomatizacii Kontrolja i Podderzhki Cerkovnoslavjanskih > Tekstov! > > (mil' pardon) За что пардон? Я понял только часть акростиха СССР, а дальше что имелось в виду? Архангельский Г.А. СПб ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 14:27:54 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC6: Expert Software Shell -------------------------------------------------------------------------------- ---------- > От: Lev Tikhonov > Кому: -=ORTHODOX-FONT=- Project Participants > Тема: RFC6: Expert Software Shell > Дата: 15 января 2000 г. 11:13 > вносить никакие изменения в текст помимо УПО. (Возможно, сам текст следует > хранить в зашифрованном виде, чтобы не было искушения поправить его > "ручками"). > Ой не надо. С меня лично хватит дебильных железок, которые упорно думают, что они все сами понимают и ни в каких вмешательствах человека не нуждаются кроме нажатий на кнопки. Нет уж, особенно если область работы учесть - славянский язык, в котором никогда не знаешь, на какой сюрприз наткнешься. Хотя учитывая следующее письмо Льва (зело резонабельное) о спящем Михаиле и игривом десятикласснике - ну тогда степени доступа при полном их снятии должны обеспечивать ПОЛНЫЙ доступ. Архангельский Г.А. СПб ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 16:42:26 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: О древнерусском алфавите -------------------------------------------------------------------------------- Глебу и Льву радоваться! > Может, если это все новоизобретенное в советские времена - не стесняться и > насаждать единую гарнитуру для ЦСл и Дрр? > > Левъ > У меня под рукой Дьяченко и грамматика Востокова. Дьяченко строго различает разные этапы славянской графики. Востоков и вовсе пользуется расширенной гражданкой для отображения Остромирова Евангелия. Гаманович также различает старославянские тексты и синодальные (как я их называю). Глеб приводит примеры древнерусских рукописей, изданных в новейшее время посредством синодальной шрифтовой технологии. Но ведь если рукопись древнерусская, это еще не значит, что она на древнерусском языке написана! Достаточно бегло взглянуть на текст в поисках особенностей церковнославянского языка. Я не буду вдаваться в дебри вопроса о диглоссии. Для меня древнерусский - язык скорее обиходный. Не будете же вы издавать долговые расписки полууставом! По этой причине для древнерусского текста как раз и пригодится стандартная юникодовая кириллица. Через месяц у меня должна появиться книжка Горшкова с Хабургаевым по исторической грамматике русского языка. Освежив в памяти университетский курс, я сообщу, если у меня возникнет иное понимание этих вопросов. Литерарурным языком древнерусский язык не являлся, следовательно регламентированных норм для него мы все равно не найдем. Не будем же мы под каждый диалект подстраиваться. Завязнем. А прочие славянские языки тоже тогда негоже отбрасывать в сторону. И повторяю, есть же стандартная юникодовая кириллица! Мы отнюдь не бросаем древнерусский язык прозябать в неоцифрованном виде. О нем позаботились и без нас. Так что, господа, давайте сосредоточим наше внимание на синодальном этапе церковнославянского языка, как представляющем из себя высшую ступень развития славянской литургической традиции. Этот язык нормативен и прекрасно задокументирован. У него отличные перспективы на будущее, особенно если мы с вами не оплошаем. Чтобы поддержать энтузиазм, предлагаю посмотреть на список уже предложенных скриптов. http://www.unicode.org/pending/pending.html Мне особо по душе Old Hungarian Runic Давайте работать, а то над нами скоро смеяться будут, если даже такая экзотика уже пробила себе дорогу к стандартизации. Алексей Гришин =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 20:33:23 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC6: Expert Software Shell -------------------------------------------------------------------------------- > > вносить никакие изменения в текст помимо УПО. (Возможно, сам текст > следует > > хранить в зашифрованном виде, чтобы не было искушения поправить его > > "ручками"). > > > Ой не надо. С меня лично хватит дебильных железок, которые упорно думают, > что они все сами понимают и ни в каких вмешательствах человека не нуждаются > кроме нажатий на кнопки. Нет уж, особенно если область работы учесть - Насколько этот софт будет дебильным - зависит в том числе и от тебя, от твоей решимости вложить в него максимум интеллекта и не спешить с немедленной отдачей, пока не станет досконально ясен общий технологический процесс. При правильной постановке дела "железки" обеспечат, по моей оценке, 95% результата и при этом не внесут дополнительного хаоса, который неизбежно вносит даже самый аккуратный человек. Если же сотрудников несколько - то хаос не суммируется, а перемножается (а то и потециируется): испытано на горьком опыте [поэтому, начиная с некоторого количества - 2-4 человека, - добавление новых сотрудников не приближает, а отдаляет результат: тоже проверено]. Соответственно, компьютер можно использовать не по назначанию, как _бумагу_, которая _все стерпит_ за этими взбалмошными персонами (и таких примеров сколько угодно), а можно - как интеллектуальный инструмент, для чего он, собственно, и создан. Интеллектуальный инструмент, конечно, принижает исполнителя на этапе своего применения, но только за счет того творческого потенциала, который ты заложишь в него на этапе проектирования. Чем больше вложенный потенциал - тем меньше роль оператора, но тем качественнее и тем предсказуемее результат его деятельности и тем незначительнее эффект умножения хаоса от увеличения числа сотрудничающих операторов. > славянский язык, в котором никогда не знаешь, на какой сюрприз наткнешься. > Хотя учитывая следующее письмо Льва (зело резонабельное) о спящем Михаиле > и игривом десятикласснике - ну тогда степени доступа при полном их снятии > должны обеспечивать ПОЛНЫЙ доступ. ....и таким образом утратить уверенность в валидности текста? Ведь огромного труда будет стоить даже однократно проверить текст валидаторами и присвоить ему уровень, чтобы дальше сопровождать его программно, а ты хочешь повторить этот процесс ради своей однократной блажи? Не лучше ли пометить на распечатке нужное место большой красной галочкой и внести требуемые исправления уже в верстку? А если такие исправления будут встречаться столь систематически, что тебя будет раздражать количество красных галочек - следует подумать о том, чтобы добавить интеллекта "железкам" и опять-таки автоматизировать 95% твоего ручного труда. Собственно, считай, что мы этим уже занялись вот сейчас, заблаговременно, а не тогда, когда система будет в эксплуатации и менять что-либо будет крайне сложно или вовсе невозможно. Левъ. ЗЫ. Собственно, текст можно в любой момент забрать из системы и далее доделывать его в любой технологии - хоть отдать в машбюро и далее в издательство "Советский печатник" ;) Только при чем здесь задумываемый программный комплекс? ЗЗЫ. И еще. Главное, что я тебе хочу втолковать: в любой системе, основанной на человеческом внимании и предъявляющей высокие начальные требования к квалификации ты, конечно, можешь начать работу и рано или поздно ее закончить в одиночку. Но, скорее всего, это будет _очень_ поздно: тем позднее, чем раньше ты работу начнешь и чем меньше уделишь внимания автоматизации процессов. Но это еще не беда. Беда или катастрофа в полном смысле слова начнется, когда ты пригласишь себе на помощь парочку сотрудников. В этом случае половину своего времени вы будете заниматься устным разрешением конфликтов и согласованиями деталей, которые в правильной масштабируемой системе уже запротоколированы и автоматизированы разработчиками. То есть от трех сотрудников эффект будет не тройной, а _полуторный_ (а низкоквалифицированные сотрудники отнимут половину твоего дорогого времени и добавят половину своего дешевого, то есть еще более снизят общий эффект). От четырех же равноквалифицированных сотрудников эффект будет существенно меньше двойного из-за большего внутреннего трения между ними и потому больших потерь выделяющегося "тепла". А четвертый и дальнейшие помощники однозначно снизят общую эффективность. Короче, даже вдвое повысить эффективность "ручного" труда такого рода принципиально невозможно. Соответственно, чем больше процедур взаимодействия составных частей сложной системы мы сможем запланировать, регламентировать и автоматизировать, чем меньше мы оставим возможностей для "творчества" операторов, тем больше будет их отдача, тем быстрее они будут двигаться к результату и тем меньше усилий уйдет в атмосферу. Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 20:44:37 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Re:Programmnoe obespechenie -------------------------------------------------------------------------------- > > Это опять же Глебу на заметку. Возможно, он тут же возьмется > протестировать > > Ваши конвертеры на реальном материале. > > > Не понял? В смысле на моих гражданкой набранных текстах? Это можно в > принципе. Вернись к тому письму. Ты слишком много поскипал. Речь шла о конвертерах Ирмологион <-> HIP > Кстати, Левушка, ты в своих классификациях текстов вот такой вариантец не > учел, а я тебя предупредить забыл. У меня многие богосл. тексты так > набраны: берется старый текст отконверченный, текст вырезается и набирается > гражданкой, а уставные указания только подправляются (т.к. там много > одинакового во всех службах). Наш конвертер это дело отлично кушает и > славянское не гадит, работая с гражданкой (как уж он это умудряется я не > знаю -к Кириллу вопрос, который упорно тут пока не желает появиться Полагаю, что он как-то маркирует текст, не подлежащий конвертированию. Очередная категория примечаний - это если Миша настоит на своем, или отдельная пара тэгов, означающая "замороженный" текст - если Миша согласится разделить basicHIP и extendedHIP. > халявщик и оболтус, ну да я ж ему по башке :-). Вот это дело не вредно бы > учесть.Поставим задачу более общо: не просто различать степень готовности > текста, но учитывать при этом _неоднородную_ готовность оного текста. Пожалуйста, внутри каждого "замораживающего" тега для начала указывай параметр - уровень готовности текста, содержащегося в нем. > Возможно это где-то еще актуально,скажем когда кто-то в современный текст > вставляет цитаты в старой орфографии итп. Все реализуемо в рамках той же модели. Чем больше таких примеров, тем больше уверенность в ее правильности. Давай еще. Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 20:59:12 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: О древнерусском алфавите -------------------------------------------------------------------------------- Привет Глеб! > > > Это тема для серьезного разговора. Дело ведь не просто в символах, а в > их > > > графике. Не принято набирать старославянские тексты шрифтами для > > > церковнославянского языка, хотя теоретически первый представляет собой > > > > Кстати, а не является ли это изобретением советских лихачевских времен, > > когда стремились оторвать древнерусскую культуру от Церкви? Как дело > > обстояло до революции? Кто видел тогдашние издания древнерусских текстов? > > > > Может, если это все новоизобретенное в советские времена - не стесняться > и > > насаждать единую гарнитуру для ЦСл и Дрр? > > > А что вы оба имеете под этим в виду? Лев, кажется, набор их гражданкой, а > Алексей - ненабор их смотрицким шрифтом (предлагаю такой термин от слова > Мелетий Смотрицкий :-). Можно еще - синодальный. Я те про фому, а ты мне про ерему. Хотя далее вроде бы по делу инфу приводишь. > Дорев. издания древнерусских - ну напр. Иосифа Волоцкого "Послание > иконописцу" было в серед. прош. века издано шрифтом середины 17, как в > Иосифовской Кормчей (я ее упоминаю т.к. сейчас наверно самый доступный > источник с этим шрифтом ознакомиться). В принципе тот же синодальный, > только чуть другое начертание, есть живете-титло (может еще пара такого > рода -не помню) и буква З случается в виде этакой хитрой загогулины над > строкой. Ну вот это и есть основание для того, чтобы использовать один и тот же уникодный "скрипт" для этих текстов. > Мне бы все же кто-нибудь популярно объяснил бы, чем отличается шрифт как > совокупность букв определенного начертания от стандарта, о котором тут идет > речь. Есть гарнитура, которая может различаться при неизменном скрипте и кодировке шрифта. Например, берешь текст Ирмологион, закрашиваешь его и заменяешь Ижицой. Получаешь очень смешно. Это значит, что у этих наборов разная категория и/или уровень в моей классификации. С другой стороны, если буквы не стали нечитаемыми - значит, это разные гарнитуры внутри _одного_ стандарта. А если ижица расширена теми символами, которых в ней недостает до Ирмология, да еще эти символы на тех же местах - то это разные гарнитуры одного стандарта и одного уровня. А если символы эти тоже на других местах - тогда это еще и другая кодировка того же стандарта, а в случае использования Уникода - просто некорректна либо такая Ижица, либо Ирмологион, либо оба вместе. Кстати, по-моему, мое объяснение темно и не совсем правильно. Буду рад поправкам. Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 22:51:11 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: О древнерусском алфавите -------------------------------------------------------------------------------- ---------- > От: A A G > Так что, господа, давайте сосредоточим наше внимание на синодальном этапе > церковнославянского языка, как представляющем из себя высшую ступень > развития славянской литургической традиции. Этот язык нормативен и прекрасно > задокументирован. У него отличные перспективы на будущее, особенно если мы с > вами не оплошаем. Чтобы поддержать энтузиазм, предлагаю посмотреть на список > уже предложенных скриптов. > Убедили. Но я все же предлагаю маленькую поправку на старообрядчество. Т.е. букву З верхнюю.Если живете-титло и подобные в существующем варианте будут (я как-то из кучи писем так это и не понял), то наверно и все. Таким образом мы себе осложняем жизнь на 1-2 символа, а хронологически и географически (в смысле в сегодняшней ситуации) расширяемся эдак где-то вдвое. Архангельский Г.А. СПб ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 22:53:20 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: О древнерусском алфавите -------------------------------------------------------------------------------- ---------- > От: Lev Tikhonov > Кому: -=ORTHODOX-FONT=- Project Participants > Тема: Re: О древнерусском алфавите > Дата: 15 января 2000 г. 20:59 > Ну вот это и есть основание для того, чтобы использовать один и тот же > уникодный "скрипт" для этих текстов. > Кто есть скрипт? > Кстати, по-моему, мое объяснение темно и не совсем правильно. Буду рад > поправкам. > Золотые слова! Насчет темноты особенно. :-) Архангельский Г.А. СПб ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 15 янв 2000 22:59:31 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC6: Expert Software Shell -------------------------------------------------------------------------------- ---------- > От: Lev Tikhonov > Кому: -=ORTHODOX-FONT=- Project Participants > Тема: Re: RFC6: Expert Software Shell > Дата: 15 января 2000 г. 20:33 > Насколько этот софт будет дебильным - зависит в том числе и от тебя, от > твоей решимости вложить в него максимум интеллекта и не спешить с Только идеи, причем самого стратегического характера. :-) Ибо давно канули в Лету те времена, когда я знал Паскаль и пытался на нем что-то писать. :-) > распечатке нужное место большой красной галочкой и внести требуемые > исправления уже в верстку? > Т.е. все ж таки я буду в конце иметь готовый текст, с которым могу делать все-все-все что хочу? Который могу открыть в ворде и изгаляться любым образом? Если да - то тогда согласен конечно. Архангельский Г.А. СПб В порядке постскриптума - маленький оффтопик. :-) Как же ты мне нравишься, Лев Евгеньич, когда занимаешься делом и не лезешь в высокие политико-философско-богословские ревнования о вере! Сразу видно руку мастера и хорошее соображение. Выдворение из РТП определенно пошло тебе на пользу. :-))) А уж ЦС стандарту - и говорить нечего. :-)))))) ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 04:15:18 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC1.1: GLOSSARY -------------------------------------------------------------------------------- Lev Tikhonov wrote: > > > Mozhet byt', "tekst" i "fajl"? > > IMHO "fajl", konechno, variant, no eto slishkom mnogoznachnoje slovo. Tam, gde nejasno iz konteksta, mozhno utochnit': CS-fajl. Vsjo-taki konkretneje, chem CS-dokument. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 04:26:34 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC6: Expert Software Shell -------------------------------------------------------------------------------- Lev Tikhonov wrote: > > > Umnaja programmnaja obolochka (UPO) > > > > > > UPO - eto programma ili kompleks programm, obespechivajushchaja... > > > > Dajosh' Vsemirnyj Nauchto-Issledovatel'skij i Proektnyj Institut > > Sovershenstvovanija Standartivacii Specifikacij Sredstv Razrabotki > > Programm Avtomatizacii Kontrolja i Podderzhki Cerkovnoslavjanskih > > Tekstov! > > > > (mil' pardon) > > Misha! Chto Vam ne nravitsja? Rovno to, chto vyrisovyvajetsja nechto nastol'ko grandioznoje, chto neponjatno, skol'ko narodu i vremeni vsjo eto potrebujet. Ili u Vas pod rukoj jest' hotja by s pjatok programmistov, kotoryje mogut zanjat'sja tol'ko etim projektom? A sistema podderzhki raznyh versij dokumenta (programmy) dlja sinhronizacii raboty kollektiva programmistov sushchestvujet. So vstrojennymi sredstvami otkata k predydushchim versijam i sravnenija versij. > i sgeneriruet dlja Vas "rabochee mesto vystavljal'shchika udarenij", gde Vy > nichem ne smozhete isportit' drugie elementy teksta A jesli, dopustim, stavja udarenija, ja obnaruzhil, chto s dannym konkretnym slovom problema iz-za opechatki? Chto togda delat'? M. G. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 04:45:42 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Programmnoe obespechenie -------------------------------------------------------------------------------- AGA wrote: > 1) proverka nalichija era i paerka v konce slov > > A kak erok mozhno vychislit' voobshche - ne ponimaju? Nash konverter ego > stavit > tol'ko v konce predlogov nad, bez i eshche kakikh-to pary shtuk, ukazannykh > vruchnuju v baze. Kak i vsjo ostal'noje: jesli v "obrazcovyh" tekstah jego upotreblenije imejet kakije-to zakonomernosti (tipa ukazannogo Vami spiska predlogov), to imi mozhno vospol'zovat'sja. > > 7) vstavka titl, prostykh i bukvennykh > > > Eto est' vse (khotja titly nebezoshibochny - esli nedlinnoe slovo titluetsja, > sluchaetsja takoe titlo uvidet' v seredine kakogo-to bol'shogo slova, gde > takoe zhe sochetanie bukv priluchilos'). U menja s etim kak raz problemy net (kak dopolnitel'nyje "bukvy" vnutri algoritma ispol'zujutsja markery nachala i konca slova). Ne lovjatsja skoreje sluchai, kogda dlja dannogo "slova bez titl" vozmozhny raznyje rasshifrovki: "dva" ili "ochi", naprimer. > > sdelat' perevod iz novoj orfografii v staruju. V principe > > ideja rabotaet, chislo oshibok udalos' dovesti do 1-2 > > A jati kak????!!!!!!!! Eto zh kruto!!!!!! Na jati kak raz samaja bol'shaja tablica pravil zamen potrebovalas'. (No dlja vosstanovlenije jatej v c.-sl. tekste nado budet delat' druguju, raz orfografija drugaja.) > > Dal'she delo upjorlos' > > v otsutstvie dostatochnogo kolichestva "obuchajushchego > > materiala" -- tekstov, nabrannykh v staroj orfografii.) > > Rekomenduju kompakt - tolkovyj slovar' Dalja. On ves' v staroj orfografii, i > materialu predostatochno. Naskol'ko znaju, Dal' ispol'zujet svoju "avtorskuju" orfografiju. A na etom kompakte tekst v kakom formate zapisan? P.S. Spasibo za "oblechennoje" udarenije. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 04:53:02 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk -------------------------------------------------------------------------------- AGA wrote: > > Prosvetite: chto eto takoje? (Ne prishljote li kusochek teksta s > > etimi znakami? -- DOC/Word6, DOC/Word97, ili sootvetstvujushchij RTF) > > > Tri tochki nesovershenno okruzheny, kak Tipikon eto opredeljaet. :-) V > irmologione simvoly, sootvetstvujushchie < > (sootv. levyj i pravyj znak). A > esli u vas irmologiona netu, to prisylat' RTF smysla net. Irmologion kak raz jest'. Tak chto prisylajte. > KSTATI: a zvezdochku dlja kanonarkhan'ja predusmotreli???!!!!! Eto uzhe ne > shesterichnyj znak, ee kartinkoj ne vkleish'! Nekaja zvjozdochka predusmotrena. Jesli zvjozdochki tozhe raznyje nuzhny -- zasskazhite i pokazhite. > > Davajte uzh (po krajnej mere sperva) sdelajem horoshuju sistemu > > dlja "formalizovannogo" jazyka -- c.-sl. po pechatnym knigam 19 veka. > > > Vozmozhno eto i pravil'no. No kak minimum staroobrjadcheskie osobennosti > vkljuchit' nado - togda paroj-trojkoj simvolov my rasshirjaem oblast' dejstvija > do 16-17 vekov, chto polezno. Da dazhe tut ne stol'ko vo vremeni delo, > skol'ko v prostranstve, sirech' staroobrjadchestve. Bol'shoj jus uzhe v HIP imejetsja, mehanizm podderzhki bol'shinstva teoreticheski vozmozhnyj vynosnyh bukv i bukvennyh titl -- tozhe. Chto jeshchjo? ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 04:56:50 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC6: Expert Software Shell -------------------------------------------------------------------------------- AGA wrote: > > Dajosh' Vsemirnyj Nauchto-Issledovatel'skij i Proektnyj Institut > > Sovershenstvovanija Standartivacii Specifikacij Sredstv Razrabotki > > Programm Avtomatizacii Kontrolja i Podderzhki Cerkovnoslavjanskih > > Tekstov! > > > > (mil' pardon) > > Za chto pardon? Ja ponjal tol'ko chast' akrostiha SSSR, > a dal'she chto imelos' v vidu? Pardon -- za glumlenije nad idejej. A SSSR tut sam voznik (eto ne ostrov, a kljaksa, nechajanno). ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 05:03:35 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Programmnoe obespechenie -------------------------------------------------------------------------------- Lev Tikhonov wrote: > > Vozmozhno eto gde-to eshche aktual'no,skazhem kogda kto-to v sovremennyj tekst > > > vstavljaet citaty v staroj orfografii itp. > > Vse realizuemo v ramkakh toj zhe modeli. Chem bol'she takikh primerov, tem > bol'she > uverennost' v ee pravil'nosti. Davaj eshche. Ljudi! Nu davajte ne buden vsjo zhe izobretat' universalj'nuju sistemu! Ne nado v HIP podderzhivat' sovremennyj tekst, latinicu i t. p. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 05:12:48 От: Mikhail Grinchuk Кому: "font-list@des-nt.tstu.ru" Тема: Otchjot o prodelannoj rabote -------------------------------------------------------------------------------- Konvertory RTF/Irmoligion <-> HIP uzhe gotovy (poka bez podderzhki kinovari). Vse teksty iz "Elisavety" tuda-sjuda uspeshno perevodjatsja. Prodolzhenije sledujet. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 06:52:12 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Programmnoe obespechenie -------------------------------------------------------------------------------- > Ljudi! Nu davajte ne buden vsjo zhe izobretat' universalj'nuju sistemu! > Ne nado v HIP podderzhivat' sovremennyj tekst, latinicu i t. p. > Тем более, что универсальная система уже есть- Unicode. Если все будет сделано правильно, можно будет в одном тексте сочетать ц.славянский с русским, финским и китайским не меняя шрифта. Вот только, быть может, придется пожертвовать Линейным письмом Б :) =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 09:50:39 От: "S. M. Hozainov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk -------------------------------------------------------------------------------- Приветствую, всех! Lev Tikhonov пишет: ----------------------------------------- ----- Original Message ----- From: Lev Tikhonov To: -=ORTHODOX-FONT=- Project Participants Sent: Friday, January 14, 2000 10:44 PM Subject: RFC2.1: Projekt IP - From Mikhail Grinchuk > ПРОЕКТ ИНВАРИАНТНОГО ПРЕДСТАВЛЕНИЯ ЦЕРКОВНОСЛАВЯНСКОГО ТЕКСТА (версия > вторая, уточненная и дополненная) > 2.3. Символы конца строки (я здесь считаю, что в конце строки стоит некое > абстрактное EOL, хотя "физически" это может быть и пара типа CR-LF), конца > страницы и конца файла не различаются. (Заменяем их все на EOL.) > 2.7. Два, три или большее число символов EOL подряд, то есть одна или более > пустых строк, не различаются и обозначают конец одного абзаца и начало > другого. (Сокращаем число подряд идущих символов EOL до двух.) Думаю, здесь есть опасность потерять концы абзацев, поскольку отсутствует символ однозначно конец абзаца определяющий. Был такой редактор -- Лексикон для DOS. В формате его файлов не было разницы между концом строки и абзаца. Да, конечно, можно было посоветовать наборщику отбивать абзац пустой строкой, но, если ошибку можно сделать, то всегда найдется тот кто ее сделает! Сколько нервов, времени и сил бездарно потрачено из-за таких текстов, сколько было написано разных утилит пытающихся разобраться в структуре файла и восстановить эти самые концы абзацев! А стоило автору Лексикона предусмотреть особый знак для конца абзаца и все было бы хорошо. . . > 2.5. Знак % обозначает начало комментария. Комментарием является > последовательность символов от символа % до ближайшего справа символа EOL, > ВКЛЮЧАЯ их оба. (Убираем комментарии -- при этом число строк, ясное дело, > уменьшается на число бывших комментариев, даже если комментарии были не во > всю строку.) Комментарий может быть многострочным, но не лучше ли для его выделения окружать его весь некоторыми символами (как скобками). В конце концов, файл -- это просто последовательность знаков. На строчки он бьется только на экране. > 2.8. Одиночный символ EOL эквивалентен пробелу. (Заменяем.) В результате А не может ли быть такой ситуации, когда перед EOL стоит знак переноса? С уважением, Сергей Михайлович Хозяинов. smh@mail.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 10:34:48 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC1.1: GLOSSARY -------------------------------------------------------------------------------- > Lev Tikhonov wrote: > > > > > > Mozhet byt', "tekst" i "fajl"? > > > > IMHO "fajl", konechno, variant, no eto slishkom mnogoznachnoje slovo. > > Tam, gde nejasno iz konteksta, mozhno utochnit': CS-fajl. Vsjo-taki > konkretneje, chem CS-dokument. Миша, то, что нам с Вами ясно, может быть вовсе не ясно человеку, только что присоединившемуся к проекту или читающему переписку по диагонали. Тогда уж надо - хотя бы на первых порах - употреблять термин ЦСфайл систематически. Везде, где это обусловленно смыслом. Обоснование: вот в той архитектуре, которую я предлагаю, если ее систематически провести, файла как такового не будет, то есть будет некое зашифрованное хранилище, не имеющее никакого смысла без УПО. А файл будет лишь результатом выдачи из УПО, отдаваемом в ответ на громкое "Колись!" Глеба Архангельского ;-) В то же время понятие ЦСфайл - одно из основных понятий во всей модели, и УПО с ними непрерывно имеет дело. Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 10:35:09 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Programmnoe obespechenie -------------------------------------------------------------------------------- > > > > sdelat' perevod iz novoj orfografii v staruju. V principe > > > ideja rabotaet, chislo oshibok udalos' dovesti do 1-2 > > > > A jati kak????!!!!!!!! Eto zh kruto!!!!!! > > Na jati kak raz samaja bol'shaja tablica pravil zamen potrebovalas'. > (No dlja vosstanovlenije jatej v c.-sl. tekste nado budet delat' > druguju, raz orfografija drugaja.) Почему? В этом как раз смысл моего предложения: работать поуровнево. Что мешает сначала текст конвертировать в дорев. орфографию, а потом текст в дорев. орфограции - в ЦСл? Тут ведь никакой неразберихи, совершенно линейное разбиение задачи на две подзадачи... Будет промежуточная точка для жесточайшего орфографического контроля.... > > > Dal'she delo upjorlos' > > > v otsutstvie dostatochnogo kolichestva "obuchajushchego > > > materiala" -- tekstov, nabrannykh v staroj orfografii.) > > > > Rekomenduju kompakt - tolkovyj slovar' Dalja. On ves' v staroj orfografii, i > > materialu predostatochno. > > Naskol'ko znaju, Dal' ispol'zujet svoju "avtorskuju" orfografiju. > > A na etom kompakte tekst v kakom formate zapisan? В картинках, если это не что-то совсем уж новое. Могу поспрошать одного знакомого, который года 3-4 назад был одержим идеей Даля в электронном виде. Он даже вроде бы имел на это спонсоров. Соберался распознавать тот компакт файнридером. Может, у него что и вышло Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 10:35:49 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Programmnoe obespechenie -------------------------------------------------------------------------------- > > > Vozmozhno eto gde-to eshche aktual'no,skazhem kogda kto-to v sovremennyj tekst > > > > > vstavljaet citaty v staroj orfografii itp. > > > > Vse realizuemo v ramkakh toj zhe modeli. Chem bol'she takikh primerov, tem > > bol'she > > uverennost' v ee pravil'nosti. Davaj eshche. Кстати, поясняю, как. Напускаем на _весь_ текст утилиту М. Гринчкуа, переводящую текст в старую орфографию. Макркируем нужные ц-сл. цитаты маркером "незалэжности" ;) или переводим их в комментарии. После чего запускаем тривиальный конвертер и опускаем текст до современной орфографии. Именно умение безошибочно решать такие задачи и должно быть признаком зрелости софта. Правда, для таких игр исходный текст должен быть проверенно русским, без, например, европейских словечек латиницей (это если Мишин конвертер не умеет сам их игнорировать). Следовательно, нужен еще валидатор, который перед каждой подобной автоматической операцией проверял бы текст на отсутствие к ней канонических препятствий. > Ljudi! Nu davajte ne buden vsjo zhe izobretat' universalj'nuju sistemu! > Ne nado v HIP podderzhivat' sovremennyj tekst, latinicu i t. p. Миша! Ты сам себе противоречишь! Сам же предлагал систему напрочь игнорируемых базовым софтом комментариев... Следовательно, наши питерцы, если пожелают, напишут "умный" софт, который эти вещи будет хранить в твоих комментариях, а по нужде (для выдачи, например) - использовать.... Кстати, и такую утилитку можно написать, которая всю латиницу автоматически загонит в комментарии, в любом формате. Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 10:35:56 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RFC7: Tags Utilizer -------------------------------------------------------------------------------- В связи с моим незнанием особенностей иных платформ, мое описание может быть ориентированно на программы под Windows в стиле VB. Предлагаю желающим корректировть этот документ для общности или _дописывать_ к нему концепции программ аналогичной функциональности для других сред и платформ. ----------------------------------------------- Итак, ГАП (см. последнюю версию RFC4) плодит в тексте альтернативные тэги, после чего текст фактически изменяет свой уровень, но для того, чтобы он был разблокирован для дальнейших манипуляций, он должен быть просмотрен оператором с помощью утилизатора тэгов. Простейший утилизатор тэгов - это программа, демонстрирующая оператору сплошной текст так, если бы в каждом альтернативном тэге была выбрана первая альтернатива. Все допускающие неоднозначность места (связанные с альтернативными тегами) закрашены, скажем, в зеленый цвет. Далее оператор может перемещаться по таким закрашенным единицам текста и либо подтверждать решение (текст становится черным), либо вызывать контекстное меню, предлагающее готовые альтернативы. Предлагается не сразу удалять альтернативные тэги, а делать это только по запросу на сохранение, поддерживая историю изменений и возможность в любом уже черном (исправленном) месте вновь вызвать зеленую подсветку и вновь предложить контекстное меню. (с) Л. Тихонов ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 10:41:01 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC6: Expert Software Shell & RFC4.1 - Vertical Software -------------------------------------------------------------------------------- > Lev Tikhonov wrote: > > > > > Umnaja programmnaja obolochka (UPO) > > > > > > > > UPO - eto programma ili kompleks programm, obespechivajushchaja... > > > > > > Dajosh' Vsemirnyj Nauchto-Issledovatel'skij i Proektnyj Institut > > > Sovershenstvovanija Standartivacii Specifikacij Sredstv Razrabotki > > > Programm Avtomatizacii Kontrolja i Podderzhki Cerkovnoslavjanskih > > > Tekstov! > > > > > > (mil' pardon) > > > > Misha! Chto Vam ne nravitsja? > > Rovno to, chto vyrisovyvajetsja nechto nastol'ko grandioznoje, > chto neponjatno, skol'ko narodu i vremeni vsjo eto potrebujet. > Ili u Vas pod rukoj jest' hotja by s pjatok programmistov, > kotoryje mogut zanjat'sja tol'ko etim projektom? См. ниже. Планирование должно быть, конечно, самым тщательным. А реализовавать можно только те части системы, которые нужны, в которых есть потребность на данном этапе. В противном случае, если поспешить - получится очередная закрытая "открытая система", на освоение которой большинству людей потребуется недюжинный запас доброй воли и решимости отказаться от всего предыдущего опыта. Таких проектов в мире тысячи, и много ли людей осчастливили они? Линух не осчастливил всех потребителей ОС, а только людей определенного склада, ТеХ не осчастливил всех издателей, а только опять же весьма ограниченный контингент. Мы же претендуем на создание системы, призванной осчастливить всех, работающих с ЦСл языком на PC, как минимум "взять мед со всех цветов" и всем им, в в свою очередь, помочь. Соответственно, но надо повторять старых немасштабируемых и негибких (или очень _специфически_ , вроде вот твоих комментариев, гибких) ошибок, иначе мы обречены на историческое поражение и останемся в конце концов со сверхсовершенной системой, круг потребителей которой вернее будет назвать сектой. [Я пишу не от книжек и не от журналов, а от личного опыта: сам работаю в организации - Свято-Тихоновском Институте - где информационая политика определяется приверженцами таких вот самопальных систем. В частности, системой управления базами данных - единственной и неповторимой - считается разработка очень хорошего и благочестивого 60-летнего профессора - личного друга о. Ректора. В результате вся информационная деятельность парализована, потому что никто не желает эту ЧУЧХЭ осваивать, да еще за ту нищенскую зарплату, которую платят в институте. А у того профессора и у неразбежавшихся пока что его 1,5-2,5 сотрудников просто не доходят руки ни до чего. Можешь вот посмотреть сайт института (ссылка с www.orthodoxy.ru, счетчик многократно накручен за счет того, что на всех институтских машинах туда стоят homepage). Зато у профессора при всем благочестии полно презрения к "малым сим", не умеющим работать с его системой, а работающим с мастдайным вордом и даже с акцесом. Все-таки несколько десятков человек из полутысячного персонала института - достаточно уверенные пользователи Windows, и многие готовы _работать_ в этой среде, а не только наступать друг другу на пятки, совместно и бестолково правя тексты. Но у руководства нет заинтересованности в организации такой работы, несмотря на готовность многих заниматься ей даже благотворительно. Руководство ожидает чудесного появления богатого спонсора, который профинансирует профессора, чтобы тот смог платить своим избранным и сверхумным сотрудникам и, наконец, занялся институтом. В результате - полный застой и отстой. Пойми правильно: я не призываю ни тебя, ни профессора, переходить на Windows. Я лишь хочу обратить твое внимание, что презрение к массам потенциальных помощников - это тревожный симптом, свидетельствующий о тупиковости затеи. Даже работая в той профессорской СУБД, при желании можно поставить дело так, чтобы экспортировать и импортировать внешние документы, работа с которыми не потребует знания ЧУЧХЭ. Но даже это никто не позаботился сделать, хотя справедливее было бы объединять подходы если не пропорционально числу приверженцев, то хотя бы равновесно, делая их равноправными и взаимозаменяемыми. Чего я и желаю нашему проекту.] Например, вот ты только что сделал конвертер Ирмологион <-> HIP. Огромное тебе спасибо. Но вот почему ты невольно его навязываешь? А ведь в Питере у Глеба тоже есть аналогичный конвертер... Почему бы не создать систему, которая предложит воспользоваться на выбор тем или другим, а еще интереснее - сразу обоими, а потом выбрать тот, чей результат лучше (особенно это относится к нетривиальным конвертерам)? Очевидно, не следует заставлять каждого оператора (а точнее - "Церковнославяниста-Компьютерщика Высшей Категории") держать в голове всю номенклатуру софта, уровней текста, все языковые грамматики и типографские правила .... Если ты такой гордый, что уверен в своих способностях - во первых это грех, а во вторых большинство людей _не таковы_, особенно _православных людей_ - это тоже факт, который я могу, к сожалению, засвидетельствовать. > A sistema podderzhki raznyh versij dokumenta (programmy) > dlja sinhronizacii raboty kollektiva programmistov sushchestvujet. > So vstrojennymi sredstvami otkata k predydushchim versijam > i sravnenija versij. И не одна, а множество. У меня вот на одном из Митинских компактов их аж пяток. Только хорошо было бы сделать специализированную систему, которой было бы не по барабану содержание ЦСфайлов, с которыми она имеет дело. > > i sgeneriruet dlja Vas "rabochee mesto vystavljal'shchika udarenij", gde Vy > > nichem ne smozhete isportit' drugie elementy teksta > > A jesli, dopustim, stavja udarenija, ja obnaruzhil, chto s dannym konkretnym > slovom problema iz-za opechatki? Chto togda delat'? Вот для этого-то вся и защита, чтобы ты чего-нибудь лишнего с недосыпу не обнаружил. Вся суть моей архитектуры состоит в том, что правка осуществляется не за один, за много проходов, чем более атомарных, тем лучше. Чем мельче шажки, тем легче пишется софт, асиистирующий оператору и даже подсказывающий ему правильный выбор. Но никто и не навязывает тебе требование писать все сразу на высшем уровне. Хорошо спроектированный мощный скелет для начала можно обростить очень тупым "мясом", с самыми простыми алгоритмами. Но если все сделано правильно - не составит большого труда по мере возникновения потребности разнообразить меню более интеллектуальными компонентами. На самом деле, даже базовая УПО тебе не позволит приступить к расстановке ударений до тех пор, пока в ней не будет стоять флажок "отстутствия опечаток". Этот флажок она сама, конечно, не поставит, но только по твоей команде, после того, как проверит текст всеми имеющимися у нее средствами валидации, да еще тебя переспросит. Следовательно, для всех опечаток, оставшихся после этой процедуры, существует _красный карандаш_. Или компьютерный его вариант, когда система переходит в незащищенное состояние и дает тебе полный доступ к тексту. Но я бы этот режим защитил административными правами, десятком психофизиологических тестов и IQ и даже добавил бы девайс в виде ГАИшной трубочки. ;-) Даже минимальная безинтеллектуальныя система расстановки ударений (если делать пакет программ в твоем стиле) для того, чтобы быть защищенной, должна лишь показывать тебе слово в контексте и предоставлять три клавиши: две стрелки туда-сюда и Enter для ввода. А хоть чуть-чуть интеллектуальная сама предложит ударение, и тебе останется лишь его подтвердить. А со временем, может быть и дойдут руки до по-настоящему интеллектуальной системы, которая в очевидных случаях расставит ударения сама. А если делать пакет в моей архитектуре, то следует писать ГАПы (см. RFC4.1), умеющие находить вероятные места для ударений и плодить альтернативные тэги, состоящие из нескольких слов на выбор. Таких ГАПов должно быть написано в конце концов много, но писаться они вовсе не обязаны все сразу, а лишь по мере возникновения потребности в каждом конкретном ГАПе. Например, ГАП, имеющий дело с чистым русским набором - не совсем тот же ГАП, что будет использован для достаточно продвинутого текста. Начинаем с того, который сейчас актуальнее - имхо это простой русский набор (хотя, если ты сделаешь повышалку в старую орфографию, то актуальнее будет уже она). Но все функции, которые могут быть повторно использованы - пихаем в некую hipaccents.dll, для того чтобы писатели последующих ГАПов не изобретали велосипед. Разумеется, в таком случае самый первый ГАП и dll должны проектироваться с особой тщательностью, зато написание последующего софта будет происходить легко и безболезненно, по готовым правилам и с готовыми библиотеками. А по поводу интерфейсной части каждого "защищенного" рабочего места - утилизатора тэгов - см. RFC7 Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 11:21:52 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Хранении метаинформации о состоянии текста -------------------------------------------------------------------------------- Если не полагаться на сверхумного всепомнящего гениального Старшего Оператора-Справщика Компьютерного Церковнославянизма - то совершенно необходимо где-нибудь хранить метаинформацию о состоянии каждого конкретного текста. В моей архитектуре пока предполагается хранить эту метаинформацию во внешнем по отношению к самим ЦСфайлам хранилище, Миша же, судя по всему, может предложить хранить ее в комментариях. Если эта информация будет формализованной и машинноинтерпретируемой - налицо еще один стандарт, требующий стандартизации -очередной вариант расширенногоHIP. Если же она будет описательной на человеческом языке - то это опять вариант записной книжки для гениев, и лично я займусь созданием частного стандарта для себя. Собственно, первичная роль УПО состоит в том, это единственный инструмент, умеющий читать и изменять метаинформацию о текстах, причем навязывающий довольно жестокий сервис и предпочитающий проверять пожелания оператора путем испытания текста всеми доступными валидаторами. Начинать проектировать УПО можно и не имея спнцификации для хранилища метаинформации, но рано или поздно такой стандарт тоже потребуется. Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 10:45:41 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Programmnoe obespechenie -------------------------------------------------------------------------------- ---------- > От: Mikhail Grinchuk > Кому: -=ORTHODOX-FONT=- Project Participants > Тема: Re: Programmnoe obespechenie > Дата: 16 января 2000 г. 4:45 > Kak i vsjo ostal'noje: jesli v "obrazcovyh" tekstah jego upotreblenije > imejet kakije-to zakonomernosti (tipa ukazannogo Vami spiska predlogov), > to imi mozhno vospol'zovat'sja. > Я вот не понимаю - если каких-то правил нету в сформулированном филологами виде, как их можно выцарапать из текстов? > Na jati kak raz samaja bol'shaja tablica pravil zamen potrebovalas'. > (No dlja vosstanovlenije jatej v c.-sl. tekste nado budet delat' > druguju, raz orfografija drugaja.) > Эта таблица, насколько я понимаю, не набор конкретных слов с ятями, а какие-то буквосочетания итп? Вообще поподробнее - как это организовано, желательно под отдельным сабжом. > Naskol'ko znaju, Dal' ispol'zujet svoju "avtorskuju" orfografiju. > Кажется она не касается ятей. > A na etom kompakte tekst v kakom formate zapisan? > А вот там забавно - я обнаружил только один файл, на это похожий Dal_s_0.dat (остальное - картинки и прочее постороннее), а он всего 40М. И екзешник еще 500К. Это что ж они, туда весь словарь запихали? Архангельский Г.А. СПб ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 10:56:42 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk -------------------------------------------------------------------------------- ---------- > От: Mikhail Grinchuk > Кому: -=ORTHODOX-FONT=- Project Participants > Тема: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk > Дата: 16 января 2000 г. 4:53 > Irmologion kak raz jest'. Tak chto prisylajte. > Что присылать-то? :-))) Я ж говорю - знаки "<",">". Ну я их могу конечно прислать в РТФ, но зачем? :-)))) > Nekaja zvjozdochka predusmotrena. Jesli zvjozdochki tozhe raznyje nuzhny -- > zasskazhite i pokazhite. > Главное чтобы не шестиконечная. :-) > > Bol'shoj jus uzhe v HIP imejetsja, mehanizm podderzhki bol'shinstva teoreticheski > vozmozhnyj vynosnyh bukv i bukvennyh titl -- tozhe. Chto jeshchjo? > Буква З в виде загогулины над строкой. А что значит "большинства" выносных букв? Какие непредусмотрены? Архангельский Г.А. СПб ЗЫ слушайте, отцы и братия, а чесо ради мне же мои же письма и приходят? Типа на полюбуйся чего ж ты там написал? А я их тут упорно удаляю, не говоря уж о том что с моим качеством связи лишний десяток писем - далеко не безобидное удовольствие. Нельзя ли с этим что-то сделать? Архангельский Г.А. СПб ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 11:26:41 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Programmnoe obespechenie -------------------------------------------------------------------------------- ---------- > От: Lev Tikhonov > Кому: -=ORTHODOX-FONT=- Project Participants > Тема: Re: Programmnoe obespechenie > Дата: 16 января 2000 г. 10:35 > В картинках, если это не что-то совсем уж новое. Нет, он там в виде текста. В шрифте Таймс Рашшн. Так что как минимум можно его в окошке выделять и копировать в буфер, хотя это и занудно. Архангельский Г.А. СПб ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 11:55:19 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk -------------------------------------------------------------------------------- Миша, отвечай по возможности здесь, а не прямо на письмо Сергея! > Сколько нервов, времени и сил бездарно потрачено из-за таких текстов, > сколько было написано разных утилит пытающихся разобраться > в структуре файла и восстановить эти самые концы абзацев! > А стоило автору Лексикона предусмотреть особый знак для конца абзаца > и все было бы хорошо. . . Если текст будет как правило изолирован от ручной правки, то с этим можно смириться. А если любопытные Глебы и всемудрые Михаилы все же частенько будут туда лазить ручками и давать такое право кому не попадя - я бы тоже предпочел перестраховаться путем введения дополнительного маркера абзаца. > Комментарий может быть многострочным, но не лучше ли для его выделения > окружать его весь некоторыми символами (как скобками). > В конце концов, файл -- это просто последовательность знаков. На строчки > он бьется только на экране. Миша уже согласился на эту идею, хотя она ему явно претит, как нам с Вами - комментарии в стиле ТеХ. Вот для того, чтобы никого не обижать, я и предлагаю ввести 1) basicHIP (без комментариев) и 2) расширенныйHIP - исторически первая система, предложенная Михаилом. Но мы в своей Вордовской кухне не будем обязаны ею пользоваться: мы вправе конвертировать расширенныйHIP в наш частный Вордовский стандарт, где формат комментариев будет иным и более удобным на наш взгляд. Но поскольку Мишин стандарт - самый уважаемый, то для того, чтобы он смог пользоваться нашими текстами, мы будем обязаны предоставить туда-сюда конвертеры из нашей системы в расширенныйHIP. Собственно, спор идет о словаре - что считать базовым HIP. Содержательно вопрос сводится к тому, нужно ли навязывать всем стандарт, для многих психологически дискомфортный. Мое решение: не нужно, а нужно просто вместо одного стандарта создать два. И каждый раз указывать, с чем работает та или иная программа: с basicHIP или с расширеннымHIP. > > 2.8. Одиночный символ EOL эквивалентен пробелу. (Заменяем.) В результате > > А не может ли быть такой ситуации, когда перед EOL стоит знак переноса? Присоединяюсь к вопросу. Наверное, нужно ввести запрет на переносы в HIP. HIP - это система хранения текста, а не издательская система. Хотя я бы предусмотрел _мягкие переносы_ - наверное, как еще одно расширение HIP, чтобы не уменьшить визуальную воспринимаемость basicHIP. > С уважением, > Сергей Михайлович Хозяинов. > > smh@mail.ru > ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 12:01:48 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Programmnoe obespechenie -------------------------------------------------------------------------------- Глебу > > > В картинках, если это не что-то совсем уж новое. > > Нет, он там в виде текста. В шрифте Таймс Рашшн. Так что как минимум можно > его в окошке выделять и копировать в буфер, хотя это и занудно. То есть он устанавливает в систему фонт Times Russian с ятями, "i десятичным" и ижицей? И из буфера обмена ты в другую программу можешь его вставить в том же совершенно читаемом виде? ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 12:32:49 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Re RFC3 и 5: Text Leveling & Classifying - М. Гринчуку - 1 -------------------------------------------------------------------------------- Здравствуйте, Михаил! Я отложил черновик ответа до понедельника, а Вы - возьми да появись сейчас. Нечестно-с! > > Na samom dele etot sintaksis sovershenno chuzheroden Wordovskoj ideologii, > > kotoraja voobshche ne myslit strokami. > > Voobshche govorja, eto uzhe privjazka k konkretnomu softu! > Pochemu Vy nastaivajete, chto HIP v Word nado konvertirovat' > SPERVA chitaja kak tekstovyj fajl i tol'ko POTOM preobrazuja? > Ved' vsegda mozhno sperva propuskat' cherez nekij fil'tr, kororyj > iz HIP sdelajet to, chto Vam udobneje. Да я с Вами аболютно согласен, ровно это и предлагаю, только призываю называть вещи своими именами: раз имеет место не один, а более стандартов, то так и следует говорить, и не просто говорить, а тщательно специфицировать каждый из них, чтобы у людей не было повода заниматься отсебятиной. > > Potomu ja i predlagaju vse zhe HIP s kommentarijami schitat' rasshireniem > > standartnogo IP, a problemu vzaimnoj konvertacii raznykh rasshirennyh IP > > schitat' samostojatel'noj chast'ju proekta. > > Ne to zhe li samoje: imejetsja HIP, v kotorom zadan format tol'ko > kommentarijev kak takovyh. A pod "rasshirennym HIP" ponimajetsja > kakaja-libo konkretnaja semantika VNUTRI kommentarijev. Не то же: см. ниже. При таком подходе нам неудобно. При другом подходе, который Вы, сморщившись, предложили - неудобно Вам. Люди все разные, особенно после Вавилонской башни. А современные быстрые и памятливые компьютеры позволяют поддерживать сколько угодно стандартов, занимаясь машинным переводом между ними. Лишь бы не было анархии, которая с неизбежностью наступит, если хоть что-то "оставить на потом". > Bojus', chto sejchas my ne smozhem vsjo vperjod uvidet' i predusmotret'. > Otsjuda i mojo "na potom". _Все_ предусмотреть не сможем, а расширяемую и гибкую систему спроектировать сможем, если, конечно, захотим. > > A predstav'te sebe raznye > > versii jazyka kommentariev. Kak vy budete markirovat' soft - "poluumnyj", > > "sverkhumnyj"? > > O markirovke rech' ne shla. V harakteristike softa, jestestvenno, nado > ukazyvat', kakije kommentarii on ponimajet. (A neponjatnyje kommentarii > on OBJAZAN ignorirovat'.) То есть речь идет опять-таки об описательной маркировке. См. мое письмо "Хранение метанформации". К софту это тоже относится. Я считаю, что формат метаинформации о софте также со временем подлежит стандартизации, чтобы сделать его машинно распознаваемым и чтобы умная оболочка смогла подсказывать оператору оптимальный вариант. > > Ne luchshe li imet' vozmozhnost' vposledstvii opisat' eti > > jazyki i prisvoit' sootvetstvujushchuju kvalifikaciju tem tekstam, > > gde oni upotrebljajutsja? I chtoby ideologija etogo opisanija byla ne vnov' > > izobretennoj dlja vnov' voznikshej nuzhdy, a toj zhe samoj, kotoruju my > > ispol'zuem dlja sozdanija bazovogo standarta... > > Vot! Raznyje-to vsjo zhe ne versii HIP, a versii jazyka kommentarijev. > S etim polnost'ju soglasen. No kak objazatel'noje trebovanije k softu > ja by postavil -- chtenije HIP-fajlov s ljubymi kommentarijami. ... при этом оформленными удобно для ТеХовцев, но вызывающими аллергию у людей, привыкших к Форточкам? Неужели это обязательно? А если я скажу, то мне были бы удобнее комментарии, оформленные как Вентурные сноски? Вас же это наверняка покоробит? А вентурщикам будет самое оно... Хотя конвертер между этими стандартами написать проще простого. [я вот посмотрел теперь на Ваше письмо по поводу тэгов и комментариев и увидел, что Ваше новое предложение теперь уже напоминает Вентуру или XML. Ну зачаем это вообще стандартизировать сейчас? Оставим ваши первоначальные комментарии как первый и пока единственный стандарт расширенного HIP)! Впоследствии желающие добавят новые стандарты и обеспечат их совместимость/конвертируемость в существующие...] Чтобы никому не было обидно, призываю не стандартизировать комментарии, особенно на базовом уровне. Естественно, мы - исповедающии ;) Ворд - обязуемся в первую очередь обеспечить поддержку Вашего формата комментариев, но также мы хотели бы, чтобы Ваш формат не был бы синтаксически обусловленным и предпочтительным, по сравнению, например, с форматом от Вентуры. Следовательно, я призываю из базового HIP убрать все, не являющееся собственно текстом. Естественно, первый же стандарт расширенного HIP, который мы собираемся поддерживать - это Ваш ТеХоподобный, но хотелось бы соблюсти политкорректность и в угоду ТеХовцам не обижать инаковерующих ;-) Можно сразу принять не один стандартHIP а два - базовый и расширенный, на этом этапе для нас ничего не меняется, но резервируется гибкость на будущее. > Kak pozhelanije k jazykam kommentarijev -- ne oboznachat' > po-raznomu odno i to zhe. Togda voobshche ne potrebujetsja > konvertorov mezhdu raznymi vozmozhnymi jazykami kommentarijev. > Prosto soft "ponjatnyje" mesta budet kak-to interpretirovat', > a neponjatnyje -- propuskat'. Так само собой, что не надо создавать лишних сущностей. Но вместо этого надо создавать "стыковочные отсеки" для сущностей, которые с большой вероятностью могут появиться. Скажем, объявится какой-нибудь фанат, который будет настаивать на своем языке комментариев и отказываться от сотрудничества, если мы не пойдем ему навстречу. Моя идеология предлагает ему зеленую улицу для присобачивания своего языка - лишь бы обеспечил конвертируемость, а следуя Вашей - увы, останется только заявить о принципиальной ограниченности нашего стандарта. > A chto kasajetsja konvertorov v HIP -- to chem bol'she oni > informacii smogut iz vjorstki izvlech' -- tem, navernoje, luchshe. Правильно, но это относится только к конвертеру в расширенный HIP (в Вашей терминологии - "умному" конвертеру). Но базовый, "глупый", конвертер - тоже имеет право на существование, и не ублюдочное, а полноценное. Тем более, что с точки зрения программной реализации первый - лишь надстройка над вторым. С уважением, Левъ ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 14:07:34 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Programmnoe obespechenie -------------------------------------------------------------------------------- ---------- > От: Lev Tikhonov > Кому: -=ORTHODOX-FONT=- Project Participants > Тема: Re: Programmnoe obespechenie > Дата: 16 января 2000 г. 12:01 > То есть он устанавливает в систему фонт Times Russian с ятями, "i > десятичным" и ижицей? Почему "десятичным"? > И из буфера обмена ты в другую программу можешь его вставить в том же > совершенно читаемом виде? > Совершенно верно. Только он его не устанавливает в систему, а как-то сам себе с компакта использует. Но на компакте лежит такой файлец таймс рашшн ттф, который я мило скопировал в виндоуз фонтс и в ворде наслаждался старой орфографией, хотя она мне и нафиг не нужна. :-) Ось тоби кусочек: :-) ОБРАЖRТЬ, образить что, или юж. обрњзить (ображенный), придавать чему ?бразъ, обдTлывать, выдTлывать вещь, образъ чего изъ сырья, отесывая или обихаживая припасъ инымъ способомъ. Камень сразу не образ?шь, надо походить около него. Обрњзь дTтокъ, кур. умой, одTнь. Это женщина неображ+ная, неряха. Уродство безобразитъ. Не воображай себя разумникомъ.. Школу переобразили. Обрњзить что, тмб. образ?ть, обдTлать, обработать; придать должный, красивый видъ, убрать, украсить; Естественно яти и буквы с ударениями превратились здесь в белиберду, а в ворде весьма симпатичны, даже начертание довольно красивое, на дореволюционное похоже. Архангельский Г.А. СПб > > > > > > ---------------------------------------------------------------------------- --- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 16:01:22 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: RFC2.1: Projekt IP - From Mikhail Grinchuk -------------------------------------------------------------------------------- Привет AGA, 15 января 2000 г., 0:23:14, ты писал: A> Вы мне еще скажите - когда автор нашего конвертера досюда доберется, ему A> можно будет все им пропущенное скопом прислать? http://orthodox.tstu.ru/font-list/font-list-arc.txt http://orthodox.tstu.ru/font-list/font-lis.zip Только хватит ли у него сил все это прочитать...? ;) Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 16:22:12 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Unicode - нужно ли стандартизировать? -------------------------------------------------------------------------------- Привет Lev, 15 января 2000 г., 6:40:43, ты писал: >> > Вы мне еще скажите - когда автор нашего конвертера досюда доберется, ему >> > можно будет все им пропущенное скопом прислать? >> >> И я о том давно прошу. Надо солидный сайт заиметь. Чтобы всяк желающий мог >> поставить на свою страницу кнопочку. LT> Нужно искать соответственный серверный софт для сайта, чтобы не линейно LT> сваливал все в кучу, а группировал обсуждения по тредам. В вебмастерстве я LT> лично - полный ламер. LT> А пока что - у меня все письма из этого списка складываются в отдельную LT> папочку, так что я могу их переслать желающим в любой момент. LT> 2Волков: А не позволяет ли eserv копить digest списка? Я вот знаю списки с LT> накопительными двойниками, рассылающимися пачками по сотне писем, или LT> письма, скажем, за неделю. Есерв позволяет программировать под него - практически все, что нужно. Возьмешься? ;) Я вам сразу сказал -- кто желает -- флаг в руки. Пойми, я не могу всем сразу заниматься, ночевать у компьютера и т.п. :) Любой, кто желает вести страницу, сообщай мне и я постараюсь создать условия. Пишите тексты, рисуйте картинки, оформляйте html. Если хотите читаемый веб интерфейс для архива сообщений - можете написать скрипт на Perl или C/C++(предпочтительнее) - формат списка, сохраненного батом, - на сайте. Если хотите динамический скрипт - мне не тяжело создать технический адрес и внести его в список рассылки. Пусть ваш скрипт находу формирует из него веб интерфейс. Только дело в том, что вы все пишите в разных кодировках, а письма от Алексея Гришина триклятущий swan.prod.itd.earthlink.net, который стоит у него на пути, вообще перекодирует в base64 :-( У кого есть желание - вперед, форматы я могу уточнить. Только боюсь, в конечном итоге, опять мне самому все делать придется :-( Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 16:34:27 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Otchjot o prodelannoj rabote -------------------------------------------------------------------------------- Привет Mikhail, 16 января 2000 г., 5:12:48, ты писал: MG> Konvertory RTF/Irmoligion <-> HIP uzhe gotovy (poka bez podderzhki MG> kinovari). Vse teksty iz "Elisavety" tuda-sjuda uspeshno perevodjatsja. MG> Prodolzhenije sledujet. Так присылай его сюды, положим на страничку. Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 16:39:29 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: Programmnoe obespechenie -------------------------------------------------------------------------------- Привет AGA, 16 января 2000 г., 10:45:41, ты писал: >> A na etom kompakte tekst v kakom formate zapisan? >> A> А вот там забавно - я обнаружил только один файл, на это похожий A> Dal_s_0.dat (остальное - картинки и прочее постороннее), а он всего 40М. И A> екзешник еще 500К. Это что ж они, туда весь словарь запихали? Если у тебя тот же компакт, что и у меня - то смотри внимательнее. Они его очень отвратно сделали -- там нет текста, они просто отсканировали дореволюционный словарь и в виде картинок поместили. :) Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 17:02:33 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: *** хамстерс проблемс -------------------------------------------------------------------------------- Привет Олл, У получателя hamster@lgg.ru явно сабж. Сегодня было 32 письма вот с таким содержанием: ERROR: Can't deliver. Fatal error. Original message follows: For: hamster@lgg.ru ........ стерто ... Я посмотрел темплоги - --------------------- SMTPSEND v3.0 beta 11 ----------------- forwardsystem@des-nt.tstu.ru!78535207!1 mail\out\forwardsystem@des-nt.tstu.ru!78535207!1 TO: hamster@lgg.ru lgg.ru: Empty MX list. Send to host directly: lgg.ru 220 aha.ru ESMTP CommuniGate Pro 3.2b8 HELO des-nt.tstu.ru 250 aha.ru is pleased to meet you MAIL FROM: 250 forwardsystem@des-nt.tstu.ru sender accepted RCPT TO: 571 hamster@lgg.ru we do not relay ERR:571 Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 16 янв 2000 18:45:17 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: *** хамстерс проблемс -------------------------------------------------------------------------------- Я нашел его рабочий адрес и послал ему приглашение. В понедельник придет на работу, авось чего-нибудь ответит. > -------------------------------------------------------------------------- ----- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 18 янв 2000 04:16:43 От: Mikhail Grinchuk Кому: "font-list@des-nt.tstu.ru" Тема: Test-W -------------------------------------------------------------------------------- Proverka svjazi kirillicej. Dolzhen poluchit'sja alfavit: ABVGD... abvgd... њ???????ћё???????АБВГДЕЖЗИЙКЛМНОП РСТУФХсЦЧШЩЪЫЬЭЮЯабвгдежзийклмноп Pros'ba soobshchit', chtitajetsja li on, ili net. (Sejchas napishu vtoroje podobnoje pis'mo, poslav chut' po-drugomu.) =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 18 янв 2000 04:19:07 От: Mikhail Grinchuk Кому: "font-list@des-nt.tstu.ru" Тема: Test-K -------------------------------------------------------------------------------- ABVGD... АБВГДЕ±ЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ abvgd... абвгдесжзийклмнопрстуфхцчшщъыьэюя (Eto tozhe dlja proverki svjazi.) =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 18 янв 2000 09:03:31 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Kommentarii i rasshirenija -------------------------------------------------------------------------------- Dobroje utro! Nekije rassuzhdenija o kommentarijah i rasshirjajemosti sistemy, a takzhe predlozhenija po formatu HIP. 1. Kommentarii. 1.1. Kommentarii (imenno kak kommentarii) polezny i v bazovom HIP-formate. Naprimer, pri konvertacii iz RTF/Irmologion v HIP udobno imet' spisok ispol'zovannyh shriftov, chtoby pri pojavlenii "chuzherodnogo" (ili prosto jeshchjo ne podderzhannogo) simvola mozhno bylo by ssylat'sja na ih nomera. 1.2. Jesli ne vvodit' kommentarii v bazovyj HIP, to jest' opasnost' nenarokom zadejstvovat' pod kakije-nibud' celi vse dostupnyje simvoly. 1.3. Mozhet byt', imet' dva sintaksisa dlja kommentarijev? Kak v C++, naprimer. Vozmozhnyj variant: %% .... EOL %{ .... } Pri etom v pervom sluchaje vnutri ne dolzhno byt' EOL. Vo vtorom -- znaka %, a vnutri figurnyje skobki nado ili sovsem zapretit', ili potrebovat' ih parnosti. Mozhno takije dva formata kommentarijev razdelit' i funkcional'no: skazhem, pervyj dlja kommentarijev kak takovyh, a vtoroj -- dlja zapisi sluzhebnoj informacii. Ili naoborot. 1.4. Psihologicheskoje zamechanije: podavljajushcheje bol'shinstvo moih znakomyh programmistov, pishushchih na C++, pochti vsegda ispol'zujut //...EOL-kommentarii, a ne /*...*/. Mozhet byt', iz-za togo, chto tak mozhno bezboleznenno zakommentarit' proizvol'nyj tekst. 1.5. Mozhet byt', ispol'zovat' sochetanije %- kak simvol mjagkogo perenosa. 1.6. Ispol'zovanije znaka % vne sluchajev iz punktov 1.3 i 1.5 schitajem oshibkoj. No v kakih-to vozmozhnyh rasshirenijah ih mozhno zadejstvovat' pod kakoj-nibud' tretij sintaksis kommentarijev. 2. Konec abzaca. 2.0. Logicheski tekst sostoit iz abzacev, a abzacy -- iz slov. Poetomy krome sobstvenno simvolov dlja zapisi slov nuzhny dva razdelitelja: razdelitel' abzacev i razdelitel' slov. Dva "logicheskih" razdelitelja rjadom stojat' ne mogut. No pri zapisi teksta v fajl sootvetstvujushchije oboznachenija mogut okazat'sja rjadom; pri etom dva odinakovyh razdelitelja slivajutsja v odin, a pri vstreche dvuh raznyh "mladshij" s'jedajetsja. V nachale i konce teksta razdeliteli ignorirujutsja. 2.1. Ne interpretirovat' pustuju stroku kak konec abzaca bylo by ochen' stranno. 2.2. No mozhno dopolnitel'no imet' i "javnuju" komandu konca abzaca. Naprimer, &{abzac} (sm. punkt 3.3). 2.3. "Vizual'no" pustaja stroka zametneje ljuboj komandy, no ne vygljadit chuzherodnoj vstavkoj v tekst. 2.4. Hochetsja, chtoby odinakovo vygljadjashchije na ekrane fajly oboznachali odno i to zhe. Poetomu "pustaja stroka" -- eto ne tol'ko para EOL+EOL, no i EOL+probel+tab+EOL, naprimer. 3. Rasshirenija sistemy. 3.1. Vse sushchestvennyje elementy CS-fajla (krome sobstvenno kommentarijev) mozhno razbit' na dva klassa: te, kotoryje otnosjatsja k tekstu (simvoly) i te, kotoryje vlijajut na vjorstku ("vneshnij vid krasivoj raspechatki"), no ne menjajut sam CS-tekst (komandy ustanovki kakih-nibud' parametrov). Dlja rasshirenija vtoroj gruppy predlagajetsja ispol'zovat' mehanizm kommentarijev. Dlja pervoj -- drugoj sintaksis. 3.2. Komanda "konec abzaca" otnositsja k pervoj gruppe, togda kak "mjagkij perenos" -- skoreje ko vtoroj: naprimer, %{-}. Iz-za potencial'noj chastoty etogo ob'jekta mozhno dazhe vvesti osobyj uproshchjonnyj sintaksis %- (punkt 1.5). 3.3. Vozmozhnyj sintaksis rasshirenija dlja pervoj gruppy: &{...}, gde vnutri skobok zapisano nazvanije simvola v alfavite HIP (bez diakritiki, no s vozmozhnymi probelami). Naprimer: &{abzac}, &{n s krjuchkom}, &{ligatura mju}, &{zelo zerkal'noje}, &{dvoje v chelne} (znak dlja raspeva), &{tri vrana} (chislovoj znak). Jesli my konvertirujem iz HIP i izvestno, chto sootvetstvujushchij simvol jest' v shriftah, to horosho by jego i ispol'zovat'; no v obshchem sluchaje nado by, po-vidimomu, pokazyvat' nazvanije "otkrytym tekstom" (mozhet byt', tak prjamo i konvertirovat', s simvolami "&", "{" i "}" -- po krajnej mere v kakom-to rezhime). 3.4. Logicheski raznica mezhdu &{...} i ?{...} takaja: v pervom sluchaje my znajem, chto za simvol imejetsja v vidu, no, mozhet byt', poka chto etot simvol v sisteme ne standartizovan i nazvanije problizitel'noje ili opisatel'noje. A vo vtorom sluchaje -- simvol sovershenno neizvestnyj, nechitajemyj ili somnitel'nyj. V chastnosti -- "al'ternativnuj teg". 4. Nadstrochnyje znaki v \-sintaksise. 4.1. Bazovyj nabor: \g \d \o \r \s \t -- bukvennyje titla, \ -- pajerok, \\ -- pustoj akcent. 4.2. Trivial'noje rasshirenije: \a \b \v ..., v tom chisle \z i \zh, o kotoryh neskol'ko raz vspominali. 4.3. No v kazhdom sluchaje iz ukazannyh vyshe ispol'zujetsja format "\" + odin simvol, i nachertanije (prosto bukva ili bukva s pokrytiem) vybirajetsja "po umolchaniju", v zavisimosti ot nadstrochnoj bukvy. 4.4. Dal'nejsheje rasshirenije: \{ ... } -- proizvol'nyj CS-tekst nad predydushchej bukvoj (v chastnosti, \{ou}, \{je} i \{ks} -- eto i imelos' v vidu, kak osobyje sluchai). Kombiniruja s &-mehanizmom, poluchajem prakticheski vsjo, chto ugodno, naprimer: \{&{dvoje v chelne}} -- "dvoje v chelne" kak nadstrochnyj znak \{d\{&{pokrytie}}}. -- "dobro" s pokrytiem kak nadstrochnyj znak \{o} -- vynosnaja bykva "on" (bez pokrytija) Rezjume: %% ... EOL (kommentarii ili komandy/parametry vjorstki) %{ ... } (kommentarii ili komandy/parametry vjorstki) %- (mjagkij perenos) &{abzac} (sinonim dlja dvojnogo EOL) &{ ... } (rasshirenije novymi znachkami) ?{ ... } (al'ternativnyje tegi i prochije nejasnyje mesta) \a \b \v ... (bol'shinstvo vynosnyh bukv/titl v "tipichnom" nachertanii) \{ ... } (proizvol'nyj nadstrochnyj ob'jekt) % pljus drugije simvoly -- sejchas zapreshcheno, na budushcheje -- kommentarii/komandy v novom sintaksise & pljus drugije simvoly -- sejchas zapreshcheno, na budushcheje -- novyje simvoly v novom sintaksise Dlja &{abzac} mozhno vzjat' i drugoje nazvanije ili dazhe sokratit' do "osobogo" sintaksisa bez skobok tipa "&a" ili "&/". (Predlozhenija?) V bazovyj HIP ja by vkljuchil hotja by odin vid kommentarijev (jesli %{...}, to s zapretom na "%", "{" i "}" vnutri), komandu %- i minimal'noje kolichestvo dobavochnyh titl. M. G. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 18 янв 2000 09:17:07 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk -------------------------------------------------------------------------------- S. M. Hozainov wrote: > A stoilo avtory Leksikona predusmotret' osobyj znak dlja konca abzaca > i vsjo bylo by horosho... V ChiWriter'e eto bylo. No jesli by naborshchiki etim pravil'no pol'zovalis'... > A ne mozhet li byt' takoj situacii, kogda pered EOL stoit znak perenosa? Logichneje vsego schitat' takoj fajl ne vpolne korrektnym predstavlenijem teksta. V luchshem sluchaje etu situaciju mozhno skonvertirovat' v ?{%- -}, to jest' al'ternativnyj teg: to li mjagkij perenos, to li defis. Prichjom dovol'no chasto v rezul'tate pereformatirovanija "razorvannoje" slovo mozhno uvidet' i vnutri stroki. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 18 янв 2000 09:22:46 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Programmnoe obespechenie -------------------------------------------------------------------------------- Lev Tikhonov wrote: > > Na jati kak raz samaja bol'shaja tablica pravil zamen potrebovalas'. > > (No dlja vosstanovlenije jatej v c.-sl. tekste nado budet delat' > > druguju, raz orfografija drugaja.) > > Pochemu? (...) Chto meshajet snachala tekst konvertirovat' v dorev. orfografiju, > > a potom (...) - v CSl? Potomu chto "dorev." jati i "CSl" jati podchinjajutsja raznym pravilam i voobshche otnosjatsja k raznym jazykam. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 18 янв 2000 09:29:53 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Programmnoe obespechenie -------------------------------------------------------------------------------- Lev Tikhonov wrote: > > Ljudi! Nu davajte ne buden vsjo zhe izobretat' universalj'nuju sistemu! > > Ne nado v HIP podderzhivat' sovremennyj tekst, latinicu i t. p. > > Misha! Ty sam sebe protivorechish'! Sam zhe predlagal sistemu naproch' > ignoriruemykh bazovym softom kommentariev... Analogija: jesli ja v kommentarijah k TeXovskomu fajlu napishu 16-richnyj damp kakogo-nibud' MPEG, to eto znachit, chto TeX podderzhivajet MPEG? ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 18 янв 2000 10:04:28 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC6: Expert Software Shell & RFC4.1 - Vertical Software -------------------------------------------------------------------------------- Lev Tikhonov wrote: > My zhe pretenduem na sozdanie sistemy, prizvannoj oschastlivit' > vsekh, rabotajushchikh s CSl jazykom na PC, kak minimum "vzjat' med so vsekh > cvetov" > i vsem im, v v svoju ochered', pomoch'. Skereje, poka chto my pytajemsja razrabotat' formu zapisi, udobnuju imenno kak apparatno-nezavisimoje predstavlenije teksta. Popytki srazu podderzhat' eto predstavlenije kakim-to softom -- skoreje, element nashej propagandy (jesli budete rabotat' s nashim predstavlenijem, to poluchite takije i sjakije poleznyje vozmozhnosti). I prostoj i otkrytyj format nuzhen dlja togo, chtoby legko bylo pisat' novyj soft, ne zavisja ni ot MS, ni ot nas s Vami. > Naprimer, vot ty tol'ko chto sdelal konverter Irmologion <-> HIP. (...) > No vot pochemu ty nevol'no ego navjazyvaesh'? A ved' v Pitere u > Gleba tozhe est' analogichnyj konverter... Pochemu by ne sozdat' sistemu, > kotoraja predlozhit vospol'zovat'sja na vybor tem ili drugim, a eshche > interesnee - srazu oboimi, a potom vybrat' tot, chej rezul'tat luchshe > (osobenno eto otnositsja k netrivial'nym konverteram)? Kto zh protiv sistemy? No: 1) Paru konvertorov napisat' vo mnogo raz proshche, chem sistemu. 2) Pust' komponenty budut polezny i sami po sebe. > Esli ty takoj gordyj, chto uveren v svoikh sposobnostjakh - vo pervykh eto > grekh, > a vo vtorykh bol'shinstvo ljudej _ne takovy_, osobenno _pravoslavnykh ljudej_ - > eto tozhe fakt, kotoryj ja mogu, k sozhaleniju, zasvidetel'stvovat'. Tak ja kak raz i bojus', chto na bol'shuju sistemu nikakih sposobnostej ne hvatit! (Mezhdu prochim, voznikla ideja: sama po sebe razrabotka bol'shoj sistemy podderzhki c.-sl. tekstov -- vpolne dostojnyj projekt; pochemu by ne poprobovat' podat' zajavku takogo roda v RGNF ili RFFI? Gljadish', i na laboratoriju mozhno budet naskresti...) > Takikh GAPov dolzhno byt' napisano v konce koncov mnogo, no pisat'sja oni vovse > ne objazany vse srazu, a lish' po mere vozniknovenija potrebnosti v kazhdom > konkretnom GAPe. Naprimer, GAP, imejushchij delo s chistym russkim naborom - ne > sovsem tot zhe GAP, chto budet ispol'zovan dlja dostatochno prodvinutogo teksta. > > Nachinaem s togo, kotoryj sejchas aktual'nee - imho eto prostoj russkij nabor > (khotja, esli ty sdelaesh' povyshalku v staruju orfografiju, to aktual'nee budet > > uzhe ona). No vse funkcii, kotorye mogut byt' povtorno ispol'zovany - pikhaem > v nekuju hipaccents.dll, dlja togo chtoby pisateli posledujushchikh GAPov ne > izobretali velosiped. Razumeetsja, v takom sluchae samyj pervyj GAP i dll > dolzhny proektirovat'sja s osoboj tshchatel'nost'ju, zato napisanie > posledujushchego > softa budet proiskhodit' legko i bezboleznenno, po gotovym pravilam i s > gotovymi bibliotekami. Nikogda ne delal *.dll, a potomu vopros: chem eto luchshe/proshche/udobneje po sravneniju s naborom standalone-utilit, jedinoobrazno napisannyh, ispol'zujushchih odni i te zhe funkcii HIP-vvoda/vyvoda i odno i to zhe predstavlenije teksta v pamjati, i dostupnyh vmeste s ishodnymi tekstami? ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 18 янв 2000 14:57:12 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC6: Expert Software Shell & RFC4.1 - Vertical Software -------------------------------------------------------------------------------- ---------- > От: Mikhail Grinchuk > Кому: -=ORTHODOX-FONT=- Project Participants > Тема: Re: RFC6: Expert Software Shell & RFC4.1 - Vertical Software > Дата: 18 января 2000 г. 10:04 > pochemu by ne poprobovat' podat' zajavku takogo roda v RGNF > ili RFFI? Gljadish', i na laboratoriju mozhno budet naskresti...) > Що цэ таке? > Potomu chto "dorev." jati i "CSl" jati podchinjajutsja raznym pravilam > i voobshche otnosjatsja k raznym jazykam. > Ой ли?? А Гаманович глаголет, что для ятей все те же правила, что и в русском. А алфавиты вроде как дошли даже - пора бы уже с японского языка на русский переходить. :-) Архангельский Г.А. СПб ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 18 янв 2000 16:18:55 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC6: Expert Software Shell & RFC4.1 - Vertical Software -------------------------------------------------------------------------------- Доброе утро! AGA wrote: > > pochemu by ne poprobovat' podat' zajavku takogo roda v RGNF > > ili RFFI? Gljadish', i na laboratoriju mozhno budet naskresti...) > > > Що цэ таке? РГНФ -- Российский Гуманитарный Научный Фонд РФФИ -- Российский Фонд Фундаментальных Исследований Как подавать заявки и в какие сроки, регулярно пишет газета "Поиск". Наверняка и сайты у этих фондов есть. > > Potomu chto "dorev." jati i "CSl" jati podchinjajutsja raznym pravilam > > i voobshche otnosjatsja k raznym jazykam. > > > Ой ли?? А Гаманович глаголет, что для ятей все те же правила, что и в > русском. Приблизительно те же, но вроде бы все же не на 100 процентов. (Это надо с текстом в руках проверять.) Например, в русском дореформенном правописании не было "всеобщего" окончания -jьхъ (с ятем) -- оно осталось лишь в словах тjьхъ и всjьхъ, если правильно помню. А для ц.-сл. нужна универсальная замена. > А алфавиты вроде как дошли даже - пора бы уже с японского языка на русский > переходить. Вот пробую... Хотя письма с алфавитами ко мне вернулись так, что без проблем читать их не получается. М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 18 янв 2000 17:27:50 От: postmaster Кому: Mikhail Grinchuk Тема: Re: Test-K -------------------------------------------------------------------------------- Привет Mikhail, 18 января 2000 г., 4:19:07, ты писал: MG> ABVGD... АБВГДЕ±ЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ MG> abvgd... абвгдесжзийклмнопрстуфхцчшщъыьэюя MG> (Eto tozhe dlja proverki svjazi.) В ISO кодировке прекрасно читается. Ты попробуй не алфавит, а смысловые предложения написать. Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 18 янв 1999 17:05:01 От: "Kirill A. Loginov" Кому: font-list@orthodox.tstu.ru Тема: -------------------------------------------------------------------------------- Здравствуйте! Меня зовут Кирилл Логинов( представляюсь т.к. впервые пишу в эту конференцию ). Я уже довольно давно занимаюсь написанием конвертера текста из гражданской орфографии в ЦС(beta версию которого могу выслать кому угодно). Поэтому выработка единого стандарта для ЦС текстов меня очень интересует. То, что у меня уже есть работает в следующим образом: (RTF либо DOS text)-->(RTF+Irmologion). C уважением. IF YOU CAN'T READ MY LETTER IN RUSSIAN, PLEASE TELL ME. IT MAY BE A PROBLEM WITH MY PROVIDER & KOI-8R. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 18 янв 2000 17:32:00 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: читабельность у Mikhail Grinchuk -------------------------------------------------------------------------------- Привет Mikhail, 18 января 2000 г., 16:18:55, ты писал: >> А алфавиты вроде как дошли даже - пора бы уже с японского языка на русский >> переходить. MG> Вот пробую... Хотя письма с алфавитами ко мне вернулись так, что MG> без проблем читать их не получается. Граждане, ставьте на его письма ISO-8859-5. Не знаю, как у вас, у меня в ней все читается. Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 18 янв 2000 17:35:51 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: -------------------------------------------------------------------------------- Привет Kirill, 18 января 1999 г., 17:05:01, ты писал: KAL> Я уже довольно давно занимаюсь написанием конвертера текста из гражданской KAL> орфографии в ЦС(beta версию которого могу выслать кому угодно). Присылай мне, вместе с докой, я положу ее на нашу страничку. KAL> IF YOU CAN'T READ MY LETTER IN RUSSIAN, PLEASE TELL ME. KAL> IT MAY BE A PROBLEM WITH MY PROVIDER & KOI-8R. У меня твое письмо прочиталось только в IBM/866-DOS кодировке, не знаю как у других. Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 18 янв 2000 19:09:31 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: -------------------------------------------------------------------------------- Привет Кирилл! А у меня никак не читается. Как Ваш новый монитор? Алексей Гришин ----- Original Message ----- From: Kirill A. Loginov To: Sent: Monday, January 18, 1999 9:05 AM > ‡¤Ю ўАБўЦ©БҐ! > ЊҐ­О §®ўЦБ ЉЁЮЁ«« ‹®ёЁ­®ў( ЇЮҐ¤АБ ў«ОНАЛ Б.Є. ўЇҐЮўКҐ ЇЁХЦ ў МБЦ > Є®­ДҐЮҐ­ФЁН ). > џ Ц¦Ґ ¤®ў®«Л­® ¤ ў­® § ­Ё¬ НАЛ ­ ЇЁА ­ЁҐ¬ Є®­ўҐЮБҐЮ  БҐЄАБ  Ё§ ёЮ ¦¤ ­АЄ®© > ®ЮД®ёЮ ДЁЁ ў –‘(beta ўҐЮАЁН Є®Б®Ю®ё® ¬®ёЦ ўКА« БЛ Є®¬Ц Цё®¤­®). > Џ®МБ®¬Ц ўКЮ Ў®БЄ  Ґ¤Ё­®ё® АБ ­¤ ЮБ  ¤«О –‘ БҐЄАБ®ў ¬Ґ­О ®ГҐ­Л Ё­БҐЮҐАЦҐБ. > ’®, ГБ® Ц ¬Ґ­О Ц¦Ґ ҐАБЛ Ю Ў®Б ҐБ ў А«Ґ¤ЦНИЁ¬ ®ЎЮ §®¬: > (RTF «ЁЎ® DOS text)-->(RTF+Irmologion). > C Цў ¦Ґ­ЁҐ¬. > IF YOU CAN'T READ MY LETTER IN RUSSIAN, PLEASE TELL ME. > IT MAY BE A PROBLEM WITH MY PROVIDER & KOI-8R. > > > > -------------------------------------------------------------------------- ----- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru > > ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 18 янв 2000 22:39:58 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: -------------------------------------------------------------------------------- ---------- > От: Kirill A. Loginov > Кому: font-list@orthodox.tstu.ru > Тема: > Дата: 18 января 1999 г. 17:05 > > IF YOU CAN'T READ MY LETTER IN RUSSIAN, PLEASE TELL ME. > IT MAY BE A PROBLEM WITH MY PROVIDER & KOI-8R. > Only using recorder, but I couldn't understand what kodirovka it was. Maybe Grishin knows how to take this information from the recorder? And what is the English for kodirovka? :-) Архангельский Г.А. СПб ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 18 янв 2000 22:41:35 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: читабельность у Mikhail Grinchuk -------------------------------------------------------------------------------- ---------- > Ют: postmaster > Ъюьу: -=ORTHODOX-FONT=- Project Participants > вхьр: читабельность у Mikhail Grinchuk > Фртр: 18 яэтрря 2000 у. 17:32 > > Привет Mikhail, > > 18 января 2000 г., 16:18:55, ты писал: > Zato u mena tvoe pismo chitaetsa tolko v recordere. Lavri Kirilla Loginova pokoya ne dajut? :-) Ррхрэухыьсъшщ У.Р. бЯс ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 19 янв 2000 02:00:11 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: SlavTeX, other TeX system and platforms -------------------------------------------------------------------------------- Hi All, Пробовал ли кто-нибудь ставить SlavTeX под Unix'ом (tetex-1.0.6 или 1.1)? Или вообще в чем-либо, отличном от emTex'а? Тут была информация еще об одном способе верстки ц.с. в TeX'е. Можно ли на нее посмотреть? Спасибо. Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 19 янв 2000 12:08:26 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: SlavTeX, other TeX system and platforms -------------------------------------------------------------------------------- ну я подключал SlavTeX к teTeX. никаких проблем нет: любые TeXовские пакеты не зависят от платформы, и могут быть подключены куда угодно (если в них не используются нестандартные расширения) ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 20 янв 2000 19:35:20 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: все нормально? -------------------------------------------------------------------------------- Привет All, все ли нормально? То по двадцать писем в день шло, то пусто? До вас письма-то доходят? Полный архив писем см. -- http://orthodox.tstu.ru/font-list/font-list-arc.txt http://orthodox.tstu.ru/font-list/font-lis.zip =postmaster ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 20 янв 2000 19:46:52 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: все нормально? -------------------------------------------------------------------------------- Да вот и неясно - писать или нет? Жив ли сервер? И.тд. Алексей > Привет All, все ли нормально? > То по двадцать писем в день шло, то пусто? > До вас письма-то доходят? > Полный архив писем см. -- > http://orthodox.tstu.ru/font-list/font-list-arc.txt > http://orthodox.tstu.ru/font-list/font-lis.zip > > =postmaster > > > > -------------------------------------------------------------------------- ----- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru > > ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 20 янв 2000 19:58:44 От: postmaster Кому: -=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: все нормально? -------------------------------------------------------------------------------- Привет AG, 20 января 2000 г., 19:46:52, ты писал: A> Да вот и неясно - писать или нет? Жив ли сервер? И.тд. Сервер-то жив -- вот, я за ним сижу. Да и в принципе -- как же не жив, если это письмо до тебя дошло? ;-) Убери, кстати, из своего заголовка вот это- Reply-To: "AG" Мешает при ответе. =postmaster =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 20 янв 2000 20:49:19 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Ц.С. в Юникоде -------------------------------------------------------------------------------- Hi All, Раз уж никто не пишет, пошлю всем большой attachment. Я попробовал на досуге разложить церковнославянские буквы и диакритики по разным, вроде как соответсвующим по смыслу страницам Юникода. В предположении, что никакой особой страницы для Ц.С. не будет. Ничего особенно хорошего в том, что у меня получилось, я не нахожу, за исключением того, что набранный таким образом текст можно будет посмотреть с помощью любого стандартного шрифта (если в тем, конечно, представлены все символы, как, например, в Lucida Sans Unicode). Главный недостаток такого расположения в том, что отображение FontName -> FontName Cyr делается только для страницы Cyrillic. Остальные символы для программ старого поколения пропадают. Конечно, можно все нужные нам символы расположить на этой странице - места более чем достаточно. Но тогда это ничем не лучше того, что дает утилита ttfconv. Пример: Izhitsa CSU. Вордовский док у меня дома остался, т.к. я не собирался сегодня это посылать, но постскрипт есть. (маленькая добавка к комментариям к тесту: все диакритики изображены в форме "a+значок", вместо "а" может быть иной подходящий для наглядности символ. Сосредоточены они в моем тексте полностью на соответсвующей странице. Все остальные символы в приведенной таблице полагаются "цельными") С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 00:34:14 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- "AVV" == Alexander V Voinov writes: AVV> Я попробовал на досуге разложить церковнославянские буквы и AVV> диакритики по разным, вроде как соответсвующим по смыслу AVV> страницам Юникода. В предположении, что никакой особой страницы AVV> для Ц.С. не будет. Ничего особенно хорошего в том, что у меня AVV> получилось, я не нахожу, за исключением того, что набранный AVV> таким образом текст можно будет посмотреть с помощью любого AVV> стандартного шрифта (если в тем, конечно, представлены все AVV> символы, как, например, в Lucida Sans Unicode). Главный AVV> недостаток такого расположения в том, что отображение FontName AVV> -> FontName Cyr делается только для страницы Cyrillic. Остальные AVV> символы для программ старого поколения пропадают. Конечно, можно AVV> все нужные нам символы расположить на этой странице - места AVV> более чем достаточно. Но тогда это ничем не лучше того, что дает AVV> утилита ttfconv. Пример: Izhitsa CSU. AVV> Вордовский док у меня дома остался, т.к. я не собирался сегодня AVV> это посылать, но постскрипт есть. (маленькая добавка к AVV> комментариям к тесту: все диакритики изображены в форме AVV> "a+значок", вместо "а" может быть иной подходящий для AVV> наглядности символ. Сосредоточены они в моем тексте полностью на AVV> соответсвующей странице. Все остальные символы в приведенной AVV> таблице полагаются "цельными") Я бы посоветовал Вам изучить "страницу unicode", посвященную кириллице. Взять ее можно на сайте ftp.unicode.org, файл называется UnicodeData-x.x.x.txt, где x.x.x --- номер версии (сейчас уже есть 3.0.0-beta). Также можно просмотреть таблицу на www.unicode.org. Вы там обнаружите и Фиту, и Ижицу, и Ять, и Юсы, и От, и т.п., причем во вполне конкретных кодовых позициях. И нет смысла распихивать их по греческим буквам, или, скажем помещать глиф "оу" на место символа "short u". То, что Вы прислали, не имеет смысла, т.к. во первых это уже давно сделано (хотя возможно, но вряд ли, понадобятся дополнения), во-вторых, совмещать разнородные символы (скажем греческие и кириллические) в одном слоте (коде) не имеет никакого смысла, а в-третьих, нужно отдавать отчет, что в unicode регистрируются символы, а не глифы, а поэтому там нет места таким вещам, как "оу" (глиф буквы "у", используемый при употреблении ее в начале слова), и т.п. [эти вопросы принадлежат к кодировке шрифтов (которая должна быть расширением unicode)]. Кроме того. Очевидно, никто не будет регистрировать под ц.-сл. отдельную "страницу unicode". в unicode УЖЕ зарегистрированы ц.-сл. символы. Best regards, -- Vladimir. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 01:07:14 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- Vladimir Volovich wrote: > Я бы посоветовал Вам изучить "страницу unicode", посвященную > кириллице. Взять ее можно на сайте ftp.unicode.org, файл называется > UnicodeData-x.x.x.txt, где x.x.x --- номер версии (сейчас уже есть > 3.0.0-beta). А есть где-нибудь пример шрифта, иллюстрирующего все эти символы? Или какого-нибудь более подробного их описания. Во всяком случае букво-титл я там сходу не заметил. И вообще, для чего тогда отдельная страница диакритиков, если национальные страницы их переопределяют? Еще вопрос про Юникод, который я давно хочу задать. Имеет ли это отношение только к шрифтам TrueType, или и Type 1 тоже возможен? Скорее всего, это вопрос о конкретных интерпретаторах постскрипта, но пользователю это неважно: важно знать, можно ли конкретный текст распечатать на постскриптовском принтере с учетом преимуществ Type 1, или нет? Fontographer, который у меня есть, умеет работать только с символами <255. Иначе ломается. А FCP, который мне недавно подарили (еще раз спасибо), создает только TTF. Что печально. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 01:18:58 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- "Alexander V. Voinov" wrote: > > Vladimir Volovich wrote: > > Я бы посоветовал Вам изучить "страницу unicode", посвященную > > кириллице. Взять ее можно на сайте ftp.unicode.org, файл называется > > UnicodeData-x.x.x.txt, где x.x.x --- номер версии (сейчас уже есть > > 3.0.0-beta). > > А есть где-нибудь пример шрифта, иллюстрирующего все эти символы? Или > какого-нибудь более подробного их описания. Во всяком случае букво-титл > я там сходу не заметил. Посмотрел я, наконец-то (раньше, почему-то мне было туда не попасть, то ли мой провайдер имел проблемы, то ли их), на http://charts.unicode.org/Unicode.charts/normal/U0400.html#Glyphs. Вызывает больше недоумений чем разрешает. Конечно, хорошо, что хоть какие-то буквы там есть, но нужно еще десятка два разместить, похоже. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 04:49:14 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- > http://charts.unicode.org/Unicode.charts/normal/U0400.html#Glyphs. > Вызывает больше недоумений чем разрешает. Конечно, хорошо, что хоть > какие-то буквы там есть, но нужно еще десятка два разместить, похоже. В этом все дело и заключается. Может и не двадцать, но все равно много. Нет места для стольких глифов в кириллической юникодовой странице. А если и как-то их туда упихать, то не будет резервных мест для прочих теоретически возможных знаков, употребимых в языках, пользующихся кириллицей. Выхода есть два. Либо размещать глифы в пользовательских кодах, либо "проталкивать" церковно-славянскую страницу. Естественно, надо начинать со второго варианта и лишь в ситуации полного неприятия этой идеи со стороны официальной юникодовой общественности сделать им всем козью морду (пардон за грубость) и нагло воспользоваться для нужд славянщины "чужим" участком Юникода. Тут вот уже предлагали вывести под это дело в расход Линейное Письмо Б. Есть и другие варианты. И мы потом еще посмотрим, какой язык нужнее. Я уже не раз указывал на то, что самые экзотические языки получают место под солнцем в Юникоде. Если мы докажем, что для правильного отображения церковнославянского необходимо выделить отдельную страницу, авось чего и выйдет. А еще мое мнение таково, что чем скорее мы поднимем вопрос об отдельной странице, тем лучше. У меня сложилось впечатление, что пока строгость правил стардарта Unicode искупается необязательностью следования им. Я в этих правилах, конечно, не особый знаток. Тем не менее, припоминаю, что не поощряется дублирование глифов, которое встречается однако сплошь и рядом. Так что можно и проскочить на этой волне с церковнославянской азбукой, пока на такие вещи смотрят сквозь пальцы. Кстати, Александр, если проблема лицензионной чистоты программных продуктов Вас не слишком волнует, то вопрос с надлежащим ПО для работы с разными типами шрифтов решается очень просто. И Вам, как корифею компьютерной славянщины непременно нужно поучаствовать в создании опытного образца шрифта, соответствующего вырабатываемому здесь стандарту. С уважением, Алексей Гришин =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 08:50:56 От: "Lev Tikhonov" Кому: "OlegL" , "-=ORTHODOX-FONT=- Project Participants" Тема: Fw: Hа тему пpогpаммиpования -------------------------------------------------------------------------------- ----- Original Message ----- From: "Akzhan Abdulin" Newsgroups: fido7.ru.delphi.info Sent: Friday, January 21, 2000 8:43 AM Subject: Hа тему пpогpаммиpования > * ----------------------------- > * Forwarded by Akzhan Abdulin (2:5040/55) > * Area: NICE.SOURCES.D (NICE.SOURCES.D) From: Sergey Akhapkin, > 2:5030/740.12@fidonet (20 Jan 00 02:04) To: All > * Subj: Hа тему пpогpаммиpования > * > Пpивет All! > > ============================================================================ > (Компьютеp Пpесс, Май 1995) > МАКСИМЫ. > Аpкадий Моpейнис > ============================================================================ > Вместо пpедисловия : > Пpи планиpовании pазpаботок нужно учитывать тpи пеpеменные: цель, деньги и > сpоки. > Если известны цель и деньги, отпущенные на pазpаботку, то неизвестно, сколько > вpемени она потpебует. > Если известны цель и сpоки, то неизвестно, сколько денег потpебуется для > завеpшения pабот. > Если известны сpок и количество денег, то непонятно, что получится в > pезультате. > Если известны все тpи составляющие, то эта задача вообще не относится к сфеpе > pазpаботок. > Один из законов Меpфи > ============================================================================ > То, что вы будете сейчас читать - не совсем статья. Скоpее это набоp некотоpых > высказываний, котоpые я повтоpял окpужающим меня pазpаботчикам настолько часто, > что выучил их наизусть. Источник появления всех этих высказываний понятен: > пpогpаммиpование вообще отличается от пpомышленного пpогpаммиpования точно так > же, как отличается бег тpусцой от спpинтеpского забега. В одном случае важен > пpоцесс, а в дpугом pезультат. > Твой бог - это готовый пpодукт. Твоя задача заключается не в том, чтобы > показать окpужающим, какой ты кpутой пpогpаммист, а в том, чтобы пpедоставить > пользователю готовый пpодукт. Целесообpазность любых твоих действий должна > опpеделяться только этим. > Если ты знаешь, все опеpатоpы языка пpогpаммиpования, если ты помнишь наизусть > все системные (включая недокументиpованные) вызовы опеpационной системы, если > ты можешь пpостучать в отладчике любую защиту - запомни, не это опpеделяет твою > квалификацию как пpогpаммиста. Твою квалификацию опpеделяет умение выполнить > поставленную задачу точно и в сpок. Задачи условно делятся на тpи категоpии - > соответственно квалификации: низшая - ты можешь запpогpаммиpовать пpедложенный > кем-то алгоpитм, сpедняя - по пpедложенной спецификации функции (или пpогpаммы) > ты можешь пpедложить алгоpитм ее pеализации (и запpогpаммиpовать его), высшая - > ты можешь пpедложить способ pешения задачи (написать спецификацию пpогpаммы, ее > pешающей, и запpогpаммиpовать ее). Кстати, есть еще и самая высшая степень: > понять, какую именно задачу стоит pешать. > Умей искать инфоpмацию и умей ее понимать. Для того чтобы пpедложить способ > pешения задачи - ты должен его знать. От тебя никто не тpебует, чтобы ты был > гением во всех отpаслях человеческого знания. От тебя тpебуют того, чтобы ты > знал, где или как это pешение можно найти. Если же pешения в явном виде не > существует - ты должен уметь быстpо освоить доступные по этой теме матеpиалы > для того, чтобы пpедложить свой способ pешения на базе тех pешений, котоpые уже > известны. > Понимай место твоей задачи в общем плане pаботы компании. В один пpекpасный > день ты можешь оказаться на обочине пpогpесса. Молодые pебята, недавно > пpишедшие в компанию, обсуждают новые планы и идеи, ставят новые задачи, а тебе > остается лишь pеализовывать функции по их спецификациям. > Hе отказывайся от pаботы, пусть даже она тебя поначалу и не вдохновляет. К > пpогpаммистам относятся так же, как и к pазведчикам: "С этим я в pазведку > пойду, а с этим - нет". > Умей оценивать вpемя, нужное тебе для выполнения pаботы. Умей оценивать вpемя, > нужное дpугим для выполнения составных частей твоей pаботы. Пpогpаммистское > pуководство pедко спpашивает: "Почему так медленно?", чаще всего оно > спpашивает: "Когда же, наконец?" > Имей шиpокий кpугозоp. Пpичем pечь идет не только о пpогpаммиpовании, но и о > пpактически любых областях человеческого знания. Hикому не известно, что может > тебе помочь пpи pешении очеpедной задачи. Кpоме всего пpочего, ты можешь > набpести на свежую идею. Кстати, это вовсе не означает, что целыми днями ты > должен ползать по Интеpнету, интеpесуясь всем на свете. е забывай: у тебя есть > конкpетная задача, котоpую ты сейчас pешаешь. > Пpогpаммиpование - это тяжкий тpуд. Ты должен пpивыкнуть к тому, что ты будешь > сидеть, не вставая со стула, по 12 часов в день, выpисовывая бесконечные макеты > диалогов, отлаживая пpогpамму под pазнообpазными конфигуpациями опеpационной > системы, ища ошибку в своей пpогpамме годичной давности, а также занимаясь > дpугими столь же не вызывающими востоpг занятиями. Пpогpаммиpование сpодни > гению: 5 пpоцентов таланта и 95 - усидчивости. > Пpогpамма не может быть пpактически готова. Она может быть либо готова, либо > нет. Опыт показывает, что между пpактически готовой пpогpаммой и готовым > пpодуктом может пpойти и полгода, и год. > Подумай, пpежде чем кидаться кодиpовать. Пока у тебя нет в голове ясной каpтины > того, как будет устpоена пpогpамма, любой сгенеpиpованный тобой код повиснет на > тебе меpтвым гpузом. Тебе будет жалко его выбpасывать, и ты будешь вставлять в > него одну заплатку за дpугой, пока пpогpамма не пеpестанет pаботать вовсе. > наиболее подходящее вpемя для pаздумий: в метpо (пока ты едешь с pаботы или на > pаботу), за едой и пеpед тем как заснуть. > Умей стpуктуpиpовать задачу. Одна пpичина состоит в том, что все более или > менее пpостые функции ты можешь пеpедать кодиpовщику. В пpотивном случае тебе > пpидется кодиpовать все это самому. Дpугая пpичина в том, что выполнение > нестpуктуpиpованной задачи невозможно ускоpить. Возможна ситуация, пpи котоpой > ты станешь бутылочным гоpлышком для всего пpоекта безо всякой возможности > помощи со стоpоны (даже от коллег той же квалификации). > Читай документацию. Есть pеальный шанс узнать много нового, а также найти > ответ на мучивший тебя давно вопpос. > Hе игpай в компьютеpные игpы. Это плохо действует на всех pуководителей. > Hе пиши пpогpаммы кpасиво, пиши пpосто. Твоя задача состоит не в том, чтобы > pодить самый, кpасивый код, а в том, чтобы написать надежную, пpостую в > испpавлении и модификации пpогpамму. Как известно, в любой пpогpамме есть хотя > бы одна ошибка. Поэтому шанс на то, что тебе пpидется влезать в свою (в лучшем > случае свою) пpогpамму не один pаз после ее выпуска, достаточно высок. е > удивляйся, если ты напpочь забудешь к этому вpемени, как она устpоена. е > усугубляй эту непpиятность тем, что тебе пpидется pешать свои собственные > головоломки. > Hе гонись за теоpетической эффективностью. Эффективность пpогpаммы опpеделяет > пользователь - это эффективность пpактическая. Если пpогpамма pаботает с > достаточной для pеакции пользователя скоpостью - остановись на этом (по кpайней > меpе, в пеpвой веpсии пpогpаммы). Занятия ползучим улучшизмом могут затянуть > появление конечного пpодукта на непpедсказуемое вpемя. > Hе изобpетай велосипед. Hе пиши в очеpедной pаз пpоцедуpу пеpесылки файлов по > локальной сети. Возьми этот код у коллеги, котоpый пpописывал аналогичную вещь > полгода назад. Со своей стоpоны: выделяй в отдельную библиотеку все те > пpоцедуpы, котоpые могут понадобиться дpугим. Кстати, это упpажнение > способствует pазвитию способности стpуктуpиpовать задачу. > Отлаживайся. а всех компьютеpах, пpи всех конфигуpациях опеpационной системы, > в условиях недостатка памяти, на очень больших файлах, и т.д. а это стоит > потpатить вpемя, иначе в течение следующего полугода (или больше) после выпуска > пpогpаммы тебе пpидется pазбиpаться в ошибках. Hаиболее часто пpактикуемый пpи > этом способ - дистанционный (когда неудовлетвоpенный пользователь звонит тебе с > дpугой стоpоны Уpальского хpебта). В пpоцессе отладки нелишне вспомнить, что > пользователь: а) пpактически никогда не читает документацию, поэтому может > выполнять все совсем не в том поpядке, котоpый описан в инстpукции; б) способен > на все, поэтому он может загнать пpогpамму в любые условия жизнедеятельности; > в) не будет pазбиpаться ни в чем, поэтому если пpогpамма не будет пpи всем этом > pаботать, то пpогpамма плохая. > Работай постоянно. Пpосто удивительно, как много вpемени для своего завеpшения > тpебует pабота, котоpую никто не делает. > > Macsimum > ============================================================================ = > > С уважением, Sergey 20 янваpя 2000 года > > ... "Для умного достаточно, для глупого всегда мало (с)" > -+- > + Origin: <--<< LazyRobotics Point >>--> (@fidonet 2:5030/740.12) > * ----------------------------- > > Здравствуй, All! > > fyi > > С уважением, > Akzhan > http://www.akzhan.midi.ru/devcorner/ - мой уголок разработчика > ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 09:32:59 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- Доброе утро! > нужно отдавать отчет, что в unicode регистрируются символы, > а не глифы, а поэтому там нет места таким вещам, как "оу" (глиф буквы > "у", используемый при употреблении ее в начале слова), и т.п. Увы, оу/Оу (но почему-то не ОУ) там уже есть. > Очевидно, никто не будет регистрировать под > ц.-сл. отдельную "страницу unicode". в unicode УЖЕ зарегистрированы > ц.-сл. символы. Вопрос в том, что же там, собственно, зарегистрировано. Чтобы это понять, сперва надо решить: старая кириллица и нынешняя -- это разные шрифтовые варианты одного и того же алфавита, или же это разные алфавиты. Ведь нынешняя кириллица и греческий алфавит не сведены в общую таблицу (хотя и это было бы не лишено известной логики). А старая кириллица расположена как раз "между". Если старая и новая кириллица -- варианты одного и того же алфавита, то надо добавить в Уникод недостающие символы (их действительно не так много: буквенные титла и комбинации ударений с придыханием). Если же это разные алфавиты, нужен отдельный кусок для старой кириллицы. И не беда, что формально он во многом повторит уже имеющееся: в конце концов, латинское, кириллическое и греческое "А" друг от друга по начертанию вообще не отличаются, но имеют разные коды. (Формально есть и третий вариант: считать старую кириллицу расширением греческого (или коптского) алфавита.) При таком подходе "всеобъемлющий" шрифт в "старокириллической" части вполне может графически отличаться от "новокириллической": примерно в том же духе, как строчные греческие буквы отличаются по начертанию от кириллических или латинских. Например, вместе с Times-образной новой кириллицей можно (в обычном, а не в художественно стилизованном) шрифте иметь полууставную старую кириллицу -- разве что подогнанную под ту же среднюю яркость. А "старые" символы в "новокириллической" части придется в таком случае рисовать максимально приближенно к гражданскому шрифту. (Сейчас это не соблюдено.) М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 10:10:11 От: "Lev Tikhonov" Кому: "Dima A. Smirnov" , "-=ORTHODOX-FONT=- Project Participants" Тема: Еще Unicode-related ссылочка -------------------------------------------------------------------------------- http://www.star.spb.ru/~yudmi/ А вот фраза автора по поводу разных шрифтовых форматов: > P.S. Гы-гы. В папке шрифтов они забыли поправить текст в Tools\Folder Options. > Тамошние фичи по-прежнему называются -- закладка "Трутайпфонтс" и опция > "показывать только трутайпы в программах". Включаю -- а она не только трутайпы > показывает, но и опентайпы. Hеувязочка %) Hаспех делали... С точки зрения системы OpenType и TrueType - это одно и тоже. И это очень хорошо. Упрощая, можно сказать, что OpenType (PS version) -- это Type 1 c прилепленным TrueType headrs (CMAP, OS/2 table etc.) Дм. ЗЫ. Этот самый Дм. Юнов - знакомый Хамстера. Еще раз напоминаю Хамстеру о наших нуждах. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 10:32:50 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- "AVV" == Alexander V Voinov writes: AVV> А есть где-нибудь пример шрифта, иллюстрирующего все эти AVV> символы? возможно, в шрифте everson mono эти символы есть. ссылку на сайт, где дают этот шрифт (точнее, набор шрифтов), можно взять на http://xtalk.price.ru/tex/ AVV> Или какого-нибудь более подробного их описания. на сайле charts.unicode.org, который Вы уже нашли. AVV> Во всяком случае букво-титл я там сходу не заметил. а они разве являются отдельными по смыслу буквами, или просто "акцентированными" буквами? во втором случае их не нужно регистрировать в unicode. AVV> И вообще, для чего тогда отдельная страница диакритиков, если AVV> национальные страницы их переопределяют? если какая-то акцентированная буква употребляется самостоятельно как отдельная смысловая единица в каком-то скрипте, то ее, как правило, регистрируют. акценты присутствуют для построения "комбинированных символов" при помощи неакцентированных букв и акцентов. правила "декомпозиции" присутствуют в файле UnicodeData-x.x.x.txt. Скажем, ударные гласные не являются отдельными по смыслу буквами, --- и хотя бы для их построения нужен акцент acute. AVV> Еще вопрос про Юникод, который я давно хочу задать. Имеет ли это AVV> отношение только к шрифтам TrueType, или и Type 1 тоже возможен? AVV> Скорее всего, это вопрос о конкретных интерпретаторах AVV> постскрипта, но пользователю это неважно: важно знать, можно ли AVV> конкретный текст распечатать на постскриптовском принтере с AVV> учетом преимуществ Type 1, или нет? можно. например, в системе Omega (расширение TeX с учетом unicode и пр.) это реализовано. т.е. Omega использует "виртуальный шрифт" (в кодировке, являющейся расширением unicode), который ссылается на несколько type1 шрифтов. При переводе результатов верстки в postscript автоматически буквы берутся из соответствующих шрифтов. AVV> Fontographer, который у меня есть, умеет работать только с AVV> символами <255. Иначе ломается. А FCP, который мне недавно AVV> подарили (еще раз спасибо), создает только TTF. Что печально. в спецификации type1 шрифтов нельзя задавать коды символов больше 255. но есть выход, упомянутый выше. кроме того, есть "обобщения" формата type1, непосредственно позволяющие задавать расширенные векторы кодировки. Best regards, -- Vladimir. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 10:42:24 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- "AAG" == A A G writes: AAG> В этом все дело и заключается. Может и не двадцать, но все равно AAG> много. Нет места для стольких глифов в кириллической юникодовой AAG> странице. у меня два вопроса. 1) знаете ли Вы, что в unicode строго говоря нет понятия "страница", и то, что Вы ей называете (логически связанный набор символов), может занимать больше, чем 256 символов, и не обязан начинаться на 0x??00 2) как видно, в текущей версии unicode свободна зона кодов, примыкающих к "кириллической юникодовой странице" -- 0x0500--0x0530 (и имеется некоторое кол-во слотов в диапазоне 0x0400-0x04FF). я что-то слышал о том, что в эту зону планировалось также помещать кириллицу. AAG> А если и как-то их туда упихать, то не будет резервных мест для AAG> прочих теоретически возможных знаков, употребимых в языках, AAG> пользующихся кириллицей. см п. 2 выше. AAG> Выхода есть два. Либо размещать глифы в пользовательских кодах, AAG> либо "проталкивать" церковно-славянскую страницу. Естественно, AAG> надо начинать со второго варианта второй вариант заведомо бессмысленный. ц.-сл. буквы уже зарегистрированы, и смысла их дублировать нет. ц.-сл. буква "аз" -- это то же самое, что cyrillic letter a. AAG> Тут вот уже предлагали вывести под это дело в расход Линейное AAG> Письмо Б. какие коды под него отведены? Best regards, -- Vladimir. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 10:34:46 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- "AVV" == Alexander V Voinov writes: AVV> Посмотрел я, наконец-то (раньше, почему-то мне было туда не AVV> попасть, то ли мой провайдер имел проблемы, то ли их), на AVV> http://charts.unicode.org/Unicode.charts/normal/U0400.html#Glyphs. AVV> Вызывает больше недоумений чем разрешает. Конечно, хорошо, что AVV> хоть какие-то буквы там есть, но нужно еще десятка два AVV> разместить, похоже. не могли бы Вы попробовать привести полный список символов, которые, на Ваш взгляд, следует добавить. после этого была бы конструктивная основа для обсуждения. Best regards, -- Vladimir. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 10:55:05 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- "MG" == Mikhail Grinchuk writes: >> нужно отдавать отчет, что в unicode регистрируются символы, а не >> глифы, а поэтому там нет места таким вещам, как "оу" (глиф буквы >> "у", используемый при употреблении ее в начале слова), и т.п. MG> Увы, оу/Оу (но почему-то не ОУ) там уже есть. имеются ввиду буквы cyrillic capital/small letter uk (0x0x78/0x0479), появивишиеся недавно в 3.0.0-beta? возможно... действительно, в unicode имеется целый ряд "отступлений от правил" (или правила не столь формальны, как хотелось бы). >> Очевидно, никто не будет регистрировать под ц.-сл. отдельную >> "страницу unicode". в unicode УЖЕ зарегистрированы ц.-сл. символы. MG> Вопрос в том, что же там, собственно, зарегистрировано. Чтобы это MG> понять, сперва надо решить: старая кириллица и нынешняя -- это MG> разные шрифтовые варианты одного и того же алфавита, или же это MG> разные алфавиты. на мой взгляд --- это безусловно варианты одного алфавита, т.к. нынешняя кириллица появиласи из "старой" в результате некоторых реформаций. и в принципе современному русскому человеку понятны тексты на ц.-сл. (во всяком случае буквы у него вряд ли бы возникло искушение относить к другому типу письменности --- стилевые особенности написания не в счет). Best regards, -- Vladimir. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 11:01:11 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- "AVV" == Alexander V Voinov writes: AVV> Во всяком случае букво-титл я там сходу не заметил. я, кажется, понял, о чем речь. действительно, букво-титл там нет, как и некоторых акцентов (упомянутых М.Гринчуком). так что наша задача --- внимательно изучить имеющееся (причем по текущей версии 3.x.x-beta), и продумать то, что отсутствует. Best regards, -- Vladimir. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 11:21:06 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- > AAG> Выхода есть два. Либо размещать глифы в пользовательских кодах, > AAG> либо "проталкивать" церковно-славянскую страницу. Естественно, > AAG> надо начинать со второго варианта > > второй вариант заведомо бессмысленный. ц.-сл. буквы уже > зарегистрированы, и смысла их дублировать нет. ц.-сл. буква "аз" -- > это то же самое, что cyrillic letter a. Такое делатся сплошь и рядом. Например, страница "Gothic" ;) В принципе для нас нет разницы, подойдет и тот, и другой подход. За исключением того, что в Вашем варианте мы не сможем в одном тексте использовать и ЦСл, и гражданский алфавит - то есть теряется сама идея Unicode IMHO совершенно новую кодовую страницу будет зарегистрировать легче, чем ЦСл расширение существующего кириллического скрипта. С уважением, Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 11:28:06 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- > на мой взгляд --- это безусловно варианты одного алфавита, > т.к. нынешняя кириллица появиласи из "старой" в результате некоторых > реформаций. и в принципе современному русскому человеку понятны тексты > на ц.-сл. (во всяком случае буквы у него вряд ли бы возникло искушение > относить к другому типу письменности --- стилевые особенности > написания не в счет). То же самое можно сказать о коптском, хотя такое наивное отождествление было бы, очевидно, ошибочным. Вопрос-то не в классификации алфавита, а в том, сколь сложные тексты можно будет передавать в виде plain unicode text без какой-либо метаинформации об использованных шрифтах и кодировках. И с этой точки зрения, если мы хотим в перспективе допустить возможность смешанных русско-славянских текстов (например, для учебников) - мы должны делать отдельный славянский скрипт. Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 11:30:19 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- > не могли бы Вы попробовать привести полный список символов, которые, > на Ваш взгляд, следует добавить. после этого была бы конструктивная > основа для обсуждения. А у Вас разве не сохранилось архива? См. предложение М. Гринчука - оно было в аттаче, а я его повторял от своего имени как RFC2.* С уваженеим, Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 11:45:59 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- Снова посмотрел на этот кириллический кусок Уникода -- и обнаружилось еще несколько странностей. 1. Сдается мне, что вместо "омеги с титлом" подразумевалась та самая "красивая омега", что в восклицаниях "о!" и "оле!" (Кстати, пока что так никто и не дал подкрепленное ссылкой толкование соответствующего надстрочного знака. А от этого в принципе зависит кодировка HIP.) 2. Знак, названный "кириллическая коппа", вроде бы на самом деле является "кириллической стигмой". (У коппы должен быть замкнутый кружочек, в отличие от стигмы, то есть вертикальной лигатуры СТ.) И выглядит он неправильно: ножка не должна опускаться под строку. И еще по поводу необходимости отдельного старокириллического блока. Насколько понимаю, одна из идей Уникода состоит в том, чтобы можно было использовать один шрифт на все языки, лишь по мере необходимости изменяя кегль, "курсивность" и жирность. Даже с такими экзотическими комбинациями, как греко-латинско-арабско-еврейский текст, эта система сработает. А вот для русско-славянского текста -- при отсутствии старой кириллицы -- уже потребуется задействовать две гарнитуры шрифтов, что нарушает сей главный принцип. P. S. Кто-то когда-то интересовался, какими шрифтами до революции печатали старые светские тексты. Так вот, в Полном Собрании Русских Летописей (у меня есть том 2, свежий репринт с издания 1908 года с новым справочным аппаратом) применен гражданский шрифт, но недостающие буквы взяты из какого-то полуустава, а также сохранены простые и буквенные титла и выносные буквы (тоже взятые из полуустава). Как числовые знаки там встречаются и стигма, и перевернутое зело. М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 11:56:25 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- "LT" == Lev Tikhonov writes: LT> Такое делатся сплошь и рядом. Например, страница "Gothic" ;) В LT> принципе для нас нет разницы, подойдет и тот, и другой подход. За LT> исключением того, что в Вашем варианте мы не сможем в одном LT> тексте использовать и ЦСл, и гражданский алфавит - то есть LT> теряется сама идея Unicode ??? что мешает переключить шрифт и того же irmologion'а (закодированного в unicode) на какой-то другой шрифт в гражданском начертании (опять же закодированный в unicode)? стилевые особенности (начертания) должны решаться на уровне разных шрифтов. а кодировка при этом может и должна оставаться одной (unicode или ее расширение некоторыми глифами). при этом не обязательно в шрифте с гражданским начертанием иметь все ц.-сл. глифы. так что лучше именно продумать, чего же не хватает в уже зарегистрированной кириллической "странице" для ц.-сл. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 12:01:43 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- "LT" == Lev Tikhonov writes: LT> Вопрос-то не в классификации алфавита, а в том, сколь сложные LT> тексты можно будет передавать в виде plain unicode text без LT> какой-либо метаинформации об использованных шрифтах и LT> кодировках. И с этой точки зрения, если мы хотим в перспективе LT> допустить возможность смешанных русско-славянских текстов LT> (например, для учебников) - мы должны делать отдельный славянский LT> скрипт. зачем? что мешает использовать одни и те же кириллические буквы? при таком подходе для немецкого, французского, польского, и т.д. нужно тоже создавать отдельные "скрипты" (во многих европейских языках, письменность которых основана на литинице, много акцентированных символов)? ибо как их отличить от смешанных французско-английских или французско-немецких текстов? ;-) кроме того, насколько я понимаю, в стандартах iso-2022 и им подобным предусмотрены тэги для указания языка. так что если хочется передавать plain text файлы в unicode, то можно будет ставить тэги языка, и т.п. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 12:02:56 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- "LT" == Lev Tikhonov writes: >> не могли бы Вы попробовать привести полный список символов, >> которые, на Ваш взгляд, следует добавить. после этого была бы >> конструктивная основа для обсуждения. LT> А у Вас разве не сохранилось архива? См. предложение М. Гринчука LT> - оно было в аттаче, а я его повторял от своего имени как RFC2.* там приведен не список символов, отсутствующих в unicode, а просто список символов в перемежку с глифами. а хотелось бы именно анализ того, что же отсутствует в текущей версии unicode. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 12:51:26 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- В прошлом письме пропустил: лигатуры IА там еще нету! (Хотя ее можно отождествить с Я, раз юс малый есть.) =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 12:48:49 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- Vladimir Volovich wrote: > а хотелось бы именно анализ > того, что же отсутствует в текущей версии unicode 1) Всего одна буква У/у, а нужно две: "ик" и гаммаобразный ук. 2) Нет буквенных титл вообще. 3) Нет сочетаний ударение+придыхание (впрочем, может быть, их можно собирать из пары отдельных акцентов). Остальное (для ц.-сл.) вроде бы есть. Для ст.-сл. и др.-рус. много чего не хватает. P. S. Gothic оказалось "готский", а не "готический"; но вот коптский реализован как расширение греческого. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 13:03:47 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- "MG" == Mikhail Grinchuk writes: MG> И еще по поводу необходимости отдельного старокириллического MG> блока. Насколько понимаю, одна из идей Уникода состоит в том, MG> чтобы можно было использовать один шрифт на все языки, лишь по MG> мере необходимости изменяя кегль, "курсивность" и жирность. Даже MG> с такими экзотическими комбинациями, как MG> греко-латинско-арабско-еврейский текст, эта система сработает. А MG> вот для русско-славянского текста -- при отсутствии старой MG> кириллицы -- уже потребуется задействовать две гарнитуры шрифтов, MG> что нарушает сей главный принцип. во-первых, unicode предназначена для передачи _текстов_ без привязки к конкретным гарнитурам. это просто абстрактная кодировка текстовой информации. как только речь заходит о гарнитурах, мы привязывается к верстке, а там уже к конкретным шрифтам и графическому виду символов и по необходимости к дополнительным глифам (скажем, к f-лигатурам, каковые в официальном unicode отсутствуют, т.к. не имеют отношения к логическому представлению информации). кроме того, строго говоря, задействовать отдельную гарнитуру не обязательно. можно все буквы передавать одной гарнитурой (пример см на сайте charts.unicode.org, --- там представлены и современные и специфические ц.-сл. символы). но естественно нам захочется для верстки ц.-сл. использовать какой-то другой шрифт, чем для верстки современного русского. и таких вариантов шрифтов очень много, --- не изобретать же для каждого шрифта свой блок в unicode? ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 13:41:50 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- Vladimir Volovich wrote: > MG> А вот для русско-славянского текста -- при отсутствии старой > MG> кириллицы -- уже потребуется задействовать две гарнитуры шрифтов, > MG> что нарушает сей главный принцип. > > во-первых, unicode предназначена для передачи _текстов_ без привязки к > конкретным гарнитурам. это просто абстрактная кодировка текстовой > информации. ...А раз смешанный русско-славянский текст передать нельзя, то...? > кроме того, строго говоря, задействовать отдельную гарнитуру не > обязательно. можно все буквы передавать одной гарнитурой (пример см на > сайте charts.unicode.org, --- там представлены и современные и > специфические ц.-сл. символы). По бедности все можно. И греческий текст латиницей передавать можно. И смешивать (как ПСРЛ или та самая кириллическая часть Уникода) гражданский шрифт с полууставом -- все можно. Но плохо смотрится. Несколько раз мне попадались греческие цитаты, набранные преимущественно латинскими буквами, но уж где латинской похожей не было -- со вставленными греческими. Это примерно то же самое. Если угодно, числовой аргумент о своеобразии старой кириллицы. (а) Нынешний русский алфавит -- 33 буквы. (б) Старая кириллица (11-12 век) -- 42 буквы. (в) Классический греческий алфавит -- 24 буквы. Чтобы сделать (б) из (а), надо 5 букв выкинуть и 14 вставить. То есть 19 отличий. Чтобы сделать (б) из (в), ничего выкидывать не надо, но надо вставить 18 букв. Итого 18 отличий. Примерно одинаковое расстояние получается. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 14:14:55 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- > во-первых, unicode предназначена для передачи _текстов_ без привязки к > конкретным гарнитурам. это просто абстрактная кодировка текстовой > информации. как только речь заходит о гарнитурах, мы привязывается к Да вот в том-то и вопрос, является ли ЦСл просто семейством кириллических гарнитур, или это некий особый алфавит. Давайте не пытаться конструировать абстрактно правильную "систему", а попробуем оценить те удобства и неудобства, которые нам обеспечат оба подхода. Причем не только нам как программистам, но и нам (и множеству прочих людей) как пользователям. > верстке, а там уже к конкретным шрифтам и графическому виду символов и > по необходимости к дополнительным глифам (скажем, к f-лигатурам, > каковые в официальном unicode отсутствуют, т.к. не имеют отношения к > логическому представлению информации). > > кроме того, строго говоря, задействовать отдельную гарнитуру не > обязательно. можно все буквы передавать одной гарнитурой (пример см на > сайте charts.unicode.org, --- там представлены и современные и > специфические ц.-сл. символы). но естественно нам захочется для > верстки ц.-сл. использовать какой-то другой шрифт, чем для верстки > современного русского. и таких вариантов шрифтов очень много, --- не > изобретать же для каждого шрифта свой блок в unicode? Конечно нет - вопрос только в том, какая концепция удобнее для использования - считать ли ЦСл разновидностью русского шрифта, или считать его отдельным алфавитом, требующим отдельного Script. Пока что я все же сторонник второй концепции. 1) Уникод - это не кодировка для хранения верстки, а кодировка для хранения и передачи _многоязычных текстов_. Если мы считаем ЦСл издательской разновидностью русского, то мы автоматически утрачиваем возможность естественным образом передавать и хранить смешанные с русским тексты, например, через http для показа в стандартных броузерах. А я полагаю, что такая задача все же будет вставать, и гораздо более часто, чем задача совместного хранения ЦСл и линейного письма, ЦСл и арабского и даже ЦСл и латиницы. Извратиться, указывая шрифт, можно, но это будет уже не plain unicode, совместимость с которым мы т. о. утрачиваем, а некий расширенный стандарт - не важно какой. 2) Второе прагматическое соображение я тоже уже приводил: сдается мне, что расширение кириллического скрипта будет сложнее зарегистрировать, чем отдельный скрипт. А создание славянского скрипта на знакоместах какого-нибудь Хангул - это полшага в нужном направлении. Всеь софт и шрифты, созданные в этом предположении, можно будет впоследствии с легкостью переделать с учетом общепризнанного ЦСл скрипта, если он будет когда-либо зарегистрирован. Левъ. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 14:38:44 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- "MG" == Mikhail Grinchuk writes: >> во-первых, unicode предназначена для передачи _текстов_ без >> привязки к конкретным гарнитурам. это просто абстрактная кодировка >> текстовой информации. MG> ...А раз смешанный русско-славянский текст передать нельзя, MG> то...? 1) почему нельзя? кириллические буквы одни и те же что в русском, что в ц.-сл., что в македонском, и т.д. у них общее ядро, и есть расширения. 2) а смешанный английско-немецко-французско-польский передать можно? 3) если нужно передавать информацию о языке текста, то следует использовать language tag'и, --- никто не мешает. >> кроме того, строго говоря, задействовать отдельную гарнитуру не >> обязательно. можно все буквы передавать одной гарнитурой (пример >> см на сайте charts.unicode.org, --- там представлены и современные >> и специфические ц.-сл. символы). MG> По бедности все можно. И греческий текст латиницей передавать MG> можно. И смешивать (как ПСРЛ или та самая кириллическая часть MG> Уникода) гражданский шрифт с полууставом -- все можно. Но плохо MG> смотрится. еще раз. unicode содержит только абстрактрые символы для набора. понятие "плохо смотрится" не применимо к unicode по определению. это понятие зависит от программ верстки и используемых шрифтов. MG> Несколько раз мне попадались греческие цитаты, набранные MG> преимущественно латинскими буквами, но уж где латинской похожей MG> не было -- со вставленными греческими. Это примерно то же самое. нет. никто не мешает в программе верстки для ц.-сл. текстов использовать любые имеющиеся шрифты (тот же irmologion). кодировка же символов (и глифов) тут ни при чем. нет смысла дублировать уже имеющиеся кириллические символы (как абстрактные объекты для набора текстов) лишь на том основании, что они должны отличаться стилистически в программе верстки. в ней (в программе верстки) можно и нужно выбрать тот конкретный шрифт, который нам нужен. представьте, что регистрируют отдельный блок для ц.-сл. глифов. тогда в шрифте times как они должны выглядеть? а в courier?... шрифт --- это то, что определяет конкретный вид глифов! поэтому нет смысла регистрировать отдельный блок для ц.-сл. Нужно использовать уже существующий. естественно, никто times'ом не будет набирать на ц.-сл. а будут набирать на irmologion'е. так зачем же регистрировать целый блок, если все равно бессмысленно вставлять этот блок в тот же times? для ц.-сл. все равно придется использовать свои шрифты, а кодировка в них должна быть unicode (без отдельного блока): вид символов (глифы) определяются самими шрифтами и только ими, а не кодировкой. а кириллические символы что в современном русском, что в ц.-сл. --- логически одни и те же, а тосему должны иметь одни коды. MG> Если угодно, числовой аргумент о своеобразии старой кириллицы. MG> (а) Нынешний русский алфавит -- 33 буквы. (б) Старая кириллица MG> (11-12 век) -- 42 буквы. (в) Классический греческий алфавит -- MG> 24 буквы. MG> Чтобы сделать (б) из (а), надо 5 букв выкинуть и 14 вставить. То MG> есть 19 отличий. MG> Чтобы сделать (б) из (в), ничего выкидывать не надо, но надо MG> вставить 18 букв. Итого 18 отличий. MG> Примерно одинаковое расстояние получается. да при чем здесь расстояние! почему в примере выше приведены только 3 языка? а где все остальные ~60 кириллических языков, которым нужны все чуть ли не 256 кириллических символов, уже присутствующих в unicode? ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 15:57:20 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- "LT" == Lev Tikhonov writes: LT> 1) Уникод - это не кодировка для хранения верстки, а кодировка LT> для хранения и передачи _многоязычных текстов_. точно. LT> Если мы считаем ЦСл издательской разновидностью русского, то мы LT> автоматически утрачиваем возможность естественным образом LT> передавать и хранить смешанные с русским тексты, например, через LT> http для показа в стандартных броузерах. что мешает указать шрифт в html документе? если Вы скажете, что этого шрифта может не оказаться у пользователя, то предположим, что у него есть times, courier, helvetica. но для этих семейств шрифтов, даже если выделить отдельный блок для ц.-сл., бессмысленно представить наличие там удобоваримых для глаза ц.-сл. символов (иначе шрифт уже нельзя будет назвать times). в любом случае: * или придется смириться с "осовремененным" видом ц.-сл. букв, унифицированным со всей остальной кириллицей (скажем, как на сайте charts.unicode.org), --- а для этого не нужен отдельный блок для ц.-сл. * или же при наличии "стильных" ц.-сл. шрифтов будут использованы они (в html можно указывать несколько семейств шрифтов в порядке предпочтения); но тогда опять специальная "страница" для ц.-сл. не нужна. LT> А я полагаю, что такая задача все же будет вставать, и гораздо LT> более часто, чем задача совместного хранения ЦСл и линейного LT> письма, ЦСл и арабского и даже ЦСл и латиницы. Извратиться, LT> указывая шрифт, можно, но это будет уже не plain unicode, LT> совместимость с которым мы т. о. утрачиваем, а некий расширенный LT> стандарт - не важно какой. расширенный markup с указанием языка набора и семейств шрифтов. LT> 2) Второе прагматическое соображение я тоже уже приводил: сдается LT> мне, что расширение кириллического скрипта будет сложнее LT> зарегистрировать, чем отдельный скрипт. сомнительно. для расширения нужно зарегистрировать немного дополнительных символов. для нового скрипта --- доказать, что он новый, и что все ц.-сл. символы, УЖЕ присутствующие в unicode, являлись ошибочными. ;-) LT> А создание славянского скрипта на знакоместах какого-нибудь LT> Хангул - это полшага в нужном направлении. зачем, если уже есть почти все, что нужно? LT> Всеь софт и шрифты, созданные в этом предположении, можно будет LT> впоследствии с легкостью переделать с учетом общепризнанного ЦСл LT> скрипта, если он будет когда-либо зарегистрирован. Best, v. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 17:11:23 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Ch-Sl in Unicode (maybe offtopic) -------------------------------------------------------------------------------- Vladimir Volovich wrote: > "MG" == Mikhail Grinchuk writes: > > >> во-первых, unicode предназначена для передачи _текстов_ без > >> привязки к конкретным гарнитурам. это просто абстрактная кодировка > >> текстовой информации. > > MG> ...А раз смешанный русско-славянский текст передать нельзя, > MG> то...? > > 1) почему нельзя? кириллические буквы одни и те же что в русском, что > в ц.-сл., что в македонском, и т.д. у них общее ядро, и есть > расширения. > 2) а смешанный английско-немецко-французско-польский передать можно? Это-то как раз можно. Потому что для всех указанных языков равно применим шрифт с общей гарнитурой. Хотя могло сложиться и иначе, сохранись традиция печатать немецкий текст готикой, а французские (например) вставки -- обычным шрифтом. Или наоборот: французская книга печаталась обычным шрифтом, а немецкие цитаты -- готикой. При этом почти наверняка и в Уникоде была бы отдельная немецкая страница. > 3) если нужно передавать информацию о языке текста, то следует > использовать language tag'и, --- никто не мешает. Это уже будет не "чистый" текст. > >> кроме того, строго говоря, задействовать отдельную гарнитуру не > >> обязательно. можно все буквы передавать одной гарнитурой (пример > >> см на сайте charts.unicode.org, --- там представлены и современные > >> и специфические ц.-сл. символы). > > MG> По бедности все можно. И греческий текст латиницей передавать > MG> можно. И смешивать (как ПСРЛ или та самая кириллическая часть > MG> Уникода) гражданский шрифт с полууставом -- все можно. Но плохо > MG> смотрится. > > еще раз. unicode содержит только абстрактные символы для > набора. понятие "плохо смотрится" не применимо к unicode по > определению. это понятие зависит от программ верстки и используемых > шрифтов. Не совсем. Как "абстрактный символ для набора" латинское, новокириллическое и греческое "А" ну совершенно ничем не различаются. Но зачем-то ведь они сделаны как разные символы? > MG> Несколько раз мне попадались греческие цитаты, набранные > MG> преимущественно латинскими буквами, но уж где латинской похожей > MG> не было -- со вставленными греческими. Это примерно то же самое. > > нет. никто не мешает в программе верстки для ц.-сл. текстов > использовать любые имеющиеся шрифты (тот же irmologion). кодировка же > символов (и глифов) тут ни при чем. нет смысла дублировать уже > имеющиеся кириллические символы (как абстрактные объекты для набора > текстов) лишь на том основании, что они должны отличаться > стилистически в программе верстки. в ней (в программе верстки) можно и > нужно выбрать тот конкретный шрифт, который нам нужен. В том и вопрос, что отличие "гражданских" кириллиц и ц.-сл. -- не стилистический элемент, раз именно для "нейтрального" стиля они не позволяют использовать символы одного и того же начертания. > представьте, что регистрируют отдельный блок для ц.-сл. глифов. тогда > в шрифте times как они должны выглядеть? а в courier?... Это как раз проблема для случая, если НЕ регистрируют: как в том же Times должна выглядеть буква "от"? (То, что сейчас там в Уникоде нарисовано -- это халтура. И вообще, по большому счету, Times годится только для латиницы -- в этом шрифте слишком резкие засечки, в латинских строчных буквах они не так часто встречаются и помогают подчеркивать различие между "круглыми" и "угловатыми" элментами букв; а в кириллице почти все строчные буквы "угловатые" и в результате текст сливается.) А если регистрируют -- все в порядке: в старокириллической части и в Times мы будем иметь начертания, опознаваемые как старый славянский шрифт (полуустав). Очень может быть, что на этом подмножестве Times и Arial вообще совпадут; в конце концов, не на все письменности влияет разница между serif и sans serif. Почему бы в качестве старокириллической части Times не использовать глифы а-ля Ирмологион, а в Arial -- нечто более похожее на Ижицу? ("Единство" шрифта не обязано состоять в том, что все значки выглядят одинаково: для разных языковых подмножеств достаточно единства по среднему размеру символов, насыщенности и наклону.) С Courier тоже особых проблем не видно: раз это в целом -- моноширинный шрифт с засечками, то всего лишь надо будет изготовить для старой кириллицы моноширинный вариант. (Что в любом случае потребуется, если вдруг нужен будет моноширинный старославянский набор.) Кстати, при Вашем подходе возникает довольно странный славянский шрифт: с дырой на латинской, греческой, арабской и т. п. частях кодировки. Практически одна сплошная большая дыра, и лишь где-то полпроцента объема занято под нечто полезное. Или прикажете все виды письменности стилизовать под полуустав? > MG> Если угодно, числовой аргумент о своеобразии старой кириллицы. > > MG> (а) Нынешний русский алфавит -- 33 буквы. (б) Старая кириллица > MG> (11-12 век) -- 42 буквы. (в) Классический греческий алфавит -- > MG> 24 буквы. > > MG> Чтобы сделать (б) из (а), надо 5 букв выкинуть и 14 вставить. То > MG> есть 19 отличий. > > MG> Чтобы сделать (б) из (в), ничего выкидывать не надо, но надо > MG> вставить 18 букв. Итого 18 отличий. > > MG> Примерно одинаковое расстояние получается. > да при чем здесь расстояние! почему в примере выше приведены только 3 > языка? а где все остальные ~60 кириллических языков, которым нужны все > чуть ли не 256 кириллических символов, уже присутствующих в unicode? Положим, для любого другого современного языка с кириллицей ситуация будет примерно той же, а то и хуже. Попробую прикинуть, сколь трудно из разных нынешних славянских кириллиц сделать "старую": украинский: 33 буквы, надо выбросить 6 и вставить 15 (расстояние = 21) белорусский: 32 буквы, надо выбросить 6 и вставить 16 (расстояние = 22) болгарский: 30 букв, набо выбросить 3 и вставить 15 (расстояние = 18) сербский: 30 букв, надо выбросить 7 и вставить 19 (расстояние = 26) македонский: 31 буква, надо выбросить 8 и вставить 19 (расстояние = 27) Все они вместе, да еще и с русским: 47 букв, надо выбросить 17 и вставить 12 (расстояние = 29) Для полноты картины: дореформенный русский: 37 (-5 +10, расстояние = 15) дореформенный болгарский: 33 (-3 +12, расстояние = 15) (Все вместе -- 52 буквы (-17 +7, расстояние = 24)) Так что русская и болгарская письменности хранят традицию вернее всех, а остальные разбрелись заметно шире. И куда дальше, чем старая кириллица отстоит от греческого алфавита. Рассмотрение неславянских кириллиц, скорее всего, большего сходства тоже не даст. А цель всей этой прикидки -- показать, что в нынешние кириллицы старая "втискивается" ненамного легче, чем в греческий алфавит. Причем с точки зрения шрифтов склейка с греческим даже более естественна: древнейший кириллический устав и современный ему греческий (византийский) устав имеют в точности одно и то же начертание -- до мельчайших загогулин. В кириллице просто было больше букв. И соображение по поводу вариантных глифов (типа z и з). Если пытаться точно воспроизводить старопечатные книги (Ивана Федорова, скажем), то они потребуются одновременно. В латинской части Уникода для похожей ситуации зарезервированы разные символы (например, обычное s и высокое s -- код 017F). Или в греческой части -- по две строчные теты, каппы, пи, ро и фи. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 18:00:58 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- здесь можно прочитать про language tags в unicode-текстах: Unicode Technical Report # 7 Plane 14 Characters for Language Tags http://www.unicode.org/unicode/reports/tr7.html ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 17:58:47 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Question -------------------------------------------------------------------------------- Где взять или как сделать (в таком случае -- как именно и где взять софт) TTF-шрифт Izhica-CS2 ? (Похоже, что без установки шрифтов Word не вполне корректно переводит DOC в RTF.) =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 18:04:19 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Ch-Sl in Unicode или За что боролись, на то и... -------------------------------------------------------------------------------- Если посмотреть на русский алфавит, то половина букв в нем аналогична латинским. Никому, однако же не пришло в голову расширить Extended Latin и так решить проблему кириллицы. Очевидно, в силу исторических причин. Таких примеров можно много привести. А посмотрите на Greek Extended. Там просто напросто собраны все необходимые сочетания с диакритиками. То и другое есть уже и по отдельности. Никакого скандала, одноко, не происходит. Я прекрасно знаю, что скрипт может в себе заключать тысячи глифов, но это еще не достаточный аргумент в пользу расширения кириллического Юникода до нужд церковнославянского языка. Сделать так значило бы признать, что законно и полезно отображать церковнославянский текст каким-нибудь Times New Roman. Что и будет происходить. То, что все нужные символы будут включены во все кириллические шрифты не есть научный факт, а скорее фантастическое предположение. Сколько нам сейчас известно шрифтов, целиком отображающих кириллический стандарт уже прописанный в Юникоде? Я знаю лишь один такой свободно распространяемый шрифт. В остальных есть только символы старорежимной графики. Так что реально люди будут видеть текст без половины необходимых знаков, но, так как он будет все же худо-бедно читаться, никто не побежит искать нужные шрифты. Неужели, братие, вас не достали издания славянских текстов гражданскими шрифтами? Не этого ли мы хотели в первую очередь избежать?! По мне, уж пусть лучше человек увидит черные квадратики и поймет, что у него нет нужного шрифта, чем будет читать искалеченный текст. Таков мой аргумент в пользу отдельного скрипта. Конечно, если нас в этом плане зарубят, остается план Б. Но нужно попытаться. Будем голосовать? Алексей Гришин ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 18:26:06 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Ch-Sl in Unicode (maybe offtopic) -------------------------------------------------------------------------------- "MG" == Mikhail Grinchuk writes: >> 2) а смешанный английско-немецко-французско-польский передать >> можно? MG> Это-то как раз можно. Потому что для всех указанных языков равно MG> применим шрифт с общей гарнитурой. Хотя могло сложиться и иначе, MG> сохранись традиция печатать немецкий текст готикой, а французские MG> (например) вставки -- обычным шрифтом. Или наоборот: французская MG> книга печаталась обычным шрифтом, а немецкие цитаты -- MG> готикой. При этом почти наверняка и в Уникоде была бы отдельная MG> немецкая страница. примеры, plz, когда в unicode включали дополнительные "скрипты" лишь на том основании, что их принято печатать в том или ином стиле. мне это далеко не очевидно. imho, в unicode регистрируются скрипты вне зависимости от стилей. >> 3) если нужно передавать информацию о языке текста, то следует >> использовать language tag'и, --- никто не мешает. MG> Это уже будет не "чистый" текст. см ссылку на language tags. при условии, что эти тэги --- законные элементы unicode, мы имеем "чистый текст". хотя необходимость поддержки именно на уровне unicode и не столь важна --- можно использовать для хранения текстов более структурно-богатые форматы, чем просто unicode text --- например, unicode xml, или unicode sgml, или unicode TeX, и т.п. Все эти системы позволяют указывать тэги как для обозначения языков, так и для гарнитур шрифтов, и т.п. >> еще раз. unicode содержит только абстрактные символы для >> набора. понятие "плохо смотрится" не применимо к unicode по >> определению. это понятие зависит от программ верстки и >> используемых шрифтов. MG> Не совсем. Как "абстрактный символ для набора" латинское, MG> новокириллическое и греческое "А" ну совершенно ничем не MG> различаются. Но зачем-то ведь они сделаны как разные символы? это действительно разные символы, --- они принадлежат разным "скриптам", т.е. логически разным блокам символов/алфавитов. MG> Это как раз проблема для случая, если НЕ регистрируют: как в том MG> же Times должна выглядеть буква "от"? (То, что сейчас там в MG> Уникоде нарисовано -- это халтура. мы же выяснили, что там всего лишь не хватает нескольких акцентов и букво-титл. так что это не халтура. MG> И вообще, по большому счету, Times годится только для латиницы -- MG> в этом шрифте слишком резкие засечки, в латинских строчных буквах MG> они не так часто встречаются и помогают подчеркивать различие MG> между "круглыми" и "угловатыми" элментами букв; а в кириллице MG> почти все строчные буквы "угловатые" и в результате текст MG> сливается.) обсуждение конкретных шрифтов, и их стилевых особенностей выходит за рамки unicode, чья цель --- лишь предоставить способ кодирования логически различных символов письменностей (скриптов), не устанавливая их конкретный стиль. MG> А если регистрируют -- все в порядке: в старокириллической части MG> и в Times мы будем иметь начертания, опознаваемые как старый MG> славянский шрифт (полуустав). Очень может быть, что на этом MG> подмножестве Times и Arial вообще совпадут; они не могут совпасть, т.к. это будет противоречить стилю шрифта. MG> Кстати, при Вашем подходе возникает довольно странный славянский MG> шрифт: с дырой на латинской, греческой, арабской и т. п. частях MG> кодировки. Практически одна сплошная большая дыра, и лишь где-то MG> полпроцента объема занято под нечто полезное. Или прикажете все MG> виды письменности стилизовать под полуустав? нет. я лишь хочу обратить внимание, что задача представления текстовой информации на ц.-сл. языке ортогональна задаче верстки и конкретного вида букв. я не вижу проблемы в возможности этой "дыры", --- нет проблем изменить шрифт в конкретной программе верстки (с помощью соответствующих тэгов). скорее, наличие стилистически несовместимых ц.-сл. глифов в шрифтах типа times и т.п. вызывает вопрос. [...] MG> И соображение по поводу вариантных глифов (типа z и з). Если MG> пытаться точно воспроизводить старопечатные книги (Ивана MG> Федорова, скажем), то они потребуются одновременно. пока наша задача --- поддержка стандартной ц.-сл. письмености. MG> В латинской части Уникода для похожей ситуации зарезервированы MG> разные символы (например, обычное s и высокое s -- код 017F). Или MG> в греческой части -- по две строчные теты, каппы, пи, ро и фи. тут сложный вопрос. уверен, что эти символы логически различаются, а не только стилистически. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 19:28:20 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Ch-Sl in Unicode (maybe offtopic) -------------------------------------------------------------------------------- Vladimir Volovich wrote: > примеры, plz, когда в unicode включали дополнительные "скрипты" лишь > на том основании, что их принято печатать в том или ином стиле. мне > это далеко не очевидно. imho, в unicode регистрируются скрипты вне > зависимости от стилей. Ну, например, "Superscripts and Subscripts, Range: U+2070 to U+209F". > MG> Не совсем. Как "абстрактный символ для набора" латинское, > MG> новокириллическое и греческое "А" ну совершенно ничем не > MG> различаются. Но зачем-то ведь они сделаны как разные символы? > > это действительно разные символы, --- они принадлежат разным > "скриптам", т.е. логически разным блокам символов/алфавитов. Это какой-то замкнутый круг получается: символы разные, потому что они из разных алфавитов, а алфавиты разные -- потому что символы разные? Кто решает-то -- что является "логически разным", а что нет? И что от этого решения зависит? > MG> Это как раз проблема для случая, если НЕ регистрируют: как в том > MG> же Times должна выглядеть буква "от"? (То, что сейчас там в > MG> Уникоде нарисовано -- это халтура. > > мы же выяснили, что там всего лишь не хватает нескольких акцентов и > букво-титл. так что это не халтура. В данном случае халтура -- вид конкретных значков в конкретной табличке. В одну повозку впряжены Times формы для современных букв, Times-подобные (и не слишком удачные) стилизации части старых букв и полууставное начертание остальных. Тот самый "стиль шрифта" не выдержан внутри одного "логического блока". Не потому ли, что блок уж слишком неоднороден? > MG> А если регистрируют -- все в порядке: в старокириллической части > MG> и в Times мы будем иметь начертания, опознаваемые как старый > MG> славянский шрифт (полуустав). Очень может быть, что на этом > MG> подмножестве Times и Arial вообще совпадут; > > они не могут совпасть, т.к. это будет противоречить стилю шрифта. Запросто могут! Не думаю, что, скажем, арабская часть этих шрифтов сильно различается. > MG> Кстати, при Вашем подходе возникает довольно странный славянский > MG> шрифт: с дырой на латинской, греческой, арабской и т. п. частях > MG> кодировки. Практически одна сплошная большая дыра, и лишь где-то > MG> полпроцента объема занято под нечто полезное. Или прикажете все > MG> виды письменности стилизовать под полуустав? > > нет. я лишь хочу обратить внимание, что задача представления текстовой > информации на ц.-сл. языке ортогональна задаче верстки и конкретного > вида букв. я не вижу проблемы в возможности этой "дыры", --- нет > проблем изменить шрифт в конкретной программе верстки (с помощью > соответствующих тэгов). скорее, наличие стилистически несовместимых > ц.-сл. глифов в шрифтах типа times и т.п. вызывает вопрос. А "стилистически несовместимые" значки арабского, еврейского, грузинского, армянского, кана, деванагари, иероглифы всякие -- вопроса не вызывают? В системе с поддержкой многих разных письменностей "стиль шрифта" -- вещь довольно условная. В каждой национальной письменности есть свои стили; пусть, скажем, имеется 30 латинских шрифтов, 20 арабских и 5 японских. Когда мы их сводим вместе, то, скорее всего, просто подбираем пары с возможно более "гладким" переходом от одной письменности к другой в смешанном тексте. Скорее всего, получим 30 комбинаций. При этом, ясное дело, зачастую разница в латинской части не будет отражена в японской. > MG> И соображение по поводу вариантных глифов (типа z и з). Если > MG> пытаться точно воспроизводить старопечатные книги (Ивана > MG> Федорова, скажем), то они потребуются одновременно. > > пока наша задача --- поддержка стандартной ц.-сл. письмености. Ц.-сл. требует не так много значков и в принципе почти "вгоняется" в то, что уже есть. Но перспектива поддержки всей полноты старославянских текстов потребует расширений, и система выйдет крайне нелогичная. Если же зарезервировать специальное место под старую кириллицу, то и набор знаков, и их последовательность можно выстроить более разумно. > MG> В латинской части Уникода для похожей ситуации зарезервированы > MG> разные символы (например, обычное s и высокое s -- код 017F). Или > MG> в греческой части -- по две строчные теты, каппы, пи, ро и фи. > > тут сложный вопрос. уверен, что эти символы логически различаются, а > не только стилистически. Что касается греческого -- совершенно не различаются (различаются только сигмы и беты). Сведения от Янниса Хараламбуса, который как раз по шрифтам и специализировался. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 19:53:50 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- Lev Tikhonov wrote: > исключением того, что в Вашем варианте мы не сможем в одном тексте > использовать и ЦСл, и гражданский алфавит - то есть теряется сама идея > Unicode И это будет иметь еще и политические последствия, выходящие за рамки эхотага. > IMHO совершенно новую кодовую страницу будет зарегистрировать легче, > чем ЦСл расширение существующего кириллического скрипта. Но правильнее было бы второе. Кстати, как я понял, зарезервировано несколько страниц для "половинных" расширений: "Reserved for Unicode Subranges", как говорит FCP, разве это не то, что нужно? С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 21 янв 2000 19:56:48 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Ch-Sl in Unicode -------------------------------------------------------------------------------- A A G wrote: > А еще мое мнение таково, что чем скорее мы поднимем вопрос об отдельной > странице, тем лучше. Первое, что мне приходит в голову, по опыту недавних упражнений, что такую страницу (точнее Микрософт) трудно будет заставить отображаться по правилу X Unicode -> X Cyr. У меня сложилось впечатление, что пока строгость правил > стардарта Unicode искупается необязательностью следования им. Я в этих > правилах, конечно, не особый знаток. Тем не менее, припоминаю, что не > поощряется дублирование глифов, которое встречается однако сплошь и рядом. Вот именно. Ц.С. шрифт, сделанный Кристофером Зингером (http://www.ccss.de/slovo), использует диакритики из выделенной для них страницы. По-моему, это правильно. Хотя и губит отображение X Cyr. > Кстати, Александр, если проблема лицензионной чистоты программных продуктов > Вас не слишком волнует, Волнует, но не слишком. Я заходил на страницу Fontographer'а, для меня это дороговато, несмотря ни на что. > непременно нужно поучаствовать в создании опытного образца > шрифта, соответствующего вырабатываемому здесь стандарту. Конечно. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 22 янв 2000 09:24:16 От: Igor Gasloff Кому: font-list@orthodox.tstu.ru Тема: subscribe -------------------------------------------------------------------------------- subscribe ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 22 янв 1999 14:37:44 От: "Kirill A. Loginov" Кому: font-list@orthodox.tstu.ru Тема: Re:RE: -------------------------------------------------------------------------------- 18-Jan-00 22:39 you wrote: > > > ---------- > > От: Kirill A. Loginov > > Кому: font-list@orthodox.tstu.ru > > Тема: > > Дата: 18 января 1999 г. 17:05 > > > > IF YOU CAN'T READ MY LETTER IN RUSSIAN, PLEASE TELL ME. > > IT MAY BE A PROBLEM WITH MY PROVIDER & KOI-8R. > > > Only using recorder, but I couldn't understand what kodirovka it was. Maybe > Grishin knows how to take this information from the recorder? > And what is the English for kodirovka? :-) > Архангельский Г.А. СПб > > > ------------------------------------------------------------------------------- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru > pridetsia teper vot tak pisat. ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 22 янв 2000 16:28:44 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Re:RE: -------------------------------------------------------------------------------- Я немного запутался в этом треде. Кодировка по-английски - encoding. Чтобы наладить почту иногда бывает достаточно сменить почтовую программу. Но не зная конкретной ситуации, ничего не могу посоветовать. Можно послать письмо с кириллическим текстом непосредственно мне и я попытаюсь понять, в чем дело. Может быть, просто в настройках почтового клиента. Алесей Гришин ----- Original Message ----- From: Kirill A. Loginov To: Sent: Friday, January 22, 1999 6:37 AM Subject: Re:RE: > 18-Jan-00 22:39 you wrote: > > > > > > ---------- > > > нР: Kirill A. Loginov > > > йНЛС: font-list@orthodox.tstu.ru > > > рЕЛЮ: > > > дЮРЮ: 18 ЪМБЮПЪ 1999 Ц. 17:05 > > > > > > IF YOU CAN'T READ MY LETTER IN RUSSIAN, PLEASE TELL ME. > > > IT MAY BE A PROBLEM WITH MY PROVIDER & KOI-8R. > > > > > Only using recorder, but I couldn't understand what kodirovka it was. Maybe > > Grishin knows how to take this information from the recorder? > > And what is the English for kodirovka? :-) > > юПУЮМЦЕКЭЯЙХИ ц.ю. яоА > > > > > > -------------------------------------------------------------------------- ----- > > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru > > > pridetsia teper vot tak pisat. > > > > > -------------------------------------------------------------------------- ----- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru > > =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 24 янв 2000 15:34:01 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[4]: -------------------------------------------------------------------------------- Привет "A A G" , 22 января 2000 г., 16:28:44, ты писал: AAG> Я немного запутался в этом треде. Кодировка по-английски - encoding. Чтобы AAG> наладить почту иногда бывает достаточно сменить почтовую программу. Но не AAG> зная конкретной ситуации, ничего не могу посоветовать. Можно послать письмо AAG> с кириллическим текстом непосредственно мне и я попытаюсь понять, в чем AAG> дело. Может быть, просто в настройках почтового клиента. Чего разбираться -- от него идут письма в кодировке IBM/866-DOS. А насчет клиента -- это верно. Только твой Microsoft Outlook Express 5.00.2314.1300 имхо тоже не совсем то. А уж про Content-Transfer-Encoding: base64, я вообще молчу. Всего хорошего, postmaster пишите:postmaster@des-nt.tstu.ru ------------------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 янв 2000 10:20:14 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: (КСТАТИ, тоже ХАМСТЕРУ) А вот еще интересная ссылочка: -------------------------------------------------------------------------------- http://vedi.d-s.ru Там, кстати, тоже ссылаются на Хамстера, и тоже переживают о его гражданской смерти, случившейся в октябре 1998 г. НЕ ЖЕНИТЕСЬ, ПОЭТЫ! ЗЫ. Я с ним разговаривал по телефону в субботу, и он мне пообещал вот прямо сейчас сесть и написать в наш список. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 янв 2000 14:28:00 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC6: Expert Software Shell & RFC4.1 - Vertical Software -------------------------------------------------------------------------------- ----- Original Message ----- From: "Mikhail Grinchuk" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Tuesday, January 18, 2000 10:04 AM Subject: Re: RFC6: Expert Software Shell & RFC4.1 - Vertical Software > Lev Tikhonov wrote: > > > My zhe pretenduem na sozdanie sistemy, prizvannoj oschastlivit' > > vsekh, rabotajushchikh s CSl jazykom na PC, kak minimum "vzjat' med so vsekh > > cvetov" > > i vsem im, v v svoju ochered', pomoch'. > > Skereje, poka chto my pytajemsja razrabotat' formu zapisi, udobnuju > imenno kak apparatno-nezavisimoje predstavlenije teksta. Popytki Это только RFC1 и 2. ;-) > srazu podderzhat' eto predstavlenije kakim-to softom -- skoreje, > element nashej propagandy (jesli budete rabotat' s nashim predstavlenijem, > to poluchite takije i sjakije poleznyje vozmozhnosti). I prostoj i otkrytyj > format nuzhen dlja togo, chtoby legko bylo pisat' novyj soft, ne zavisja > ni ot MS, ni ot nas s Vami. M$ с успехом навязала свое представление о легкости, которому следует нынче масса программистов, а главное - пользователей. Если мы будем пытаться уперто настаивать на том, что наши представления правильнее - мы первратимся в сектантов: у нас нет и миллионной доли средств, брошенной M$ на пропаганду своих взглядов. Единственное, что можно сделать - это найти некий общий знаменатель (в идеале - наибольший общий делитель) всех возможных для нас подходов, чтобы никто не был обижен тем, что его мышление "не делится" на принятый нами стандарт. > > Naprimer, vot ty tol'ko chto sdelal konverter Irmologion <-> HIP. (...) > > No vot pochemu ty nevol'no ego navjazyvaesh'? A ved' v Pitere u > > Gleba tozhe est' analogichnyj konverter... Pochemu by ne sozdat' sistemu, > > kotoraja predlozhit vospol'zovat'sja na vybor tem ili drugim, a eshche > > interesnee - srazu oboimi, a potom vybrat' tot, chej rezul'tat luchshe > > (osobenno eto otnositsja k netrivial'nym konverteram)? > > Kto zh protiv sistemy? No: > 1) Paru konvertorov napisat' vo mnogo raz proshche, chem sistemu. Так и систем ЦС-набора и окрест-них-существующего софта существует, наверное, уже более десятка. И каждая создавалась с претензией на совершенство. Единственное, чего не хватило каждой - именно системности, понимания того, что на ней свет клином не сошелся. Соотвтетственно, если мы не будем пытаться создать именно Систему с большой буквы, к которой можно было бы прикрутить все остальное, то мы создадим лишь еще одну систему, столь же самонадеянно претендующую на совершенство. Причем расширяемость требуетчся не просто теоретическая, а практическая. "Прикручивать" сателлитов следует по существующим четко описанным спецификациям, которые тоже мы обязаны зафиксировать. Вовсе недостаточно просто провозгласить гибкость сисетмы: теоретически можно запрграммировать что угодно на любом языке, наша же задача - четко описать, что нужно сделать алгоритмически для того, чтобы достичь совместимости с нашей системой. А еще - постараться самим прикрутить таким же образом уже существующие системы, чтобы тем самым самим и оттестировать только что созданные собственные спецификации. о, а > 2) Pust' komponenty budut polezny i sami po sebe. Система с большой буквы все равно должна существовать, хотя бы виртуально - в виде программных "заглушек". Это требуется для того, чтобы не создавать впредь конвертеров, не вписывающихся в стандарт. (То есть не совместимых между собой по четко определенным правилам. Каковые правила эти должны быть созданы в начале, с учетом существующих систем, а потом уже - создаваться конвертеры на основе этих правил). > > Esli ty takoj gordyj, chto uveren v svoikh sposobnostjakh - vo pervykh eto > > grekh, > > a vo vtorykh bol'shinstvo ljudej _ne takovy_, osobenno _pravoslavnykh ljudej_ - > > eto tozhe fakt, kotoryj ja mogu, k sozhaleniju, zasvidetel'stvovat'. > > Tak ja kak raz i bojus', chto na bol'shuju sistemu nikakih sposobnostej > ne hvatit! Преимущество "большой" системы - компонентность: ты можешь сконцентрироваться на своей четко определенной задаче, абсолютно выбросив из головы все, что к ней не относится. Но для этого все подзадачи надо "четко определить". В этой-то необходимости я и пытаюсь тебя убедить. > (Mezhdu prochim, voznikla ideja: sama po sebe razrabotka bol'shoj > sistemy podderzhki c.-sl. tekstov -- vpolne dostojnyj projekt; > pochemu by ne poprobovat' podat' zajavku takogo roda v RGNF > ili RFFI? Gljadish', i na laboratoriju mozhno budet naskresti...) Я могу поспрашивать у нас в ПСТБИ. В любом случае IMHO нужна какая-то базовая контора, которой и будут выделяться деньги. Чисто виртуальному образованию деньги вряд ли будут выделены. Боюсь, что заинтересовать наш ученый совет будет не просто: у них отношение к компьютерным наукам чисто потребительское. > > Takikh GAPov dolzhno byt' napisano v konce koncov mnogo, no pisat'sja oni vovse > > ne objazany vse srazu, a lish' po mere vozniknovenija potrebnosti v kazhdom > > konkretnom GAPe. Naprimer, GAP, imejushchij delo s chistym russkim naborom - ne > > sovsem tot zhe GAP, chto budet ispol'zovan dlja dostatochno prodvinutogo teksta. > > > > Nachinaem s togo, kotoryj sejchas aktual'nee - imho eto prostoj russkij nabor > > (khotja, esli ty sdelaesh' povyshalku v staruju orfografiju, to aktual'nee budet > > > > uzhe ona). No vse funkcii, kotorye mogut byt' povtorno ispol'zovany - pikhaem > > v nekuju hipaccents.dll, dlja togo chtoby pisateli posledujushchikh GAPov ne > > izobretali velosiped. Razumeetsja, v takom sluchae samyj pervyj GAP i dll > > dolzhny proektirovat'sja s osoboj tshchatel'nost'ju, zato napisanie > > posledujushchego > > softa budet proiskhodit' legko i bezboleznenno, po gotovym pravilam i s > > gotovymi bibliotekami. > > Nikogda ne delal *.dll, a potomu vopros: chem eto luchshe/proshche/udobneje > po sravneniju s naborom standalone-utilit, jedinoobrazno napisannyh, Dll - dynamic link library. Лучше это тем, что позволяет пользоваться функциями, полностью позабыв об их реализации и не имея доступа к исходному коду. Допустим, ты в своей расставлялке ударений (для ТеХ и для русского набора) продумал и реализовал некий алгоритм. Тогда, если ты его правильно оформишь в виде dll (то есть правильно разобьешь этот алгоритм на мелкие функции, которые можно впоследствии использовать и документируешь эти функции) - ты сможешь выкинуть исходный код библиотеки и освободить свои мозги для новых задач. А при нужде - пользоваться своими же функциями в уже откомпилированном виде. Конечно, прежде чем выкидывать код, следует библиотеку оттестировать, желательно на в близких реальным уловиях. Мало того, твою dll сможет использовать кто угодно из любой среды - даже я, решив реализовать свою расставлялку ударений, работающую в Ворде и рассчитанную, допустим, на дореволюционную орфографию. При этом я не должен буду ничего узнавать ни об алгоритме твоих функций, и даже в принципе не обязан буду знать о существовании языка C. > ispol'zujushchih odni i te zhe funkcii HIP-vvoda/vyvoda i odno i to zhe > predstavlenije teksta v pamjati, i dostupnyh vmeste s ishodnymi tekstami? Для этого надо разбираться в исходных текстах. 1) не все - сишники, как это ни удивительно и 2) не все способны быстро разобраться в исходных текстах, даже в своих собственных по прошествии некоторого времени. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 янв 2000 14:28:15 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk -------------------------------------------------------------------------------- > > A ne mozhet li byt' takoj situacii, kogda pered EOL stoit znak perenosa? > > Logichneje vsego schitat' takoj fajl ne vpolne korrektnym predstavlenijem > teksta. V luchshem sluchaje etu situaciju mozhno skonvertirovat' v > ?{%- -}, to jest' al'ternativnyj teg: to li mjagkij perenos, to li defis. Prichjom > > dovol'no chasto v rezul'tate pereformatirovanija "razorvannoje" slovo > mozhno uvidet' i vnutri stroki. Не лучше ли запретить такие вещи и и считать это просто ошибкой? Это, кстати, вполне содержательное возражение против строчно-ориентированного принципа организации текста. То есть либо приходится с этим мириться, либо вводить дополнительное правило о запрете переносов, либо.... преходить к абзацно-ориентироанному принципу. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 янв 2000 14:28:20 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Tegi i kommentarii -------------------------------------------------------------------------------- > 2) kommentarii mozhno oformljat' po tomu zhe principu kak > > %{.....} > > No togda vnutri kommentarija nel'zja upotrebljat' simvol "}". Почему бы не разрешить вложенные комментарии? Очень полезное расширение синтаксиса. Комментарий кончается тогда, когда баланс скобок сводится к нулю (отрицательный баланс - ошибка). ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 янв 2000 14:28:34 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC5: Text Classifying -------------------------------------------------------------------------------- > Lev Tikhonov wrote: > > > -- esli v principe dannyj format konvertiruetsja v HIP, to ukazanie na > > vozmozhnost' konvertacii k HIP dannogo konkretnogo fajla > > > > (s) M. Grinchuk > > > ------------------------------------------------------------------------- > > Primechanie: poslednij abzac podlezhit rasshifrovke, a predmet ego - > > otdel'nomu > > rassmotreniju, tak kak eta kharakteristika otnositsja, ochevidno, k inomu > > predmetu (k fajlu, a ne k formatu), sravnitel'no so ostal'nymi chetyr'mja > > kharakteristikami. > > Naprimer, RTF "v principe" konvertirujetsja v HIP, no jesli v RTF-fajle > popadajutsja znaki chuzhdyh shriftov, vstavlennyje kartinki ili formuly -- > to avtomaticheskoj konvertacii uzhe ne budet. Значит, с точки зрения моей классификации в RFC - в первом случае мы имеем IP-RTF ЦСфайл второй категории, а во втором случае - некий дисквалифицированный текст, который, впрочем, может все же претендовать на категорию 2 или 2plus после некоторой обработки (заключающейся либо в чистке чуждых элементов, либо в защите их маркерами "незалэжности" ;) - кстати, вопрос об этих маркерах - это к тебе как к стандартизатору. Поэтому, этот признак относится скорее не к технологический, а к формальной классификации - > в RFC > -------------------------------------------------------------------------- ----- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 янв 2000 15:03:55 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: (КСТАТИ, тоже ХАМСТЕРУ) А вот еще интересная ссылочка: -------------------------------------------------------------------------------- Привет Lev Tikhonov , -- 25 января 2000 г., 10:20:14, ты писал: LT> Там, кстати, тоже ссылаются на Хамстера, и тоже переживают о его гражданской LT> смерти, случившейся в октябре 1998 г. Докладываю - до хамстера регулярный недоход списка. У меня ящик по мере ваших постингов переполняется такими сообщениями: ERROR: Can't deliver. Fatal error. Original message follows: For: hamster@lgg.ru =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 янв 2000 18:06:44 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Fw: (КСТАТИ, тоже ХАМСТЕРУ) А вот еще интересная ссылочка: -------------------------------------------------------------------------------- > LT> Там, кстати, тоже ссылаются на Хамстера, и тоже переживают о его гражданской > LT> смерти, случившейся в октябре 1998 г. > > Докладываю - до хамстера регулярный недоход списка. > У меня ящик по мере ваших постингов переполняется такими сообщениями: А я ему перешлю это на рабочий адрес. Полагаю, что у него просто переполнился ящик. Хотя он утверждал, что видел наши заголовки, да и я ему самое важно пересылал. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 янв 2000 18:24:48 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: project's Website -------------------------------------------------------------------------------- Так как никто за это дело не берется, готов сделать примитивный дизайн для сайта проекта. Большего предложить не могу, так как слабо владею CGI. На безрыбье, знаете ли... Для работы мне нужно: 1. Уверенность в том, что работа сайта улучшится. Сейчас он очень часто просто недоступен. 2. Предложения по структуре и наполнению сайта. (От Постмастера) 3. Некий шаблон для автоматизации сайта. Имею в виду элементарный документ с прописанным в нем синтаксисом включения кусков HTML на лету. Чтобы, по крайней мере, можно было бы вставлять footer и header. 4. Очеведно, не обойтись без логина и тестовой директории. 5. Любые данные о доступных на сайте стандартных скриптах. 6. В перспективе - скрипты для работы с архивом сообщений. Повторяю, это прежде всего дизайн сайта, а не его перманентная поддержка. Если этого недостаточно, умываю руки! Кстати, в рамках проекта "Елисавета" наконец-то собран весь Новый Завет на славянском в Ирмологионе. На сайте еще не все выложено, правда. Еще немного работы - появится программа просмотра. Алексей Гришин ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 янв 2000 21:45:17 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: распознавание речи -------------------------------------------------------------------------------- Нет ли у кого свежего софта для распознавания речи? Если пока невозможно сканировать ц.с. текст, то можно же его прочитать и получить некое подобие русского текста. Затем к делу подключается конвертор. Звучит дико, но можно же попробовать. Софт такого рода неуклонно совершенствуется. За ним надо следить. Алексей ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 25 янв 2000 22:17:56 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AG" Тема: Re: распознавание речи -------------------------------------------------------------------------------- > Нет ли у кого свежего софта для распознавания речи? Если пока невозможно > сканировать ц.с. текст, то можно же его прочитать и получить некое подобие > русского текста. Затем к делу подключается конвертор. Звучит дико, но можно > же попробовать. Софт такого рода неуклонно совершенствуется. За ним надо > следить. Недавно читал, что прогресса тут почти совсем нет. Кроме того, ситуация аналогична программам распознавания образов: очень существенная роль уделяется словарю и спеллчекеру. Какой спеллчекер для славянского? Разве что в результате наших долгих и систематических усплий народится.... А распознавалки речи и вообще пока что не в состоянии распознать незнакомое слово иначе, как шум. Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 26 янв 2000 00:38:01 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: распознавание речи -------------------------------------------------------------------------------- > > Нет ли у кого свежего софта для распознавания речи? Если пока невозможно Гражданы, простите за выражение (прокуратора благо тут нету :-) - не извращайтесь! Утреня какого-нибудь Богоявления набирается гражданкой ручками за пару часов. При этом получается великолепный отдых от тягот жизни и наслаждение текстом. А если учесть ограниченное (хотя и немаленькое) количество подлежащих электронизации текстов - так все эти звукораспознаватели можно смело отдать на откуп передаче очевидное-невероятное и заняться более полезными делами. :-) Архангельский Г.А. СПб ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 26 янв 2000 03:12:17 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: распознавание речи -------------------------------------------------------------------------------- AGA wrote: > > > > Нет ли у кого свежего софта для распознавания речи? Если пока > невозможно > > Гражданы, простите за выражение (прокуратора благо тут нету :-) - не > извращайтесь! Утреня ... Богоявления набирается гражданкой > ручками за пару часов. При этом получается великолепный отдых от тягот С помощью скромно анонсированного мной шаблона для Izhits'ы-CSU это будет немного длиннее, но зато сразу полноценный текст. Насколько длиннее, конечно, зависит от индивидуальных способностей к (слепому) набору. Раскладка, может быть, и не лучшая, но ее можно менять как угодно (это не elisp ;-). Мои знакомые развесили наиболее частые диакритики прямо на цифры. Тоже выход. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 26 янв 2000 06:51:40 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Tegi i kommentarii -------------------------------------------------------------------------------- Доброе утро! Lev Tikhonov wrote: > > 2) kommentarii mozhno oformljat' po tomu zhe principu kak > > > > %{.....} > > > > No togda vnutri kommentarija nel'zja upotrebljat' simvol "}". > > Почему бы не разрешить вложенные комментарии? Очень полезное > расширение синтаксиса. > Комментарий кончается тогда, когда баланс скобок сводится к нулю > (отрицательный баланс - ошибка). Возможный вариант. Но не придется ли тогда потребовать парности скобок в любом контексте, чтобы закомментаривание не могло порождать некорректный текст. Возможный источник неприятности: текст ТЕКСТ %% скобки } опасны ТЕКСТ текст текст Закомментаривая то, что написано заглавными буквами, получаем некорректный текст: текст %{ТЕКСТ %% скобки } опасны ТЕКСТ} текст текст А отказываться от "свободы" в %%-комментариях не хочется, именно чтобы иметь возможность безопасно закомментарить что угодно: берем кусок текста и ставим %% в начале каждой строки. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 26 янв 2000 08:47:33 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC6: Expert Software Shell & RFC4.1 - Vertical Software -------------------------------------------------------------------------------- Lev Tikhonov wrote: > > I prostoj i otkrytyj > > format nuzhen dlja togo, chtoby legko bylo pisat' novyj soft, ne zavisja > > ni ot MS, ni ot nas s Vami. > > M$ с успехом навязала свое представление о легкости, которому > следует нынче масса программистов, а главное - пользователей. Положим, звезда MS не вечно будет Солнцем, а то, глядишь, и вовсе закатится. И что тогда делать? С другой стороны, хранение документов как текстовых файлов является некоей гарантией их "вечности". Не так редки сообщения, что та или иная группа исследователей использует в работе тексты, набранные еще на заре компьтерной техники. > Если мы будем пытаться уперто настаивать на том, что наши > представления правильнее - мы первратимся в сектантов: у нас > нет и миллионной доли средств, брошенной M$ на пропаганду своих > взглядов. Единственное, что можно сделать - это найти некий общий > знаменатель (в идеале - наибольший общий делитель) всех возможных > для нас подходов, чтобы никто не был обижен тем, что его мышление > "не делится" на принятый нами стандарт. Правильно. Один общий знаменатель -- текстовое представление. Другой -- описание алгоритмов проверки и восстановления текста в "воспроизводимом" виде. Сюда же можно добавить алгоритмы конвертации в другие системно-независимые представления (например, TXT/Unicode). Все остальное уже, увы, будет привязано к конкретной платформе. > Так и систем ЦС-набора и окрест-них-существующего софта существует, > наверное, уже более десятка. И каждая создавалась с претензией на > совершенство. Единственное, чего не хватило каждой - именно > системности, понимания того, что на ней свет клином не сошелся. Есть ли среди них системы, направленные не только на задачу "бумажного" издания книги? О таких было бы полезно узнать больше и, может быть, чем-то воспользоваться. > Соотвтетственно, если мы не будем пытаться создать именно Систему с большой > буквы, к которой можно было бы прикрутить все остальное, то мы создадим лишь > еще одну систему, столь же самонадеянно претендующую на совершенство. Причем > расширяемость требуетчся не просто теоретическая, а практическая. > "Прикручивать" сателлитов следует по существующим четко описанным > спецификациям, которые тоже мы обязаны зафиксировать. Вовсе недостаточно > просто провозгласить гибкость сисетмы: теоретически можно запрграммировать > что угодно на любом языке, наша же задача - четко описать, что нужно сделать > алгоритмически для того, чтобы достичь совместимости с нашей системой. Бесспорно согласен, если это значит "использовать наш формат файлов для входной и выходной информации". Если что-то другое -- что именно? > А > еще - постараться самим прикрутить таким же образом уже существующие > системы, чтобы тем самым самим и оттестировать только что созданные > собственные спецификации. Это означает написание конверторов? > > 2) Pust' komponenty budut polezny i sami po sebe. > > Система с большой буквы все равно должна существовать, хотя бы виртуально - > в виде программных "заглушек". Это требуется для того, чтобы не создавать > впредь конвертеров, не вписывающихся в стандарт. (То есть не совместимых > между собой по четко определенным правилам. Каковые правила эти должны быть > созданы в начале, с учетом существующих систем, а потом уже - создаваться > конвертеры на основе этих правил). Чего-то я тут не понимаю. Если конвертор не вписывается в стандарт, то это вроде бы просто неправильный конвертор? Просьба пояснить. > Преимущество "большой" системы - компонентность: ты можешь > сконцентрироваться на своей четко определенной задаче, абсолютно выбросив из > головы все, что к ней не относится. Но для этого все подзадачи надо "четко > определить". В этой-то необходимости я и пытаюсь тебя убедить. Так я уже и есть убежденный! Например, работа с текстом с помощью набора standalone-утилит (не диалоговых) и какого-нибудь нехитрого текстового редактора вырисовывается такая: 1) конвертируем его в HIP; 2) если какие-то детали орфографии (диакритика, наличие тех или иных букв) отсутствуют, запускаем автоматическое их восстановление. В сомнительных случаях программа восстановления добавит пометку "?" (и, возможно, что-нибудь еще, типа "альтернативного тега"); 3) потом пробегаемся по тексту редактором, ища символ "?" и исправляем соответствующие места. 4) Затем, когда в наборе "явно отстутствующих" элементов правописания больше не видно, запускаем все возможные процедуры формальной проверки. Среди них могут быть довольно простые (проверка отсутствия каких-либо невозможных сочетаний), и более тонкие. Например, такая: а) убираем все "ъ" и паерки; б) запускаем формальное их восстановление; в) запускаем программу вывода списка разночтений между исходным текстом и полученным; г) по поводу каждого разночтения (вообще говоря) лезем в книгу и сверяем текст с первоисточником. После этих формальных проверок текст конвертируется в какой-нибудь издательский формат, распечатывается и вычитывается. При наличии опечаток исправляем их и возвращается к пункту 4). > > (Mezhdu prochim, voznikla ideja: sama po sebe razrabotka bol'shoj > > sistemy podderzhki c.-sl. tekstov -- vpolne dostojnyj projekt; > > pochemu by ne poprobovat' podat' zajavku takogo roda v RGNF > > ili RFFI? Gljadish', i na laboratoriju mozhno budet naskresti...) > > Я могу поспрашивать у нас в ПСТБИ. В любом случае IMHO нужна какая-то > базовая контора, которой и будут выделяться деньги. Чисто виртуальному > образованию деньги вряд ли будут выделены. > Боюсь, что заинтересовать наш ученый совет будет не просто: у них > отношение к компьютерным наукам чисто потребительское. Насколько помню, контора нужна просто как место, где есть бухгалтерия и касса. Одобрение самого проекта вроде бы не упоминалось. Может быть, в качестве конторы можно использовать и какое-нибудь заинтересованное издательство. Хотя "чистой виртуальностью" здесь уже не обойтись -- по ходу дела надо сотворять довольно много бумажек с паспортными данными, подписями участников и проч. > > Nikogda ne delal *.dll, a potomu vopros: chem eto > luchshe/proshche/udobneje > > po sravneniju s naborom standalone-utilit, jedinoobrazno napisannyh, > > Dll - dynamic link library. Лучше это тем, что позволяет пользоваться > функциями, полностью позабыв об их реализации и не имея доступа к исходному > коду. Допустим, ты в своей расставлялке ударений (для ТеХ и для русского > набора) продумал и реализовал некий алгоритм. Тогда, если ты его правильно > оформишь в виде dll (то есть правильно разобьешь этот алгоритм на мелкие > функции, которые можно впоследствии использовать и документируешь эти > функции) - ты сможешь выкинуть исходный код библиотеки и освободить свои > мозги для новых задач. А при нужде - пользоваться своими же функциями в уже > откомпилированном виде. Конечно, прежде чем выкидывать код, следует > библиотеку оттестировать, желательно на в близких реальным уловиях. > Мало того, твою dll сможет использовать кто угодно из любой среды - даже я, > решив реализовать свою расставлялку ударений, работающую в Ворде и > рассчитанную, допустим, на дореволюционную орфографию. При этом я не должен > буду ничего узнавать ни об алгоритме твоих функций, и даже в принципе не > обязан буду знать о существовании языка C. Насколько эти dll системно-независимы? Или кроме как в Win они нигде не применяются? > > ispol'zujushchih odni i te zhe funkcii HIP-vvoda/vyvoda i odno i to zhe > > predstavlenije teksta v pamjati, i dostupnyh vmeste s ishodnymi tekstami? > > Для этого надо разбираться в исходных текстах. 1) не все - сишники, как это > ни удивительно и 2) не все способны быстро разобраться в исходных текстах, > даже в своих собственных по прошествии некоторого времени. Так ведь речь не идет о том, чтобы навязывать именно исходники. Пусть будут и они, и exe-шники. Может быть, и dll тоже в такую схему можно без особых проблем вложить (прицепив к "телу" алгоритма другой интерфейс ввода-вывода). Но, имея исходники, кто-нибудь сможет применить их и в совершенно другой платформе. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 26 янв 2000 09:00:39 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk -------------------------------------------------------------------------------- Lev Tikhonov wrote: > > > A ne mozhet li byt' takoj situacii, kogda pered EOL stoit znak perenosa? > > > > Logichneje vsego schitat' takoj fajl ne vpolne korrektnym predstavlenijem > > teksta. V luchshem sluchaje etu situaciju mozhno skonvertirovat' v > > ?{%- -}, to jest' al'ternativnyj teg: to li mjagkij perenos, to li defis. > Prichjom > > > > dovol'no chasto v rezul'tate pereformatirovanija "razorvannoje" slovo > > mozhno uvidet' i vnutri stroki. > > Не лучше ли запретить такие вещи и и считать это просто ошибкой? > Это, кстати, вполне содержательное возражение против > строчно-ориентированного принципа организации текста. То есть либо > приходится с этим мириться, либо вводить дополнительное правило о запрете > переносов, либо.... преходить к абзацно-ориентироанному принципу. "Чистый" абзацно-ориентированный принцип опасен тем, что порождает файлы со сколь угодно длинными строками (= последовательностями символов между EOL). А это у многих текстовых редакторов вызывает трудности: длинные строки могут просто обрезаться, либо рваться на части в произвольном месте (файл, сохраненный после такого редактирования, будет содержать разорванные слова). Если исходный текст содержит знаки переноса -- с ними что-то надо делать. А в HIP никаких переносов нет. (Поразмыслив, склоняюсь к тому, чтобы и "мягких" переносов там не было. Взамен предлагается иметь отдельный файл образцов переноса, который может использоваться программами-конверторами из HIP в те форматы, где "мягкие" переносы надо расставлять в каждом слове явно.) Вопрос: возможна ли в ц.-сл. языке ситуация, когда одно и то же (визуально) слово в зависимости от грамматической роли или иного контекста будет переноситься по-разному? (Собственно, только в этом случае "мягкие" переносы надо иметь в самом тексте.) =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 26 янв 2000 09:11:32 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC5: Text Classifying -------------------------------------------------------------------------------- Lev Tikhonov wrote: > > > -- esli v principe dannyj format konvertiruetsja v HIP, to ukazanie na > > > vozmozhnost' konvertacii k HIP dannogo konkretnogo fajla > > > > > > Naprimer, RTF "v principe" konvertirujetsja v HIP, no jesli v RTF-fajle > > popadajutsja znaki chuzhdyh shriftov, vstavlennyje kartinki ili formuly -- > > to avtomaticheskoj konvertacii uzhe ne budet. > > ·щпГьБ, А БчГзь вЮущьО эчуы зшпААьДьзпФьь р RFC - р ъуЮрчэ АшЦГпу эК ьэууэ > IP-RTF фаДпыш рБчЮчы зпБусчЮьь, п рч рБчЮчэ АшЦГпу - щузьы > тьАзрпшьДьФьЮчрпщщКы БузАБ, зчБчЮКы, ръЮчГуэ, эчжуБ рАу жу ъЮуБущтчрпБЛ щп > зпБусчЮьН 2 ьшь 2plus ъчАшу щузчБчЮчы чяЮпячБзь (впзшНГпНИуыАО шьяч р ГьАБзу > ГЦжтКЕ МшуэущБчр, шьяч р впИьБу ьЕ эпЮзуЮпэь "щувпшМжщчАБь" ;) - зАБпБь, > рчъЮчА чя МБьЕ эпЮзуЮпЕ - МБч з Буяу зпз з АБпщтпЮБьвпБчЮЦ. ачруЮХущщч щу ЕчГуБАО ьвчяЮуБпБЛ эпЮзуЮК тшО Гусч-шьяч, зЮчэу HIP. ° р HIP эчжщч ьАъчшЛвчрпБЛ ГБч-щьяЦтЛ р Бпзчэ тЦЕу (ъчзп ъЮчАБч ДпщБпвьЮЦН): АКЮчы АшпрОщАзьы БузАБ АКЮчы АшпрОщАзьы БузАБ АКЮчы АшпрОщАзьы БузАБ %{-рчААБпщчршущьу} рКруЮущщКы АшпрОщАзьы БузАБ рКруЮущщКы АшпрОщАзьы БузАБ рКруЮущщКы АшпрОщАзьы БузАБ %{+рчААБпщчршущьу} АКЮчы АшпрОщАзьы БузАБ АКЮчы АшпрОщАзьы БузАБ ЅЦ п АчрАуэ ГЦжтКу МшуэущБК (Бу жу зпЮБьщзь ьшь зпзпО-щьяЦтЛ шпБКщЛ) эчсЦБ ъЮьАЦБАБрчрпБЛ р HIP-Дпышу БчшЛзч рщЦБЮь зчээущБпЮьур. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 26 янв 2000 11:27:29 От: "S. M. Hozainov" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AG" Тема: Re: распознавание речи -------------------------------------------------------------------------------- ----- Original Message ----- From: AG To: -=ORTHODOX-FONT=- Project Participants Sent: 25 января 2000 г. 21:45 Subject: распознавание речи > Нет ли у кого свежего софта для распознавания речи? Если пока невозможно > сканировать ц.с. текст, то можно же его прочитать и получить некое подобие > русского текста. Затем к делу подключается конвертор. Звучит дико, но можно > же попробовать. Софт такого рода неуклонно совершенствуется. За ним надо > следить. > > Алексей Господа! Как-то я скупил на горбушке весь софт по этой теме и серьезно пытался приспособить его для набора в издательстве. Поддался рекламным статейкам! Результат отрицательный. Все программы такого рода пока только игрушки. 1. Слова распознаются плохо (пробовал разные микрофоны и зв. карты). 2. Обучать программу понимать слова можно, но она приучается к конкретному голосу. 3. Лев прав, упор в этих программах делается на словарь и спеллчекер. Т.е. программа распознает не буквы и слоги, а слова (или выражения) сравнивая произнесенные звуки с ранее записанными. 4. И самое главное. Думаю для русского языка эти программы вообще не годятся. Во всяком случае пока, в теперешнем из виде. Давайте посчитаем. Например, есть у англичан слово red. Скольким словам придется обучать программу для распознавания этого слова на русском языке? красный красная красное красные красному красной и т.д. и т.п. 5. Пока это утопия. Раздал диски знакомым. Все поигрались и бросили это дело. А вообще-то идея замечательная! -------------------------------------------------------------- From: Mikhail Grinchuk To: -=ORTHODOX-FONT=- Project Participants Sent: 26 января 2000 г. 9:00 Subject: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk > "Чистый" абзацно-ориентированный принцип опасен тем, что порождает > файлы со сколь угодно длинными строками (= последовательностями > символов между EOL). А это у многих текстовых редакторов вызывает > трудности: длинные строки могут просто обрезаться, либо рваться на > части в произвольном месте (файл, сохраненный после такого > редактирования, будет содержать разорванные слова). Считаю абзацно-ориентированный принцип правильным и естественным. Загрузим текст в издательскую систему и подвигаем правую границу (правое поле) текста. Сразу видно что именно абзац является структурной единицей текста. При записи в текстовой файл абзацев строками, получим строки длиной равной длине абзацев. Разве это такие уж длинные строки? Можно разломить абзац на строки принудительно, но пускай будет однозначный знак конца абзаца. По поводу запретов переносов и др. Во всем к чему будет доступ оператора, будут сделаны все возможные ошибки + все невозможные, и будут нарушены все запреты. Т.е. все конверторы должны не только решать свою прямую задачу, но и как-то реагировать на нарушения самого формата инварианта и ошибки наборщика во всем их разнообразии и непредсказуемости :(. Кстати и верстальщики внесут свою лепту. И не малую. Вместо мягкого переноса - дефис, неоправданные принудительные обрывы строк, табуляторы, пробелы всех сортов и пр. Что можно со всем этим сделать? Разве что изменить природу человека. Только где взять исходники? :) С уважением, Сергей Михайлович Хозяинов. smh@mail.ru http://stop.at/smh ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 26 янв 2000 11:54:05 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk -------------------------------------------------------------------------------- "MG" == Mikhail Grinchuk writes: MG> Если исходный текст содержит знаки переноса -- с ними что-то надо MG> делать. А в HIP никаких переносов нет. (Поразмыслив, склоняюсь к MG> тому, чтобы и "мягких" переносов там не было. Взамен предлагается MG> иметь отдельный файл образцов переноса, который может MG> использоваться программами-конверторами из HIP в те форматы, где MG> "мягкие" переносы надо расставлять в каждом слове явно.) а почему бы не допустить мягкие пепеносы в HIP? их можно представлять либо как \- либо как 8-битные символы мягкого переноса, присутствующие в кодовых страницах (скажем, в cp1251 такой символ есть) MG> Вопрос: возможна ли в ц.-сл. языке ситуация, когда одно и то же MG> (визуально) слово в зависимости от грамматической роли или иного MG> контекста будет переноситься по-разному? (Собственно, только в MG> этом случае "мягкие" переносы надо иметь в самом тексте.) могу точно утверждать, что в русском языке такие ситуации имеются (зависимость переносов одинаково пишущихся слов от грамматической формы). если требуется привести примеры --- напишите. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 26 янв 2000 03:08:07 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: распознавание речи -------------------------------------------------------------------------------- > Гражданы, простите за выражение (прокуратора благо тут нету :-) - не > извращайтесь! Утреня какого-нибудь Богоявления набирается гражданкой > ручками за пару часов. При этом получается великолепный отдых от тягот > жизни и наслаждение текстом. А если учесть ограниченное (хотя и > немаленькое) количество подлежащих электронизации текстов - так все эти > звукораспознаватели можно смело отдать на откуп передаче > очевидное-невероятное и заняться более полезными делами. > :-) Как вы, Глеб, вульгарно выразились. Это Вы у Ролана Барта почерпнули идею наслаждения текстом? Это же извращение и есть! А что же, при чтении тех же текстов вслух не происходит наслаждения? Как говорят в Америке, whatever turns you on :) А если серьезно, то мне хорошо известно, как непросто засадить людей за набор этого самого ограниченного количества текстов. И наш долг им (нам) эту задачу, поелику возможно, облегчить. Набрали бы Вы за пару часов Притчи? Алексей =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 26 янв 2000 12:48:13 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Re: распознавание речи -------------------------------------------------------------------------------- S. M. Hozainov wrote: > > "гьАБКы" пявпФщч-чЮьущБьЮчрпщщКы ъЮьщФьъ чъпАущ Буэ, ГБч ъчЮчжтпуБ > > ДпышК Ач АзчшЛ Цсчтщч тшьщщКэь АБЮчзпэь (= ъчАшутчрпБушЛщчАБОэь > > Аьэрчшчр эужтЦ EOL). ° МБч Ц эщчсьЕ БузАБчрКЕ ЮутпзБчЮчр рКвКрпуБ > > БЮЦтщчАБь: тшьщщКу АБЮчзь эчсЦБ ъЮчАБч чяЮувпБЛАО, шьяч ЮрпБЛАО щп > > ГпАБь р ъЮчьврчшЛщчэ эуАБу (Дпыш, АчЕЮпщущщКы ъчАшу Бпзчсч > > ЮутпзБьЮчрпщьО, яЦтуБ АчтуЮжпБЛ ЮпвчЮрпщщКу Ашчрп). > > аГьБпН пявпФщч-чЮьущБьЮчрпщщКы ъЮьщФьъ ъЮпрьшЛщКэ ь уАБуАБрущщКэ. > ·псЮЦвьэ БузАБ р ьвтпБушЛАзЦН АьАБуэЦ ь ъчтрьспуэ ъЮпрЦН сЮпщьФЦ (ъЮпрчу > ъчшу) БузАБп. аЮпвЦ рьтщч ГБч ьэущщч пявпФ ОршОуБАО АБЮЦзБЦЮщчы утьщьФуы > БузАБп. »чсьГуАзчы АБЮЦзБЦЮщчы утьщьФуы -- яувЦАшчрщч. Ѕч "ДьвьГуАзь" чщ яЦтуБ Юпвтушущ щп АБЮчзь (щпъЮьэуЮ, р щпХуы ъуЮуъьАзу ъч email'Ц МБч ъЮчьАЕчтьБ прБчэпБьГуАзь). > їЮь впъьАь р БузАБчрчы Дпыш пявпФур АБЮчзпэь, ъчшЦГьэ АБЮчзь тшьщчы > Юпрщчы тшьщу пявпФур. юпвру МБч Бпзьу Цж тшьщщКу АБЮчзь? црК, тп. їчъптпНБАО чсЮпщьГущьО ь р 80 Аьэрчшчр, ь р 255. Ј уАшь ЮутпзБчЮ ъЮчАБч ЮужуБ АБЮчзЦ щп зЦАчГзь -- МБч уИу щу АпэКы ъшчЕчы АшЦГпы. > јчжщч ЮпвшчэьБЛ пявпФ щп АБЮчзь ъЮьщЦтьБушЛщч, щч ъЦАзпы яЦтуБ > чтщчвщпГщКы вщпз зчщФп пявпФп. гуэ ъшчЕп ъЦАБпО АБЮчзп? > їч ъчрчтЦ впъЮуБчр ъуЮущчАчр ь тЮ. > Іч рАуэ з ГуэЦ яЦтуБ тчАБЦъ чъуЮпБчЮп, яЦтЦБ АтушпщК рАу рчвэчжщКу чХьязь > + рАу щурчвэчжщКу, ь яЦтЦБ щпЮЦХущК рАу впъЮуБК. > б.у. рАу зчщруЮБчЮК тчшжщК щу БчшЛзч ЮуХпБЛ АрчН ъЮОэЦН вптпГЦ, > щч ь зпз-Бч ЮупсьЮчрпБЛ щп щпЮЦХущьО Апэчсч ДчЮэпБп ьщрпЮьпщБп ь чХьязь щпячЮИьзп > рч рАуэ ьЕ ЮпвщччяЮпвьь ь щуъЮутАзпвЦуэчАБь :(. їЦАБЛ зчщруЮБчЮК рАу жу щу чАчяч эЦтЮАБрЦНБ, п ГуАБщч зчщруЮБьЮЦНБ "зпз уАБЛ". ° тшО "рКГьИущьО" рАуЕ МБьЕ чХьячз эчжщч ьэуБЛ чБтушЛщЦН ЦБьшьБЦ -- р АшЦГпу А ъуЮущчАпэь МБч яЦтуБ ъчьАз АьБЦпФьы (яЦзрп)(туДьА)(ъЮчяушК ь EOL р шНячэ зчшьГуАБру)(яЦзрп) ь Цтпшущьу р щьЕ туДьАп ь ъЮчяушчр/EOL. > єАБпБь ь руЮАБпшЛИьзь рщуАЦБ АрчН шуъБЦ. Ј щу эпшЦН. ІэуАБч эОсзчсч ъуЮущчАп - > туДьА, щучъЮпртпщщКу ъЮьщЦтьБушЛщКу чяЮКрК АБЮчз, БпяЦшОБчЮК, ъЮчяушК рАуЕ > АчЮБчр ь ъЮ. ° "БпяЦшОБчЮК ь ъЮчяушК рАуЕ АчЮБчр" р HIP ъч чъЮутушущьН МзрьрпшущБщК чтщчэЦ ъЮчяушЦ. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 26 янв 2000 13:30:45 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk -------------------------------------------------------------------------------- Vladimir Volovich wrote: > MG> µАшь ьАЕчтщКы БузАБ АчтуЮжьБ вщпзь ъуЮущчАп -- А щьэь ГБч-Бч щптч > MG> тушпБЛ. ° р HIP щьзпзьЕ ъуЮущчАчр щуБ. (їчЮпвэКАшьр, АзшчщОНАЛ з > MG> БчэЦ, ГБчяК ь "эОсзьЕ" ъуЮущчАчр Бпэ щу яКшч. Івпэущ ъЮутшпспуБАО > MG> ьэуБЛ чБтушЛщКы Дпыш чяЮпвФчр ъуЮущчАп, зчБчЮКы эчжуБ > MG> ьАъчшЛвчрпБЛАО ъЮчсЮпээпэь-зчщруЮБчЮпэь ьв HIP р Бу ДчЮэпБК, сту > MG> "эОсзьу" ъуЮущчАК щптч ЮпААБпршОБЛ р зпжтчэ Ашчру Орщч.) > > п ъчГуэЦ яК щу тчъЦАБьБЛ эОсзьу ъуъущчАК р HIP? ьЕ эчжщч ъЮутАБпршОБЛ > шьяч зпз \- шьяч зпз 8-яьБщКу АьэрчшК эОсзчсч ъуЮущчАп, ъЮьАЦБАБрЦНИьу > р зчтчрКЕ АБЮпщьФпЕ (Азпжуэ, р cp1251 Бпзчы Аьэрчш уАБЛ) 1) дчЮэпшЛщч ьЕ АтушпБЛ эчжщч, рчъЮчА БчшЛзч р АьщБпзАьАу -- ъч АэКАшЦ HIP МБч эчжуБ яКБЛ %- ьшь &- (з зчтчрКэ АБЮпщьФпэ ъЮьрОвКрпБЛАО щь р зчуэ АшЦГпу щушЛвО, ъчБчэЦ ГБч щу рАу чщь эОсзьы ъуЮущчА ьэуНБ, п Аьэрчш "\" тшО утьщччяЮпвьО ъЦАБЛ чАБпщуБАО ъЮуДьзАчэ тшО щптАБЮчГщКЕ чяЙузБчр). 2) %- (ьшь тЮЦсчы рпЮьпщБ АъуФзчээущБпЮьО) ъшчЕ Буэ, ГБч щптч чАчяч чсчрчЮьБЛ, ГБч ъЮчьвчытуБ, уАшь чщ чзпжуБАО р АБЮпщщчэ эуАБу -- Азпжуэ, ЮОтчэ А ъЮчяушчэ ьшь рщЦБЮь эщчсчАьэрчшЛщчсч чячвщпГущьО чтщчы яЦзрК. 3) &- (ьшь тЮЦсчы рпЮьпщБ "ЮупшЛщчсч" Аьэрчшп) ъшчЕ Буэ, ГБч р БузАБу зпз Бпзчрчэ эОсзьЕ ъуЮущчАчр щуБ -- МБч щпХп пяАБЮпзФьО рчвэчжщКЕ АъчАчячр руЮАБзь. 4) І шНячэ АшЦГпу щпЮЦХпуБАО (ь чГущЛ Юувзч) БЮуячрпщьу "щпсшОтщчАБь" HIP-БузАБп ь, щпруЮщчу, щп БЮуБЛ ЦрушьГьрпуБАО усч тшьщп. 5) їЮпрьшп ъуЮущчАп щу щпАБчшЛзч ГуБзч впДьзАьЮчрпщК, ГБчяК А ЦруЮущщчАБЛН счрчЮьБЛ ч "ъЮпрьшЛщчэ щпъьАпщьь" ь "чХьязпЕ". (° яьяшьчБузп HIP-БузАБчр эКАшьБАО зпз щуАБч МБпшчщщчу.) 6) їЮь ЦБчГщущьь ъЮпрьш ъуЮущчАп ъчБЮуяЦуБАО ъуЮуБЮОЕщЦБЛ рАу БузАБК (ь Ц зпжтчсч БузАБп рчвщьзщуБ щчрпО руЮАьО). 7) дьзАьЮЦО эОсзьу ъуЮущчАК р БузАБу, эК, Буэ АпэКэ, ъЮьрОвКрпуэ АуяО з ъпЮптьсэу "ъуЮущчА рчвэчжущ/ъуЮущчА щурчвэчжущ", ЕчБО уАБЛ (ъЦАБЛ щу Бпз ЮпАъЮчАБЮпщущщКу ь -- сшпрщчу -- щу Бпз ЕчЮчХч ЮпвЮпячБпщщКу) ьтуь ъуЮущчАчр А Юпвщчы АБуъущЛН тчъЦАБьэчАБь. ІКщчАО ъЮчяшуэК ъуЮущчАчр "вп Азчязь" БузАБп, эК ъчврчшьэ р яЦтЦИуэ рчАъчшЛвчрпБЛАО МБьэь ьтуОэь, ьвэущьр БчшЛзч зчщруЮБчЮК ьв HIP ь щпАБЮчьр чтьщ Дпыш А МБпшчщпэь ъуЮущчАп. 8) µАшь рчъЮчА р Бчэ, ГБч щу ЕчГуБАО ъьАпБЛ пшсчЮьБэ рАБпрзь ъуЮущчАчр р зпжтчэ зчщруЮБчЮу ьв HIP, Бч МБч ЮуХпуБАО Юпвшчжущьуэ зчщруЮБпФьь р трп Хпсп: АъуЮрп чБтушЛщпО ъЮчсЮпээп рАБпршОуБ ъуЮущчАК (уу щптч яЦтуБ щпъьАпБЛ рАусч чтьщ Юпв), п ъчБчэ АчяАБрущщч зчщруЮБчЮ ъуЮурчтьБ ЮувЦшЛБпБ р щЦжщКы ДчЮэпБ. > MG> ІчъЮчА: рчвэчжщп шь р Ф.-Аш. ОвКзу АьБЦпФьО, зчстп чтщч ь Бч жу > MG> (рьвЦпшЛщч) Ашчрч р впрьАьэчАБь чБ сЮпээпБьГуАзчы Ючшь ьшь ьщчсч > MG> зчщБузАБп яЦтуБ ъуЮущчАьБЛАО ъч-ЮпвщчэЦ? (ачяАБрущщч, БчшЛзч р > MG> МБчэ АшЦГпу "эОсзьу" ъуЮущчАК щптч ьэуБЛ р Апэчэ БузАБу.) > > эчсЦ БчГщч ЦБруЮжтпБЛ, ГБч р ЮЦААзчэ ОвКзу Бпзьу АьБЦпФьь ьэуНБАО > (впрьАьэчАБЛ ъуЮущчАчр чтьщпзчрч ъьХЦИьЕАО Ашчр чБ сЮпээпБьГуАзчы > ДчЮэК). уАшь БЮуяЦуБАО ъЮьруАБь ъЮьэуЮК --- щпъьХьБу. ґшО ЮЦААзчсч ОвКзп ъЮьэуЮК, зчщуГщч, уАБЛ (АзчЮуу рАусч, Ц щпА АрутущьО ьв чтщчсч ьАБчГщьзп). ІчъЮчА ьэущщч ч ФуЮзчрщчАшпрОщАзчэ. Ёту щпшьГьу ЦтпЮущьы ь ячшЛХуу ГьАшч яЦзр ЦэущЛХпНБ ХпщАК АшЦГпыщКЕ Ачръптущьы Ашчр. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 26 янв 2000 15:24:04 От: "S. M. Hozainov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Знак конца абзаца -------------------------------------------------------------------------------- > S. M. Hozainov wrote: > Можно разломить абзац на строки принудительно, но пускай будет > однозначный знак конца абзаца. > Mikhail Grinchuk wrote: > Чем плоха пустая строка? Тем, что в случае утраты пустых строк, восстановить абзацы будет очень трудно. Разве что сличением с бумажным оригиналом. Если есть возможность потерять пустые строки, значит они будут потеряны. В свое время я много намучился с текстами Лексикона для DOS. Теперь дую на воду. С уважением, Сергей Михайлович Хозяинов. smh@mail.ru PS. А что это за редакторы такие, которые не могут прочитать строку в 256 символов? Имеет ли смысл обращать на них внимание? ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 26 янв 2000 16:53:51 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: *** troubles -------------------------------------------------------------------------------- Привет All, 25 января 2000 г., 18:06:44, ты писал: Очередные недоходы: For: avv@quasar.ipa.nw.ru одно For: K.Loginov@pobox.spbu.ru пять писем For: Gleb.Arkh@paloma.spbu.ru два письма For: hamster@lgg.ru три письма Кроме хамстера у всех остальных проблемы связанны со вчерашним большим тормозом на канале. У хамстера, как и всегда, Empty MX list. =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 26 янв 2000 23:41:28 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Подарок для сишников и юниксоидов. -------------------------------------------------------------------------------- Один вумный крякер крякнул такую вот программу. Нужно кому-нибудь? њ Insure++ v5.1 *Incl.Keymaker* (на самом деле там только кеймейкер, а саму программу качайте сами с указанного сайта). ЬЬЬЬЬЬЬЬ ЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬ ЬЬЬЬЬЬЬЬЬ ХННННННННННННННННННё ЦД ДДДД Д ДДННДД Д ДДДДДД Д ДДДДДД Д ДДННДД Д ДДДД Д? ЪД?Э RELEASE INFO ЮГД? ЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯ А? Ы ФНННННННННННННННННН? Ы Ы Ы Ы [ Program ........................................... Insure++ v5.1 ] Ы Ы [ Type .................. Powerful programming error detection tool ] Ы Ы [ OS ...................................................... Win9xNT ] Ы Ы [ By ..................................................... ParaSoft ] Ы Ы [ Homepage ................................ http://www.parasoft.com ] Ы Ы Ы Ы [ Cracked by ........................ Ivanopulo ] Ы Ы [ Release type .................. Incl.Keymaker ] Ы Ы [ Release date ................... Jan 24, 2000 ] Ы Ы Ы А? ЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬ ЪЩ ?ХННННННННННННННННННё ЦД ДДДД Д ДДННДД Д ДДДДДД Д ДДДДДД Д ДДННДД Д ДДДД Д? ЪБ?Э DESCRIPTION ЮГД? ЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯ А? Ы ФНННННННННННННННННН? Ы Ы Ы Ы Insure++ is a tool that automatically detects large classes of Ы Ы programming and run-time errors, including algorithmic anomalies, Ы Ы bugs, and deficiencies. By visualizing the execution of a program and Ы Ы the concurrent data manipulation, Insure++ helps developers Ы Ы understand how code operates. Insure++ uses patented Source Code Ы Ы Instrumentation (patent #5,581,696) and Mutation Testing technologies Ы Ы to locate bugs in source code automatically. Operating in place of a Ы Ы compiler, Insure++ builds a database of all program elements. At Ы Ы runtime, Insure++ then verifies memory references and program Ы Ы implementation by checking data values against the database. Ы Ы Ы Ы Insure++ provides a complete diagnosis of each problem, including a Ы Ы description of the error, the line of source code containing the Ы Ы error, and stack trace information. The error reports Insure++ Ы Ы provides help developers find errors more quickly than by manual Ы Ы testing. Insure++ operates without modifying source code; it simply Ы Ы provides developers with complete information for fixing errors. Ы Ы Ы Ы Developers at intermediate stages of a project can choose to run Ы Ы Insure++ in intermediate mode. This alternative to source code Ы Ы instrumentation is a less thorough but far quicker method of checking Ы Ы for several basic error types and providing coverage. Ы Ы Ы Ы Insure++ detects the following categories of errors: Ы Ы Ы Ы - Memory corruption/uninitialized memory Ы Ы - Memory leaks Memory allocation errors Ы Ы - Variable definition conflicts I/O errors Ы Ы - Pointer errors Ы Ы - Library errors Ы Ы - Logic errors Ы Ы - Algorithmic errors Ы Ы - Program optimization Ы Ы - Program understanding Ы Ы - Coverage analysis Ы Ы Ы Ы Developers can use Insure++ to find run-time errors before they reach Ы Ы customers, in much less time than is required by manual Ы Ы error-detection methods. Ы Ы Ы Ы Insure++ includes three distinct tools that work together to improve Ы Ы your development process. Ы Ы Ы Ы Insure++ automatically detects large classes of programming and Ы Ы run-time errors. It quickly pinpoints algorithmic anomalies, bugs, Ы Ы and deficiencies. Inuse visualizes in real-time the memory Ы Ы manipulation of your program, helping developers spot bugs and Ы Ы inefficiencies in memory handling. TCA also performs coverage Ы Ы analysis of programs, providing necessary feedback to programmers Ы Ы about which parts of the code were actually tested. Ы Ы Ы Ы Insure++ operates at four distinct levels in the software development Ы Ы and maintenance life cycle: Ы Ы Ы Ы - Memory Reference Verification Ы Ы - Programming Verification Ы Ы - Optimization Ы Ы - Coverage Analysis Ы Ы Ы Ы Insure++ improves software reliability by verifying memory references Ы Ы and program implementation. Insure++ exposes all the bugs - in your Ы Ы lab rather than the customer's site. Insure++ pinpoints bugs quickly, Ы Ы then provides all the information necessary to repair the bug Ы Ы immediately. In addition, the available add-on modules provide Ы Ы further information that is valuable to the developer. TCA gives Ы Ы feedback about which parts of the code were tested and where bugs may Ы Ы still be hiding. Once the software is functioning, Inuse helps to Ы Ы optimize software performance. Ы Ы Ы Ы Insure++ - Automatic Runtime Debugging Ы Ы Ы Ы Insure++ finds a wide variety of programming and memory access errors Ы Ы including: Ы Ы Ы Ы - Memory corruption due to reading or writing beyond the valid areas Ы Ы of global, local, shared, and dynamically allocated objects. Ы Ы - Operations on uninitialized, NULL, or "wild" pointers. Ы Ы - Memory leaks. Ы Ы - Errors allocating and freeing dynamic memory. Ы Ы - String manipulation errors. Ы Ы - Operations on pointers to unrelated data blocks. Ы Ы - Invalid pointer operations. Ы Ы - Incompatible variable declarations. Ы Ы - Mismatched variable types in printf and scanf argument lists. Ы Ы Ы Ы Insure++ finds _all_ memory reference errors. It does not use a Ы Ы "statistical" approach to trap memory reference errors, but rather Ы Ы checks each memory reference for validity when that reference is Ы Ы executed. Insure++ checks all types of memory references, including Ы Ы those to static(global), and stack, as well as dynamically allocated Ы Ы memory. When Insure++ finds a problem, it provides a complete Ы Ы diagnosis, including the name of related variables, the line of Ы Ы source code containing the error, a description of the error, and a Ы Ы stack trace. Ы Ы Ы Ы Just as it does with memory reference errors, Insure++ finds all Ы Ы library interface errors. Ы Ы Ы Ы - Mismatched argument types or function declarations. Ы Ы - Out of range, or otherwise invalid arguments in library calls. Ы Ы - Errors returned by library calls. Ы Ы Ы Ы Insure++ knows about every standard UNIX system call, the X Window Ы Ы System, Motif, and many other popular libraries. On each library Ы Ы call, Insure++ checks that every variable is of the correct type and Ы Ы is within its valid range. Insure++ is the only tool with the Ы Ы intelligence which assures that these libraries are called correctly, Ы Ы every time. Ы Ы Ы Ы Insure++ has been used on programs with hundreds of thousands of Ы Ы lines of code. Multi-process applications and programs distributed Ы Ы over hundreds of workstations have been validated with Insure++. Some Ы Ы of these applications ran for many weeks in production settings with Ы Ы Insure++ reporting bugs whenever they arose, with no disruption of Ы Ы normal system operations. Ы Ы Ы Ы OPERATION Ы Ы Ы Ы Insure++ requires NO MODIFICATION of the source code. You use Ы Ы Insure++ by processing your program with the special "insight" Ы Ы program in place of your normal compiler. Then you run the resulting Ы Ы program in the normal fashion. Ы Ы Ы Ы COMPILER COMPATIBILITY Ы Ы Ы Ы Insure++ works with all popular compilers. - cc, gcc, acc, etc. Ы Ы Insure++ will check interfaces to modules written in languages other Ы Ы than C, such as Fortran, Ada, Pascal, etc. Ы Ы Ы Ы THIRD PARTY LIBRARIES and FUNCTIONS Ы Ы Ы Ы Insure++ can check third party libraries and functions thoroughly, at Ы Ы the interface level. It verifies parameter types and ranges and also Ы Ы checks return error codes. Insure++ includes built-in interface tests Ы Ы for hundreds of libraries. You can construct additional interface Ы Ы checks easily, with the interface definition features of Insure++. Ы Ы Ы Ы PLATFORM AVAILABILITY Ы Ы Ы Ы Insure++ is now available for 64-bit users on the SGI, HP and Solaris Ы Ы platforms. Ы Ы Ы Ы Insure++ is also available for Windows NT/95/98 and a wide variety of Ы Ы UNIX platforms, including: DEC (Alpha 3.x & 4.x), HP (HPUX 10.x & Ы Ы 11), IBM (AIX 4.x), Linux, SGI (Irix 6.x & 6.x 64 bit), Solaris 2.x, Ы Ы and SunOS 4.x. The Windows version of Insure++ supports Visual C++ Ы Ы 6.0. Ы Ы Ы А? ЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬ ЪЩ ?ХННННННННННННННННННё ЦД ДДДД Д ДДННДД Д ДДДДДД Д ДДДДДД Д ДДННДД Д ДДДД Д? ЪБ?Э INSTRUCTIONS ЮГД? ЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯ А? Ы ФНННННННННННННННННН? Ы Ы Ы Ы Run the keymaker and register the program. Please read carefully the Ы Ы instructions you'll see. Ы Ы Enjoy =) Ы Ы Ы А? ЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬ ЪЩ ?ХННННННННННННННННННё ЦД ДДДД Д ДДННДД Д ДДДДДД Д ДДДДДД Д ДДННДД Д ДДДД Д? ЪБ?Э GREETINGS ЮГД? ЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯ А? Ы ФНННННННННННННННННН? Ы Ы Ы Ы Our greetings fly to all groups and crackers who work hard to keep Ы Ы the Scene alive. Ы Ы Ы Ы Personal greetings to: Dimedrol, russ97. Ы Ы Ы А? ЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬ ЪЩ ?ХННННННННННННННННННё ЦД ДДДД Д ДДННДД Д ДДДДДД Д ДДДДДД Д ДДННДД Д ДДДД Д? ЪБ?Э CONTACT ЮГД? ЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯ А? Ы ФНННННННННННННННННН? Ы Ы Ы Ы Visit our www site at [ http://www.damn.to ] Ы Ы Backup page [ http://damn.da.ru ] Ы Ы Ы Ы Email address for contacts [ ivanopulo@usa.net ] Ы Ы Ы А? ЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬ ЪЩ АД ДДДДДД Д ДДННДД Д ДДДДДД В ДДДДДД Д ДДДДДД В ДДДДДД Д ДДННДД Д ДДДДДД ДЩ ?Э (c) 2000 DAMN Ю? А ЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬ Щ ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 26 янв 2000 23:48:27 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Re: Подарок для сишников и юниксоидов. -------------------------------------------------------------------------------- Не, это как раз не для юниксоидов. Последние используют один-единственный способ разработки программ: cat >my_prog.c Александр Lev Tikhonov wrote: > > Один вумный крякер крякнул такую вот программу. Нужно кому-нибудь? > > њ Insure++ v5.1 *Incl.Keymaker* (на самом деле там только кеймейкер, а саму > программу качайте сами с указанного сайта). > > ЬЬЬЬЬЬЬЬ ЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬ ЬЬЬЬЬЬЬЬЬ > > ХННННННННННННННННННё ЦД ДДДД Д ДДННДД Д ДДДДДД Д ДДДДДД Д ДДННДД Д ДДДД Д? > > ЪД?Э RELEASE INFO ЮГД? ЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯ А? > > Ы ФНННННННННННННННННН? Ы > > Ы Ы > > Ы [ Program ........................................... Insure++ v5.1 ] Ы > > Ы [ Type .................. Powerful programming error detection tool ] Ы > > Ы [ OS ...................................................... Win9xNT ] Ы > > Ы [ By ..................................................... ParaSoft ] Ы > > Ы [ Homepage ................................ http://www.parasoft.com ] Ы > > Ы Ы > > Ы [ Cracked by ........................ Ivanopulo ] Ы > > Ы [ Release type .................. Incl.Keymaker ] Ы > > Ы [ Release date ................... Jan 24, 2000 ] Ы > > Ы Ы > > А? ЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬ > ЪЩ > > ?ХННННННННННННННННННё ЦД ДДДД Д ДДННДД Д ДДДДДД Д ДДДДДД Д ДДННДД Д ДДДД Д? > > ЪБ?Э DESCRIPTION ЮГД? ЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯ А? > > Ы ФНННННННННННННННННН? Ы > > Ы Ы > > Ы Insure++ is a tool that automatically detects large classes of Ы > > Ы programming and run-time errors, including algorithmic anomalies, Ы > > Ы bugs, and deficiencies. By visualizing the execution of a program and Ы > > Ы the concurrent data manipulation, Insure++ helps developers Ы > > Ы understand how code operates. Insure++ uses patented Source Code Ы > > Ы Instrumentation (patent #5,581,696) and Mutation Testing technologies Ы > > Ы to locate bugs in source code automatically. Operating in place of a Ы > > Ы compiler, Insure++ builds a database of all program elements. At Ы > > Ы runtime, Insure++ then verifies memory references and program Ы > > Ы implementation by checking data values against the database. Ы > > Ы Ы > > Ы Insure++ provides a complete diagnosis of each problem, including a Ы > > Ы description of the error, the line of source code containing the Ы > > Ы error, and stack trace information. The error reports Insure++ Ы > > Ы provides help developers find errors more quickly than by manual Ы > > Ы testing. Insure++ operates without modifying source code; it simply Ы > > Ы provides developers with complete information for fixing errors. Ы > > Ы Ы > > Ы Developers at intermediate stages of a project can choose to run Ы > > Ы Insure++ in intermediate mode. This alternative to source code Ы > > Ы instrumentation is a less thorough but far quicker method of checking Ы > > Ы for several basic error types and providing coverage. Ы > > Ы Ы > > Ы Insure++ detects the following categories of errors: Ы > > Ы Ы > > Ы - Memory corruption/uninitialized memory Ы > > Ы - Memory leaks Memory allocation errors Ы > > Ы - Variable definition conflicts I/O errors Ы > > Ы - Pointer errors Ы > > Ы - Library errors Ы > > Ы - Logic errors Ы > > Ы - Algorithmic errors Ы > > Ы - Program optimization Ы > > Ы - Program understanding Ы > > Ы - Coverage analysis Ы > > Ы Ы > > Ы Developers can use Insure++ to find run-time errors before they reach Ы > > Ы customers, in much less time than is required by manual Ы > > Ы error-detection methods. Ы > > Ы Ы > > Ы Insure++ includes three distinct tools that work together to improve Ы > > Ы your development process. Ы > > Ы Ы > > Ы Insure++ automatically detects large classes of programming and Ы > > Ы run-time errors. It quickly pinpoints algorithmic anomalies, bugs, Ы > > Ы and deficiencies. Inuse visualizes in real-time the memory Ы > > Ы manipulation of your program, helping developers spot bugs and Ы > > Ы inefficiencies in memory handling. TCA also performs coverage Ы > > Ы analysis of programs, providing necessary feedback to programmers Ы > > Ы about which parts of the code were actually tested. Ы > > Ы Ы > > Ы Insure++ operates at four distinct levels in the software development Ы > > Ы and maintenance life cycle: Ы > > Ы Ы > > Ы - Memory Reference Verification Ы > > Ы - Programming Verification Ы > > Ы - Optimization Ы > > Ы - Coverage Analysis Ы > > Ы Ы > > Ы Insure++ improves software reliability by verifying memory references Ы > > Ы and program implementation. Insure++ exposes all the bugs - in your Ы > > Ы lab rather than the customer's site. Insure++ pinpoints bugs quickly, Ы > > Ы then provides all the information necessary to repair the bug Ы > > Ы immediately. In addition, the available add-on modules provide Ы > > Ы further information that is valuable to the developer. TCA gives Ы > > Ы feedback about which parts of the code were tested and where bugs may Ы > > Ы still be hiding. Once the software is functioning, Inuse helps to Ы > > Ы optimize software performance. Ы > > Ы Ы > > Ы Insure++ - Automatic Runtime Debugging Ы > > Ы Ы > > Ы Insure++ finds a wide variety of programming and memory access errors Ы > > Ы including: Ы > > Ы Ы > > Ы - Memory corruption due to reading or writing beyond the valid areas Ы > > Ы of global, local, shared, and dynamically allocated objects. Ы > > Ы - Operations on uninitialized, NULL, or "wild" pointers. Ы > > Ы - Memory leaks. Ы > > Ы - Errors allocating and freeing dynamic memory. Ы > > Ы - String manipulation errors. Ы > > Ы - Operations on pointers to unrelated data blocks. Ы > > Ы - Invalid pointer operations. Ы > > Ы - Incompatible variable declarations. Ы > > Ы - Mismatched variable types in printf and scanf argument lists. Ы > > Ы Ы > > Ы Insure++ finds _all_ memory reference errors. It does not use a Ы > > Ы "statistical" approach to trap memory reference errors, but rather Ы > > Ы checks each memory reference for validity when that reference is Ы > > Ы executed. Insure++ checks all types of memory references, including Ы > > Ы those to static(global), and stack, as well as dynamically allocated Ы > > Ы memory. When Insure++ finds a problem, it provides a complete Ы > > Ы diagnosis, including the name of related variables, the line of Ы > > Ы source code containing the error, a description of the error, and a Ы > > Ы stack trace. Ы > > Ы Ы > > Ы Just as it does with memory reference errors, Insure++ finds all Ы > > Ы library interface errors. Ы > > Ы Ы > > Ы - Mismatched argument types or function declarations. Ы > > Ы - Out of range, or otherwise invalid arguments in library calls. Ы > > Ы - Errors returned by library calls. Ы > > Ы Ы > > Ы Insure++ knows about every standard UNIX system call, the X Window Ы > > Ы System, Motif, and many other popular libraries. On each library Ы > > Ы call, Insure++ checks that every variable is of the correct type and Ы > > Ы is within its valid range. Insure++ is the only tool with the Ы > > Ы intelligence which assures that these libraries are called correctly, Ы > > Ы every time. Ы > > Ы Ы > > Ы Insure++ has been used on programs with hundreds of thousands of Ы > > Ы lines of code. Multi-process applications and programs distributed Ы > > Ы over hundreds of workstations have been validated with Insure++. Some Ы > > Ы of these applications ran for many weeks in production settings with Ы > > Ы Insure++ reporting bugs whenever they arose, with no disruption of Ы > > Ы normal system operations. Ы > > Ы Ы > > Ы OPERATION Ы > > Ы Ы > > Ы Insure++ requires NO MODIFICATION of the source code. You use Ы > > Ы Insure++ by processing your program with the special "insight" Ы > > Ы program in place of your normal compiler. Then you run the resulting Ы > > Ы program in the normal fashion. Ы > > Ы Ы > > Ы COMPILER COMPATIBILITY Ы > > Ы Ы > > Ы Insure++ works with all popular compilers. - cc, gcc, acc, etc. Ы > > Ы Insure++ will check interfaces to modules written in languages other Ы > > Ы than C, such as Fortran, Ada, Pascal, etc. Ы > > Ы Ы > > Ы THIRD PARTY LIBRARIES and FUNCTIONS Ы > > Ы Ы > > Ы Insure++ can check third party libraries and functions thoroughly, at Ы > > Ы the interface level. It verifies parameter types and ranges and also Ы > > Ы checks return error codes. Insure++ includes built-in interface tests Ы > > Ы for hundreds of libraries. You can construct additional interface Ы > > Ы checks easily, with the interface definition features of Insure++. Ы > > Ы Ы > > Ы PLATFORM AVAILABILITY Ы > > Ы Ы > > Ы Insure++ is now available for 64-bit users on the SGI, HP and Solaris Ы > > Ы platforms. Ы > > Ы Ы > > Ы Insure++ is also available for Windows NT/95/98 and a wide variety of Ы > > Ы UNIX platforms, including: DEC (Alpha 3.x & 4.x), HP (HPUX 10.x & Ы > > Ы 11), IBM (AIX 4.x), Linux, SGI (Irix 6.x & 6.x 64 bit), Solaris 2.x, Ы > > Ы and SunOS 4.x. The Windows version of Insure++ supports Visual C++ Ы > > Ы 6.0. Ы > > Ы Ы > > А? ЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬ > ЪЩ > > ?ХННННННННННННННННННё ЦД ДДДД Д ДДННДД Д ДДДДДД Д ДДДДДД Д ДДННДД Д ДДДД Д? > > ЪБ?Э INSTRUCTIONS ЮГД? ЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯ А? > > Ы ФНННННННННННННННННН? Ы > > Ы Ы > > Ы Run the keymaker and register the program. Please read carefully the Ы > > Ы instructions you'll see. Ы > > Ы Enjoy =) Ы > > Ы Ы > > А? ЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬ > ЪЩ > > ?ХННННННННННННННННННё ЦД ДДДД Д ДДННДД Д ДДДДДД Д ДДДДДД Д ДДННДД Д ДДДД Д? > > ЪБ?Э GREETINGS ЮГД? ЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯ А? > > Ы ФНННННННННННННННННН? Ы > > Ы Ы > > Ы Our greetings fly to all groups and crackers who work hard to keep Ы > > Ы the Scene alive. Ы > > Ы Ы > > Ы Personal greetings to: Dimedrol, russ97. Ы > > Ы Ы > > А? ЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬ > ЪЩ > > ?ХННННННННННННННННННё ЦД ДДДД Д ДДННДД Д ДДДДДД Д ДДДДДД Д ДДННДД Д ДДДД Д? > > ЪБ?Э CONTACT ЮГД? ЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯЯ А? > > Ы ФНННННННННННННННННН? Ы > > Ы Ы > > Ы Visit our www site at [ http://www.damn.to ] Ы > > Ы Backup page [ http://damn.da.ru ] Ы > > Ы Ы > > Ы Email address for contacts [ ivanopulo@usa.net ] Ы > > Ы Ы > > А? ЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬ > ЪЩ > > АД ДДДДДД Д ДДННДД Д ДДДДДД В ДДДДДД Д ДДДДДД В ДДДДДД Д ДДННДД Д ДДДДДД ДЩ > > ?Э (c) 2000 DAMN Ю? > > А ЬЬЬЬЬЬЬЬЬЬЬЬЬЬЬ Щ > > ---------------------------------------------------------------------- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 01:09:16 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Подарок для сишников и юниксоидов. -------------------------------------------------------------------------------- А как-нибудь покороче и по русски - что же эта дивная Ы - Ы программа такого пользительного делает? Архангельский Г.А. СПб ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 07:48:28 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Подарок для сишников и юниксоидов. -------------------------------------------------------------------------------- ----- Original Message ----- From: "Alexander V. Voinov" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Wednesday, January 26, 2000 11:48 PM Subject: Re: Подарок для сишников и юниксоидов. > Не, это как раз не для юниксоидов. Последние используют > один-единственный способ разработки программ: > > cat >my_prog.c > Да, похоже я ошибся; среагировал вот на что: > > > > Ы Insure++ knows about every standard UNIX system call, the X Window Ы > > > > Ы System, Motif, and many other popular libraries. On each library Ы > > > > Ы call, Insure++ checks that every variable is of the correct type and Ы > > > > Ы is within its valid range. Insure++ is the only tool with the Ы > > > > Ы intelligence which assures that these libraries are called correctly, Ы > > > > Ы every time. Ы А вот до сюда (ниже) не дочитал. Конечно же, крякер крякал виндовую версию, вряд ли он позаботился о "юниксоидах" > > Ы Insure++ is also available for Windows NT/95/98 and a wide variety of Ы > > > > Ы UNIX platforms, including: DEC (Alpha 3.x & 4.x), HP (HPUX 10.x & Ы > > > > Ы 11), IBM (AIX 4.x), Linux, SGI (Irix 6.x & 6.x 64 bit), Solaris 2.x, Ы > > > > Ы and SunOS 4.x. The Windows version of Insure++ supports Visual C++ Ы > > > > Ы 6.0. Ы > > Левъ. ЗЫ. А вот насчет > cat >my_prog.c - это и беда всех поборников юникса, открытых исходников и командной строки. Таким способом не осилить проект, достигший некоторого порога сложности: принципиально невозможно. Если хочешь перемещаться со скоростью 1000 км/час - покупай самолет, никакой самый совершенный автомобиль, ни даже вертолет тут тебе не помогут. Кстати, "нормальные" коммерческие юниксоиды это понимают - для них эти отладчики и CASE-средства и делаются. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 10:08:59 От: "Dima A. Smirnov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Subject: Хамстер -------------------------------------------------------------------------------- Здравствуйте уважаемые, дорогие, любимые. Благодарю вас за уважение, за подпискку. Поскольку я занят работой и семьей никакого времени на что-либо другое у меня не остается.... К сожаление пока личная жизнь в каком либо проявлении у меня отсутствует. С одной стороны это грустно, но с другой -- у меня есть сын, и вырастить его -- дело гораздо более важное, чем что-либо другое. Уффф. Теперь к делу. 1. Пакет документов и перекодировщик выложен на http://hamster.lgg.ru/ftp/slav.zip 2. Я с удовольствием когда-нибудь прочитаю письма эхи, но сейчас у меня на это нет ну никакого времени. 3. Если время появится я чего-нибудь полезное для общества напишу или сделаю. С Паратайповскими контактами ситуация такая: всеми ЦС шрифтами занимался один внештатный сотрудник Александр Шишкин. Летом часть прихода на котором он подвизался перевели в новый храм в сельской местности. Он он очень активно занялся приходской деятельностью. Потом он разбил машину. Теперь я не могу его нигде поймать. По домашнему телефону сначала говорили, что его нет, потом сказали, что он больше здесь не живет. У родителей он бывает нерегулярно. Я оставил там свои телефоны с настоятельной просьбой со мной связаться. Е-мэйл у него был не свой, поэтому я не могу туда сейчас писать. Однако все что касается вопросов кодировки (по версии Шишкина) отражено в его статье (включена в пакет slav.zip. С уважением и любовью Д.Смирнов. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 12:37:10 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RFC8: п¦пЎп» я€яЂпЈя„я‚ -------------------------------------------------------------------------------- пћяЂпЈпЁпЈпЅп°п» яЃя‚п°я‚яЊпЈ пІ я„пѕяЂпјп°я‚пµ word97, я‚яЂпµп±яѓяЋя‰пЈп№ пґп»яЏ пїяЂпѕяЃпјпѕя‚яЂп° яѓяЃя‚п°пЅпѕпІп»пµпЅпЅя‹я… я€яЂпЈя„я‚пѕпІ Evangelie пЈ NewtonC - яЃпј. http://hamster.lgg.ru/ftp/slav.zip п’пѕпїяЂпѕяЃ яЃя‚п°пЅпґп°яЂя‚пЈп·п°я†пЈпЈ пєпѕпґпЈяЂпѕпІпєпЈ яЃп»п°пІяЏпЅяЃпєпЈя… я€яЂпЈя„я‚пѕпІ пІпѕп·пЅпЈпє яЃ яЃп°пјпѕпЁпѕ пЅп°я‡п°п»п° пєпѕпјпїяЊяЋя‚пµяЂпЅпѕпЁпѕ пЅп°п±пѕяЂп° яЃп»п°пІяЏпЅяЃпєпѕпЁпѕ я‚пµпєяЃя‚п°. пџпѕя‚яЂпµп±пЅпѕяЃя‚яЊ пІ яЃя‚п°пЅпґп°яЂя‚пЈп·п°я†пЈпЈ пєпѕпґпЈяЂпѕпІпєпЈ пЈяЃя…пѕпґпЈп»п° пІ пѕяЃпЅпѕпІпЅпѕпј пѕя‚ пїпѕп»яЊп·пѕпІп°я‚пµп»пµп№ пїяЂпѕпЁяЂп°пјпј пєпѕпјпїяЊяЋя‚пµяЂпЅя‹я… пЅп°п±пѕяЂп° пЈ пІпµяЂяЃя‚пєпЈ, яЂп°п±пѕя‚п°яЋя‰пЈя…, пІпѕ-пїпµяЂпІя‹я…, пЅп°пґ пІя‹пїяѓяЃпєпѕпј пЅп°п±пѕяЂпЅпѕп№ яЃп»яѓп¶пµп±пЅпѕп№ п»пЈя‚пµяЂп°я‚яѓяЂя‹ пЅп° я†пµяЂпєпѕпІпЅпѕ-яЃп»п°пІяЏпЅяЃпєпѕпј яЏп·я‹пєпµ пЈ, пІпѕ-пІя‚пѕяЂя‹я…, пЅп°пґ пІя‹пїяѓяЃпєпѕпј пЅп°п±пѕяЂпЅя‹я… пєпЅпЈпЁ - п»пЈя‚пµяЂп°я‚яѓяЂпЅя‹я… пїп°пјяЏя‚пЅпЈпєпѕпІ пЅп° яЃя‚п°яЂпѕяЃп»п°пІяЏпЅяЃпєпЈя… яЏп·я‹пєп°я…. пЎпѕп·пЅп°я‚пµп»яЊпЅпѕ пІ пІпѕпїяЂпѕяЃпµ яЃя‚п°пЅпґп°яЂя‚пЈп·п°я†пЈпЈ пєпѕпґпЈяЂпѕпІпєпЈ пєпѕпјпїяЊяЋя‚пµяЂпЅя‹я… я€яЂпЈя„я‚пѕпІ п¶пµп»п°я‚пµп»яЊпЅпѕ пѕпЁяЂп°пЅпЈя‡пЈя‚яЊяЃяЏ пѕп±п»п°яЃя‚яЊяЋ я†пµяЂпєпѕпІпЅпѕ-яЃп»п°пІяЏпЅяЃпєпѕпЁпѕ яЏп·я‹пєп° XIX пІпµпєп° пєп°пє пѕяЃпЅпѕпІя‹ пїяЂпѕя†пµяЃяЃп° яЃя‚п°пЅпґп°яЂя‚пЈп·п°я†пЈпЈ пїпѕ яЃп»пµпґяѓяЋя‰пЈпј пїяЂпЈя‡пЈпЅп°пј: 1. пЎпѕп·пґп°пЅпЈпµ пєпѕпґпЈяЂпѕпІпєпЈ, пІпєп»яЋя‡п°яЋя‰пµп№ пІ яЃпµп±яЏ пІяЃпµ яЃпЈпјпІпѕп»я‹ яЏп·я‹пєпѕпІ,пѕяЃпЅпѕпІп°пЅпЅя‹я… пЅп° пєпЈяЂпЈп»п»пЈя‡пµяЃпєпѕп№ пІпµяЂяЃпЈпЈ яЃп»п°пІяЏпЅяЃпєпѕпЁпѕ п°п»я„п°пІпЈя‚п°, пїяЂпµпґяЃя‚п°пІп»яЏпµя‚ яЃпѕп±пѕп№ яЃпµяЂяЊпµп·пЅя‹п№ пЈяЃяЃп»пµпґпѕпІп°я‚пµп»яЊяЃпєпЈп№ пЈ пїяЂп°пєя‚пЈя‡пµяЃпєпЈп№ я‚яЂяѓпґ, пїпѕяЃпєпѕп»яЊпєяѓ пЅпµпѕп±я…пѕпґпЈпјпѕ яѓя‡пЈя‚я‹пІп°я‚яЊ пЅпµ я‚пѕп»яЊпєпѕ я‡пЈяЃя‚пѕ п·пЅп°пєпѕпІя‹п№ яЃпѕяЃя‚п°пІ яЏп·я‹пєп°, пЅпµпѕп±я…пѕпґпЈпјя‹п№ пґп»яЏ пѕя‚пѕп±яЂп°п¶пµпЅпЈяЏ пІ пєпѕпґпѕпІпѕп№ я‚п°п±п»пЈя†пµ, пЅпѕ пЈ пєпѕпјпїпѕп·пЈя‚пЅя‹пµ яЃпЈпјпІпѕп»я‹, пЅпµпѕп±я…пѕпґпЈпјя‹пµ пґп»яЏ яЂпµя€пµпЅпЈяЏ пїяЂп°пєя‚пЈя‡пµяЃпєпЈя… п·п°пґп°я‡, яЃпІяЏп·п°пЅпЅя‹я… яЃ пЅп°п±пѕяЂпѕпј я‚пµпєяЃя‚п° пЅп° пєпѕпЅпєяЂпµя‚пЅпѕпј яЏп·я‹пєпµ (п“п°яЃп»пѕпІ п.). пџяЂпµпґпїпѕяЃя‹п»пєпЈ пґп»яЏ яѓяЃпїпµя€пЅпѕпЁпѕ п·п°пІпµяЂя€пµпЅпЈяЏ пІ пѕп±пѕп·яЂпЈпјя‹п№ яЃяЂпѕпє пґп°пЅпЅпѕп№ яЂп°п±пѕя‚я‹, пЅп° пјпѕп№ пІп·пЁп»яЏпґ, пµяЃя‚яЊ я‚пѕп»яЊпєпѕ пґп»яЏ я†пµяЂпєпѕпІпЅпѕ-яЃп»п°пІяЏпЅяЃпєпѕпЁпѕ яЏп·я‹пєп°, пґп»яЏ пєпѕя‚пѕяЂпѕпЁпѕ я…п°яЂп°пєя‚пµяЂпЅя‹: ц п•пґпЈпЅп°яЏ пјпµп¶пЅп°я†пЈпѕпЅп°п»яЊпЅп°яЏ яЃя‚яЂяѓпєя‚яѓяЂп° яЏп·я‹пєп° пІ пїяЂпѕя€п»пѕпј пЈ пІ пЅп°яЃя‚пѕяЏя‰пµпµ пІяЂпµпјяЏ, пїпѕп·пІпѕп»яЏяЋя‰п°яЏ пЈяЃпїпѕп»яЊп·пѕпІп°я‚яЊ пµпЁпѕ пІ пєп°я‡пµяЃя‚пІпµ пѕяЃпЅпѕпІя‹ пґп»яЏ яЃпѕп·пґп°пЅпЈяЏ пµпґпЈпЅпѕп№ яЃп»п°пІяЏпЅяЃпєпѕп№ пєпѕпґпЈяЂпѕпІпєпЈ ц п‘пѕпЁп°я‚я‹п№ пѕпїя‹я‚ пєпѕпјпїяЊяЋя‚пµяЂпЅпѕпЁпѕ пЅп°п±пѕяЂп° пЈ пІпµяЂяЃя‚пєпЈ пЅп° яЏп·я‹пєпµ ц п—пЅп°я‡пЈя‚пµп»яЊпЅп°яЏ пїпѕя‚яЂпµп±пЅпѕяЃя‚яЊ пІ п»пЈя‚пµяЂп°я‚яѓяЂпµ пЅп° пЅпµпј ц п—пЅп°пЅпЈпµ пµпЁпѕ пїяЂп°пєя‚пЈя‡пµяЃпєпЈ пІяЃпµпјпЈ яѓя‡п°яЃя‚пЅпЈпєп°пјпЈ пґп°пЅпЅпѕпЁпѕ пѕп±яЃяѓп¶пґпµпЅпЈяЏ 2. п”п»яЏ яЃп»п°пІяЏпЅяЃпєпЈя… яЏп·я‹пєпѕпІ я…п°яЂп°пєя‚пµяЂпµпЅ я‚пѕя‚ я„п°пєя‚, я‡я‚пѕ пЅп° пЅпЈя… пЅпµ яЃяѓя‰пµяЃя‚пІяѓпµя‚ яЃпѕпІяЂпµпјпµпЅпЅпѕп№ яЃпІпµя‚яЃпєпѕп№ п»пЈя‚пµяЂп°я‚яѓяЂя‹ БЂ“ я€яЂпЈя„я‚ я‚яЂпµп±яѓпµя‚яЃяЏ я‚пѕп»яЊпєпѕ пґп»яЏ пЅп°п±пѕяЂп° п»пЈя‚пµяЂп°я‚яѓяЂпЅя‹я… пїп°пјяЏя‚пЅпЈпєпѕпІ пЈ я†пµяЂпєпѕпІпЅпѕп№ яЃп»яѓп¶пµп±пЅпѕп№ п»пЈя‚пµяЂп°я‚яѓяЂя‹ (пЈп·пґп°пЅпЈпµ яЃп»пѕпІп°яЂпµп№ пЈ яѓя‡пµп±пЅпѕп№ п»пЈя‚пµяЂп°я‚яѓяЂя‹ пїпѕ яЏп·я‹пєяѓ пјпѕп¶пЅпѕ пЅпµ яѓя‡пЈя‚я‹пІп°я‚яЊ пІ яЃпЈп»яѓ яЃп»п°п±пѕпЁпѕ пїяЂпЈяЃяѓя‚яЃя‚пІпЈяЏ я€яЂпЈя„я‚п° пІ пЈп·пґп°пЅпЈпЈ ~ 10% яЃпЈп»яЊпЅпѕ я„яЂп°пЁпјпµпЅя‚пЈяЂпѕпІп°пЅпЅпѕпЁпѕ я‚пµпєяЃя‚п°, пѕяЃя‚п°п»яЊпЅпѕпµ БЂ“ яЃпІпµя‚яЃпєпЈп№ яЏп·я‹пє (яЂяѓяЃяЃпєпЈп№ пЈп»пЈ пЈпЅпѕп№)). п”п»яЏ пєп°п¶пґпѕпЁпѕ (пґпѕяЃя‚п°я‚пѕя‡пЅпѕ яѓп·пєпѕпЁпѕ) пЈяЃя‚пѕяЂпЈя‡пµяЃпєпѕпЁпѕ пїпµяЂпЈпѕпґп° я‚пµпєяЃя‚я‹ пЅп° яЃп»п°пІяЏпЅяЃпєпѕпј яЏп·я‹пєпµ пЈпјпµп»пЈ яЃпІпѕп№ пѕпїяЂпµпґпµп»пµпЅпЅя‹п№ п·пЅп°пєпѕпІя‹п№ яЃпѕяЃя‚п°пІ я€яЂпЈя„я‚п° пЈ пЅп°п±пѕяЂ пЁп°яЂпЅпЈя‚яѓяЂ. п’ пЁп°яЂпЅпЈя‚яѓяЂп°я… пєп°п¶пґпѕпЁпѕ пїпµяЂпЈпѕпґп° (п° я‡п°яЃя‚пѕ пЈ пєп°п¶пґпѕпЁпѕ пЈп·пґп°яЋя‰пµпЁпѕ яЂпµпЁпЈпѕпЅп°) пґяЂяѓпЁпЈя… яЃпЈпјпІпѕп»пѕпІ, пєяЂпѕпјпµ пїяЂпµпґяѓяЃпјпѕя‚яЂпµпЅпЅя‹я… пїяЂп°пІпЈп»п°пјпЈ пЅп°п±пѕяЂп°, пїяЂпѕяЃя‚пѕ пЅпµ я‚яЂпµп±пѕпІп°п»пѕяЃяЊ! п’яЃя‚п°пІп»яЏя‚яЊ пІяЃпµ яЃпЈпјпІпѕп»я‹ пµпґпЈпЅпѕп№ пєпѕпґпЈяЂпѕпІпєпЈ пІ я‚п°пєяѓяЋ пЁп°яЂпЅпЈя‚яѓяЂяѓ пїяЂпѕяЃя‚пѕ п±пµяЃяЃпјя‹яЃп»пµпЅпЅпѕ БЂ“ пЅпµ яЃяѓя‰пµяЃя‚пІяѓпµя‚ пєпЅпЈпЁпЈ, пЁпґпµ пЅяѓп¶пЅя‹ пІяЃпµ яЌя‚пЈ п·пЅп°пєпЈ. пђпЅп°п»пЈп· п»пЈя‚пµяЂп°я‚яѓяЂя‹ пѕпїяЂпµпґпµп»пµпЅпЅя‹я… пїпµяЂпЈпѕпґпѕпІ пЅп° я†пµяЂпєпѕпІпЅпѕ-яЃп»п°пІяЏпЅяЃпєпѕпј яЏп·я‹пєпµ яЃ я‚пѕя‡пєпЈ п·яЂпµпЅпЈяЏ п·пЅп°пєпѕпІпѕпЁпѕ яЃпѕяЃя‚п°пІп° пЁп°яЂпЅпЈя‚яѓяЂ я€яЂпЈя„я‚п° БЂ“ п·п°пґп°я‡п° пѕп±пѕп·яЂпЈпјп°яЏ пЈ я‡п°яЃя‚пЈя‡пЅпѕ пІя‹пїпѕп»пЅпµпЅпЅп°яЏ, я‡пµпЁпѕ пЅпµп»яЊп·яЏ яЃпєп°п·п°я‚яЊ (пІ пїяЂпµпґпµп»п°я… пЅп°я€пµпЁпѕ пѕп±яЃяѓп¶пґпµпЅпЈяЏ)пѕ пІяЃпµя… яЏп·я‹пєп°я… пЁяЂяѓпїпїя‹. 3. пўпѕп»яЊпєпѕ пє яЃпµяЂпµпґпЈпЅпµ XIX пІпµпєп° пѕпєпѕпЅя‡п°я‚пµп»яЊпЅпѕ яѓя‚пІпµяЂпґпЈп»пЈяЃяЊ пµпґпЈпЅя‹пµ пїяЂпѕяЃя‚я‹пµ пїяЂп°пІпЈп»п° пЅп°п±пѕяЂп° пЈ яѓя‚пІпµяЂпґпЈп»пЈяЃяЊ пїяЂп°пІпЈп»п° пєпѕяЂяЂпµпєя‚яѓяЂя‹ я†пµяЂпєпѕпІпЅпѕ-яЃп»п°пІяЏпЅяЃпєпЈя… я‚пµпєяЃя‚пѕпІ (яѓя‡пЈя‚я‹пІп°яЏ пѕяЃпѕп±пµпЅпЅпѕяЃя‚пЈ пљпЈпµпІпѕ-пџпµя‡пµяЂяЃпєпѕп№ я‚пЈпїпѕпЁяЂп°я„пЈпЈ). п”пѕ яЌя‚пѕпЁпѕ пІяЂпµпјпµпЅпЈ яЌя‚пЈ пїяЂп°пІпЈп»п° п·пЅп°я‡пЈя‚пµп»яЊпЅпѕ яЂп°п·п»пЈя‡п°п»пЈяЃяЊ пѕя‚ я‚пЈпїпѕпЁяЂп°я„пЈпЈ пє я‚пЈпїпѕпЁяЂп°я„пЈпЈ пЈ п±я‹п»пЈ пѕя‡пµпЅяЊ яЃп»пѕп¶пЅя‹ пґп»яЏ я‚пЈпїпѕпЁяЂп°я„яЃпєпѕпЁпѕ пЅп°п±пѕяЂп° пєп°пє я‚пµя…пЅпѕп»пѕпЁпЈя‡пµяЃпєпѕпЁпѕ пїяЂпѕя†пµяЃяЃп° БЂ“ пІ я‚п°пєпЈя… пєпЅпЈпЁп°я…, пЅп°пїяЂпЈпјпµяЂ, пѕя‡пµпЅяЊ пІпµп»пЈпєпѕ пєпѕп»пЈя‡пµяЃя‚пІпѕ яѓпїпѕя‚яЂпµп±п»яЏпµпјя‹я… п±яѓпєпІ-пЅп°пґяЃя‚яЂпѕя‡пЅпЈпєпѕпІ пЈп»пЈ я‡п°яЃя‚пѕ яѓпїпѕя‚яЂпµп±п»яЏпµя‚яЃяЏ пґпІп° яЂп°п·п»пЈя‡пЅя‹я… пЅп°я‡пµяЂя‚п°пЅпЈяЏ пѕпґпЅпѕп№ пЈ я‚пѕп№ п¶пµ п±яѓпєпІя‹ пІ пѕпґпЅпѕпј пЈ я‚пѕпј п¶пµ яЃп»пѕпІпµ (пЅп°пїяЂпЈпјпµяЂ, п±пµп·п·п°пєпѕпЅпЈпµ). пўп°пєпЈпј пѕп±яЂп°п·пѕпј, яЂп°п·яЂп°п±пѕя‚п°пІ пЅп° пѕяЃпЅпѕпІпµ пїпѕп·пґпЅпµпЁпѕ я†пµяЂпєпѕпІпЅпѕ-яЃп»п°пІяЏпЅяЃпєпѕпЁпѕ я€яЂпЈя„я‚п° я‚п°пє пЅп°п·я‹пІп°пµпјяѓяЋ б«п±п°п·пѕпІяѓяЋ пєпѕпґпЈяЂпѕпІпєяѓб» яЃп»п°пІяЏпЅяЃпєпѕп№ яЃя‚п°пЅпЈя†я‹ (яЃпЅп°я‡п°п»пѕ пїпѕ яЃпѕяЃя‚п°пІяѓ, п·п°я‚пµпј пїпѕ яЂп°п·пјпµя‰пµпЅпЈяЋ), пјпѕп¶пЅпѕ пїяЂпѕпґпѕп»п¶п°я‚яЊ пґпѕяЂп°п±п°я‚я‹пІп°я‚яЊ пєпѕпґпЈяЂпѕпІпєяѓ пґпѕпїпѕп»пЅпЈя‚пµп»яЊпЅя‹я… яЃпЈпјпІпѕп»пѕпІ пґп»яЏ яЂпµя€пµпЅпЈяЏ п±пѕп»пµпµ пѕп±я‰пЈя… п·п°пґп°я‡ пЅп°п±пѕяЂп°. п”п»яЏ яЌя‚пѕпЁпѕ пЅпµпѕп±я…пѕпґпЈпјпѕ п·п°яЂпµп·пµяЂпІпЈяЂпѕпІп°я‚яЊ яѓя‡п°яЃя‚пѕпє Unicode пєп°пє пґп»яЏ п±п°п·пѕпІпѕп№ пєпѕпґпЈяЂпѕпІпєпЈ, я‚п°пє пЈ пґп»яЏ пґпѕпїпѕп»пЅпЈя‚пµп»яЊпЅя‹я… яЃп»п°пІяЏпЅяЃпєпЈя… яЃпЈпјпІпѕп»пѕпІ. пҐпѕя‡пµя‚яЃяЏ яЃяЂп°п·яѓ пѕя‚пјпµя‚пЈя‚яЊ, я‡я‚пѕ яЌя‚пѕ пїяЂпѕяЃя‚яЂп°пЅяЃя‚пІпѕ пґпѕп»п¶пЅпѕ п±я‹я‚яЊ п±пѕп»пµпµ 256 яЏя‡пµпµпє, я‚.пє. пѕп±я‰пµпµ пєпѕп»пЈя‡пµяЃя‚пІпѕ яЃпЈпјпІпѕп»пѕпІ я€яЂпЈя„я‚пѕпІ яЃп»п°пІяЏпЅяЃпєпѕп№ пЁяЂяѓпїпїя‹ яЂп°п·пЅя‹я… пІпµпєпѕпІ (яЃ яѓя‡пµя‚пѕпј яѓпґпѕп±яЃя‚пІп° пЅп°п±пѕяЂп°) пґпѕп»п¶пЅпѕ п±я‹я‚яЊ пІпµяЃяЊпјп° п·пЅп°я‡пЈя‚пµп»яЊпЅпѕ. п”п»яЏ пїпѕп»яѓя‡пµпЅпЈяЏ пµпґпЈпЅпѕп№ п±п°п·пѕпІпѕп№ пєпѕпґпЈяЂпѕпІпєпЈ пЅп° пѕяЃпЅпѕпІпµ я†пµяЂпєпѕпІпЅпѕ-яЃп»п°пІяЏпЅяЃпєпѕпЁпѕ яЏп·я‹пєп° пЅпµпѕп±я…пѕпґпЈпјпѕ пїяЂпµп¶пґпµ пІяЃпµпЁпѕ пїпѕпїя‹я‚п°я‚яЊяЃяЏ пѕпїяЂпµпґпµп»пЈя‚яЊ пєпѕп»пЈя‡пµяЃя‚пІпµпЅпЅя‹п№ яЃпѕяЃя‚п°пІ п±п°п·пѕпІпѕпЁпѕ я€яЂпЈя„я‚п°. п пµп·яѓп»яЊя‚п°я‚пѕпј яЂп°п±пѕя‚я‹ пїпѕ яЃпѕп·пґп°пЅпЈяЋ я€яЂпЈя„я‚п° б«Evangelieб» яЃпѕпІпјпµяЃя‚пЅпѕ яЃ я„пЈяЂпјпѕп№ Paratype яЏпІпЈп»п°яЃяЊ пєпѕпґпЈяЂпѕпІпєп°, яЃпѕяЃя‚пѕяЏя‰п°яЏ пЈп· 176 п·пЅп°пєпѕпІ пЈ пїяЂпµпґп»п°пЁп°пµпјп°яЏ пє яЂп°яЃяЃпјпѕя‚яЂпµпЅпЈяЋ. (п пЈяЃяѓпЅпѕпє я€яЂпЈя„я‚п° Evangelie яЃ пїяЂпµпґп»пѕп¶пµпЅпЅпѕп№ пєпѕпґпЈяЂпѕпІпєпѕп№ п¦пЎп» яЃпЈпјпІпѕп»пѕпІ) пћяЃпЅпѕпІпЅя‹пјпЈ пїяЂпЈпЅя†пЈпїп°пјпЈ пїпѕяЃя‚яЂпѕпµпЅпЈяЏ пЅп°п±пѕяЂп° яЃпЈпјпІпѕп»пѕпІ пґп»яЏ пѕпґпЅпѕп±п°п№я‚пЅпѕп№ пєпѕпґпЈяЂпѕпІпєпЈ яЏпІпЈп»пЈяЃяЊ яЃп»пµпґяѓяЋя‰пЈпµ пїпѕп»пѕп¶пµпЅпЈяЏ: 1. пћя‚пґпµп»яЊпЅя‹я… п·пЅп°пєпѕпІ яѓпґп°яЂпµпЅпЈяЏ пЈ пїяЂпЈпґя‹я…п°пЅпЈяЏ 16: 8 пґп»яЏ п·п°пЁп»п°пІпЅя‹я… пЈ 8 (я‚п°пєпЈя… п¶пµ) пґп»яЏ яЃя‚яЂпѕя‡пЅя‹я… п±яѓпєпІ. п—пЅп°пє б«яѓпґп°яЂпµпЅпЈпµ яЃ пїяЂпЈпґя‹я…п°пЅпЈпµпјб» - пµпґпЈпЅя‹п№ яЃпЈпјпІпѕп» (2 пґп»яЏ п·п°пЁп»п°пІпЅя‹я… пЈ 2 пґп»яЏ яЃя‚яЂпѕя‡пЅя‹я…). пўп°пєп¶пµ пЈпјпµпµя‚яЃяЏ 2 пѕя‚пґпµп»яЊпЅя‹я… п·пЅп°пєп° я‚пЈя‚п»п° (п·п°пЁп»п°пІпЅпѕпµ пЈ яЃя‚яЂпѕя‡пЅпѕпµ). 2. п’пјпµяЃя‚пµ яЃ яѓпґп°яЂпµпЅпЈпµпј пІ пѕпґпЅпѕпј яЃпЈпјпІпѕп»пµ я…яЂп°пЅяЏя‚яЃяЏ яЃп»пµпґяѓяЋя‰пЈпµ п±яѓпєпІя‹: { я’C x y z l m яѓC. 3. п’пјпµяЃя‚пµ яЃ пїяЂпЈпґя‹я…п°пЅпЈпµпј пІ пѕпґпЅпѕпј яЃпЈпјпІпѕп»пµ я…яЂп°пЅяЏя‚яЃяЏ яЃп»пµпґяѓяЋя‰пЈпµ п±яѓпєпІя‹: Z | } E e F f. 4. п’яЃяЏпєп°яЏ пІяЃя‚яЂпµя‚пЈпІя€п°яЏяЃяЏ пІ я‚пµпєяЃя‚п°я… п±яѓпєпІп° яЃ я‚пЈя‚п»пѕпј я…яЂп°пЅпЈя‚яЃяЏ пІ пµпґпЈпЅпѕпј яЃпЈпјпІпѕп»пµ БЂ“ пІяЃпµпЁпѕ 29 яЃпЈпјпІпѕп»пѕпІ. 5. п‘яѓпєпІя‹ п‹ (я›) пЈ пЉ пІяЃя‚яЂпµя‡п°яЋя‚яЃяЏ я‚пѕп»яЊпєпѕ пІ пІпЈпґпµ п·пЅп°пєп° пЋ (яћ) пІ пЅп°я‡п°п»пµ яЃп»пѕпІп°. пћпґпЅп°пєпѕ пґп»яЏ пїпѕп»яѓя‡пµпЅпЈяЏ пІпѕп·пјпѕп¶пЅпѕяЃя‚пЈ пЅп°п±пѕяЂп° п±яѓпєпІпЈя† пЈп· п·пЅп°пєп° пЋ БЂ“ п‹пЉ пєп°п¶пґп°яЏ пЈп· пЅпЈя… яЂп°п·пјпµя‰пµпЅп° пІ пѕя‚пґпµп»яЊпЅпѕпј п·пЅп°пєпµ (пІяЃпµпЁпѕ 3). 6. пќпµ п·п°пЅпЈпјп°яЋя‚яЃяЏ яЃпЈпјпІпѕп»я‹, пЅпµ пЈпјпµяЋя‰пЈпµ пєпѕпґп°-п°пЅп°п»пѕпЁп° пІ яЃпЈяЃя‚пµпјпµ Mac БЂ“ пІяЃпµпЁпѕ 23 яЃпЈпјпІпѕп»п° 7. пќпµ п·п°пЅпЈпјп°яЋя‚яЃяЏ яЃп»яѓп¶пµп±пЅя‹пµ яЃпЈпјпІпѕп»я‹ (пєпѕпЅпµя† п°п±п·п°я†п°, пЅпµяЂп°п·яЂя‹пІпЅя‹п№ пґпµя„пЈяЃ пЈ я‚.пґ.) 8. п’ яЂяѓяЃяЃпєпЈп№ п·пЅп°пєпѕяЂяЏпґ (пђ-яЏ) пЈп· пѕпґпЈпЅп°пєпѕпІя‹я… п·пІяѓпєпѕ-яЃпЈпјпІпѕп»пѕпІ яЂп°п·пЅя‹я… пІпЈпґпѕпІ пІя‹п±пЈяЂп°п»яЃяЏ я‚пѕя‚, пєпѕя‚пѕяЂя‹п№ яЏпІп»яЏпµя‚яЃяЏ п±пѕп»пµпµ я‡п°яЃя‚пѕ пІяЃя‚яЂпµя‡п°яЋя‰пЈпјяЃяЏ. пќпµпѕп±я…пѕпґпЈпјпѕяЃя‚яЊ пІ яЂп°п·пјпµя‰пµпЅпЈпЈ пІяЃпµя… п·пЅп°пєпѕпІ яЃ я‚пЈя‚п»п°пјпЈ, п° я‚п°пєп¶пµ пЅпµпєпѕя‚пѕяЂя‹я… п·пЅп°пєпѕпІ яЃ яѓпґп°яЂпµпЅпЈяЏпјпЈ пЈ пїяЂпЈпґя‹я…п°пЅпЈяЏпјпЈ п±я‹п»п° пІя‹яЏпІп»пµпЅп° пІ пїяЂпѕя†пµяЃяЃпµ пЅп°п±пѕяЂп° я‚пµпєяЃя‚пѕпІ, пєпѕпЁпґп° яЌя‚пЈ п±яѓпєпІя‹ пїяЂпЈя…пѕпґпЈп»пЈяЃяЊ пЅп° яЃпµяЂпµпґпЈпЅяѓ яЃп»пѕпІп°. п’ яЃп»яѓя‡п°пµ, пєпѕпЁпґп° п±яѓпєпІп° яЃ я‚пЈя‚п»пѕпј (пЈп»пЈ пЅпµпєпѕя‚пѕяЂп°яЏ п±яѓпєпІп° яЃ яѓпґп°яЂпµпЅпЈпµпј, пїяЂпЈпґя‹я…п°пЅпЈпµпј) яЃпѕяЃя‚пѕяЏп»п° пЈп· пґпІяѓя… яЃпЈпјпІпѕп»пѕпІ БЂ“ п±яѓпєпІя‹ пЈ я‚пЈя‚п»п° (яѓпґп°яЂпµпЅпЈяЏ, пїяЂпЈпґя‹я…п°пЅпЈяЏ), пІпѕп·пЅпЈпєп°п»п° пїяЂпѕп±п»пµпјп° б«я‚яЂпѕп№пЅпѕпЁпѕ пєпµяЂпЅпЈпЅпЁп°б» БЂ“ б«п±яѓпєпІп°-я‚пЈя‚п»пѕ-п±яѓпєпІп°б». п’ я‡пµпј п¶пµ яЃяѓя‚яЊ яЌя‚пѕп№ пїяЂпѕп±п»пµпјя‹? п‘пѕп»яЊя€пЈпЅяЃя‚пІпѕ п·пЅп°пєпѕпІ яЃ яѓпґп°яЂпµпЅпЈяЏпјпЈ (пїяЂпЈпґя‹я…п°пЅпЈяЏпјпЈ) пІ я†пµяЂпєпѕпІпЅпѕ-яЃп»п°пІяЏпЅяЃпєпѕпј я‚пµпєяЃя‚пµ пґпѕп»п¶пЅя‹ яЃпѕяЃя‚пѕяЏя‚яЊ пЈп· пґпІяѓя… яЃпЈпјпІпѕп»пѕпІ БЂ“ п±яѓпєпІя‹ пЈ яЃп»пµпґяѓяЋя‰пµпЁпѕ п·п° пЅпЈпј яѓпґп°яЂпµпЅпЈяЏ. пџяЂпЈ яЌя‚пѕпј яЃп°пј п·пЅп°пє яѓпґп°яЂпµпЅпЈяЏ (пїяЂпЈпґя‹я…п°пЅпЈяЏ) пґпѕп»п¶пµпЅ пЈпјпµя‚яЊ пјпЈпЅпЈпјп°п»яЊпЅяѓяЋ я€пЈяЂпЈпЅяѓ (пґп»яЏ пѕп±п»пµпЁя‡пµпЅпЈяЏ пІпЈп·яѓп°п»яЊпЅпѕпЁпѕ пІпѕяЃпїяЂпЈяЏя‚пЈяЏ пЅп°п±яЂп°пЅпЅпѕпЁпѕ я‚пµпєяЃя‚п° п±пµп· пєпµяЂпЅпЈпЅпЁп°) пЈ пЈпјпµя‚яЊ пєпµяЂпЅпЈпЅпЁ яЃ пїяЂпµпґя‹пґяѓя‰пµп№ п±яѓпєпІпѕп№ пЅп° пІпµп»пЈя‡пЈпЅяѓ, яЂп°пІпЅяѓяЋ яЃпІпѕпµп№ я€пЈяЂпЈпЅя‹ (пґп»яЏ я‚пѕпЁпѕ, я‡я‚пѕп±я‹ пЅп°п»пЈя‡пЈпµ яѓпґп°яЂпµпЅпЈяЏ пЈп»пЈ пїяЂпЈпґя‹я…п°пЅпЈяЏ пЅпµ пЈп·пјпµпЅяЏп»пѕ пјпµп¶п±яѓпєпІпµпЅпЅя‹п№ пЈпЅя‚пµяЂпІп°п»). п•яЃп»пЈ пґп»яЏ п±яѓпєпІ яЃ яЂп°п·пјпµяЂпѕпј пЅпµ п±пѕп»пµпµ п° яѓпґп°яЂпµпЅпЈпµ (пїяЂпЈпґя‹я…п°пЅпЈпµ) б«яЃпјпѕя‚яЂпЈя‚яЃяЏ я…пѕяЂпѕя€пѕб», я‚пѕ пґп»яЏ п±яѓпєпІ я‚пЈпїп° W, w я’ пЈп»пЈ яѓ пїпѕпґпѕп±пЅп°яЏ яЃя…пµпјп° пїяЂпЈпІпѕпґпЈя‚ пє пЅпµпєяЂп°яЃпЈпІпѕпјяѓ, пЅпµпµяЃя‚пµяЃя‚пІпµпЅпЅпѕпјяѓ пЅп°п»пѕп¶пµпЅпЈяЋ яѓпґп°яЂпµпЅпЈяЏ. п•яЃп»пЈ п¶пµ яѓпІпµп»пЈя‡пЈпІп°я‚яЊ пєпµяЂпЅпЈпЅпЁ яѓпґп°яЂпµпЅпЈяЏ пЅп° пІпµп»пЈя‡пЈпЅяѓ, пїяЂпµпІя‹я€п°яЋя‰яѓяЋ я€пЈяЂпЈпЅяѓ яѓпґп°яЂпµпЅпЈяЏ, я‚пѕ яЃп»пµпґяѓяЋя‰п°яЏ п·п° яѓпґп°яЂпµпЅпЈпµпј п±яѓпєпІп° п±яѓпґпµя‚ БЂњпЅп°пµп·п¶п°я‚яЊБЂќ пЅп° пїяЂпµпґя‹пґяѓя‰яѓяЋ. п”п»яЏ пєпѕпјпїпµпЅяЃп°я†пЈпЈ яЌя‚пѕпЁпѕ яЌя„я„пµпєя‚п° пІпѕп·пјпѕп¶пµпЅ пѕя‚яЂпЈя†п°я‚пµп»яЊпЅя‹п№(яЂп°п·пґпІпЈпЁп°яЋя‰пЈп№ п±яѓпєпІя‹) пєпµяЂпЅпЈпЅпЁ пјпµп¶пґяѓ яѓпґп°яЂпµпЅпЈпµпј пЈ яЃп»пµпґяѓяЋя‰пµп№ п·п° пЅпЈпј п±яѓпєпІпѕп№. пќпѕ яЌя‚пѕ пЅпµпѕп±я…пѕпґпЈпјпѕ пЅпµ пґп»яЏ пІяЃпµя… п±яѓпєпІ яЃ яѓпґп°яЂпµпЅпЈяЏпјпЈ. пќп°пїяЂпЈпјпµяЂ, wdпЅ я‚яЂпµп±яѓпµя‚ яЃпјпµя‰пµпЅпЈяЏ пїяЂпЈпґя‹я…п°пЅпЈяЏ пІп»пµпІпѕ пЈ пѕя‚яЂпЈя†п°я‚пµп»яЊпЅпѕпЁпѕ пєпµяЂпЅпЈпЅпЁп° пїяЂпЈпґя‹я…п°пЅпЈяЏ яЃ пЅ, п° п°dпЅ БЂ“ пЅпµ я‚яЂпµп±яѓпµя‚ яЃпјпµя‰пµпЅпЈяЏ пїяЂпЈпґя‹я…п°пЅпЈяЏ пІп»пµпІпѕ пЈ пѕя‚яЂпЈя†п°я‚пµп»яЊпЅпѕпЁпѕ пєпµяЂпЅпЈпЅпЁп° пїяЂпЈпґя‹я…п°пЅпЈяЏ яЃ пЅ. п пµя€пЈя‚яЊ яЌя‚пѕ пїяЂпѕя‚пЈпІпѕяЂпµя‡пЈпµ пјпѕп¶пЅпѕ я‚пѕп»яЊпєпѕ пїяѓя‚пµпј БЂњя‚яЂпѕп№пЅпѕпЁпѕ пєпµяЂпЅпЈпЅпЁп°БЂќ БЂ“ я‚.пµ. пєпµяЂпЅпЈпЅпЁ пґп°пЅпЅпѕп№ п±яѓпєпІя‹ яЃ пїяЂпµпґя‹пґяѓя‰пµп№ п·п°пІпЈяЃпЈя‚ пѕя‚ яЃпѕя‡пµя‚п°пЅпЈяЏ п”п’пёпҐ пїяЂпµпґя‹пґяѓя‰пЈя… п±яѓпєпІ, п° пЅпµ я‚пѕп»яЊпєпѕ пѕя‚ пѕпґпЅпѕп№ пїяЂпµпґя‹пґяѓя‰пµп№. п­я‚пѕ я‚яѓпїпЈпєпѕпІя‹п№ пїяѓя‚яЊ. п п°п·яЂп°п±пѕя‚п°пЅпЅя‹п№ п·пЅп°пєпѕяЂяЏпґ я€яЂпЈя„я‚п° БЂњEvangelieБЂќ пЅпЈ пІ пєпѕпµпј яЃп»яѓя‡п°пµ пЅпµ пїяЂпµя‚пµпЅпґяѓпµя‚ пЅп° пІяЃпµпѕп±я‰яѓяЋ я„яѓпЅпєя†пЈпѕпЅп°п»яЊпЅяѓяЋ пїпѕп»пЅпѕя‚яѓ, яЏпІп»яЏяЏяЃяЊ, яЃпєпѕяЂпµпµ, п»пѕпЁпЈя‡пµяЃпєпЈ пѕп±пѕяЃпЅпѕпІп°пЅпЅя‹пј пІп°яЂпЈп°пЅя‚пѕпј я€яЂпЈя„я‚п°, пїяЂпѕпІпµяЂпµпЅпЅпѕпј пЅп° 500 000 п·пЅп°пєп°я… пЅп°п±пѕяЂп°. пёп¶пµ яЃпµп№я‡п°яЃ п°пІя‚пѕяЂяѓ пѕя‡пµпІпЈпґпЅпѕ, я‡я‚пѕ пґп»яЏ пїпѕяЃя‚яЂпѕпµпЅпЈяЏ пїпѕп»пЅпѕя†пµпЅпЅпѕпЁпѕ яЃя‚п°пЅпґп°яЂя‚пЅпѕпЁпѕ п°пїпїп°яЂп°я‚п° пґп»яЏ пЅп°п±пѕяЂп° яЃп»п°пІяЏпЅяЃпєпЈпј я€яЂпЈя„я‚пѕпј пЅпµпѕп±я…пѕпґпЈпјпѕ: 1. пяЃпїпѕп»яЊп·пѕпІп°я‚яЊ пґп»яЏ яЂп°п·пјпµя‰пµпЅпЈяЏ яЃп»п°пІяЏпЅяЃпєпЈя… яЃпЈпјпІпѕп»пѕпІ пїяЂпµпґпЅп°п·пЅп°я‡пµпЅпЅя‹п№ пґп»яЏ яЌя‚пѕпЁпѕ яЂп°п·пґпµп» Unicode БЂ“ Cyrillic яЃ пЅпѕпјпµяЂп°пјпЈ пѕя‚ 0400 пґпѕ 04FF пЈ Unassigned zone БЂ“ 0500-052F. 2. п п°п·яЂп°п±пѕя‚п°я‚яЊ пЈ пІпІпµяЃя‚пЈ пІ яЃпїпЈяЃпѕпє яЏп·я‹пєпѕпІ пѕпїпµяЂп°я†пЈпѕпЅпЅя‹я… яЃпЈяЃя‚пµпј Microsoft Windows яЃп»п°пІяЏпЅяЃпєпЈп№ яЏп·я‹пє пґп»яЏ п°пґпµпєпІп°я‚пЅпѕпЁпѕ пѕя‚пѕп±яЂп°п¶пµпЅпЈяЏ яЂп°п·пјпµя‰пµпЅпЅя‹я… яЃпЈпјпІпѕп»пѕпІ Unicode. 3. ппјпµя‚яЊ пґпІяѓя…п±п°п№я‚пѕпІя‹п№ Windows (п°пЅп°п»пѕпЁпЈя‡пЅпѕ яЏпїпѕпЅяЃпєпѕпјяѓ) пґп»яЏ яЃпІпѕп±пѕпґпѕпЁпѕ пѕя‚пѕп±яЂп°п¶пµпЅпЈяЏ п±пѕп»пµпµ 256 п·пЅп°пєпѕпІ яЃя‚п°яЂпѕяЃп»п°пІяЏпЅяЃпєпѕп№ пЁяЂяѓпїпїя‹. п’ п·п°пєп»яЋя‡пµпЅпЈпµ яЌя‚пѕп№ яЃя‚п°я‚яЊпЈ я…пѕя‚пµп»пѕяЃяЊ п±я‹ пѕп±яЂп°я‚пЈя‚яЊ пІпЅпЈпјп°пЅпЈпµ пЅп° пЁп»п°пІпЅяѓяЋ я†пµп»яЊ, пєпѕя‚пѕяЂяѓяЋ п°пІя‚пѕяЂ яЃя‚п°пІпЈя‚ пїпµяЂпµпґ яЃпѕп±пѕп№ пїяЂпЈ яЂп°п±пѕя‚пµ пЅп°пґ пµпґпЈпЅпѕп№ пєпѕпґпЈяЂпѕпІпєпѕп№ я€яЂпЈя„я‚п° - пѕп±пµяЃпїпµя‡пЈя‚яЊ пїпѕп»яЊп·пѕпІп°я‚пµп»яЏпј пєпѕпјпїяЊяЋя‚пµяЂпѕпІ яЃя‚п°пЅпґп°яЂя‚пЅя‹п№, яѓпґпѕп±пЅя‹п№ пЈ пґпѕяЃя‚яѓпїпЅя‹п№ п°пїпїп°яЂп°я‚ пґп»яЏ пЅп°п±пѕяЂп°, пІпµяЂяЃя‚пєпЈ пЈ пЈп·пґп°пЅпЈяЏ яЃп»п°пІяЏпЅяЃпєпЈя… пґпѕпєяѓпјпµпЅя‚пѕпІ пІ яЃпѕпѕя‚пІпµя‚яЃя‚пІпЈпЈ яЃ пЈя… пѕяЂя„пѕпЁяЂп°я„пЈя‡пµяЃпєпЈпјпЈ пЈ пЁяЂп°пјпјп°я‚пЈя‡пµяЃпєпЈпјпЈ пїяЂп°пІпЈп»п°пјпЈ. (c) пђ. пЁпЈя€пєпЈпЅ ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 15:59:43 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RFC6: Expert Software Shell & RFC4.1 - Vertical Software -------------------------------------------------------------------------------- > Положим, звезда MS не вечно будет Солнцем, а то, глядишь, и > вовсе закатится. И что тогда делать? Даже если это произойдет - то уже тогда, когда все славянские тексты будут существовать в HIP $-) А иначе грош цена нашему проекту. ;-))) > С другой стороны, хранение документов как текстовых файлов > является некоей гарантией их "вечности". Не так редки сообщения, > что та или иная группа исследователей использует в работе тексты, > набранные еще на заре компьтерной техники. Дык я ж разве спорю - ради того и предложил наш список. Спор идет о принципе построения софта, работающего с текcтовым же форматом - "вертикального софта" в моей терминологии. А вот MS привожу только в качестве примера того, как успешно можно продвигать объектную и компонентную парадигму мышления. То, что не расширяемо - для меня лично не годится, как к привыкшему к этой парадигме. То, что не "прикручиваемо" к виндам - не годится для 99 процента пользователей, фактически использующих винды, помимо всякого моего желания. Соответственно, очередная система, игнорирующая эту реальность - будет сама проигнорирована, сколь бы она ни была совершенна в идеале. Разумеется, если ты создашь всесовершенную утилиту командной строки - то я с твоей помощью постараюсь в ней (в командной ее строке, а не в потрохах - от последнего уволь!) разобраться, прикрутить к ней виндовый GUI и сделать твой продукт доступным для основной массы людей. Но: 1) в создании такой всеобъемлющей утилиты я ничем не смогу тебе помочь, а боюсь - и _никто_ не сможет тебе помочь; 2) соответственно, как всякому продукту индивидуального, а не коллективного творчества, твоей утилите неизбежно будут присущи какие-то внутренние ограничения, затрудняющие ее использование кем-либо, кроме тебя. Следовательно, даже от моей адаптации, вероятно, проку будет мало, а может быть - окажется, что на 80 процентов мне проще будет все написать заново, но в той виндовой парадигме мышления, к которой привыкли и я, и юзеры. > > Если мы будем пытаться уперто настаивать на том, что наши > > представления правильнее - мы первратимся в сектантов: у нас > > нет и миллионной доли средств, брошенной M$ на пропаганду своих > > взглядов. Единственное, что можно сделать - это найти некий общий > > знаменатель (в идеале - наибольший общий делитель) всех возможных > > для нас подходов, чтобы никто не был обижен тем, что его мышление > > "не делится" на принятый нами стандарт. > > Правильно. Один общий знаменатель -- текстовое представление. С этим естественно согласен. > Другой -- описание алгоритмов проверки и восстановления текста > в "воспроизводимом" виде. Сюда же можно добавить алгоритмы > конвертации в другие системно-независимые представления > (например, TXT/Unicode). Все остальное уже, увы, будет привязано > к конкретной платформе. Описание алгоритма зачастую труднее сделать, чем реализовать сам алгоритм. Пока ты пишешь программу - ты совершенствуешь алгоритм в отладчике. Когда программа готова - заниматься описательством уже неинтересно, потому в некоммерческих проектах обычно этим никто и не занимается. Соответственно, вместо описания алгоритмов лучше делиться ими самими в работающем виде - в виде dll, лучшего история не изобрела пока что. Описывать лучше не алгоритмы (динамику), а спецификации стандартов (статику). Любой алгоритм есть лишь вектор над множеством текстов, где начальная и исходная точки должны быть точно специфицированы. А для этого надо для начала тщательнейшим образом исследовать то пространство, с которым мы собираемся иметь дело. А точнее, алгоритм - это даже не вектор, а целое преобразование, которое, если его применять к прочим точкам - можно получить иногда бессмысленные, а иногда очень удивительные и приближающие нас к цели результаты. И теоретически, если добавить сложность (т.е. кол-во измерений!) в описание самого предметного пространства - можно добиться того, чтобы все используемые нами алгоритмы имели осмысленное во всем этом пространстве действие. Вот с необходимого минимума этих - классифицируемых и квалифицируемых - алгоритмов и лучше всего начинать. А минимум этот определится только вместе с изученностью пространства, но никак не сам по себе. Ты же хочешь обойтись без исследовательской работы, положившись лишь на свою интуицию, и тем самым неизбежно чего-то не учесть. Например, обидеть корректоров, тщательно расставлявших переносы в изданиях, напр., Сретенского монастыря. Объявить, что в HIP их переносы пропадут. - Очень хорошо, но тогда не рассчитывай на доверие к своей системе со стороны этих обиженных издателей. Они заявят, например, что с их точки зрения мягкие переносы - это главное, и потому с таким уродством как HIP они связываться не будут. И массу можно привести других тонкостей из реальной жизни, превращающих кабинетных программистов в замкнутый сектантский кружок, а творчество их в интеллектульный онанизм, прости уж за грубость. Можно ведь еще объявить всех несогласных идиотами и плебсом - так обычно и делают даже христианнейшие программеры, оказавшись в подобной ситуации. Несмотря на то, что это совершенно не по-христиански, и приводит к еще большей сектантской замкнутости. > > Так и систем ЦС-набора и окрест-них-существующего софта существует, > > наверное, уже более десятка. И каждая создавалась с претензией на > > совершенство. Единственное, чего не хватило каждой - именно > > системности, понимания того, что на ней свет клином не сошелся. > > Есть ли среди них системы, направленные не только на задачу > "бумажного" издания книги? О таких было бы полезно узнать > больше и, может быть, чем-то воспользоваться. Ну ты понимаешь важность такой системы, я понимаю, еще несколько десятков, быть может, человек понимают. И все. А вся остальная масса людей, в т. ч. располагающих свободным временем, желанием и средствами для работы, этого не понимает и никогда не способна понять - хоть в лепешку расшибись. И среди духовенства вряд ли кто понимает, в том числе среди принимающих решения "духовников издательств", в том числе из имеющих высшее образование, программистский опыт "в прошлой жизни" и даже ученые степени. Поверь, я с этим сталкивался многократно. Заставить их понять это невозможно, можно только принести все на блюдечке с голубой каемочкой, да в красивой обертке, как это делает M$. Только M$ это делает с помощью мегабаксов, а мы должны умудриться в нашей ограниченной области преуспеть практически без финансирования. Уж прости за жесткие слова, но понимать это мы обязаны, иначе мы обречены на поражение. Кстати, эта же малоденежность проекта - еще один довод в пользу множества несложных комбинируемых алгоритмов и против некоей синтетической системы; сложную систему, части которой мы не сможем проверить по отдельности, мы просто не осилим, ибо тестирование стоит денег - либо явных, либо неявных, когда использование неоотестированого софта приносит одни убытки. > > Соотвтетственно, если мы не будем пытаться создать именно Систему с большой > > буквы, к которой можно было бы прикрутить все остальное, то мы создадим лишь > > еще одну систему, столь же самонадеянно претендующую на совершенство. Причем > > расширяемость требуетчся не просто теоретическая, а практическая. > > "Прикручивать" сателлитов следует по существующим четко описанным > > спецификациям, которые тоже мы обязаны зафиксировать. Вовсе недостаточно > > просто провозгласить гибкость сисетмы: теоретически можно запрграммировать > > что угодно на любом языке, наша же задача - четко описать, что нужно сделать > > алгоритмически для того, чтобы достичь совместимости с нашей системой. > > Бесспорно согласен, если это значит "использовать наш формат > файлов для входной и выходной информации". Если что-то другое -- > что именно? Ровно наоборот: все существующие форматы файлов должны стать "нашими", обрести место в нашей классификации, а постепенно - и обрасти алгоритмами для изменения этого места. Разумеются только те форматы, в которых существует более десяти страниц вычитанного корректором текста. Если текста меньше - то его проще будет просто перенабрать. Я знаю, с какими муками издавался в ПСТБИ "братский молебен" - несколько десятков страничек в лаврской-Вентуре. Человек, бывший ответственным за внесение правки в слав. текст, заявляет, что никогда больше не возьмется повторить эту работу. А HIP нужен, конечно, но лишь как некий индейский язык для структурных лингвистов - язык без сингулярностей, где не существует исключений из правил. (Вроде бы, этот язык теперь избран стандартом в лаборатории Апресяна в качестве промежуточного "хранилища смысла", используемого в машинном переводе.) > > А > > еще - постараться самим прикрутить таким же образом уже существующие > > системы, чтобы тем самым самим и оттестировать только что созданные > > собственные спецификации. > > Это означает написание конверторов? > > > > 2) Pust' komponenty budut polezny i sami po sebe. > > > > Система с большой буквы все равно должна существовать, хотя бы виртуально - > > в виде программных "заглушек". Это требуется для того, чтобы не создавать > > впредь конвертеров, не вписывающихся в стандарт. (То есть не совместимых > > между собой по четко определенным правилам. Каковые правила эти должны быть > > созданы в начале, с учетом существующих систем, а потом уже - создаваться > > конвертеры на основе этих правил). > > Чего-то я тут не понимаю. Если конвертор не вписывается в стандарт, > то это вроде бы просто неправильный конвертор? Просьба пояснить. Допустим, ты считаешь конвертером только то, что работает со строчным текстом, а какой-нибудь виндузятник - наоборот, только с абзацным. Все. Патовая ситуация. Вы можете только разойтись в гордом презрении друг к другу, считая все остальные подходы, кроме своего, неправильными. Так до сих пор дело и обстоит, и каждая вновь появляющаяся "система" живо себя обретает в этой парадигме. А я предлагаю "взять выше" и создавать систему, для которой ваши подходы - лишь частные случаи. Такая вот Вавилонская башня в пределах православно-компьютерного мира ;) С помощью братской любви и отвергнув гордыню можно преодолеть разделение, но никак не навязывая свои идеи всем. Навязать можно не идеи, а готовое решение - так, чтобы _никто_ _добровольно_ не захотел изобретать велосипед. Поставим технологические и психологические достижения Билла Гейтса на службу единству славянского православия! > > Преимущество "большой" системы - компонентность: ты можешь > > сконцентрироваться на своей четко определенной задаче, абсолютно выбросив из > > головы все, что к ней не относится. Но для этого все подзадачи надо "четко > > определить". В этой-то необходимости я и пытаюсь тебя убедить. > > Так я уже и есть убежденный! Например, работа с текстом с помощью > набора standalone-утилит (не диалоговых) и какого-нибудь нехитрого > текстового редактора вырисовывается такая: Скажи, у тебя _лично_ есть силы на то, чтобы такую систему завершить и с ее помощью ввести и обработать _все_ тексты? Если есть - мы все тебе в ноги поклонимся, дерзай, а мы будем за тебя молиться. Если же нет, и ты рассчитываешь на нашу помощь - учти, что мы, конечно, постараемся, но 1) как правило, у нас будет получаться далеко не то, что ты хочешь ("хотели как лучше, а получили как всегда"), и 2) каждый будет "тянуть одеяло на себя", пытаясь приблизить твою систему к той платформе, а твои тексты к тому представлению, которое ему удобнее. И это только тесный наш круг. А по мере расширения круга участников появятся и такие, которые все набранное схавают и издадут в какой-нибудь изд. системе под своим именем, не дожидаясь окончания нашего труда. И никакая "система" им для этого не понадобится. > > > Nikogda ne delal *.dll, a potomu vopros: chem eto > > luchshe/proshche/udobneje > > > po sravneniju s naborom standalone-utilit, jedinoobrazno napisannyh, > > > > Dll - dynamic link library. Лучше это тем, что позволяет пользоваться > > функциями, полностью позабыв об их реализации и не имея доступа к исходному > > коду. Допустим, ты в своей расставлялке ударений (для ТеХ и для русского > > набора) продумал и реализовал некий алгоритм. Тогда, если ты его правильно > > оформишь в виде dll (то есть правильно разобьешь этот алгоритм на мелкие > > функции, которые можно впоследствии использовать и документируешь эти > > функции) - ты сможешь выкинуть исходный код библиотеки и освободить свои > > мозги для новых задач. А при нужде - пользоваться своими же функциями в уже > > откомпилированном виде. Конечно, прежде чем выкидывать код, следует > > библиотеку оттестировать, желательно на в близких реальным уловиях. > > Мало того, твою dll сможет использовать кто угодно из любой среды - даже я, > > решив реализовать свою расставлялку ударений, работающую в Ворде и > > рассчитанную, допустим, на дореволюционную орфографию. При этом я не должен > > буду ничего узнавать ни об алгоритме твоих функций, и даже в принципе не > > обязан буду знать о существовании языка C. > > Насколько эти dll системно-независимы? Или кроме как в Win они нигде > не применяются? Еще я видел такие в полуоси, но уверен, что с виндовыми они не совместимы ;( Существуют два способа обеспечить повторное использование программ (речь идет о реализациях, а не об алгоритмах): либо унифицировать ОС или хотя бы ее исполняющую подсистему, оставив программистам свободу выбора языка, как это делает открытая "закрытая M$", либо навязать язык вместе со всеми особенностями психики софтописателя, оставив свободу выбора платформы, как это делают закрытые "открытые системы" с исходными кодами. Честно говоря, в этом споре я однозначно на стороне первых, прекрасно отдавая себе отчет, что в системе той могут быть и наверняка находятся нежелательные "пасхальные яйца". В конце концов, даже если вдруг Windows начнет через слово ругаться тремя шестерками - это будет просто означать, что пора мотать в горы, ибо, даже если у тебя на столе невинный Юникс (это с бесенком-то?), то в радиусе кубического километра вокруг тебя - все равно тысяча Виндов. Первый подход расширяет круг "программистов", позволяя даже полным чайникам вроде меня чувствовать себя таковыми, собирая действующие программы из готовых компонент, второй ведет к крайней элитарности, ибо обладает невероятно крутой learning curve. Кроме того, он принципиально ограничен по сложности, ибо правильная доработка софта с открытыми текстами возможна только при полном постижении смысла всех существующих его частей. А возможен компромисс - "виртуальная текстово-ориентированная ОС" - нечто вроде Сабжа (Expert Software Shell ), под которую можно и нужно писать ЦСл программы. К чему я и призываю всех. Тогда юниксоиды и ТеХовцы вроде тебя не будут унижаться, работая напрямую с мастдайным софтом, а мастдайщики вроде меня смогут использовать Ваши результаты в своем, пусть мастдайном, но более обширном, мире, на благо его обитателей Вы бы могли заняться логикой, а мы - интерфейсом. И таким образм получится здоровое сотрудничество на общее благо. А вот когда появится дружественный к пользователю и дуронепробиваемый интерфейс - к сотрудничетву можно будет привлечь массы профанов непрограммистов и вообще некомпьютерщиков. Каковых к предложенной тобой системе не следует подпускать и на пушечный выстрел. > > > ispol'zujushchih odni i te zhe funkcii HIP-vvoda/vyvoda i odno i to zhe > > > predstavlenije teksta v pamjati, i dostupnyh vmeste s ishodnymi tekstami? > > > > Для этого надо разбираться в исходных текстах. 1) не все - сишники, как это > > ни удивительно и 2) не все способны быстро разобраться в исходных текстах, > > даже в своих собственных по прошествии некоторого времени. > > Так ведь речь не идет о том, чтобы навязывать именно исходники. > Пусть будут и они, и exe-шники. Standalone exe в твоей терминологии - это то же, что dll в терминологии виндов. Только dll автоматически линкует и исполняет соответствующая подсистема OC, а твои exe-шники не подчиняются никаким двоичным правилам, помимо текстового описания, в худшем случае существующего только в твоей голове. Вот и разница: если эти exe написаны с учетом неких машинно-интерпретируемых правил - то это уже разновидность сабжа, и написаны они для некоторой виртуальной ОС, а если таких правил не существует, то толку от них мало, ибо диспетчеризацией их использования должен заниматься некий гуру-человек, а не автомат. Может быть, и dll тоже в такую схему > можно без особых проблем вложить (прицепив к "телу" алгоритма другой > интерфейс ввода-вывода). Но, имея исходники, кто-нибудь сможет > применить их и в совершенно другой платформе. Нам шашечки или ехать? Если ты мне предложишь готовый результат - _все_ ЦСл тексты в HIP - то мне не нужно будет ничего из планируемого в рамках Windows. Делай это на чем угодно, лишь бы текст выдал на-гора. ;) И желательно не к 2010 году.... Так что чтО уж мечтать о многоплатформенности, когда есть надежда создать софт одноразового использования.... А чем больше людей смогут его _использовать_, тем скорее будет достигнут результат. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 16:10:08 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Tegi i kommentarii -------------------------------------------------------------------------------- Здравствуй, Михаил! > А отказываться от "свободы" в %%-комментариях не хочется, > именно чтобы иметь возможность безопасно закомментарить > что угодно: берем кусок текста и ставим %% в начале каждой > строки. Миша, эта "свобода" - просто программистская заморочка, да еще вызванная убожеством редакторов, к которым привыкли программисты же. Представь себе, не только в ТеХе или в С используются милые твоему сердцу комментарии, но и в bat-файлах (забыл уже?), и (о ужас!) в M$ Visual Васике! ;), в том числе и в том, что встроен в Ворд. Но это не повод навязывать простым людям - непрограммистам такой довольно извращенный синтаксис. Были бы вовремя созданы нормальные редакторы, ассистирующие при вставке целых блоков кода (свитчей, циклов и условных конструкций, кстати и парных комментариев) - никогда бы не потребовались комментарии "отсюда до конца строки". И в Васике же есть строчная организация программы - но не из-за ограничения редактора собственно текста, а из-за требования к визуализатору не искажать тот layout, что задан программистом. Захочет программист пользоваться строками в 30К - сможет это сделать за милую душу. Соответственно, для длинных операторов используется особый значок, означающий, что оператор продолжается на следующей строке. Но использование этого знака опционально, как и сам перенос оператора. И не повод это для того, чтобы прочие редакторы _для пользователей_ подражали, в частности, этому совершенно узкоспециализированному редактору _для программеров_. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 16:13:56 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk -------------------------------------------------------------------------------- Здравствуй, Михаил! > 2) %- (или другой вариант спецкомментария) плох тем, что надо особо > оговорить, что произойдет, если он окажется в странном месте -- скажем, > рядом с пробелом или внутри многосимвольного обозначения одной буквы. Считать ошибкой для пакетных утилит или маркером красного символа 20-го кегля для визуальных редакторов ;). > 3) &- (или другой вариант "реального" символа) плох тем, что в тексте > как таковом мягких переносов нет -- это наша абстракция возможных > способов верстки. > 4) В любом случае нарушается (и очень резко) требование "наглядности" > HIP-текста и, наверное, на треть увеличивается его длина. Опять же - это повод для стандартизации еще одного измерения пространства расширений HIP, характеризующегося наличием-отсутствием мягких переносов. В basicHIP логично потребовать их отсутствия. > 5) Правила переноса не настолько четко зафиксированы, чтобы > с уверенностью говорить о "правильном написании" и "ошибках". > (А библиотека HIP-текстов мыслится как несто эталонное.) Во-первых, достаточно четко, а во-вторых эти переносы - суть точно такие же накопленные и выверенные знания, как сами HIP-тексты. > 6) При уточнении правил переноса потребуется перетряхнуть все > тексты (и у каждого текста возникнет новая версия). Почему? Если где-то допущен перенос - логично предположить, что это сделано сознательно. Я не думаю, что следует требовать наличия всех текстов в этом расширенном стандарте с переносами. Но оттого-то и есть нужда в множественных стандартах, чтобы ради единственно правильного ЧУЧХЭ не отказываться от уже проделанной работы и накопленных знаний. Ведь во многих текстах эти переносы _уже_ стоят, пусть не везде, а только в реально перенесенных словах. Что же - заранее определенно решить, что мы будем игнорировать эту уже проделанную кем-то работу по переносу данных слов? Можно было бы и так, если было бы доказано, что уже проделанная работа принципиально ничтожна по объему относительно требуемого результата (хотя бы того же словаря переносов). Почему-то мне кажется, что не так уж она и ничтожна. > 7) Фиксируя мягкие переносы в тексте, мы, тем самым, привязываем > себя к парадигме "перенос возможен/перенос невозможен", хотя > есть (пусть не так распространенные и -- главное -- не так хорошо > разработанные) идеи переносов с разной степенью допустимости. > Вынося проблемы переносов "за скобки" текста, мы позволим в > будущем воспользоваться этими идеями, изменив только конверторы > из HIP и настроив один файл с эталонами переноса. Ой, боюсь, что как раз переносы с разной степенью допустимости для не столь уж великого по объему, а главное - ограниченного корпуса славянских текстов - это как раз чрезмерное расширение проекта. Все равно окончательно править переносы будут художники-корректоры уже в верстке, в любой издательской системе. > 8) Если вопрос в том, что не хочется писать алгоритм вставки переносов > в каждом конверторе из HIP, то это решается разложением конвертации > в два шага: сперва отдельная программа вставляет переносы (ее надо > будет написать всего один раз), Все бы хорошо, только, учитывая накопленный опыт по переносу ЦСл слов, это будет слишком революционно и нечетко. Ты можешь заранее гарантировать, что написанная тобой такая программа не ошибется в тех словах, которые уже кем-то перенесены в каких-то верстках? И что у тебя не дойдут до нее руки только тогда, когда она станет практически не нужна - годков этак через пять, когда, дай Бог, уже все тексты будут в HIP, а хорошая часть уже будет кем-то на основе этого формата издана, а переносы вновь расставлены вручную ;) ? Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 16:16:46 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Ответ Хозяинову. -------------------------------------------------------------------------------- Сергей! Следите пожалуйста за сабжем! > From: Mikhail Grinchuk > To: -=ORTHODOX-FONT=- Project Participants > Sent: 26 января 2000 г. 9:00 > Subject: Re: RFC2.1: Projekt IP - From Mikhail Grinchuk > > > "Чистый" абзацно-ориентированный принцип опасен тем, что порождает > > файлы со сколь угодно длинными строками (= последовательностями > > символов между EOL). А это у многих текстовых редакторов вызывает > > трудности: длинные строки могут просто обрезаться, либо рваться на > > части в произвольном месте (файл, сохраненный после такого > > редактирования, будет содержать разорванные слова). > > Считаю абзацно-ориентированный принцип правильным и естественным. > Загрузим текст в издательскую систему и подвигаем правую границу (правое > поле) текста. Сразу видно что именно абзац является структурной единицей > текста. При записи в текстовой файл абзацев строками, получим строки длиной > равной длине абзацев. Разве это такие уж длинные строки? > Можно разломить абзац на строки принудительно, но пускай будет однозначный > знак конца абзаца. Для компьютера или для программиста с "компьютерными мозгами" двойной конец строки - это и есть требуемый знак абзаца. Но НЕ для подавляющего большинства НОРМАЛЬНЫХ людей. ;( (2Войнов: элитарность православного меньшинства отнюдь не должна состоять в поголовном требовании изучить программирование :-). > По поводу запретов переносов и др. > Во всем к чему будет доступ оператора, будут сделаны все возможные ошибки > + все невозможные, и будут нарушены все запреты. Следовательно, желательно доступ оператора ограничить, и чем больше в нашей нотации элементов, не учитывающих естественные механизмы человеческой психики, тем важнее такой "железный" контроль за оператором. > Т.е. все конверторы должны не только решать свою прямую задачу, > но и как-то реагировать на нарушения самого формата инварианта и ошибки наборщика > во всем их разнообразии и непредсказуемости :(. Потому я и предлагал разделить конверторы и валидаторы, и а общие алгоритмы - совать в dll. > Кстати и верстальщики внесут свою лепту. И не малую. Вместо мягкого переноса - > дефис, неоправданные принудительные обрывы строк, табуляторы, пробелы всех > сортов и пр. Вот-вот, потому и лучше не давать текст верстальщикам до полной его готовности. И если в реально действующих технологических цепочках такое разделение весьма утопично, то в создаваемой "с нуля" системе его можно и нужно жестко запроектировать. Следующий вопрос - что делать уже сверстанными текстами - решается конвертацией их в HIP. А для успешной конвертации нужен их анализ, который в свою очередь, если будет произведен с умом, может породить еще несколько более приближенных к верстке стандартов. И от них желательно не шарахаться, отодвигая проблемы на будущее, а наоборот - тщательно их фиксировать. С уважением, Левъ ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 16:28:23 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Ответ Гринчуку -------------------------------------------------------------------------------- Прошу, следите за сабжами! > > Считаю абзацно-ориентированный принцип правильным и естественным. > > Загрузим текст в издательскую систему и подвигаем правую границу (правое > > поле) текста. Сразу видно что именно абзац является структурной единицей > > текста. > > Логической структурной единицей -- безусловно. Но "физически" > он будет разделен на строки (например, в нашей переписке по email'у > это происходит автоматически). Пример с email как раз работает против строчного принципа. Аутглюк делит текст на строки способом, совершенно несовместимым с фидошным Голдедом. И если переписку между интернетовскими клиентами он обрабатывет нормально и не для кого не обидно, то в ФИДОшных эхах ФИДОшники оказываюся незаслуженно обиженными. Если бы работающих с Голдедом было бы столько, сколько Chiwriter-овцев, то их интересы IMHO можно было бы проигнорировать. Но их на несколько порядков больше. [И тем не менее я их обижаю и пользуюсь Аутглюком - хотя бы для того, чтобы читать твои письма, мышкой выбрав кодировку ISO!] А вот юниксоидов, да не просто эстетов вроде тебя, а тех, кто реально не может пользоваться Windows - не знаю сколько.... Явно больше, чем поклонников Chiwriter-а, но столь же очевидно меньше, чем людей, ограниченных Голдедом. А что, неужели ТеХ - такой продвинутый - не понимает абзацев неограниченной длины? 8-() > > При записи в текстовой файл абзацев строками, получим строки длиной > > равной длине абзацев. Разве это такие уж длинные строки? > > Увы, да. Попадаются ограничения и в 80 символов, и в 255. И если > редактор просто режет строку на кусочки -- это еще не самый плохой > случай. Не есть ли это показатель дремучести редактора? Вот от мыльного указанного тобой ограничения одни проблемы. Но это ограничение - следствие IMHO следования _устаревшим_ почтовым стандартам. Мы же создаем станадарт _заново_. Что нам мешает создать его современным, а не на уровне наивняка 80-х гг.? > > Можно разломить абзац на строки принудительно, но пускай будет > > однозначный знак конца абзаца. > > Чем плоха пустая строка? Тем что человек-оператор - не машина, и с легкостью может ее пропустить (если, конечно, его не изолировать от текста, против чего ты пока был против). Или если за дело не берется человек - программист и гуру, отвечающий за все от начала до конца и не желающий ничьей помощи. Полагаю, что ты не такой - иначе с нами бы не советовался ;-) Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 16:38:40 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC8: п¦пЎп» я€яЂпЈя„я‚ -------------------------------------------------------------------------------- Привет Lev Tikhonov , -- 27 января 2000 г., 12:37:10, ты писал: LT> пћяЂпЈпЁпЈпЅп°п» яЃя‚п°я‚яЊпЈ пІ я„пѕяЂпјп°я‚пµ word97, LT> я‚яЂпµп±яѓяЋя‰пЈп№ пґп»яЏ пїяЂпѕяЃпјпѕя‚яЂп° LT> яѓяЃя‚п°пЅпѕпІп»пµпЅпЅя‹я… я€яЂпЈя„я‚пѕпІ Evangelie пЈ NewtonC - LT> яЃпј. LT> (c) пђ. пЁпЈя€пєпЈпЅ ОЧЕНЬ убедительно! Чей копирайт, а то я не расслышал? ;) =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 16:48:21 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RFC8: ЦСл шрифт -------------------------------------------------------------------------------- Оригинал статьи в формате word97, требующий для просмотра установленных шрифтов Evangelie и NewtonC - см. http://hamster.lgg.ru/ftp/slav.zip Вопрос стандартизации кодировки славянских шрифтов возник с самого начала компьютерного набора славянского текста. Потребность в стандартизации кодировки исходила в основном от пользователей программ компьютерных набора и верстки, работающих, во-первых, над выпуском наборной служебной литературы на церковно-славянском языке и, во-вторых, над выпуском наборных книг - литературных памятников на старославянских языках. Сознательно в вопросе стандартизации кодировки компьютерных шрифтов желательно ограничиться областью церковно-славянского языка XIX века как основы процесса стандартизации по следующим причинам: 1. Создание кодировки, включающей в себя все символы языков,основанных на кириллической версии славянского алфавита, представляет собой серьезный исследовательский и практический труд, поскольку необходимо учитывать не только чисто знаковый состав языка, необходимый для отображения в кодовой таблице, но и композитные символы, необходимые для решения практических задач, связанных с набором текста на конкретном языке (Гаслов И.). Предпосылки для успешного завершения в обозримый срок данной работы, на мой взгляд, есть только для церковно-славянского языка, для которого характерны: O Единая межнациональная структура языка в прошлом и в настоящее время, позволяющая использовать его в качестве основы для создания единой славянской кодировки O Богатый опыт компьютерного набора и верстки на языке O Значительная потребность в литературе на нем O Знание его практически всеми участниками данного обсуждения 2. Для славянских языков характерен тот факт, что на них не существует современной светской литературы - шрифт требуется только для набора литературных памятников и церковной служебной литературы (издание словарей и учебной литературы по языку можно не учитывать в силу слабого присутствия шрифта в издании ~ 10% сильно фрагментированного текста, остальное - светский язык (русский или иной)). Для каждого (достаточно узкого) исторического периода тексты на славянском языке имели свой определенный знаковый состав шрифта и набор гарнитур. В гарнитурах каждого периода (а часто и каждого издающего региона) других символов, кроме предусмотренных правилами набора, просто не требовалось! Вставлять все символы единой кодировки в такую гарнитуру просто бессмысленно - не существует книги, где нужны все эти знаки. Анализ литературы определенных периодов на церковно-славянском языке с точки зрения знакового состава гарнитур шрифта - задача обозримая и частично выполненная, чего нельзя сказать (в пределах нашего обсуждения)о всех языках группы. 3. Только к середине XIX века окончательно утвердились единые простые правила набора и утвердились правила корректуры церковно-славянских текстов (учитывая особенности Киево-Печерской типографии). До этого времени эти правила значительно различались от типографии к типографии и были очень сложны для типографского набора как технологического процесса - в таких книгах, например, очень велико количество употребляемых букв-надстрочников или часто употребляется два различных начертания одной и той же буквы в одном и том же слове (например, беззаконие). Таким образом, разработав на основе позднего церковно-славянского шрифта так называемую <базовую кодировку> славянской станицы (сначало по составу, затем по размещению), можно продолжать дорабатывать кодировку дополнительных символов для решения более общих задач набора. Для этого необходимо зарезервировать участок Unicode как для базовой кодировки, так и для дополнительных славянских символов. Хочется сразу отметить, что это пространство должно быть более 256 ячеек, т.к. общее количество символов шрифтов славянской группы разных веков (с учетом удобства набора) должно быть весьма значительно. Для получения единой базовой кодировки на основе церковно-славянского языка необходимо прежде всего попытаться определить количественный состав базового шрифта. Результатом работы по созданию шрифта совместно с фирмой Paratype явилась кодировка, состоящая из 176 знаков и предлагаемая к рассмотрению. (Рисунок шрифта Evangelie с предложенной кодировкой ЦСл символов) Основными принципами построения набора символов для однобайтной кодировки явились следующие положения: 1. Отдельных знаков ударения и придыхания 16: 8 для заглавных и 8 (таких же) для строчных букв. Знак <ударение с придыханием> - единый символ (2 для заглавных и 2 для строчных). Также имеется 2 отдельных знака титла (заглавное и строчное). 2. Вместе с ударением в одном символе хранятся следующие буквы: { ?C x y z l m уC. 3. Вместе с придыханием в одном символе хранятся следующие буквы: Z | } E e F f. 4. Всякая встретившаяся в текстах буква с титлом хранится в едином символе - всего 29 символов. 5. Буквы ? (?) и ? встречаются только в виде знака ? (?) в начале слова. Однако для получения возможности набора буквиц из знака ? - ?? каждая из них размещена в отдельном знаке (всего 3). 6. Не занимаются символы, не имеющие кода-аналога в системе Mac - всего 23 символа 7. Не занимаются служебные символы (конец абзаца, неразрывный дефис и т.д.) 8. В русский знакоряд (А-я) из одинаковых звуко-символов разных видов выбирался тот, который является более часто встречающимся. Необходимость в размещении всех знаков с титлами, а также некоторых знаков с ударениями и придыханиями была выявлена в процессе набора текстов, когда эти буквы приходились на середину слова. В случае, когда буква с титлом (или некоторая буква с ударением, придыханием) состояла из двух символов - буквы и титла (ударения, придыхания), возникала проблема <тройного кернинга> - <буква-титло-буква>. В чем же суть этой проблемы? Большинство знаков с ударениями (придыханиями) в церковно-славянском тексте должны состоять из двух символов - буквы и следующего за ним ударения. При этом сам знак ударения (придыхания) должен иметь минимальную ширину (для облегчения визуального восприятия набранного текста без кернинга) и иметь кернинг с предыдущей буквой на величину, равную своей ширины (для того, чтобы наличие ударения или придыхания не изменяло межбуквенный интервал). Если для букв с размером не более а ударение (придыхание) <смотрится хорошо>, то для букв типа W, w ? или у подобная схема приводит к некрасивому, неестественному наложению ударения. Если же увеличивать кернинг ударения на величину, превышающую ширину ударения, то следующая за ударением буква будет "наезжать" на предыдущую. Для компенсации этого эффекта возможен отрицательный(раздвигающий буквы) кернинг между ударением и следующей за ним буквой. Но это необходимо не для всех букв с ударениями. Например, wdн требует смещения придыхания влево и отрицательного кернинга придыхания с н, а аdн - не требует смещения придыхания влево и отрицательного кернинга придыхания с н. Решить это противоречие можно только путем "тройного кернинга" - т.е. кернинг данной буквы с предыдущей зависит от сочетания ДВУХ предыдущих букв, а не только от одной предыдущей. Это тупиковый путь. Разработанный знакоряд шрифта "Evangelie" ни в коем случае не претендует на всеобщую функциональную полноту, являясь, скорее, логически обоснованным вариантом шрифта, проверенном на 500 000 знаках набора. Уже сейчас автору очевидно, что для построения полноценного стандартного аппарата для набора славянским шрифтом необходимо: 1. Использовать для размещения славянских символов предназначенный для этого раздел Unicode - Cyrillic с номерами от 0400 до 04FF и Unassigned zone - 0500-052F. 2. Разработать и ввести в список языков операционных систем Microsoft Windows славянский язык для адекватного отображения размещенных символов Unicode. 3. Иметь двухбайтовый Windows (аналогично японскому) для свободого отображения более 256 знаков старославянской группы. В заключение этой статьи хотелось бы обратить внимание на главную цель, которую автор ставит перед собой при работе над единой кодировкой шрифта - обеспечить пользователям компьютеров стандартный, удобный и доступный аппарат для набора, верстки и издания славянских документов в соответствии с их орфографическими и грамматическими правилами. (c) А. Шишкин ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 17:31:51 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC8: ЦСл шрифт -------------------------------------------------------------------------------- А вот еще какая статья была на Православной Беседе. http://beseda.mscom.ru/arc3/1769.html > Оригинал статьи в формате word97, требующий для просмотра установленных > шрифтов Evangelie и NewtonC - см. > > http://hamster.lgg.ru/ftp/slav.zip > > > Вопрос стандартизации кодировки славянских шрифтов возник с самого начала > компьютерного набора славянского текста. Потребность в стандартизации > кодировки исходила в основном от пользователей программ компьютерных набора > и верстки, работающих, во-первых, над выпуском наборной служебной литературы > на церковно-славянском языке и, во-вторых, над выпуском наборных книг - > литературных памятников на старославянских языках. Сознательно в вопросе > стандартизации кодировки компьютерных шрифтов желательно ограничиться > областью церковно-славянского языка XIX века как основы процесса > стандартизации по следующим причинам: > > > > 1. Создание кодировки, включающей в себя все символы языков,основанных на > кириллической версии славянского алфавита, представляет собой серьезный > исследовательский и практический труд, поскольку необходимо учитывать не > только чисто знаковый состав языка, необходимый для отображения в кодовой > таблице, но и композитные символы, необходимые для решения практических > задач, связанных с набором текста на конкретном языке (Гаслов И.). > Предпосылки для успешного завершения в обозримый срок данной работы, на мой > взгляд, есть только для церковно-славянского языка, для которого характерны: > > > > O Единая межнациональная структура языка в прошлом и в настоящее > время, позволяющая использовать его в качестве основы для создания единой > славянской кодировки > > O Богатый опыт компьютерного набора и верстки на языке > > O Значительная потребность в литературе на нем > > O Знание его практически всеми участниками данного обсуждения > > > > > > 2. Для славянских языков характерен тот факт, что на них не существует > современной светской литературы - шрифт требуется только для набора > литературных памятников и церковной служебной литературы (издание словарей и > учебной литературы по языку можно не учитывать в силу слабого присутствия > шрифта в издании ~ 10% сильно фрагментированного текста, остальное - > светский язык (русский или иной)). Для каждого (достаточно узкого) > исторического периода тексты на славянском языке имели свой определенный > знаковый состав шрифта и набор гарнитур. В гарнитурах каждого периода (а > часто и каждого издающего региона) других символов, кроме предусмотренных > правилами набора, просто не требовалось! Вставлять все символы единой > кодировки в такую гарнитуру просто бессмысленно - не существует книги, где > нужны все эти знаки. Анализ литературы определенных периодов на > церковно-славянском языке с точки зрения знакового состава гарнитур шрифта - > задача обозримая и частично выполненная, чего нельзя сказать (в пределах > нашего обсуждения)о всех языках группы. > > 3. Только к середине XIX века окончательно утвердились единые простые > правила набора и утвердились правила корректуры церковно-славянских текстов > (учитывая особенности Киево-Печерской типографии). До этого времени эти > правила значительно различались от типографии к типографии и были очень > сложны для типографского набора как технологического процесса - в таких > книгах, например, очень велико количество употребляемых букв-надстрочников > или часто употребляется два различных начертания одной и той же буквы в > одном и том же слове (например, беззаконие). > > > > Таким образом, разработав на основе позднего церковно-славянского шрифта так > называемую <базовую кодировку> славянской станицы (сначало по составу, затем > по размещению), можно продолжать дорабатывать кодировку дополнительных > символов для решения более общих задач набора. Для этого необходимо > зарезервировать участок Unicode как для базовой кодировки, так и для > дополнительных славянских символов. Хочется сразу отметить, что это > пространство должно быть более 256 ячеек, т.к. общее количество символов > шрифтов славянской группы разных веков (с учетом удобства набора) должно > быть весьма значительно. > > Для получения единой базовой кодировки на основе церковно-славянского языка > необходимо прежде всего попытаться определить количественный состав базового > шрифта. Результатом работы по созданию шрифта совместно с фирмой > Paratype явилась кодировка, состоящая из 176 знаков и предлагаемая к > рассмотрению. > > > > (Рисунок шрифта Evangelie с предложенной кодировкой ЦСл символов) > > > > Основными принципами построения набора символов для однобайтной кодировки > явились следующие положения: > > > > 1. Отдельных знаков ударения и придыхания 16: 8 для заглавных и 8 (таких > же) для строчных букв. Знак <ударение с придыханием> - единый символ (2 для > заглавных и 2 для строчных). Также имеется 2 отдельных знака титла > (заглавное и строчное). > > 2. Вместе с ударением в одном символе хранятся следующие буквы: { ?C x y > z l m уC. > > 3. Вместе с придыханием в одном символе хранятся следующие буквы: Z | } > E e F f. > > 4. Всякая встретившаяся в текстах буква с титлом хранится в едином > символе - всего 29 символов. > > 5. Буквы ? (?) и ? встречаются только в виде знака ? (?) в начале > слова. Однако для получения возможности набора буквиц из знака ? - ?? каждая > из них размещена в отдельном знаке (всего 3). > > 6. Не занимаются символы, не имеющие кода-аналога в системе Mac - всего > 23 символа > > 7. Не занимаются служебные символы (конец абзаца, неразрывный дефис и > т.д.) > > 8. В русский знакоряд (А-я) из одинаковых звуко-символов разных видов > выбирался тот, который является более часто встречающимся. > > > > Необходимость в размещении всех знаков с титлами, а также некоторых знаков с > ударениями и придыханиями была выявлена в процессе набора текстов, когда эти > буквы приходились на середину слова. В случае, когда буква с титлом (или > некоторая буква с ударением, придыханием) состояла из двух символов - буквы > и титла (ударения, придыхания), возникала проблема <тройного кернинга> - > <буква-титло-буква>. В чем же суть этой проблемы? > > Большинство знаков с ударениями (придыханиями) в церковно-славянском тексте > должны состоять из двух символов - буквы и следующего за ним ударения. При > этом сам знак ударения (придыхания) должен иметь минимальную ширину (для > облегчения визуального восприятия набранного текста без кернинга) и иметь > кернинг с предыдущей буквой на величину, равную своей ширины (для того, > чтобы наличие ударения или придыхания не изменяло межбуквенный интервал). > Если для букв с размером не более а ударение (придыхание) <смотрится > хорошо>, то для букв типа W, w ? или у подобная схема приводит к > некрасивому, неестественному наложению ударения. Если же увеличивать кернинг > ударения на величину, превышающую ширину ударения, то следующая за ударением > буква будет "наезжать" на предыдущую. Для компенсации этого эффекта возможен > отрицательный(раздвигающий буквы) кернинг между ударением и следующей за ним > буквой. Но это необходимо не для всех букв с ударениями. Например, wdн > требует смещения придыхания влево и отрицательного кернинга придыхания с н, > а аdн - не требует смещения придыхания влево и отрицательного кернинга > придыхания с н. Решить это противоречие можно только путем "тройного > кернинга" - т.е. кернинг данной буквы с предыдущей зависит от сочетания ДВУХ > предыдущих букв, а не только от одной предыдущей. Это тупиковый путь. > > Разработанный знакоряд шрифта "Evangelie" ни в коем случае не претендует на > всеобщую функциональную полноту, являясь, скорее, логически обоснованным > вариантом шрифта, проверенном на 500 000 знаках набора. Уже сейчас автору > очевидно, что для построения полноценного стандартного аппарата для набора > славянским шрифтом необходимо: > > 1. Использовать для размещения славянских символов предназначенный для > этого раздел Unicode - Cyrillic с номерами от 0400 до 04FF и Unassigned > zone - 0500-052F. > > 2. Разработать и ввести в список языков операционных систем Microsoft > Windows славянский язык для адекватного отображения размещенных символов > Unicode. > > 3. Иметь двухбайтовый Windows (аналогично японскому) для свободого > отображения более 256 знаков старославянской группы. > > > > > > В заключение этой статьи хотелось бы обратить внимание на главную цель, > которую автор ставит перед собой при работе над единой кодировкой шрифта - > обеспечить пользователям компьютеров стандартный, удобный и доступный > аппарат для набора, верстки и издания славянских документов в соответствии с > их орфографическими и грамматическими правилами. > > > > (c) А. Шишкин > > > > > ---------------------------------------------------------------------- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru > > > > > ---------------------------------------------------------------------- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru > > ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 17:51:10 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AG" Тема: Re: RFC8: ЦСл шрифт -------------------------------------------------------------------------------- ----- Original Message ----- From: "AG" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Thursday, January 27, 2000 5:31 PM Subject: Re: RFC8: ЦСл шрифт > А вот еще какая статья была на Православной Беседе. > > http://beseda.mscom.ru/arc3/1769.html > > У меня-то инет халявный - мне все равно. Но зачем, например, того же Глеба наказывать оверквотингом? ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 19:55:18 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC8: -------------------------------------------------------------------------------- "p" == postmaster writes: p> ОЧЕНЬ убедительно! Чей копирайт, а то я не расслышал? ;) выкиньте Ваш mailer (The Bat!), и установите нормальный, понимающий кодировку utf-8. ;-) ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 20:03:48 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC8: ЦСл шрифт -------------------------------------------------------------------------------- > > У меня-то инет халявный - мне все равно. Но зачем, например, того же Глеба > наказывать оверквотингом? > Если я не ошибаюсь, у Глеба тоже халявный, но плохой. Надо, конечно, осторожнее быть с этим делом, хотя в условиях мэйл-листа нужно быть ко всему готовым. В том документе, slav.zip, есть адреса людей, которые занимались смежными проблемами. Есть ли у нас возможность сделать формальное приглашение всем тем, кого мы найдем? Можно было бы каждому недельку покопаться, поискать народ и составить некое соборное послание с Mission Statement и т.д.. Я могу и сам написать, но лично я не знаю почти никого. Лучше это делать от лица коллектива. Алексей Гришин ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 21:13:02 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Re: RFC8: ЦСл шрифт -------------------------------------------------------------------------------- Hi All, Я еще почитаю внимательнее статьи из slav.zip, но вот первое навскидку: имхо это лишнее - городить много символов для случаев, когда нормальный наползающий диакритик плохо смотрится на конкретной букве. Это можно решать кернингом. В то время, когда я начинал свои занятия с фонтами, нельзя еще было полагаться на то, что кернинг все понимают. ворд-6, например, его игнорировал. Поэтому я ввел два лишних символа для оксии и варии. Кроме того, невозможно ограничить все возможные гарнитуры, в некоторых из них как раз что-то другое может смотреться плохо. (Выделение оверквотинга в исходном письме для последующего удаления заняло несколько секунд. Действительно, это многовато...) Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 22:22:09 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC8: ЦСл шрифт -------------------------------------------------------------------------------- ----- Original Message ----- From: "Alexander V. Voinov" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Thursday, January 27, 2000 9:13 PM Subject: Re: RFC8: ЦСл шрифт > Hi All, > > Я еще почитаю внимательнее статьи из slav.zip, но вот первое навскидку: > имхо это лишнее - городить много символов для случаев, когда нормальный > наползающий диакритик плохо смотрится на конкретной букве. Это можно А ты почитай еще и http://beseda.mscom.ru/arc3/1769.html Действительно, кернинг - противоестественное извращение, раз уж мы можем свободно располагаться в Unicode. Почему письмо индейцев чероки занимает 640 знакомест, а мы должны экономить на спичках? В этой статье приводится приблизительный подсчет - 175 знакомет самых употребительных ЦСл символов. И (это Воловичу ;) доказывается, что буквы с титлами - это именно _ЛОГИЧЕСКИ_ иные буквы, а не только лишь глифы - варианты основного начертания. > решать кернингом. В то время, когда я начинал свои занятия с фонтами, > нельзя еще было полагаться на то, что кернинг все понимают. ворд-6, > например, его игнорировал. Поэтому я ввел два лишних символа для оксии и > варии. > > Кроме того, невозможно ограничить все возможные гарнитуры, в некоторых > из них как раз что-то другое может смотреться плохо. Тут проблема в другом: создание такого "полновесного" шрифта - конечно, труд гораздо более тяжкий, чем создание поделки, рассчитанной на кернинг. Но и результат выше, и не будет сожаления о проделанной халтуре. ;) Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 23:14:26 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC8: ЦСл шрифт -------------------------------------------------------------------------------- > Почему письмо индейцев чероки занимает 640 знакомест, а мы должны экономить > на спичках? В этой статье приводится приблизительный подсчет - 175 знакомет > самых употребительных ЦСл символов. Прошу прощения: когда отвечал, сам не успел дочитать статью. Информация ложна. на самом деле ок. трех с половиной сотен. Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 17:50:40 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC8: пѓпЃпЃ яTя-пTяLя- -------------------------------------------------------------------------------- > LT> (c) п-. пЁпTяTпЃпTп+ > > ОЧЕНЬ убедительно! > Чей копирайт, а то я не расслышал? ;) > Вот и я говорю -вы б лучше братцы не изуверствовали, а транслитом писали как раньше. Его хоть рекодер понимает в отличие от этих иероглифов. Архангельский Г.А. СПб ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 23:22:30 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Re: RFC8: ЦСл шрифт -------------------------------------------------------------------------------- Lev Tikhonov wrote: > > Я еще почитаю внимательнее статьи из slav.zip, но вот первое навскидку: > > имхо это лишнее - городить много символов для случаев, когда нормальный > > наползающий диакритик плохо смотрится на конкретной букве. Это можно > > А ты почитай еще и http://beseda.mscom.ru/arc3/1769.html > Действительно, кернинг - противоестественное извращение, раз уж мы можем > свободно располагаться в Unicode. > > Почему письмо индейцев чероки занимает 640 знакомест, а мы должны экономить > на спичках? В этой статье приводится приблизительный подсчет - 175 знакомет > самых употребительных ЦСл символов. > > И (это Воловичу ;) доказывается, что буквы с титлами - это именно > _ЛОГИЧЕСКИ_ иные буквы, а не только лишь глифы - варианты основного > начертания. А где это там _доказывается_? Конечно, есть дельные, весьма продуманные соображения, так ведь и я в свое время это тоже продумывал, и пришлось решать. Я выбрал что попроще. И Юникодов никаких еще не было. И в России еще долгое время будет много рабочих мест без Юникода. Интересно, правда, было узнать, что общество свт. Игнатия Брянчанинова еще существует. Тоже община в своем роде. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 23:33:42 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC8: ЦСл шрифт -------------------------------------------------------------------------------- > И (это Воловичу ;) доказывается, что буквы с титлами - это именно > _ЛОГИЧЕСКИ_ иные буквы, а не только лишь глифы - варианты основного > начертания. Надо бы собрать воедино такие фактыи написать письмо с вопросом, можно ли теоретически считать ц.с. кандидатом на собственный скрипт. А послать письмо можно вот сюда - http://ourworld.compuserve.com/homepages/profirst/homepagx.htm Это компания, состоящая в ассоциации Unicode. Они продают немало кириллических шрифтов. В свое время я их вопрошал, трудно ли добавить нужные глифы в кириллический Юникод, коли их там нет. Мне ответили просто - говорите, что надо добавить и мы will make sure, что все будет сделано должным образом. Вопрос о скрипте нужно решить на самом раннем этапе.Кстати, контора эта находится в Сан-Франциско. Знаю я одного человека :-) , который мог бы их навестить при крайней необходимости или на стадии готовности нашего 16-битового стандарта к официальному представлению на суд Ассоциации. > > Тут проблема в другом: создание такого "полновесного" шрифта - конечно, труд > гораздо более тяжкий, чем создание поделки, рассчитанной на кернинг. Но и > результат выше, и не будет сожаления о проделанной халтуре. ;) Да уж, нам бы только не закопаться с нашими благими намерениями. Но вот что интересно. Года два назад я читал в одном полиграфическом журнале, что для печати славянских книг наши предки фактически и изобрели метод простановки диакритиков известный нам как метод символов нулевой ширины. До этого в Европе все делалось композитными шрифтами. У нас же число возможных комбинаций было столь велико, что экономически было целесообразнее употреблять упомянутый способ. Отчетливо помню картинки набора на церковнославянском, где четко было видно, что одну строку составляли из двух и более уровней плашек (не знаю я эту терминологию). То есть предки наши пошли не по пути, требующему много труда со стороны литейщиков (каковыми мы, кажется, и являемся), а по пути, возлагающем ответственность на наборщиков (кернинг и т.п.) и, отчасти лишь, разработчиков конкретных гарнитур. Найти бы тот журнал. Даже названия не помню. Алексей ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 23:49:25 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC8: ЦСл шрифт -------------------------------------------------------------------------------- А вот что еще пишут на сайте unicode.org. There are ways for programmers and scholarly organizations to make use of Unicode character encoding, even if the script they want to use or transmit is not yet (or may never be) part of the Unicode Standard. Individual groups that make use of rare scripts or special characters can reach a private agreement about interchange and set aside part of the Private Use Area to encode their private set of characters. Individuals with interests in rare scripts or materials relating to them may sometimes be contacted through an electronic mail list which the Consortium maintains. For information about these mail lists, please contact info@unicode.org. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 00:42:15 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: RFC 2.2 -------------------------------------------------------------------------------- ґчяЮчу ЦБЮч! їЮутшпспуБАО щчрпО ЮутпзФьО чъьАпщьО ДчЮэпБп HIP (чБзЮКБКэ БузАБчэ ъЮОэч БЦБ ь ъЮьшчжущ zip-пЮЕьр р 5 зчтьЮчрзпЕ). µАшь эчжщч, ъЮчАЛяп рКшчжьБЛ МБчБ БузАБ чБтушЛщч щп http://orthodox.tstu.ru/font-list/ (жушпБушЛщч Бпз, ГБчяК ъЮчАэчБЮ Хуш р эчщчХьЮьщщчэ ХЮьДБу ь А АчЕЮпщущьуэ ъЮчяушчр -- эуАБпэь щуъшчЕч яК рьтуБЛ вщпГзь тЮЦс щпт тЮЦсчэ, п щу ЮпвяужпрХьэьАО р АБчЮчщК). І зчщФу МБчсч БузАБп АьтьБ АъьАчз чАБпНИьЕАО рчъЮчАчр; ъЮчАЛяп зч рАуэ ъЮьАЦБАБрЦНИьэ рКАзпвпБЛ Арчу эщущьу ьшь ъЮутшчжьБЛ рпЮьпщБК ЮуХущьО. Ѕп щпяужпрХьу Ач рГуЮпХщусч тщО туАОБзп БЮь АччяИущьы чБруГЦ ъчвжу, АуыГпА БчшЛзч ъЮьАчутьщНАЛ зч рАущпЮчтщчэЦ ъшпГЦ ъч щуГьБпуэчэЦ ъьАЛэЦ р цщьзчту. (І Юужьэу UTF эчы Netscape ъчзпвКрпуБ рэуАБч ЮЦААзьЕ яЦзр ъЮчяушК). ј. Ё. ============================================================= їюѕµєб ЈЅІ°юЈ°ЅбЅѕЁѕ їюµґаб°І»µЅЈо фµюєѕІЅѕа»°ІоЅаєѕЁѕ бµєаб° (руЮАьО 3 АьАБуэК HIP) ============================================================= I. ѕ±иЈµ їюЈЅфЈїк 1. ЈщрпЮьпщБщчу ъЮутАБпршущьу HIP ъЮутщпвщпГущч тшО впъьАь р "ГьБпуэчы" ДчЮэу ФуЮзчрщчАшпрОщАзьЕ БузАБчр А АчЕЮпщущьуэ рАуЕ туБпшуы ъЮпрчъьАпщьО. ѕщч р Арчуы япвчрчы ДчЮэу щу чяОвпщч ъЮутАБпршОБЛ рщуОвКзчрКу МшуэущБК БузАБп ь туБпшь руЮАБзь: ЮпвэуЮ ХЮьДБп, Юпвщчсч Ючтп чБАБЦъК, Юпвяьущьу щп АБЮчзь, АБчшяФК ь АБЮпщьФК ь Б. ъ. єчтьЮЦНБАО БчшЛзч Ашчрп (ь ГьАшп) БузАБп, вщпзь ъЮуъьщпщьО, ъЮчяушК эужтЦ Ашчрпэь ь Юпвяьущьу щп пявпФК. ѕтщпзч япвчрчу HIP АчтуЮжьБ рчвэчжщчАБЛ чБэуГпБЛ ГпАБЛ БузАБп зпз "ъчОАщущьу" (АщчАзь, ъпЮпшшушЛщКу эуАБп ь Б. ъ.). бпзжу ьэууБАО рчвэчжщчАБЛ чячвщпГпБЛ рКтушущьу зьщчрпЮЛН. 2. ґшО ьАъчшЛвчрпщьО рщуБузАБчрчы ьщДчЮэпФьь (тпшуу чщп ьэущЦуБАО "зчээущБпЮьОэь") ъЮутшпспуБАО впЮувуЮрьЮчрпБЛ (ъЦАБЛ щу ъчшщчАБЛН ДчЮэпшьвЦО) эуЕпщьвэК уу рчвэчжщчы рАБпрзь. »НяпО зчщзЮуБщпО ЮупшьвпФьО рАБпрзь рщуБузАБчрчы ьщДчЮэпФьь тпшуу щпвКрпуБАО "ЮпАХьЮущщКы HIP". їЮьэуГпщьу 1. »Нячы БузАБ р рьту япвчрчсч HIP ОршОуБАО БузАБчэ р ЮпАХьЮущщчэ HIP. »Нячы БузАБ р ЮпАХьЮущщчэ HIP эчжщч ъуЮуруАБь р япвчрчу HIP, Цтпшьр зчээущБпЮьь. їЮьэуГпщьу 2 -- ч зчЮЮузБщчАБь БуЮэьщчшчсьь. єчээущБпЮьы р "Цвзчэ" АэКАшу (щузпО ъчэуБзп тшО ъпэОБь ьшь зЦАчз БузАБп, "чБзшНГущщКы" чБ тчзЦэущБп) Бчжу ОршОуБАО рщуБузАБчрчы ьщДчЮэпФьуы. 3. HIP ОршОуБАО пяАБЮпзБщКэ 8-яьБчрКэ ъЮутАБпршущьуэ БузАБп. µсч зчщзЮуБщКу ЮупшьвпФьь эчсЦБ эущОБЛАО р АччБруБАБрьь А ЮпвшьГщКэь рчвэчжщКэь зчтьЮчрзпэь зьЮьшшьФК. їчМБчэЦ р HIP-ДпышпЕ ЮпвЮуХпуБАО ьАъчшЛвчрпБЛ БчшЛзч АьэрчшК, спЮпщБьЮчрпщщч ъЮьАЦБАБрЦНИьу рч Іаµе зчтьЮчрзпЕ, ъЮьсчтщКЕ тшО ЮЦААзчсч ОвКзп, п ьэущщч: 1234567890-=[]\;',./` A...Z °...о !@#$%^&*()_+{}|:"<>?~ a...z п...О єЮчэу Бчсч, ьАъчшЛвЦНБАО трп "пяАБЮпзБщКЕ яушКЕ Аьэрчшп": ъЮчяуш ь EOL (TAB, BS ь ъЮчГ. ъЮьЮпрщьрпНБАО з ъЮчяушЦ, п VT, FF, EOF ь ъЮчГ. -- з EOL). 4. І япвчрчэ HIP рьвЦпшЛщч щуЮпвшьГьэКу АьэрчшК ь АчГуБпщьО Аьэрчшчр ("у" ЮЦААзчу ь "e" шпБьщАзчу, щпъЮьэуЮ) чячвщпГпНБ чтщч ь Бч жу. аъьАчз "рьвЦпшЛщч щуЮпвшьГьэКЕ" яЦзр: °п І µу є ј Ѕ ѕч юЮ аА б цЦ еЕ Aa B Ee K M H Oo Pp Cc T Yy Xx 5. їч МБчы ъЮьГьщу (щч щу БчшЛзч) япвчрчу HIP щу впэуГпуБ ъЮчяушчр ЮОтчэ А EOL, ЮпААэпБЮьрпуБ шНячу ГьАшч АчАутщьЕ ъЮчяушчр зпз чтьщ ь шНячу ГьАшч ъЦАБКЕ АБЮчз (АБЮчз, АчАБчОИьЕ БчшЛзч ьв ъЮчяушчр) зпз чтщЦ -- шчсьГуАзьы зчщуФ пявпФп. ѕтьщчГщКы Аьэрчш EOL (ъЦАБпО АБЮчзп -- МБч ъпЮп EOL'чр) МзрьрпшущБущ ъЮчяушЦ. 6. їч ъЮчАЛяпэ БЮЦтОИьЕАО р HIP рзшНГущч чячвщпГущьу тшО Орщчсч зчщФп пявпФп (Аэ. щьжу). ѕщч МзрьрпшущБщч ъпЮу Аьэрчшчр EOL EOL (Бч уАБЛ ъЦАБчы АБЮчзу) ь Бпз жу, зпз МБп ъпЮп Аьэрчшчр, рвпьэчтуыАБрЦуБ А АчАутщьэь ъЮчяушпэь ь EOL (Аэ. ъ. 5). 7. І ЮпАХьЮущщчэ HIP БЮуячрпщьО ъъ. 4--7 эчсЦБ щу АчяшНтпБЛАО рщЦБЮь зчээущБпЮьур. 8. ¶ушпБушЛщч, ГБчяК HIP-впзчтьЮчрпщщКы БузАБ яКш "ГьБпяушЛщКэ" ь яув ъЮьэущущьО зпзьЕ-шьяч ъЮчсЮпээ. II. б°±»Јф° єѕґЈюѕІєЈ ±°·ѕІѕЁѕ HIP. ѕячвщпГущьО ЦЮчрщО: 0 япвчрКы HIP (БчшЛзч счшКы БузАБ) 1 эьщьэпшЛщчу ЮпАХьЮущьу 2 рчвэчжщКу тпшЛщуыХьу ЮпАХьЮущьО * Аьэрчш, щу ьэуНИьы АпэчАБчОБушЛщчсч вщпГущьО, щч ьАъчшЛвЦуэКы р АчАБпру эщчсчАьэрчшЛщКЕ чячвщпГущьы (щпъЮьэуЮ, зпз ъЮуДьзА) ? АъчЮщчу эуАБч р АьАБуэу чячвщпГущьы ?? чГущЛ АъчЮщчу эуАБч р АьАБуэу чячвщпГущьы - Аьэрчш ъчзп щу ьАъчшЛвЦуБАО -? Аьэрчш, зчБчЮКы р ъЮутКтЦИьЕ руЮАьОЕ ъЮутшпспшчАЛ тшО Гусч-шьяч ьАъчшЛвчрпБЛ, щч АуыГпА ъЮутшчжущч тЮЦсчу чячвщпГущьу => "Аьщчщьэ тшО" ?=> "АъчЮщКы Аьщчщьэ тшО" (їЮч зпжтчу "АчэщьБушЛщчу" чячвщпГущьу ("?", "??", "-?", "?=>") щуГБч щпъьАпщч щьжу р зчээущБпЮьОЕ.) аьэрчш цЮчрущЛ ·щпГущьу ! 0 Аьэрчш "!" " 0 трп ХБЮьЕп (тшО ьжьФК; АБпрьБАО ъчАшу яЦзрК) # 0 вщпз тшО 1000 $ ?? эпшпО БчГзп? БчГзп ъч ФущБЮЦ АБЮчзь? % * Аьэрчш щпГпшп зчээущБпЮьО (зчщзЮуБщКы АьщБпзАьА зчээущБпЮьО впрьАьБ чБ ьАъчшЛвЦуэчсч рпЮьпщБп ЮпАХьЮущщчсч HIP) %% 1 щпГпшч зчээущБпЮьО, зчБчЮКы ьтуБ тч яшьжпыХусч EOL (рзшНГпО EOL) %- ?? эОсзьы ъуЮущчА %< 1 ъуЮуЕчт щп зЮпАщКы ФруБ (зьщчрпЮЛ) %> 1 ъуЮуЕчт щп ГуЮщКы ФруБ (зчщуФ зьщчрпЮь) %{ 1 щпГпшч зчээущБпЮьО, зчБчЮКы ьтуБ тч } (рщЦБЮь { ь } рчвэчжщК, щч тчшжщК яКБЛ ъпЮщКэь) & * ъЮуДьзА тшО рчвэчжщКЕ чячвщпГущьы щчрКЕ Аьэрчшчр &- ?? эОсзьы ъуЮущчА &= ??=> EOL EOL (зчщуФ пявпФп) &{...} ?? рчвэчжщКы япвчрКы АьщБпзАьА тшО щучсЮпщьГущщчсч ГьАшп щчрКЕ Аьэрчшчр ' 0 чАБЮчу ЦтпЮущьу (АБпрьБАО ъчАшу яЦзрК) '= ?=> =' ( 0 Аьэрчш "(" ) 0 Аьэрчш ")" * 0 8-зчщуГщпО врувтчГзп (ъчтщОБпО щпт АБЮчзчы) + 0 зЮуАБьз , 0 Аьэрчш "," - 0 Аьэрчш "-" (туДьА) . 0 Аьэрчш "." (БчГзп рщьвЦ АБЮчзь) / ? Аьэрчш "/" (чячвщпГущьу Юпвтушп щп АБЮчзь р чЮьсьщпшу ъЮь БчГщчы ъуЮутпГу ФьБпБ) // ? Аьэрчш "//" (зчщуФ АБЮпщьФК/шьАБп р чЮьсьщпшу ъЮь БчГщчы ъуЮутпГу ФьБпБ) 0..9 0 пЮпяАзьу ФьДЮК : 0 Аьэрчш ":" ; 0 Аьэрчш ";" ("ЦтьрьБушЛщпО") < - Юпщуу ъЮутшпспшчАЛ ьАъчшЛвчрпБЛ зпз чячвщпГущьу тшО щпГпшп зьщчрпЮь, щч шчсьГщуу ьАъчшЛвчрпБЛ %< = 0 ъЮьтКЕпщьу Бчщзчу (АБпрьБАО ъчАшу яЦзрК) =' 0 чАБЮчу ЦтпЮущьу А ъЮьтКЕпщьуэ (АБпрьБАО ъчАшу яЦзрК) =^ 0 чяшуГущщчу ЦтпЮущьу А ъЮьтКЕпщьуэ, чщч жу пзФущБ тшО "зЮпАьрчы чэусь" =` 0 БОжушчу ЦтпЮущьу А ъЮьтКЕпщьуэ (АБпрьБАО ъчАшу яЦзрК) > - Юпщуу ъЮутшпспшчАЛ ьАъчшЛвчрпБЛ зпз чячвщпГущьу тшО зчщФп зьщчрпЮь, щч шчсьГщуу ьАъчшЛвчрпБЛ %> ? 0 чячвщпГущьу тшО щуОАщчсч Аьэрчшп (эчжуБ АчГуБпБЛАО А пзФущБпэь) ?{...} 0 щуОАщКы Аьэрчш А ъчОАщущьуэ (щпъЮьэуЮ, пшЛБуЮщпБьрщКы Бус) @ 0 Аьэрчш "зпрКзп" A => ° B => І C => а D - E => µ F 0 яЦзрп "ДьБп" G - H => Ѕ I 0 яЦзрп "I" (яув ОрщКЕ пзФущБчр -- А трЦэО БчГзпэь) I\\ 0 яЦзрп "I" яув БчГуз J * ъЮуДьзА тшО "ычБьЮчрпщщКЕ" чячвщпГущьы ъЮчъьАщКЕ яЦзр (ъЮь МБчэ щу АЦИуАБрущщч, ъЮчъьАщчы ьшь АБЮчГщчы яЦзрчы впъьАпщч ъЮчтчшжущьу) JA => J° JE => Jµ JN 2 ычБьЮчрпщщКы НА ячшЛХчы Ja => J° Je => Jµ Jn => JN J° 0 шьспБЦЮп I° Jµ 2 шьспБЦЮп Iµ Jм => Jµ Jл 0 яЦзрп "ОБЛ" Jо 2 ычБьЮчрпщщКы НА эпшКы JЛ => Jл Jп => J° Jу => Jµ JМ => Jµ JО => Jо K => є KS => єS Ks => єS L - M => ј N 0 НА ячшЛХчы O => ѕ P => ю Q 0 яЦзрп "ч ХьЮчзчу" R ?=> Jл S 0 яЦзрп "вушч" T => б U 0 яЦзрп "ьз" (рБчЮпО ГпАБЛ тьсЮпДп ѕц, п Бпзжу ГьАшчрчы вщпз 400) V 0 яЦзрп "ьжьФп" (ъч ЦэчшГпщьН -- яув пзФущБчр) V" 0 яЦзрп "ьжьФп" А трЦэО ХБЮьЕпэь W 0 яЦзрп "чэусп" W\Б 0 яЦзрп "чБ" X => е Y => ц Z ?? яЦзрп "·" (z-чяЮпвщчу щпГуЮБпщьу) [ 0 Аьэрчш "[" \ * ъЮуДьзА тшО щптАБЮчГщчсч БузАБп \\ 0 ъЦАБчы пзФущБ (АщьэпНИьы БчГзь А i/I); ЮпвтушьБушЛ ъпЮ з+s ь ъ+s \x 2 ("x" -- ъЮчьврчшЛщчу чтщчАьэрчшЛщчу HIP-чячвщпГущьу АБЮчГщчы яЦзрК) -- чячвщпГущьу тшО рКщчАщчы яЦзрК ьшь яЦзрущщчсч БьБшп (АБпрьБАО ъчАшу яЦзрК); ДчЮэп впрьАьБ чБ яЦзрК (щпъЮьэуЮ, \ь -- МБч ъЮчАБч трп ХБЮьЕп, щч \\, п щу //, зпз щпт ьжьФуы) \{...} 2 щптАБЮчГщКы БузАБ (щпт ъЮутКтЦИуы яЦзрчы) \с 0 с-БьБшч (АБпрьБАО ъчАшу яЦзрК) \т 0 т-БьБшч (АБпрьБАО ъчАшу яЦзрК) \ж 1 ж-БьБшч (АБпрьБАО ъчАшу яЦзрК) \в 1 в-БьБшч (АБпрьБАО ъчАшу яЦзрК) \ч 0 ч-БьБшч (АБпрьБАО ъчАшу яЦзрК) \Ю 0 Ю-БьБшч (АБпрьБАО ъчАшу яЦзрК) \А 0 А-БьБшч (АБпрьБАО ъчАшу яЦзрК) \Б 0, 1 Б-БьБшч (АБпрьБАО ъчАшу яЦзрК; р япвчрчэ HIP щптч ъчттуЮжьрпБЛ БчшЛзч тшО чэусь) \Е 0 Е-БьБшч (АБпрьБАО ъчАшу яЦзрК) \Й 0 ъпуЮчз (АБпрьБАО ъчАшу яЦзрК) ] 0 Аьэрчш "]" ^ 0 чяшуГущщчу ЦтпЮущьу (АБпрьБАО ъчАшу яЦзрК) ^= ?=> =^ _ ? ъЦАБчу эуАБч, щпт зчьэ эчжщч АБпрьБЛ тьпзЮьБьГуАзьу вщпзь ` 0 БОжушчу ЦтпЮущьу (АБпрьБАО ъчАшу яЦзрК) `= ?=> =` a => п b - c => А d - e => у f 0 яЦзрп "ДьБп" g - h ?? ъЮьтКЕпщьу сЦАБчу (АБпрьБАО ъчАшу яЦзрК) i 0 яЦзрп "i" (яув ОрщКЕ пзФущБчр -- А трЦэО БчГзпэь) i\\ 0 яЦзрп "i" яув БчГуз ja => J° je => jу jn 2 ычБьЮчрпщщКы НА ячшЛХчы jп 0 шьспБЦЮп iп jу 2 шьспБЦЮп Iµ jМ => jу jЛ 0 яЦзрп "ОБЛ" jО 2 ычБьЮчрпщщКы НА эпшКы k - l - m - n 0 НА ячшЛХчы o => ч p => Ю q 0 яЦзрп "ч ХьЮчзчу" r ?=> jЛ s 0 яЦзрп "вушч" t - u 0 яЦзрп "ьз" (рБчЮпО ГпАБЛ тьсЮпДп чЦ, п Бпзжу ГьАшчрчы вщпз 400) v 0 яЦзрп "ьжьФп" (ъч ЦэчшГпщьН -- яув пзФущБчр) v" 0 яЦзрп "ьжьФп" А трЦэО ХБЮьЕпэь w 0 яЦзрп "чэусп" w\Б 0 яЦзрп "чБ" x => Е y => Ц z ?? яЦзрп "в" (z-чяЮпвщчу щпГуЮБпщьу) { 0 щпГпшч "рьтьэКЕ" АщчАзь/ъчОАщущьО {...} 0 БузАБ АщчАзь/ъчОАщущьО шНячсч Ючтп (рщЦБЮь щусч Азчязь тчшжщК яКБЛ ъпЮщКэь). аэ. Бпзжу &{...} \{...} %{...} ?{...} | -? АъуЮрп ъЮутшпспшчАЛ ьАъчшЛвчрпБЛ МБчБ Аьэрчш зпз чячвщпГущьу тшО ъпуЮзп, щч \Й рЮчту яК щпсшОтщуу. ауыГпА ъЮутшпспН зпз ЮпвтушьБушЛ рпЮьпщБчр рщЦБЮь "пшЛБуЮщпБьрщКЕ Бусчр": ?{xxx|yyy|zzz} } 0 зчщуФ "рьтьэКЕ" АщчАзь/ъчОАщущьО ~ 0 ъЮчАБчу БьБшч (АБпрьБАО ъчАшу яЦзрК) ° 0 яЦзрп "°" ± 0 яЦзрп "±" І 0 яЦзрп "І" Ё 0 яЦзрп "Ё" ґ 0 яЦзрп "ґ" µ 0 яЦзрп "µ" ¶ 0 яЦзрп "¶" · 0 яЦзрп "·" Ј 0 яЦзрп "Ј" № 0 яЦзрп "№" є 0 яЦзрп "є" єS 0 яЦзрп "зАь" єs => єS » 0 яЦзрп "»" ј 0 яЦзрп "ј" Ѕ 0 яЦзрп "Ѕ" ѕ 0 яЦзрп "ѕ Цвзчу" ѕU 0 "Цз" зпз тьсЮпД "ѕц" ѕu 0 "Цз" зпз тьсЮпД "ѕЦ" ї 0 яЦзрп "ї" їS 0 яЦзрп "ъАь" їs => їS ю 0 яЦзрп "ю" а 0 яЦзрп "а" б 0 яЦзрп "б" ц 0 яЦзрп "ц" (спээп-чяЮпвщКы "Цз") д 0 яЦзрп "д" е 0 яЦзрп "е" ф 0 яЦзрп "ф" г 0 яЦзрп "г" х 0 яЦзрп "х" и 0 яЦзрп "и" (тьсЮпД "хБ" Бпз ь чАБпуБАО "хБ") й 0 яЦзрп "й" к 0 яЦзрп "к" (ъчтЮпвЦэурпуБАО щпГуЮБпщьу к, п щу йI) л 0 яЦзрп "л" м 0 яЦзрп "µ" (ДчЮэпшЛщКы ъЮчъьАщчы рпЮьпщБ зЮЦсшчсч "у") н 0 яЦзрп "н" о 0 яЦзрп "НА эпшКы" п 0 яЦзрп "п" я 0 яЦзрп "я" р 0 яЦзрп "р" с 0 яЦзрп "с" т 0 яЦзрп "т" у 0 яЦзрп "у" (ЦсшчрпБчу Цвзчу щпГуЮБпщьу) ж 0 яЦзрп "ж" в 0 яЦзрп "в" ь 0 яЦзрп "ь" ы 0 яЦзрп "ы" з 0 яЦзрп "з" зs 0 яЦзрп "зАь" ш 0 яЦзрп "ш" э 0 яЦзрп "э" щ 0 яЦзрп "щ" ч 0 яЦзрп "ч Цвзчу" чu 0 "Цз" зпз тьсЮпД "чЦ" ъ 0 яЦзрп "ъ" ъs 0 яЦзрп "ъАь" Ю 0 яЦзрп "Ю" А 0 яЦзрп "А" Б 0 яЦзрп "Б" Ц 0 яЦзрп "Ц" (спээп-чяЮпвщКы "Цз") Д 0 яЦзрп "Д" Е 0 яЦзрп "Е" Ф 0 яЦзрп "Ф" Г 0 яЦзрп "Г" Х 0 яЦзрп "Х" И 0 яЦзрп "И" (тьсЮпД "ХБ" Бпз ь чАБпуБАО "ХБ") Й 0 яЦзрп "Й" К 0 яЦзрп "К" (ъчтЮпвЦэурпуБАО щпГуЮБпщьу К, п щу Йi) Л 0 яЦзрп "Л" М 0 яЦзрп "у" (зЮЦсшчу ХьЮчзчу щпГуЮБпщьу) Н 0 яЦзрп "Н" О 0 яЦзрп "НА эпшКы" III. їюЈјµг°ЅЈо Ј Іѕїюѕак. 1. І АчГуБпщьОЕ .:. .:- .:.- .: :.- ъчтЮпвЦэурпНБАО БчГзп ь туДьА, ЮпАъчшпспНИьуАО ъч рКАчБу щп ЦЮчрщу АуЮутьщК трчуБчГьО (ъчМБчэЦ ъЮь щпшьГьь р ХЮьДБпЕ трЦЕ рьтчр туДьАп ь/ьшь БчГуз -- "ФущБЮпшЛщчсч" ь "щьжщусч" -- HIP-АьэрчшК "-" ь "." щптч р впрьАьэчАБь чБ зчщБузАБп зчщруЮБьЮчрпБЛ ъч-ЮпвщчэЦ). 2. јпшпО БчГзп ь/ьшь БчГзп ъч ФущБЮЦ АБЮчзь: п) ъч зЮпыщуы эуЮу чтщч "впъпАщчу" чячвщпГущьу ($) ъчзп уАБЛ; я) ъчзп щьзБч щу чБруБьш, Гуэ эпшпО БчГзп "рьвЦпшЛщч" чБшьГпуБАО чБ чяКГщчы; р) р БуЕ АшЦГпОЕ, зчстп чяКГщпО БчГзп ь БчГзп ъч ФущБЮЦ АБЮчзь рАБЮуГпНБАО р чтщчэ ь Бчэ жу БузАБу -- ОршОНБАО шь чщь шчсьГуАзь ЮпвщКэь Аьэрчшпэь ьшь рпЮьпщБщКэь сшьДпэь Бчсч жу Аьэрчшп? І ъуЮрчэ АшЦГпу эчжщч ьАъчшЛвчрпБЛ чячвщпГущьО "." ь "$", п рч рБчЮчэ -- "." ь ".%." (ЦрчтО ЮпвшьГьу ьв АчяАБрущщч БузАБп р зчээущБпЮьь). 3. јОсзьы ъуЮущчА ъЮутшпспуБАО ьАъчшЛвчрпБЛ БчшЛзч рч "рЮуэущщКЕ" БузАБпЕ (зпз ъЮчэужЦБчГщКы рпЮьпщБ БЮпщАДчЮэпФьь ьв HIP р тЮЦсьу ДчЮэпБК): HIP-БузАБ МБпшчщК ъуЮущчАчр | | v v +-------------+ | ъЮчсЮпээп | | ЮпААБпщчрзь | | ъуЮущчАчр | +-------------+ | v БузАБ А эОсзьэь ъуЮущчАпэь | v +-------------+ | зчщруЮБчЮ | +-------------+ | v RTF, TeX, ... Јв трЦЕ рчвэчжщКЕ чячвщпГущьы тшО эОсзчсч ъуЮущчАп (%- ь &-) щптч рКяЮпБЛ чтщч. їЮутшпспН %- єпз впъьАКрпБЛ "МБпшчщК ъуЮущчАчр" ь чБзЦтп ьЕ рвОБЛ -- Буэп тшО чБтушЛщчсч чяАЦжтущьО. І ГпАБщчАБь, эчжщч ъчъЮчячрпБЛ ьвршузпБЛ щузЦН ьщДчЮэпФьН (АшчрпЮЛ) ьв БузАБчр, р зчБчЮКЕ МБь ъуЮущчАК зуэ-Бч ЮпААБпршущК рЮЦГщЦН. 4. ґшО АчГуБпщьы ъЮьтКЕпщьО А ЦтпЮущьОэь ьАъчшЛвЦуэ ДьзАьЮчрпщщКы ъчЮОтчз МшуэущБчр (АъуЮрп Аьэрчш ъЮьтКЕпщьО, п ъчБчэ Аьэрчш ЦтпЮущьО), ьшь ЮпвЮуХпуэ чяп? 5. гБч АзпжуБу ъЮч / ь // (Аэ. АъьАчз чячвщпГущьы)? 6. гБч АзпжуБу ъЮч зчтьЮчрзЦ яЦзрК "ОБЛ"? (о зпз-Бч рАу ячшЛХу АзшчщОНАЛ з чячвщпГущьН Jл/jЛ, п ъЮч R/r ъЮутшпспН впяКБЛ.) 7. юувуЮрьЮЦуэ шь Z/z ъчт рпЮьпщБщКы сшьД тшО ·/в? (І ъЮчБьрщчэ АшЦГпу ртЮЦс эК ьАъчшЛвЦуэ Z/z ъчтч ГБч-щьяЦтЛ тЮЦсчу, п ъчБчэ зпз-щьяЦтЛ Ашчжщч чячвщпГьэ ЮпвшьГьу сшьДчр · ь Z, ь МБч яЦтуБ АБЮпщщч.) 8. єпзчрп ДчЮэпшЛщпО БЮпзБчрзп пзФущБп щпт "зЮпАьрчы чэусчы"? (ЅуЦжушь щь Ц зчсч щуБ вщпзчэКЕ вщпБчзчр?) 9. аьэрчш "_" ъЮутшпспуБАО ьАъчшЛвчрпБЛ БчшЛзч зпз АЮутАБрч ъчзпвКрпБЛ тьпзЮьБьГуАзьу вщпзь, п яув чщКЕ АГьБпБЛ Аьщчщьэчэ чяКГщчсч ъЮчяушп. 10. ЅЦжщч шЛ рАу-Бпзь сЦАБчу ъЮьтКЕпщьу? (аэ. Бпзжу ъ. 8.) 11. µАБЛ шь ъЮчБуАБК чБщчАьБушЛщч чячвщпГущьО ъпуЮзп ГуЮув "\Й", п щу "|"? єпзьу эщущьО ч ДчЮэпБу "пшЛБуЮщпБьрщКЕ Бусчр": ?{xxx|yyy|zzz} 12. єчщуФ пявпФп: п) ъЦАБпО АБЮчзп чячвщпГпуБ зчщуФ пявпФп я) впъьАЛ &= Бпзжу чячвщпГпуБ зчщуФ пявпФп р) Ц зчщруЮБчЮчр р HIP ъЦАБЛ яЦтуБ чъФьО, ГБч ьэущщч ьАъчшЛвчрпБЛ: п), я) ьшь п)+я) с) уАБЛ шь рчвЮпжущьО ъЮчБьр зчщзЮуБщчсч чячвщпГущьО "&="? (о усч ьвчяЮуш ъч пщпшчсьь А рщЦБЮущщуы зчтьЮчрзчы ChiWriter'п руЮАьы 3.xx, сту яКшч "\="; зпзьу-щьяЦтЛ &{par} ьшь &{пявпФ}, ъч-эчуэЦ, Цж АшьХзчэ сЮчэчвтзь.) 13. їЮутшпспуБАО ЮпвшьГпБЛ ?{...} ь &{...} -- р ъуЮрчэ АшЦГпу ьэууэ щуьвруАБщКы (щпячЮИьзЦ) ьшь щучтщчвщпГщКы Аьэрчш, рч рБчЮчэ -- Аьэрчш, ьвруАБщКы щпячЮИьзЦ, щч, рчвэчжщч, чБАЦБАБрЦНИьы р АьАБуэу чячвщпГущьы (ь, ъчзп чщ щу АБпщтпЮБьвчрпщ, эчжщч ъЮьэущОБЛ ъЮьяшьвьБушЛщчу чъьАпБьушЛщчу щпврпщьу). їЦАБЛ зчщруЮБчЮК ьв HIP р БпзьЕ АшЦГпОЕ ъЮучяЮпвЦНБ МБь впъьАь Бпз, ГБчяК ъЮь чяЮпБщчы зчщруЮБпФьь щу ъЮчьвчХшч ъчБуЮь ьщДчЮэпФьь. ЅпъЮьэуЮ, ьЕ эчжщч ъЮчАБч ъчАьэрчшЛщч ъуЮуъьАКрпБЛ "зпз уАБЛ" -- ьАъчшЛвЦО зпзьу-шьяч АьэрчшК зпзьЕ-шьяч тчАБЦъщКЕ ХЮьДБчр тшО "?", "&", "{" ь "}" -- п Бпзжу тшО "|" р "пшЛБуЮщпБьзщКЕ БуспЕ". єпзьу тчъчшщьБушЛщКу вщпГзь эчсЦБ ъчБЮуячрпБЛАО тшО ъчшщчы АшпрОщИьщК? ІчБ ГБч рАъчэьщпуБАО ьв АпэКЕ ЮпвщКЕ ьАБчГщьзчр (ъЮьрчжЦ рчвэчжщКу чячвщпГущьО тшО АБЮчГщКЕ яЦзр): ч\v "Цз" р рьту "ч А спшчГзчы" &с туЮрЛ &q АшпрОщАзпО АБьсэп (ьшь зчъъп) -- ГьАшчрчы вщпз тшО 90 &s ъуЮуруЮщЦБчу вушч &Г Y-чяЮпвщчу "Г" &{ФГ} Г-чяЮпвщчу "Ф" &{тс} т А зЮНГзчэ &{шс} ш А зЮНГзчэ &{шН} шьспБЦЮп ш+Н &{эН} шьспБЦЮп э+Н &{щс} щ А зЮНГзчэ &{jjЛ} ычБьЮчрпщщКы ОБЛ (ь Бпзчу яКшч!) &{zс} z А зЮНГзчэ (рпЮьпщБщКы сшьД тшО яЦзрК вушч) &{#s} вщпз тшО 6000 (шьспБЦЮп ьв вщпзп тшО 1000 ь ъуЮуруЮщЦБчсч s) &{О_} рпЮьпщБ НАп эпшчсч (А БЮуэО щчжзпэь, АчутьщущщКэь АщьвЦ счЮьвчщБпшЛщчы ГуЮБчы) &{п_} рпЮьпщБ НАп эпшчсч (А трЦэО щчжзпэь, АчутьщущщКэь АщьвЦ счЮьвчщБпшЛщчы ГуЮБчы) &{О.} рпЮьпщБ НАп эпшчсч (р рьту яЦзрК °, р зчБчЮчы счЮьвчщБпшЛщпО ГуЮБп ьэууБ рьт V) &{n-} рпЮьпщБ НАп ячшЛХчсч (А трЦэО щчжзпэь) &{i_} яЦзрп i А зЮНГзчэ рщьвЦ &{пщ} щчАчрчу "п" (тшО БЮпщАшьБуЮпФьь сшпсчшьФК) &{oi} ъуЮуруЮщЦБчу "Н" &{ХГ} рпЮьпБщКы сшьД тшО "И" (Аэ. Ц ІчАБчзчрп) &{j-п} шьспБЦЮп iп А АчутьщьБушЛщчы ГуЮБчы ъчАЮуть АБЮчзь (щу АруЮЕЦ) \{x} рКщчАщпО яЦзрп "x" (яув ъчзЮКБьО) &^ ъчзЮКБьу \{x&^} рКщчАщпО яЦзрп "x" (А ъчзЮКБьуэ) ^ щпт АчсшпАщКэь -- чячвщпГущьу эОсзчАБь (рЮчту яК ъч щпГуЮБпщьН щу чБшьГпуБАО чБ чяшуГущщчсч ЦтпЮущьО, п ъчБчэЦ эчжщч щу ррчтьБЛ щчрКы вщпз) &v v-чяЮпвщКы Аьэрчш, ЦъчБЮуяшОрХьыАО р АэКАшу ъпуЮзп эужтЦ АчсшпАщКэь їшНА ЮпвщччяЮпвщКу ГьАшчрКу вщпзь: &рЮпщ, &зчшчтп ь ъЮчГ., ъшНА зЮНзчрпО щчБпФьО (р щуы щу Аьшущ), ъшНА тшьщщчу БьБшч (щпт щуАзчшЛзьэь яЦзрпэь АЮпвЦ) &{~пяр} 14. ѕ рщЦБЮущщуы ЮпвэуБзу р БузАБпЕ А щучтщчЮчтщКэ зпГуАБрчэ тпщщКЕ -- ГБч ьэущщч ЕчГуБАО ЦзпвКрпБЛ: ьвэущущьО АрчыАБр БузАБп ьшь зчэпщтК тшО ъЮчсЮпээ-чяЮпячБГьзчр (щпъЮьэуЮ, "А МБчсч эуАБп ь тч чАчячсч ЮпАъчЮОжущьО чБэущьБЛ ъЮчруЮзЦ/зчЮЮузФьН ЦтпЮущьы")? мБч ъчтЕчтК яшьвзьу, щч рАу жу ЮпвшьГщКу. 15. ЅЦжщч шь ъЮутъЮьщьэпБЛ зпзьу-Бч эуЮК тшО ЮпвшьГущьО Ашчр ь ГьАуш? (їЮужту рАусч, р зпзьЕ АшЦГпОЕ рчвэчжщп ъЦБпщьФп?) 16. µАшь ъЮутшчжущщКу чячвщпГущьО тшО зАь, ъАь, "i яув БчГуз" зпжЦБАО АчрАуэ АБЮпщщКэь, Бч рчБ рчвэчжщпО впэущп: &{зА} &{єа} = &{єА} (зАь) &{ъА} &{їа} = &{їА} (ъАь) &i &I (i яув БчГуз) їЮь МБчэ чАчячу чячвщпГущьу \\ яЦтуБ щу щЦжщч. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 01:06:59 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC 2.2 -------------------------------------------------------------------------------- Mikhail Grinchuk wrote: > В частности, можно попробовать извлекать некую информацию (словарь) > > из текстов, в которых эти переносы кем-то расставлены вручную. Мной, например. Я всюду ставил в винворде Ctrl-Minus, обычно больше, чем было нужно в конкретном случае. Возьмите любой мой текст и нажмите Ctrl-Shift-*. Надо только сконвертировать в HIP и выделить список слов. Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 01:09:36 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC 2.2 -------------------------------------------------------------------------------- Mikhail Grinchuk wrote: > 4. Для сочетаний придыхания с ударениями используем фиксированный > порядок > элементов (сперва символ придыхания, а потом символ ударения), или > разрешаем оба? Фиксированный порядок, как предложено. Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 23:40:04 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AG" Тема: Re: RFC8: ЦСл шрифт -------------------------------------------------------------------------------- > Если я не ошибаюсь, у Глеба тоже халявный, но плохой. Надо, конечно, > осторожнее быть с этим делом, хотя в условиях мэйл-листа нужно быть ко всему > готовым. > Щаз-з-з! :-) Дешевый он, но не халявный. Хотя плохой настолько,что иногда начинаешь думать, что дорогой вышел бы дешевле. И в любом случае Лев прав - пишущему это две секунды срезать, а мне это 10 секунд качать. И деньги, и время. > > Я могу и сам написать, но лично я не знаю почти никого. Лучше это делать от > лица коллектива. > Дык пишите, тут распубликуйте, и устроим вече. :-) Архангельский Г.А. СПб ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 27 янв 2000 23:41:13 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC8: -------------------------------------------------------------------------------- > > выкиньте Ваш mailer (The Bat!), и установите нормальный, понимающий > кодировку utf-8. ;-) > А мне он долго доказывал - выкинь свой мэйлер и поставь что-нибудь нормальное, например the bat. И кому ж мне верить? Только я собрался оный бат ставить, а тут на тебе. Архангельский Г.А. СПб ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 09:13:44 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC6: Expert Software Shell & RFC4.1 - Vertical Software -------------------------------------------------------------------------------- Доброе утро! Lev Tikhonov wrote: > А вот MS привожу только в качестве примера того, как успешно можно > продвигать объектную и компонентную парадигму мышления. То, что не > расширяемо - для меня лично не годится, как к привыкшему к этой парадигме. > То, что не "прикручиваемо" к виндам - не годится для 99 процента > пользователей, фактически использующих винды, помимо всякого моего желания. > > Соответственно, очередная система, игнорирующая эту реальность - будет сама > проигнорирована, сколь бы она ни была совершенна в идеале. Разумеется, если > ты создашь всесовершенную утилиту командной строки - то я с твоей помощью > постараюсь в ней (в командной ее строке, а не в потрохах - от последнего > уволь!) разобраться, прикрутить к ней виндовый GUI и сделать твой продукт > доступным для основной массы людей. Пока что речь об "всесовершенной утилите" не шла. Для "повышения уровня" я пытаюсь задавать алгоритм как набор правил для множественных взаимодействующих замен. Сами замены выполняет древняя самодельная программа, написанная еще для такого зверя, как СМ-4. Пока что набор этих правил я по "эталонным" текстам подбираю вручную (сперва текст как-либо формально упрощаю, а потом пытаюсь по возможности точно восстановить). Есть некие задумки, как этот подбор правил можно автоматизировать. Но система и "вручную" тоже вполне настраиваемая, правда это довольно утомительный процесс. Собственно, все виды восстановления орфографии (в том числе и яти) я делал с помощью этой программы. (И еще одной -- некого аналога стандартной утилиты сравнения файлов, но с более удобным для данной задачи форматом вывода.) Как только с HIP определимся, я все это хозяйство выложу -- для начала на примере какого-нибудь несложного элемента восстановления, типа еров, где можно обойтись небольшим числом правил. Вообще, как оказывается, набором локальных замен можно задавать очень нетривиальные преобразования. Скажем, приведение небрежно набранного текстового файла (с переносами, без разделения абзацев, с неправильной расстановкой пробелов у знаков препинания и т. п.) к почти идеальному входному тексту для ТеХа (даже с превращением пробелов после предлогов в неразрывные и сменой рисунка при вложенных кавычках, а также переформатированием для избежания слишком длинных строк). > > Другой -- описание алгоритмов проверки и восстановления текста > > в "воспроизводимом" виде. Сюда же можно добавить алгоритмы > > конвертации в другие системно-независимые представления > > (например, TXT/Unicode). Все остальное уже, увы, будет привязано > > к конкретной платформе. > > Описание алгоритма зачастую труднее сделать, чем реализовать сам алгоритм. В нашем случае все же это не совсем верно: алгоритм является в основном реализацией системы замен, и почему бы эту систему замен не вытащить наружу, превратив в документацию? Почти наверняка это заинтересует и филологов: ведь наша цель -- выявить и в компактной и конструктивной форме задать такие сведения о языке, которые обычно излагаются "в общих чертах". Например, написание и/i -- для алгоритма потребуется явно извлечь все те буквосочетания, где нужно писать i, а не просто сказать, что i пишется перед гласными, перед й и "в некоторых заимствованных именах" (это я утрирую). Причем если мы что-то пропустим или добавим слишком всеобъемлющее правило, то ошибка с большой вероятностью обнаружится при попытке восстановления "эталонного" текста. > Описывать лучше не алгоритмы (динамику), а спецификации стандартов > (статику). Любой алгоритм есть лишь вектор над множеством текстов, где > начальная и исходная точки должны быть точно специфицированы. А для этого > надо для начала тщательнейшим образом исследовать то пространство, с которым > мы собираемся иметь дело. Проблема в том, что наше "пространство" состоит из текстов, изначально изготовленных вручную и потому с любыми возможными неожиданностями. На каждом этапе переработки мы только можем говорить нечто вроде: "скорее всего, яти сейчас стоят правильно, а потому попробуем расставить ударения". Но если изначально в тексте что-то было напутано, то расстановщик ятей мог никакой проблемы не обнаружить, но добавить в результате новые ошибки, и ударения в итоге тоже могут оказаться не те. > Ты же хочешь обойтись без исследовательской работы, положившись лишь > на свою интуицию, и тем самым неизбежно чего-то не учесть. Так, вроде бы, мы сейчас и пытаемся по ходу обсуждения понять, что можно/нужно учитывать и как. > Например, обидеть корректоров, тщательно > расставлявших переносы в изданиях, напр., Сретенского > монастыря. Объявить, что в HIP их переносы пропадут. Не совсем так. Идея в том, чтобы по таким текстам составить алгоритм для переносов (в простейшем случае -- список всех слов с расставленными переносами) и хранить его как единую для всех текстов базу данных. > > > Так и систем ЦС-набора и окрест-них-существующего софта существует, > > > наверное, уже более десятка. И каждая создавалась с претензией на > > > совершенство. Единственное, чего не хватило каждой - именно > > > системности, понимания того, что на ней свет клином не сошелся. > > > > Есть ли среди них системы, направленные не только на задачу > > "бумажного" издания книги? О таких было бы полезно узнать > > больше и, может быть, чем-то воспользоваться. > > Ну ты понимаешь важность такой системы, я понимаю, еще несколько > десятков, быть может, человек понимают. И все. > А вся остальная масса людей, в т. ч. располагающих свободным временем, > желанием и средствами для работы, этого не понимает и никогда не способна > понять - хоть в лепешку расшибись. Прошу прощения, здесь был чистый вопрос, без каких-либо оценок и сравнений. Что же, собственно, существует, помимо: 1) различных способов записи текста для различных издательских систем (включая раскладки шрифтов); 2) клавиатурных макросов для ускорения набора; 3) конверторов? (Хотя и про 1-2-3 тоже надо знать.) Может быть, попытаться свести воедино информацию о том, что есть? > Кстати, эта же малоденежность проекта - еще один довод в пользу множества > несложных комбинируемых алгоритмов и против некоей синтетической системы; > сложную систему, части которой мы не сможем проверить по отдельности, мы > просто не осилим, ибо тестирование стоит денег - либо явных, либо неявных, > когда использование неоотестированого софта приносит одни убытки. Ok! (Кто ж спорит...) > > > наша же задача - четко описать, что нужно сделать > > > алгоритмически для того, чтобы достичь совместимости с нашей системой. > > > > Бесспорно согласен, если это значит "использовать наш формат > > файлов для входной и выходной информации". Если что-то другое -- > > что именно? > > Ровно наоборот: все существующие форматы файлов должны стать "нашими", > обрести место в нашей классификации, а постепенно - и обрасти алгоритмами > для изменения этого места. Тогда так: "формат наш" обозначает "мы в/из него умеем конвертировать во все остальные наши форматы" (пусть и не один шаг). Или снова не то? > > Чего-то я тут не понимаю. Если конвертор не вписывается в стандарт, > > то это вроде бы просто неправильный конвертор? Просьба пояснить. > > Допустим, ты считаешь конвертером только то, что работает со строчным > текстом, а какой-нибудь виндузятник - наоборот, только с абзацным. Все. > Патовая ситуация. Вы можете только разойтись в гордом презрении друг к > другу, считая все остальные подходы, кроме своего, неправильными. Конвертор -- это то, что из одного формата делает другой. Причем подразумевается, что оба формата как-то уже стандартизованы. А уж "строчный" формат или "абзацный" -- дело десятое. (Тем более что одно в другое превратить на пару порядков проще, чем разбираться с действительно нетривиальными форматами.) > С помощью братской любви и отвергнув гордыню можно преодолеть разделение, но > никак не навязывая свои идеи всем. Навязать можно не идеи, а готовое > решение - так, чтобы _никто_ _добровольно_ не захотел изобретать велосипед. > Поставим технологические и психологические достижения Билла Гейтса на службу > единству славянского православия! Главное психологическое достижение г-на Гейтса -- порочный круг: "Вот Вам новая версия системы, толстая! и медленная! Но с кучей финтифлюшек. Купите для нее новый компьютер! Вы купили новый компьютер? Значит, Вам нужна еще более толстая и медленная версия!" > > Так я уже и есть убежденный! Например, работа с текстом с помощью > > набора standalone-утилит (не диалоговых) и какого-нибудь нехитрого > > текстового редактора вырисовывается такая: > > Скажи, у тебя _лично_ есть силы на то, чтобы такую систему завершить и с ее > помощью ввести и обработать _все_ тексты? Какие части я в состоянии изготовить -- писано в самом первом сообщении: конверторы RTF/Irmologion <-> базовый HIP, некоторые восстановители диакритики и "валидаторы" (как наборы правил локальных замен), ДОСовский редактор для HIP. Сейчас могу добавить конвертор RTF/Unicode (Izhica-CSU) <-> базовый HIP. Надо лишь довести HIP до состояния зафиксированной версии, чтобы все это хозяйство не переделывать. В задумках -- самообучающиеся программы восстановления и система для работы с переносами (извлечение их из текста в базу данных, сравнение переносов в тексте с базой данных, расстановка по базе данных). Конвертор из HIP в любой TeX сделать тоже совсем просто (в чистом виде набор локальных замен); в обратную сторону -- зависит от того, как набран текст. А вот за GUI браться совершенно не хочется. > Standalone exe в твоей терминологии - это то же, что dll в терминологии > виндов. Только dll автоматически линкует и исполняет соответствующая > подсистема OC, а твои exe-шники не подчиняются никаким двоичным правилам, > помимо текстового описания, в худшем случае существующего только в твоей > голове. > > Вот и разница: если эти exe написаны с учетом неких машинно-интерпретируемых > правил - то это уже разновидность сабжа, и написаны они для некоторой > виртуальной ОС, а если таких правил не существует, то толку от них мало, ибо > диспетчеризацией их использования должен заниматься некий гуру-человек, а не > автомат. Мое "текстовое описание" может состоять в том, какой формат читается, какой формат пишется и что изменяется по ходу преобразования. Например: <<На входе и на выходе -- базовый HIP, операция -- расстановка придыханий. В случае обнаружения каких-либо проблем соответствующее место в выходном файле будет помечено символом "?".>> Так годится? М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 10:00:25 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Re: RFC8: ууЬ лвЩЦд -------------------------------------------------------------------------------- > 2. Для славянских языков характерен тот факт, что на них не существует > современной светской литературы ;^) =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 10:13:41 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Re: RFC8: ууЬ лвЩЦд -------------------------------------------------------------------------------- AG wrote: > Но вот что интересно. Года два назад я читал в одном полиграфическом > журнале, что для печати славянских книг наши предки фактически и изобрели > метод простановки диакритиков известный нам как метод символов нулевой > ширины. До этого в Европе все делалось композитными шрифтами. У нас же число > возможных комбинаций было столь велико, что экономически было целесообразнее > употреблять упомянутый способ. Отчетливо помню картинки набора на > церковнославянском, где четко было видно, что одну строку составляли из двух > и более уровней плашек (не знаю я эту терминологию). То есть предки наши > пошли не по пути, требующему много труда со стороны литейщиков (каковыми мы, > кажется, и являемся), а по пути, возлагающем ответственность на наборщиков > (кернинг и т.п.) и, отчасти лишь, разработчиков конкретных гарнитур. Найти > бы тот журнал. Даже названия не помню. Нечто подобное (не так подробно и без картинок) мне попадалось года на два раньше в книге под названием "Искусство книги" или что-то в этом духе. Попробую найти ссылку. Никто не знает, как проходит (северо)корейский компьютерный набор? Дело в том, что у них алфавит (не иероглифы), но буквы одного слога располагаются не обязательно в ряд, а могут и друг на друге, или две сверху -- третья снизу и т. п. В зависимости от формы самих букв. В результате получается иероглифоподобный квадратик со значками внутри. (В Южной Корее то же самое, но вперемешку с настоящими китайскими иероглифами.) М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 09:55:56 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Re: ядзХд чвЩЮоеЫе -------------------------------------------------------------------------------- Lev Tikhonov wrote: > Пример с email как раз работает против строчного принципа. > Аутглюк делит текст на строки способом, совершенно несовместимым с фидошным > Голдедом. И если переписку между интернетовскими клиентами он обрабатывет > нормально и ни для кого не обидно, то в ФИДОшных эхах ФИДОшники оказываюся > незаслуженно обиженными. Если бы работающих с Голдедом было бы столько, > сколько Chiwriter-овцев, то их интересы IMHO можно было бы проигнорировать. > Но их на несколько порядков больше. [И тем не менее я их обижаю и пользуюсь > Аутглюком - хотя бы для того, чтобы читать твои письма, мышкой выбрав > кодировку ISO!] > А вот юниксоидов, да не просто эстетов вроде тебя, а тех, кто реально не > может > пользоваться Windows - не знаю сколько.... Явно больше, чем поклонников > Chiwriter-а, но столь же очевидно меньше, чем людей, ограниченных Голдедом. Ну не эстет я! Просто весь интернет только на Sun'е, а не на PC. > А что, неужели ТеХ - такой продвинутый - не понимает абзацев неограниченной > длины? 8-() "Неограниченной" точно не понимает (максимум страниц пять). Но на длину строк в нем (в стандартных версиях) ограничение, если не ошибаюсь, 500 символов. Уж такой там буфер внутри встроен. (Странно было прочитать "продвинутый" про программу, написанную 20 лет назад. С тех пор изменения сводились только к исправлению немногочисленных букашек, а в целом текст "заморожен".) > > > При записи в текстовой файл абзацев строками, получим строки длиной > > > равной длине абзацев. Разве это такие уж длинные строки? > > > > Увы, да. Попадаются ограничения и в 80 символов, и в 255. И если > > редактор просто режет строку на кусочки -- это еще не самый плохой > > случай. > > Не есть ли это показатель дремучести редактора? В общем, да -- но выбор редактора это и вопрос привычки. (Зато в этом редакторе нет ограничения на длину файла и запускается он и на кнопки реагирует практически мгновенно.) > Вот от мыльного указанного > тобой ограничения одни проблемы. Но это ограничение - следствие IMHO > следования _устаревшим_ почтовым стандартам. Мы же создаем станадарт > _заново_. Что нам мешает создать его современным, а не на уровне > наивняка 80-х гг.? Плохо будет, если наш "инвариантный" текст может прокиснуть по ходу пересылки по email'у. (Хотя это, с другой стороны, резон и против комментариев "до конца строки" -- они тоже запросто могут прокиснуть. Обдумаю.) > > > Можно разломить абзац на строки принудительно, но пускай будет > > > однозначный знак конца абзаца. > > > > Чем плоха пустая строка? > > Тем что человек-оператор - не машина, и с легкостью может ее пропустить > (если, конечно, его не изолировать от текста, против чего ты пока был > против). Сугубо личное мнение -- маленькую закорючку для конца абзаца пропустят еще легче, а большую так и вовсе сразу вставлять не станут, отложат на потом, а там и забудут. Так пускай будут оба способа! (И пусть никто не уйдет обиженным.) М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 10:27:36 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC 2.2 -------------------------------------------------------------------------------- Alexander V. Voinov wrote: > Mikhail Grinchuk wrote: > > В частности, можно попробовать извлекать некую информацию (словарь) > > > > из текстов, в которых эти переносы кем-то расставлены вручную. > > Мной, например. Я всюду ставил в винворде Ctrl-Minus, обычно больше, чем > было нужно в конкретном случае. Возьмите любой мой текст и нажмите > Ctrl-Shift-*. > > Надо только сконвертировать в HIP и выделить список слов. > > Александр Александр, можно Вас попросить все сконвертировать в RTF? А то у меня что-то шрифты не хотят устанавливаться, а без них в RTF перегоняется не вполне корректно. (В результате под каждый файл надо заново настраивать конвертор.) Переносы же как раз очень хорошо стоят, несомненно надо извлекать накопленный опыт. (А файлы PM6 -- это PageMaker? Их во что можно перевести?) М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 11:58:42 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: (***) -------------------------------------------------------------------------------- Привет All, -- 28 января 2000 г., 10:27:36, ты писал: 1.Первое PROJECT OF INVARIANT PRESENTATION OF CHURCHSLAVONIC TEXT (version 3 systems HIP) RUSSIAN http://orthodox.tstu.ru/font-list/invariant.txt 2.Второе ХАМСТЕРА я убираю из списка рассылки, мне каждый день десятки писем валятся на Postmaster из-за его MX problems. До него они все равно не доходят - а мне мешаются. Так и так он сейчас не читает. А архив я веду. =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 12:02:04 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: RFC8: -------------------------------------------------------------------------------- Привет AGA , -- 27 января 2000 г., 23:41:13, ты писал: A> X-Mailer: Microsoft Internet Mail 4.70.1155 >> выкиньте Ваш mailer (The Bat!), и установите нормальный, понимающий >> кодировку utf-8. ;-) Угу, желательно Gnus/5.0802 (Gnus v5.8.2) Emacs/20.5 A> А мне он долго доказывал - выкинь свой мэйлер и поставь что-нибудь A> нормальное, например the bat. И кому ж мне верить? Только я собрался оный A> бат ставить, а тут на тебе. Я тебе и снова повоторю - Microsoft Internet Mail - это не серьезно. Ставь бат для нетмейла. =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 12:10:28 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: (***) -------------------------------------------------------------------------------- "p" == postmaster writes: p> 2.Второе ХАМСТЕРА я убираю из списка рассылки, мне каждый день p> десятки писем валятся на Postmaster из-за его MX problems. До него p> они все равно не доходят - а мне мешаются. Так и так он сейчас не p> читает. А архив я веду. а может его подписать на "правильный" адрес -- smirnov@astelit.ru или hamster@microdin.ru ? ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 12:13:30 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Re[2]: RFC8: -------------------------------------------------------------------------------- "p" == postmaster writes: >>> выкиньте Ваш mailer (The Bat!), и установите нормальный, >>> понимающий кодировку utf-8. ;-) p> Угу, желательно Gnus/5.0802 (Gnus v5.8.2) Emacs/20.5 факт остается фактом --- The Bat! не понимает utf-8 (судя по тому, что Вы его прочесть не смогли), а gnus понимает. можно, конечно, установить и свежий outlook express, --- тогда тоже проблем не будет. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 12:14:30 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: (***) -------------------------------------------------------------------------------- Привет Vladimir Volovich , -- 28 января 2000 г., 12:10:28, ты писал: VV> p> 2.Второе ХАМСТЕРА я убираю из списка рассылки, мне каждый день VV> p> десятки писем валятся на Postmaster из-за его MX problems. До него VV> p> они все равно не доходят - а мне мешаются. Так и так он сейчас не VV> p> читает. А архив я веду. VV> а может его подписать на "правильный" адрес -- smirnov@astelit.ru VV> или hamster@microdin.ru ? Хорошо, подписал hamster@microdin.ru, посмотрим, как туда пойдут. =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 12:18:14 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: The Bat!/Gnus offtopics -------------------------------------------------------------------------------- Привет Vladimir Volovich , -- 28 января 2000 г., 12:13:30, ты писал: VV> >>> выкиньте Ваш mailer (The Bat!), и установите нормальный, VV> >>> понимающий кодировку utf-8. ;-) VV> p> Угу, желательно Gnus/5.0802 (Gnus v5.8.2) Emacs/20.5 VV> факт остается фактом --- The Bat! не понимает utf-8 (судя по тому, VV> что Вы его прочесть не смогли), а gnus понимает. можно, конечно, VV> установить и свежий outlook express, --- тогда тоже проблем не VV> будет. Аутлук -- это совсем ужасно. Нет, Бат _очень_ удобен в настройках, а равного по возможностям я еще не встречал. В чем-то напоминает GoldEd, может, поэтому я к нему так и привязался? ;) =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 12:19:41 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[3]: (***) -------------------------------------------------------------------------------- Привет postmaster , -- 28 января 2000 г., 12:14:30, ты писал: VV>> а может его подписать на "правильный" адрес -- smirnov@astelit.ru VV>> или hamster@microdin.ru ? p> Хорошо, подписал hamster@microdin.ru, посмотрим, как туда пойдут. This message was created automatically by mail delivery software. A message that you sent could not be delivered to all of its recipients. The following address(es) failed: hamster@microdin.ru The following text was generated during the delivery attempt: ------ hamster@microdin.ru ------ hamster@microdin.ru..... Unknown user Внимание! Получатель данного сообщения (hamster) не найден в базе пользователей IPC =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 12:28:45 От: Vladimir Volovich Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Re[3]: (***) -------------------------------------------------------------------------------- "p" == postmaster writes: VV> а может его подписать на "правильный" адрес -- smirnov@astelit.ru VV> или hamster@microdin.ru ? p> Хорошо, подписал hamster@microdin.ru, посмотрим, как туда пойдут. p> hamster@microdin.ru..... Unknown user имеет смысл попробовать последний вариант --- smirnov@astelit.ru с этого адреса Дима сам писал сюда, так что есть надежда, что он работает ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 12:27:36 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[5]: (***) -------------------------------------------------------------------------------- Привет Vladimir Volovich , -- 28 января 2000 г., 12:28:45, ты писал: VV> p> hamster@microdin.ru..... Unknown user VV> имеет смысл попробовать последний вариант --- smirnov@astelit.ru VV> с этого адреса Дима сам писал сюда, так что есть надежда, что он VV> работает ТЕСТ..... =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 12:41:27 От: "Dima A. Smirnov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Re[5]: (***) -------------------------------------------------------------------------------- ----- Original Message ----- From: postmaster To: -=ORTHODOX-FONT=- Project Participants Sent: Friday, January 28, 2000 12:27 PM Subject: Re[5]: (***) > Привет Vladimir Volovich , -- 28 января 2000 г., > 12:28:45, ты писал: > > VV> p> hamster@microdin.ru..... Unknown user > > VV> имеет смысл попробовать последний вариант --- smirnov@astelit.ru > VV> с этого адреса Дима сам писал сюда, так что есть надежда, что он > VV> работает > > ТЕСТ..... Будьте добры, добавьте лучше hamster@cityline.ru Рабочий адрес -- вещь не очень хорошая для дел, не относящихся к организации. Спасибо. Д.Смирнов > > =postmaster > > > > ---------------------------------------------------------------------- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru > =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 13:56:49 От: "S. M. Hozainov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Re[2]: (***) -------------------------------------------------------------------------------- ----- Original Message ----- From: postmaster To: -=ORTHODOX-FONT=- Project Participants Sent: 28 января 2000 г. 12:14 Subject: Re[2]: (***) > VV> а может его подписать на "правильный" адрес -- smirnov@astelit.ru > VV> или hamster@microdin.ru ? > > Хорошо, подписал hamster@microdin.ru, посмотрим, как туда пойдут. Господа, microdin - мой бывший провайдер. Он обанкротился в прошлом году. С уважением, Сергей Михайлович Хозяинов. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 14:27:45 От: "Dima A. Smirnov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Re[2]: (***) -------------------------------------------------------------------------------- Микродина больше нет в природе..... На сайте старый неработающий адрес.... В выходные сменю.... Д.Смирнов =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 16:49:49 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AG" Тема: Re: RFC8: ЦСл шрифт -------------------------------------------------------------------------------- > метод простановки диакритиков известный нам как метод символов нулевой Насколько я помню, на самом деле это было больше похоже на мозаику. Совершенно причудливые очертания отдельных элементов. Так что там и для литейщиков мороки было много. Архангельский Г.А. СПб ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 17:08:41 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC8: ЦСл шрифт -------------------------------------------------------------------------------- > > метод простановки диакритиков известный нам как метод символов нулевой > > Насколько я помню, на самом деле это было больше похоже на мозаику. > Совершенно причудливые очертания отдельных элементов. Так что там и для > литейщиков мороки было много. > Я плохо разбираюсь в технике набора, тем более стародавней. Но, согласитесь, достаточно отлить варию, а прилаживать ее к конкретной букве дело наборщика. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 17:24:41 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: ядзХд чвЩЮоеЫе -------------------------------------------------------------------------------- > > пользоваться Windows - не знаю сколько.... Явно больше, чем поклонников > > Chiwriter-а, но столь же очевидно меньше, чем людей, ограниченных Голдедом. > > Ну не эстет я! Просто весь интернет только на Sun'е, а не на PC. Был. А даже если и есть - то это только для богатых контор, могущих себе позволить Sun. А с Виндами - это просто некая данность. Как, допустим, с английским языком - нравится он нам или не нравится, а в любой точке мира, если брать наугад, вы скорее сможете объясниться на английском, чем на каком другом языке. А уж на церковнославянском, несмотря всю любезность его нашему сердцу - и вовсе нигде не получится. Несмотря на то, что язык очень правильный, куда правильнее мерзскаго омасоненного аглицкаго :-) На котором, к тому же, разговаривают и думают оба Билла... ;-( > > Вот от мыльного указанного > > тобой ограничения одни проблемы. Но это ограничение - следствие IMHO > > следования _устаревшим_ почтовым стандартам. Мы же создаем станадарт > > _заново_. Что нам мешает создать его современным, а не на уровне > > наивняка 80-х гг.? > > Плохо будет, если наш "инвариантный" текст может прокиснуть по > ходу пересылки по email'у. (Хотя это, с другой стороны, резон и против > комментариев "до конца строки" -- они тоже запросто могут прокиснуть. > Обдумаю.) А зачем слать ЦСл текст в теле сообщения? Почему бы не перестраховаться маленько и не слать его аттачем? Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 17:08:41 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC8: ЦСл шрифт -------------------------------------------------------------------------------- > > метод простановки диакритиков известный нам как метод символов нулевой > > Насколько я помню, на самом деле это было больше похоже на мозаику. > Совершенно причудливые очертания отдельных элементов. Так что там и для > литейщиков мороки было много. > Я плохо разбираюсь в технике набора, тем более стародавней. Но, согласитесь, достаточно отлить варию, а прилаживать ее к конкретной букве дело наборщика. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 18:33:14 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: ядзХд чвЩЮоеЫе -------------------------------------------------------------------------------- > > > > Плохо будет, если наш "инвариантный" текст может прокиснуть по > > ходу пересылки по email'у. (Хотя это, с другой стороны, резон и против > > комментариев "до конца строки" -- они тоже запросто могут прокиснуть. > > Обдумаю.) Так мы еще по-русски толком не умеем слать сообщения, чтобы не прокисали! ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 28 янв 2000 21:08:24 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Fw: (***) (ПОСТМАСТЕРУ) -------------------------------------------------------------------------------- ----- Original Message ----- From: "Dima A. Smirnov" To: "Lev Tikhonov" Sent: Friday, January 28, 2000 12:39 PM Subject: Re: (***) > У.... фидошники блин. Автомат нельзя натравить на мой адрес чтобы проблемные > письма убивать? Ты Андрей не смотри - он вообще-то не злобный, а просто усталый. > А что опять проблемы? Вроде со вчерашнего дня все ходит? > > > А как подписаться на hamster@cityline.ru ? Подпиши, а? > Не очень это хорошо, ну ладно.... > > Подпиши, а? Мне некогда сейчас.... > > Д.С. > > Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 янв 2000 05:23:54 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: O prokisanii -------------------------------------------------------------------------------- Доброе утро! > > Плохо будет, если наш "инвариантный" текст может прокиснуть > > по ходу пересылки по email'у. (Хотя это, с другой стороны, резон > > и против комментариев "до конца строки" -- они тоже запросто > > могут прокиснуть. Обдумаю.) > AG> Так мы еще по-русски толком не умеем слать сообщения, AG> чтобы не прокисали! По-русски хотя бы ясно, дошло сообщение правильно или прокисло. А тут есть опасность, что выглядеть оно будет как правильное, хотя на самом деле прокисло. LT> А зачем слать ЦСл текст в теле сообщения? Почему бы не LT> перестраховаться маленько и не слать его аттачем? "Если ошибку можно сделать, то всегда найдется тот, кто ее сделает!" С. М. Хозяинов (c) Раз не во всех текстовых редакторах и просмотрщиках различимы невооруженным глазом "настоящий" конец строки и "наблюдаемый" конец строки, который на самом деле просто пробел, то и нам нельзя их различать. (Но вот целую пустую строку так сымитировать -- это надо очень хотеть и специально добиваться.) *********************** Всем: жду ответов на вопросы из RFC 2.2, оно же http://orthodox.tstu.ru/font-list/invariant.txt *********************** Еще по поводу полезного софта: не иметь ли средство "эстетической настройки" HIP-текста, которое единообразно заменяет несколько различных HIP-обозначений одного и того же на вариант, который конкретному пользователю ближе? Например, то же оформление конца абзаца, синтаксис комментариев, кириллицу или латиницу в визуально неразличимых случаях, максимально допустимую длину "физической" строки и т. п. М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 янв 2000 05:37:41 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: O prokisanii -------------------------------------------------------------------------------- Вынужден констатировать, что ни одно письмо в этой кодировке я прочитать не смог. Несмотря на арсенал разных конвертеров. :-( Александр Mikhail Grinchuk wrote: > > ґчяЮчу ЦБЮч! > > > > їшчЕч яЦтуБ, уАшь щпХ "ьщрпЮьпщБщКы" БузАБ эчжуБ ъЮчзьАщЦБЛ> =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 янв 2000 06:14:55 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: O prokisanii -------------------------------------------------------------------------------- Alexander V. Voinov wrote: > "Vynuzhden konstatirovat', chto ni odno pis'mo v etoj kodirovke [ISO-8859-5] > ja prochitat' ne smog. Nesmotrja na arsenal raznyh konverterov. :-( 1) Prilagajetsja arhiv, gde vse eti pis'ma konvertirovany v Win-1251 2) Vozvrashchajus' k translitu. :-( M. G. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 янв 2000 12:40:28 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: RFC9: Славянская иероглифика -------------------------------------------------------------------------------- ... Гм. Насчет "простейшего случая". Идея совершенно левая и нетрадиционная пришла в голову. А почему бы нам не придумать "иероглифический" способ хранения ЦСл текста? Перечислить все основы и пронумеровать их. Например, "агглъ" - (Основа 145 в форме 1), "аггеломъ" - (основа 146 в форме 7), "творите" - (основа 12345 в форме 44), "сотворите" - ("со"+ основа 12345 в форме 44). В таком случае действительно можно будет создать не очень сложный синтетический алгоритм, обеспечивающий полуавтоматическую идентификацию практически любого ЦСл текста, а вред и тормоза от невнимательности корректора снизятся многократно. Раз уж мы признаЕм, что все равно не обойдемся без словарей, то почему бы не создать такой вот единый словарь? Тем более, что создание его задача весьма увлекательная, и даже, надо полагать, для филологов. Нам - паршивым компьютерным аналитикам - не придется им объяснять, что такое множественные замены и "уровни текста". Надо будет лишь перебрать словообразующие форманты и перечислить основы. Следующая стадия - описать сочетаемость слов в соответствующих формах. Хорошо еще, что для практической задачи даже не потребуется полного и точного алгоритма - достаточно будет некоторого приближения, чтобы альтернатив возникало не очень много и обретались они не в каждом слове. В любом случае нам придется проделать эту работу, только в сложно-препарированном и неинтересном для филологов виде, и потому их участие их будет для них не очень-то приятным. Совсем не так в случае принятия "иероглифического" подхода. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 янв 2000 12:41:19 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC6: Expert Software Shell & RFC4.1 - Vertical Software -------------------------------------------------------------------------------- Добрый день, Михаил! > Пока что речь об "всесовершенной утилите" не шла. Для "повышения > уровня" я пытаюсь задавать алгоритм как набор правил для множественных > взаимодействующих замен. Сами замены выполняет древняя самодельная > программа, написанная еще для такого зверя, как СМ-4. Пока что набор этих > типа еров, где можно обойтись небольшим числом правил. > > Вообще, как оказывается, набором локальных замен можно задавать > очень нетривиальные преобразования. Скажем, приведение небрежно > набранного текстового файла (с переносами, без разделения абзацев, > с неправильной расстановкой пробелов у знаков препинания и т. п.) > к почти идеальному входному тексту для ТеХа (даже с превращением > пробелов после предлогов в неразрывные и сменой рисунка при вложенных > кавычках, а также переформатированием для избежания слишком > длинных строк). Очень здОрово. Идея абсолютно справедлива, я тоже точно таким же образом работаю в Ворде, который является, заметим, в первую очередь _текстовым процессором_, причем в этом отношении непревзойденным ;-) В таком случае ваша изобретаемая среда - есть лишь всем давно известный велосипед (изобретение которого оправдано только в условиях работы в зоопарке из СМ-4 и ей подобных ;-). Никто из хоть раз делавших что-нибудь реальное в Ворде не станет ради таких задач изучать вашу среду - могу ответственно это заявить. А вот алгоритмы на C, если вы их рано или поздно формализуете, все равно окажутся невостребованными в Ворде, потому что для автоматизации своих действий у него есть свой встроенный макроязык. Впрочем, если вы пренебрежете "универсальностью" и все же оформите их в dll - ими можно будет пользоваться и из Ворда. > > > Другой -- описание алгоритмов проверки и восстановления текста > > > в "воспроизводимом" виде. Сюда же можно добавить алгоритмы > > > конвертации в другие системно-независимые представления > > > (например, TXT/Unicode). Все остальное уже, увы, будет привязано > > > к конкретной платформе. > > > > Описание алгоритма зачастую труднее сделать, чем реализовать сам алгоритм. > > В нашем случае все же это не совсем верно: алгоритм является в основном > реализацией системы замен, и почему бы эту систему замен не вытащить > наружу, превратив в документацию? Да потому, что, все время оставляя это на потом, мы всю жизнь так и проработаем - неформализованно и неорганизованно - я в Ворде, а вы в своей среде. И так и не сможем никогда пристегнуть к этому делу менее квалифицированных людей без риска для текста. Этим надо заниматься прямо сейчас, и не дергаться сразу писать вертикальные конвертеры, чтобы не обрастать балластом, который, возможно, придется переделывать для совместимости. > Почти наверняка это заинтересует и филологов: ведь наша цель -- выявить > и в компактной и конструктивной форме задать такие сведения о языке, > которые обычно излагаются "в общих чертах". Например, написание и/i -- > для алгоритма потребуется явно извлечь все те буквосочетания, где > нужно писать i, а не просто сказать, что i пишется перед гласными, перед й > и "в некоторых заимствованных именах" (это я утрирую). Причем если мы > что-то пропустим или добавим слишком всеобъемлющее правило, то > ошибка с большой вероятностью обнаружится при попытке > восстановления "эталонного" текста. Согласен. И именно для удобства этого анализа предлагаю мыслить в категориях уровней текста. Уровни - это некорректное слово, на самом деле имеются в виду точки в очень многомерном пространстве конечной мощности. Алгоритм, заменяющий в нужных местах "и" на "i" - это один из таких атомарных алгоритмов, которые можно и нужно проектировать и оценивать отдельно от всех остальных. Тогда и вопрос к филологам возникает четкий и конкретный, и в зависимости от их ответа и оценки усилий, которые от нас потребуется затратить на реализацию этого алгоритма, мы сможем принять решение - доводить ли алгоритмизацию данного конкретного шага до конца, или сначала, а может и насовсем, просто добавить к нему генератор "альтернативных тэгов", примитивный или суггестирующий. А категории софта, нужного, чтобы в такой парадигме обслужить все алгоритмы - я попытался уже описать. > > Описывать лучше не алгоритмы (динамику), а спецификации стандартов > > (статику). Любой алгоритм есть лишь вектор над множеством текстов, где > > начальная и исходная точки должны быть точно специфицированы. А для этого > > надо для начала тщательнейшим образом исследовать то пространство, с которым > > мы собираемся иметь дело. > > Проблема в том, что наше "пространство" состоит из текстов, изначально > изготовленных вручную и потому с любыми возможными неожиданностями. > На каждом этапе переработки мы только можем говорить нечто вроде: > "скорее всего, яти сейчас стоят правильно, а потому попробуем расставить > ударения". Но если изначально в тексте что-то было напутано, то расстановщик > ятей мог никакой проблемы не обнаружить, но добавить в результате новые > ошибки, и ударения в итоге тоже могут оказаться не те. Для того я и предложил рассмотреть это пространство и аппроксимировать его удобной нам моделью. Далее следует найти среди реальных ЦСл текстов желаемые точки соприкосновения с нашей моделью и классифицировать все существующие тексты по этим точкам. Причем любой текст может либо опускаться вниз (желательно как можно меньше) тривиальным конвертером, либо подниматься вверх с помощью валидатора - интерактивного, или генерящего альтернативные тэги. А чтобы не усложнять черезчур программы (очень много практически одинаковых алгоритмов потребуется реализовать) - хорошо бы алгоритмы эти пихать в dll. После того, как мы промаркируем все тексты - работать с ними можно будет исключительно с помощью формального инструментария. Хотите - держите Инструкцию по его употребления в голове, хотите - напишите Expert Software Shell, которая будет это делать вместо вас, да и не только это, а кое-что еще. > > Ты же хочешь обойтись без исследовательской работы, положившись лишь > > на свою интуицию, и тем самым неизбежно чего-то не учесть. > > Так, вроде бы, мы сейчас и пытаемся по ходу обсуждения понять, что > можно/нужно учитывать и как. > > > Например, обидеть корректоров, тщательно > > расставлявших переносы в изданиях, напр., Сретенского > > монастыря. Объявить, что в HIP их переносы пропадут. > > Не совсем так. Идея в том, чтобы по таким текстам составить алгоритм > для переносов (в простейшем случае -- список всех слов с расставленными > переносами) и хранить его как единую для всех текстов базу данных. Тогда вопрос только в том, находить ли такие "дырки", требующие затыка, по мере реального продвижения вперед и софтописания, или постараться все-таки для начала не дергаться и выявить как можно больше "дырок" уже сейчас. В таком случае сам процесс софтописания значительно упростится за счет выявления общих для многих задач компонент софта и не придется срочно подыскивать заплатки. И что касается конкретно ударений - для начала каждой реальной верстке понадобится свой алгоритм "собирания сливок". Это если мы не хотим создавать "список всех слов" от начала и до конца, что является само по себе весьма сложной задачей. =======ЗРИ======== отдельное письмо ======== ... Гм. Насчет "простейшего случая". Идея совершенно левая и нетрадиционная пришла в голову. А почему бы нам не придумать "иероглифический" способ хранения ЦСл текста? Перечислить все основы и пронумеровать их. Например, "агглъ" - (Основа 145 в форме 1), "аггеломъ" - (основа 146 в форме 7), "творите" - (основа 12345 в форме 44), "сотворите" - ("со"+ основа 12345 в форме 44). В таком случае действительно можно будет создать сложный синтетический алгоритм, обеспечивающий полуавтоматическую идентификацию практически любого ЦСл набора, а вред и тормоза от невнимательности корректора снизятся многократно. > > > > Так и систем ЦС-набора и окрест-них-существующего софта существует, > > > > наверное, уже более десятка. И каждая создавалась с претензией на > > > > совершенство. Единственное, чего не хватило каждой - именно > > > > системности, понимания того, что на ней свет клином не сошелся. > > > > > > Есть ли среди них системы, направленные не только на задачу > > > "бумажного" издания книги? О таких было бы полезно узнать > > > больше и, может быть, чем-то воспользоваться. > > > > Ну ты понимаешь важность такой системы, я понимаю, еще несколько > > десятков, быть может, человек понимают. И все. > > А вся остальная масса людей, в т. ч. располагающих свободным временем, > > желанием и средствами для работы, этого не понимает и никогда не способна > > понять - хоть в лепешку расшибись. > > Прошу прощения, здесь был чистый вопрос, без каких-либо оценок > и сравнений. Что же, собственно, существует, помимо: 1) различных > способов записи текста для различных издательских систем (включая > раскладки шрифтов); 2) клавиатурных макросов для ускорения набора; > 3) конверторов? (Хотя и про 1-2-3 тоже надо знать.) > > Может быть, попытаться свести воедино информацию о том, что есть? Обязательно нужно. Но прежде, чем "сводить воедино информацию", я попытался убедить народ создать для начала полочки, по которым ее можно разложить. Причем желательно довести эти полочки до машинно-узнаваемого состояния. > > > > наша же задача - четко описать, что нужно сделать > > > > алгоритмически для того, чтобы достичь совместимости с нашей системой. > > > > > > Бесспорно согласен, если это значит "использовать наш формат > > > файлов для входной и выходной информации". Если что-то другое -- > > > что именно? > > > > Ровно наоборот: все существующие форматы файлов должны стать "нашими", > > обрести место в нашей классификации, а постепенно - и обрасти алгоритмами > > для изменения этого места. > > Тогда так: "формат наш" обозначает "мы в/из него умеем конвертировать во > все остальные наши форматы" (пусть и не один шаг). Или снова не то? Угу. А если в реальном тексте есть особенности, которые вынуждают его сильно упростить для того, чтобы мы смогли его конвертировать имеющими средствами? В пределе-то все тексты "наши" путем их низведения до голого русского набора.... ;-( Не лучше ли _вовремя_ принять _правильное_ решение - упрощать ли тексты с определенными особенностями "до конца", объявить ли их "узловой точкой", т. е. одним из нормативных состояний, поддерживаемых нашими конвертерами (если таких текстов достаточно много) или упрощать до ближайшего нормативного состояния (а для этого, конечно, надо определиться с этими "узловыми точками" и с теми параметрами, по которым они различаются)? По идее, чем более сложную и адекватную реальности систему классификации удастся создать, тем реально проще будет создание каждой атомарной утилиты и каждого алгоритма. > > > Чего-то я тут не понимаю. Если конвертор не вписывается в стандарт, > > > то это вроде бы просто неправильный конвертор? Просьба пояснить. > > > > Допустим, ты считаешь конвертером только то, что работает со строчным > > текстом, а какой-нибудь виндузятник - наоборот, только с абзацным. Все. > > Патовая ситуация. Вы можете только разойтись в гордом презрении друг к > > другу, считая все остальные подходы, кроме своего, неправильными. > > Конвертор -- это то, что из одного формата делает другой. Причем > подразумевается, что оба формата как-то уже стандартизованы. ВОТ-ВОТ. И желательно _подробно_ до дотошности. > А уж > "строчный" формат или "абзацный" -- дело десятое. (Тем более что одно > в другое превратить на пару порядков проще, чем разбираться с действительно > нетривиальными форматами.) Гм. Как выясняется, даже здесь могут быть неожиданные проблемы. Да я специально привел такой тривиальный пример, чтобы показать, что проблемы непонимания и поводы для обид начинаются уже тут. А вот фраза "подразумевается, что оба формата как-то уже стандартизованы" означает ли, к моей радости, ваше признание необходимости _множественных_ стандартов? > > С помощью братской любви и отвергнув гордыню можно преодолеть разделение, но > > никак не навязывая свои идеи всем. Навязать можно не идеи, а готовое > > решение - так, чтобы _никто_ _добровольно_ не захотел изобретать велосипед. > > Поставим технологические и психологические достижения Билла Гейтса на службу > > единству славянского православия! > > Главное психологическое достижение г-на Гейтса -- порочный круг: > "Вот Вам новая версия системы, толстая! и медленная! Но с кучей > финтифлюшек. Купите для нее новый компьютер! Вы купили новый > компьютер? Значит, Вам нужна еще более толстая и медленная версия!" Самое главное, что россияне денег не берут ;-), и толстыми системами пользуются совершенно бесплатно. Но почему-то буржуины все же за них платят - иначе Гейтс не был бы таким богатым ;) Хотя будь я на их месте - сам всерьез бы подумал, платить или нет. А если серьезно - то это все обиды нищих людей. На самом деле можно ведь объявить, что Мерседес (пускай позапрошлогодний Опель, но с автоматической коробкой передач, центральным замком и обогревом кресел) ничем не лучше нового Жигуля, а тот - собранного в гараже вездехода: тоже ведь автомобиль. В каких-то случаях выручит только вездеход, но предлагать всем и каждому заниматься конструированием вездеходов - просто несерьезно. Тем более, что подавляющее большинство людей не то что вездехода - и ржавого самоката не соберет, я в том числе. > > > Так я уже и есть убежденный! Например, работа с текстом с помощью > > > набора standalone-утилит (не диалоговых) и какого-нибудь нехитрого > > > текстового редактора вырисовывается такая: > > > > Скажи, у тебя _лично_ есть силы на то, чтобы такую систему завершить и с ее > > помощью ввести и обработать _все_ тексты? > > Какие части я в состоянии изготовить -- писано в самом первом сообщении: > конверторы RTF/Irmologion <-> базовый HIP, некоторые восстановители > диакритики и "валидаторы" (как наборы правил локальных замен), > ДОСовский редактор для HIP. Сейчас могу добавить конвертор > RTF/Unicode (Izhica-CSU) <-> базовый HIP. Надо лишь довести HIP до состояния > зафиксированной версии, чтобы все это хозяйство не переделывать. > В задумках -- самообучающиеся программы восстановления и система > для работы с переносами (извлечение их из текста в базу данных, > сравнение переносов в тексте с базой данных, расстановка по базе > данных). Конвертор из HIP в любой TeX сделать тоже совсем просто > (в чистом виде набор локальных замен); в обратную сторону -- зависит > от того, как набран текст. Хм. Я-то спрашивал не об увлекательном процессе программирования, а о конечной цели. Сколько вам потребуется времени, чтобы, не адаптируя ваш инструментарий к нашим виндовозным запросам, сконвертировать 90% существующих ЦСл текстов в HIP? И не является ли это время неоправданно большим, настолько большим, что, может быть, предпочли бы переложить часть работы на наши и еще чьи-то плечи? А если так - то просьба постараться услышать наши пожелания, чтобы потом не обижаться, что ваши замечательные утилиты нами невостребованы, а от нас никакого толку. > А вот за GUI браться совершенно не хочется. GUI мы - виндузятники - беремся приделать, если ваш софт окажется для этого приспособлен. В простейшем случае его и делать не надо: Ворд уже готовая GUI-шная среда. Но если ваши утилиты будут взаимосвязаны по правилам, существующим только в вашей голове и никак не документированным - беда! Беда, если вы все силы будете тратить на борьбу с ветряными мельницами, вроде создания технологии множественных замен с помощью утилит командной строки ;-) Алгоритмы от вас нужны - это так. Но эти алгоритмы должны быть либо реально в dll, либо в командных утилитах - но атомизированных до полного безобразия. Чтобы их можно было вызывать из VB, не борясь с тщательно спроектированным вами алгоритмическим "гарниром", воспроизводимым одной строчкой в VB(A). И чтобы они не были привязаны к конкретному состоянию текста, что, кстати, должно помочь и вам в проектировании следующих алгоритмов. > > Standalone exe в твоей терминологии - это то же, что dll в терминологии > > виндов. Только dll автоматически линкует и исполняет соответствующая > > подсистема OC, а твои exe-шники не подчиняются никаким двоичным правилам, > > помимо текстового описания, в худшем случае существующего только в твоей > > голове. > > > > Вот и разница: если эти exe написаны с учетом неких машинно-интерпретируемых > > правил - то это уже разновидность сабжа, и написаны они для некоторой > > виртуальной ОС, а если таких правил не существует, то толку от них мало, ибо > > диспетчеризацией их использования должен заниматься некий гуру-человек, а не > > автомат. > > Мое "текстовое описание" может состоять в том, какой формат читается, > какой формат пишется и что изменяется по ходу преобразования. Например: > <<На входе и на выходе -- базовый HIP, операция -- расстановка придыханий. Абсолютный минимум. Не учтено даже, есть ли уже расставленные ударения - а алгоритм, конечно же, будет разным. Или же следует указать, что эту операцию _запрещено_ применять к тексту, не содержащему ударения. Следовательно, перед применением этого алгоритма _требуется_ проверка текста валидатором а наличие всех ударений. А при попытке нарушить этот запрет, при попытке применить этот конвертер к тексту, не помеченному "безопасным" для расстановки придыханий - система громко верещит ;-). Или верещит не система, а какая-то извилина у тебя в подкорке, что ты до поры до времени предпочитаешь. Боюсь, правда, что по мере развития вот этих правил ты должен будешь периодически выслушивать целый оркестр из своих извилин. Лучше доверь учет и контроль компьютеру, чтобы не утратить чувствительность и не начать игнорировать сигналы предупреждения, надеясь на авось и на потом. Посмотри выше, сам же писал о том, что в реальности пока нет ни одного текста, гарантированно соответствующего идеалу. Соответственно, кому-то все равно придется взять на себя черную работу по приведению текстов к чему-нибудь поддерживаемому нами. Ты все время инстинктивно пытаешься увильнуть от рассмотрения этого вопроса и отложить кому-нибудь на потом. А думать-то надо уже сейчас.... Я могу сколько угодно поддакивать тебе на этом этапе, но только нам это не поможет: просто будет расти риск слишком сильно упростить многие тексты перед тем, как их куда-либо конвертировать. В результате реально на только на этом (на их обратном преобразовании) потерять годы. > В случае обнаружения каких-либо проблем соответствующее место в > выходном файле будет помечено символом "?".>> Так годится? Вот это уже хуже. Альтернативные тэги лучше однозначно, чем эти вопросики. Причем желательно не смешивать тексты, где альтернативные тэги - результат работы валидатора и тексты, где они - результат работы повышающего уровень текста конвертера. Формально между такими текстами разницы нет, но фактически для человека-корректора, снимающего расставленные программой тэги, это крайне важно для того, чтобы правильно управлять своим вниманием. С уважением, Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 янв 2000 13:59:32 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: O prokisanii -------------------------------------------------------------------------------- > AG> Так мы еще по-русски толком не умеем слать сообщения, > AG> чтобы не прокисали! > > По-русски хотя бы ясно, дошло сообщение правильно или прокисло. > А тут есть опасность, что выглядеть оно будет как правильное, хотя > на самом деле прокисло. Это да. Но раз есть опасность - значит просто надо помнить, что HIP-текст не годится для пересылки открытым текстом, точно так же, как, допустим, хорошо оформленная программа на С с десятком-другим вложенных структур. > LT> А зачем слать ЦСл текст в теле сообщения? Почему бы не > LT> перестраховаться маленько и не слать его аттачем? > > "Если ошибку можно сделать, то всегда найдется тот, кто ее сделает!" > С. М. Хозяинов (c) Ой, а часто мы пересылаем ЦСл тексты? Наверное, гораздо реже, чем, например, исполняемые модули программ... Но никому же не приходит в голову переслать exe-шник, просто открыв его в текстовом редакторе и вставив содержимое в текст письма.... Полагаю, что и HIP-текст достаточно характерный внешний вид будет иметь, чтобы не делать с ним таких ошибок. > Раз не во всех текстовых редакторах и просмотрщиках различимы > невооруженным глазом "настоящий" конец строки и "наблюдаемый" > конец строки, который на самом деле просто пробел, то и нам нельзя > их различать. (Но вот целую пустую строку так сымитировать -- это > надо очень хотеть и специально добиваться.) Да нет, просто строчная организация текста - наследие "физических" консолей, с физическими же "CR" и "LF". Еще одна реальная причина для ее удержания - хилость XT и 286 машин, для того, чтобы динамически пересчитывать концы строк в зависимости от параметров форматирования абзаца. Так что - не знаю как на Sun, ;) а на PC первым и, надеюсь, последним редактором со строчной организацией текста для меня был Лексикон. В промежутке были (очень давно) редакторы от Борландовских Turbo-сред. Но тут особая программистская специфика, я ее вчера попытался охарактеризовать (хранение структурных элементов), и потому редакторы, рассчитанные на программеров - вовсе не показатель. Может быть, кто-то с АЦ-терминалом вместо графического монитора привык только к моноширинному шрифту - что же, будем всем навязывать и это? Хотя моноширинный шрифт ИНОГДА, несомненно, удобнее. > Еще по поводу полезного софта: не иметь ли средство "эстетической > настройки" HIP-текста, которое единообразно заменяет несколько > различных HIP-обозначений одного и того же на вариант, который > конкретному пользователю ближе? Например, то же оформление > конца абзаца, синтаксис комментариев, кириллицу или латиницу > в визуально неразличимых случаях, максимально допустимую > длину "физической" строки и т. п. Конечно! Но прежде, чем запускать такой "настройщик", изменяющий, скажем, оформление конца абзаца, нужно будет иметь разрешение Супервизора ;-(), то есть гарантию того, что данное преобразование применимо к данному тексту. То есть опять-таки, возникает проблема валидации и общих алгоритмов, которые желательно вызывать из самых разных утилит, в том числе таких вот валидаторов. Что до меня - я бы предпочел не столько уделять внимания многочисленным валидациям, сколько автоматической системе, призванной снизить ущерб от главного вредителя-корректора ;-), склонного к недосыпу и всяческим ошибкам. Тогда единожды проверенный и классифицированный текст уже не сможет выбиться из классификации, быв неудачно и неквалифицированно подправлен. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 янв 2000 15:39:31 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: RFC6: Expert Software Shell & RFC4.1 - Vertical Software -------------------------------------------------------------------------------- [Na vsjakij sluchaj -- vnizu to zhe v translite.] Доброе утро! Lev Tikhonov wrote: > > Пока что речь об "всесовершенной утилите" не шла. > > Для "повышения уровня" я пытаюсь задавать алгоритм > > как набор правил для множественных взаимодействующих > > замен. Сами замены выполняет древняя самодельная > > программа, написанная еще для такого зверя, как СМ-4. > > Очень здОрово. Идея абсолютно справедлива, я тоже точно > таким же образом работаю в Ворде, который является, > заметим, в первую очередь _текстовым процессором_, > причем в этом отношении непревзойденным ;-) > В таком случае ваша изобретаемая среда - есть лишь всем > давно известный велосипед (изобретение которого > оправдано только в условиях работы в зоопарке из СМ-4 > и ей подобных ;-). > Никто из хоть раз делавших что-нибудь реальное в Ворде > не станет ради таких задач изучать вашу среду - могу > ответственно это заявить. Поскольку не работал с Word'ом сколько-нибудь серьезно, то не знаю, насколько мощный в нем макроязык, как набор макрокоманд взаимодействует между собой и насколько трудно в нем разбираться и что-нибудь исправлять, если результат оказывается неверным. А потому утверждение насчет "давно изобретенного велосипеда" пока оценить не могу. Про свою систему могу выложить полную информацию (чтобы можно было сравнить). Перерабатываемый текст рассматривается как последовательность символов, на которой стоит "активная точка", постепенно ползущая от начала последовательности к концу. Эта "активная точка" имеет несколько внутренних переменных с числовыми значениями; вначале все они равны нулю, а сама точка стоит в самом начале последовательности. "Программа" (набор правил замены) состоит из 5-компонентных записей (скажем, А-Б-В-Г-Д), где А, Б, В -- конечные последовательности символов, Г -- набор условий на значения внутренних переменных (сравнения с константами), Д -- набор операций над внутренними переменными (присваивание им констант и увеличение/уменьшение на 1). Программы выполняется так: ищется правило, у которого выполнены все условия (Г) и часть А совпадает с начальным отрезком обрабатываемой последовательности после активной точки. Если таких правил несколько, выбирается правило с самой длинной частью А. После этого часть А из обрабатываемой последовательности убирается, часть Б вставляется перед активной точкой, часть В -- после активной точки, и к внутренним переменным применяется набор операций Д. После этого процесс повторяется. Если же ни одного подходящего правила не нашлось, активная точка сдвигается вперед на 1 символ. Процесс заканчивается, когда она окажется в самом конце последовательности. Сам набор команд хранится в текстовом файле, причем программа может попутно его отсортировать. Обычно для реализации каких-либо преобразований текста его приходится последовательно обработать несколькими (обычно двумя-тремя) программами такого рода. Когда такой набор программ отлажен, пользователю про детали системы можно и не говорить, спрятав весь внутренний механизм в один bat-файл с двумя параметрами: что читать и куда писать. (Ваш набор макрокоманд тоже ведь, скорее всего, "спрятан", и пользователю сообщается лишь, куда надо нажать, чтобы все сработало.) (Выше было ПОЛНОЕ описание программы, недостает лишь описания ее опций и формата самих команд. Но если от пользователя не требуется править алгоритм, то это и не нужно.) > А вот алгоритмы на C, если вы их рано или поздно > формализуете, все равно окажутся невостребованными > в Ворде, потому что для автоматизации своих действий > у него есть свой встроенный макроязык. Впрочем, если > вы пренебрежете "универсальностью" и все же оформите > их в dll - ими можно будет пользоваться и из Ворда. Никогда dll (и вообще под Win) не программировал, поэтому нужна информация о том, как организуется интерфейс. У меня Borland C++ (пятая версия). Не прислал бы кто-нибудь "рыбу" для изготовления этого самого dll (для какого-нибудь простого примера, но чтобы было взаимодействие с Word'ом)? Или это уже нечто нетривиальное? > > > Описание алгоритма зачастую труднее сделать, чем > > > реализовать сам алгоритм. > > > > В нашем случае все же это не совсем верно: алгоритм > > является в основном реализацией системы замен, и > > почему бы эту систему замен не вытащить наружу, > > превратив в документацию? > > Да потому, что, все время оставляя это на потом, мы всю > жизнь так и проработаем - неформализованно и > неорганизованно - я в Ворде, а вы в своей среде. В "моей среде" алгоритм уже сам по себе почти документация: запись типа А/Б// (чаще всего используемая) обозначает "заменить А на Б". Так реально выглядит строка в программе моей системы. (И ничего, кроме таких строк-команд, в ней нет.) > И так и не сможем никогда пристегнуть к этому делу менее > квалифицированных людей без риска для текста. Этим надо > заниматься прямо сейчас, и не дергаться сразу писать > вертикальные конвертеры, чтобы не обрастать балластом, > который, возможно, придется переделывать для совместимости. Сперва надо "заморозить" стандарт представления текста. (А на вопросы по HIP откликов почти нет...) > > Почти наверняка это заинтересует и филологов: ведь наша > > цель -- выявить и в компактной и конструктивной форме > > задать такие сведения о языке, которые... > > Согласен. И именно для удобства этого анализа предлагаю > мыслить в категориях уровней текста. Уровни - это > некорректное слово, на самом деле имеются в виду > точки в очень многомерном пространстве конечной мощности. Конечной-то оно конечной, но не то чтобы уж очень маленькой... Вопрос в том, в каких точках сидит основная масса реально существующих текстов, чтобы наши "повышатели" имели что повышать. > Тогда вопрос только в том, находить ли такие "дырки", > требующие затыка, по мере реального продвижения вперед > и софтописания, или постараться все-таки для начала не > дергаться и выявить как можно больше "дырок" уже сейчас. Снова вопрос сильно упирается в то, что же мы реально имеем в набранных текстах. > И что касается конкретно ударений - для начала каждой > реальной верстке понадобится свой алгоритм "собирания > сливок". Это если мы не хотим создавать "список всех > слов" от начала и до конца, что является само по себе > весьма сложной задачей. Почему свой? И почему "сложной задачей"? К конвертору RTF -> HIP добавить сохранение мягких переносов труда вовсе не составляет (вставить пару строк в программу), а написать средство для составления словаря переносов по такому HIP -- работы максимум на полдня. > =======ЗРИ======== отдельное письмо ======== (Будет отдельный ответ.) > > Может быть, попытаться свести воедино информацию о том, что есть? [имеется в виду ц.-сл. софт] > > Обязательно нужно. Но прежде, чем "сводить воедино > информацию", я попытался убедить народ создать для > начала полочки, по которым ее можно разложить. Причем > желательно довести эти полочки до машинно-узнаваемого > состояния. Имея весьма смутное представление о существующих системах, все же опасаюсь нагородить 10000 полочек под 20 предметов. Хоть какой-нибудь бы список для начала, пусть самый неформализованный! (И второй список -- реально существующих тестов.) > > > > > наша же задача - четко описать, что нужно сделать > > > > > алгоритмически для того, чтобы достичь совместимости > > > > > с нашей системой. > > > > > > > > Бесспорно согласен, если это значит "использовать наш формат > > > > файлов для входной и выходной информации". Если что-то другое -- > > > > что именно? > > > > > > Ровно наоборот: все существующие форматы файлов должны стать "нашими", > > > обрести место в нашей классификации, а постепенно - и обрасти > > > алгоритмами для изменения этого места. > > > > Тогда так: "формат наш" обозначает "мы в/из него > > умеем конвертировать во все остальные наши форматы" > > (пусть и не один шаг). Или снова не то? > > Угу. А если в реальном тексте есть особенности, которые > вынуждают его сильно упростить для того, чтобы мы смогли > его конвертировать имеющими средствами? В пределе-то все > тексты "наши" путем их низведения до голого русского > набора.... ;-( Скажем, "TeX с особенностями" он и есть "TeX с особенностями". Почти наверняка в каждом тексте будут свои особенности. Даже если в целом использавался один и тот же TeX и один и тот же ц.-сл. пакет. И "стандартизовать формат" в этом случае может только тот, кто эти тексты реально видит -- иначе нельзя отличить "особенности" от "закономерностей". Даже "до голого русского набора" свести без этого не получится. Идея тут такая: иметь для начала хотя бы один формат, в котором можно представить всю полноту текстовой информации (например, HIP). Иметь полное и подробное описание этого формата. Тогда тот, кому потребуется работать с TeXовскими текстами, будут иметь возможность написать СВОИ конверторы (под СВОИ особенности набора), чтобы через наш формат получить доступ к другим форматам и (или) издательским системам. От людей "со стороны" (не работавших с ДАННЫМ TeXом и ц.-сл. пакетом -- а то и с ДАННЫМИ текстами!) в этом случае помощь вряд ли будет. А если особенности состоят в том, какие элементы собственно текста присутствуют или отсутствуют -- то это уже совсем другой вопрос. Такой текст ОБЯЗАН конвертироваться в HIP (или другой стандарт) с сохранением всех этих особенностей, и уже в недрах нашей системы "повышаться уровнем". > Не лучше ли _вовремя_ принять _правильное_ решение - > упрощать ли тексты с определенными особенностями "до > конца", объявить ли их "узловой точкой", т. е. одним > из нормативных состояний, поддерживаемых нашими > конвертерами (если таких текстов достаточно много) > или упрощать до ближайшего нормативного состояния > (а для этого, конечно, надо определиться с этими > "узловыми точками" и с теми параметрами, по которым > они различаются)? Конвертору не должно быть дела до "состояния" текста. (В Вашей терминологии -- конвертор есть горизонтальный софт, а "нормативные состояния" различаются по вертикали.) > А вот фраза "подразумевается, что оба формата как-то уже > стандартизованы" означает ли, к моей радости, ваше > признание необходимости _множественных_ стандартов? Без вопросов! Но при условии взаимной конвертируемости. (И, вообще говоря, тут с одним-то форматом уже месяц разбираемся...) > > Главное психологическое достижение г-на Гейтса -- порочный круг: > > "Вот Вам новая версия системы, толстая! и медленная! Но с кучей > > финтифлюшек. Купите для нее новый компьютер! Вы купили новый > > компьютер? Значит, Вам нужна еще более толстая и медленная версия!" > > Самое главное, что россияне денег не берут ;-), и толстыми системами > пользуются совершенно бесплатно. Но почему-то буржуины все же за них > платят - иначе Гейтс не был бы таким богатым ;) Хотя будь я на их месте - > сам всерьез бы подумал, платить или нет. Большей частью потому, что на самом деле это крайне дешево. Поелику сам сейчас в "буржуинстве" обитаю, то по секрету скажу: нынешний доллар означает нечто среднее между 1 и 10 "брежневскими" копейками. Представьте, что у Вас -- при советских ценах -- была бы возможность купить всю эту систему рублей за десять -- с фирменной гарантией, документацией, без вирусов и проч. Плюс к этому фирменная бесплатная справочная служба по телефону и upgrade на будущее. (Но в целом весь этот порочный круг не такой уж дорогой; хотя что это действительно порочный круг, а не прогресс на благо общества, здесь считают практически очевидным.) > Хм. Я-то спрашивал не об увлекательном процессе программирования, а о > конечной цели. Сколько вам потребуется времени, чтобы, не адаптируя ваш > инструментарий к нашим виндовозным запросам, сконвертировать 90% > существующих ЦСл текстов в HIP? И не является ли это время неоправданно > большим, настолько большим, что, может быть, предпочли бы переложить часть > работы на наши и еще чьи-то плечи? Без "повышения уровня" и имея все тексты в RTF (в любых шрифтах и кодировках, пусть пока и неведомых) -- несколько дней. (Зависит, конечно, от числа разных шрифтов и кодировок.) > > Мое "текстовое описание" может состоять в том, какой формат читается, > > какой формат пишется и что изменяется по ходу преобразования. Например: > > <<На входе и на выходе -- базовый HIP, операция -- расстановка придыханий. > > Абсолютный минимум. Не учтено даже, есть ли уже расставленные ударения - а > алгоритм, конечно же, будет разным. Или же следует указать, что эту операцию > _запрещено_ применять к тексту, не содержащему ударения. В данном случае наличие ударений несущественно. Хотя в принципе применимость преобразования от состояния текста, конечно, зависит. > Соответственно, кому-то все > равно придется взять на себя черную работу по приведению текстов к > чему-нибудь поддерживаемому нами. Ты все время инстинктивно пытаешься > увильнуть от рассмотрения этого вопроса и отложить кому-нибудь на потом. А > думать-то надо уже сейчас.... > Я могу сколько угодно поддакивать тебе на этом этапе, но только нам это не > поможет: просто будет расти риск слишком сильно упростить многие тексты > перед тем, как их куда-либо конвертировать. В результате реально на только > на этом (на их обратном преобразовании) потерять годы. Тут два разных аспекта -- горизонтальный и вертикальный. Я сначала хочу понять, можем ли мы все "нормализовать" по горизонтали и какие конверторы для этого потребуются. При этом как раз "упрощать" крайне не хочется. > > В случае обнаружения каких-либо проблем соответствующее место в > > выходном файле будет помечено символом "?". Так годится? > > Вот это уже хуже. Альтернативные тэги лучше однозначно, чем эти вопросики. > Причем желательно не смешивать тексты, где альтернативные тэги - результат > работы валидатора и тексты, где они - результат работы повышающего уровень > текста конвертера. Формально между такими текстами разницы нет, но > фактически для человека-корректора, снимающего расставленные программой > тэги, это крайне важно для того, чтобы правильно управлять своим вниманием. Стоп-стоп. Во-первых, лучше бы без "конверторов, повышающих уровень". Пусть каждая программа делает что-нибудь одно, но хорошо. А вопросики могут возникать в трех случаях: 1) "горизонтальный" конвертор обнаружил нечто неконвертируемое 2) валидатор обнаружил нечто странное 3) повышатель уровня не может однозначно выбрать вариант При этом "альтернативный тег" обязан появиться в случае 3), но в случаях 1) и 2) -- не всегда. Например, проверяет валидатор букву "ъ" -- и видит слово "дуъа" (вместо "духа" -- кнопки были рядом, вот и опечатка). И какой альтернативный тег тут ставить? М. Г. [Teper' to zhe samoje v translite.] =========================== Dobroe utro! > > Poka chto rech' ob "vsesovershennoj utilite" ne shla. > > Dlja "povyshenija urovnja" ja pytajus' zadavat' algoritm > > kak nabor pravil dlja mnozhestvennykh vzaimodejstvujushchikh > > zamen. Sami zameny vypolnjaet drevnjaja samodel'naja > > programma, napisannaja eshche dlja takogo zverja, kak SM-4. > > Ochen' zdOrovo. Ideja absoljutno spravedliva, ja tozhe tochno > takim zhe obrazom rabotaju v Vorde, kotoryj javljaetsja, > zametim, v pervuju ochered' _tekstovym processorom_, > prichem v etom otnoshenii neprevzojdennym ;-) > V takom sluchae vasha izobretaemaja sreda - est' lish' vsem > davno izvestnyj velosiped (izobretenie kotorogo > opravdano tol'ko v uslovijakh raboty v zooparke iz SM-4 > i ej podobnykh ;-). > Nikto iz khot' raz delavshikh chto-nibud' real'noe v Vorde > ne stanet radi takikh zadach izuchat' vashu sredu - mogu > otvetstvenno eto zajavit'. Poskol'ku ne rabotal s Word'om skol'ko-nibud' ser'ezno, to ne znaju, naskol'ko moshchnyj v nem makrojazyk, kak nabor makrokomand vzaimodejstvuet mezhdu soboj i naskol'ko trudno v nem razbirat'sja i chto-nibud' ispravljat', esli rezul'tat okazyvaetsja nevernym. A potomu utverzhdenie naschet "davno izobretennogo velosipeda" poka ocenit' ne mogu. Pro svoju sistemu mogu vylozhit' polnuju informaciju (chtoby mozhno bylo sravnit'). Pererabatyvaemyj tekst rassmatrivaetsja kak posledovatel'nost' simvolov, na kotoroj stoit "aktivnaja tochka", postepenno polzushchaja ot nachala posledovatel'nosti k koncu. Eta "aktivnaja tochka" imeet neskol'ko vnutrennikh peremennykh s chislovymi znachenijami; vnachale vse oni ravny nulju, a sama tochka stoit v samom nachale posledovatel'nosti. "Programma" (nabor pravil zameny) sostoit iz 5-komponentnykh zapisej (skazhem, A-B-V-G-D), gde A, B, V -- konechnye posledovatel'nosti simvolov, G -- nabor uslovij na znachenija vnutrennikh peremennykh (sravnenija s konstantami), D -- nabor operacij nad vnutrennimi peremennymi (prisvaivanie im konstant i uvelichenie/umen'shenie na 1). Programmy vypolnjaetsja tak: ishchetsja pravilo, u kotorogo vypolneny vse uslovija (G) i chast' A sovpadaet s nachal'nym otrezkom obrabatyvaemoj posledovatel'nosti posle aktivnoj tochki. Esli takikh pravil neskol'ko, vybiraetsja pravilo s samoj dlinnoj chast'ju A. Posle etogo chast' A iz obrabatyvaemoj posledovatel'nosti ubiraetsja, chast' B vstavljaetsja pered aktivnoj tochkoj, chast' V -- posle aktivnoj tochki, i k vnutrennim peremennym primenjaetsja nabor operacij D. Posle etogo process povtorjaetsja. Esli zhe ni odnogo podkhodjashchego pravila ne nashlos', aktivnaja tochka sdvigaetsja vpered na 1 simvol. Process zakanchivaetsja, kogda ona okazhetsja v samom konce posledovatel'nosti. Sam nabor komand khranitsja v tekstovom fajle, prichem programma mozhet poputno ego otsortirovat'. Obychno dlja realizacii kakikh-libo preobrazovanij teksta ego prikhoditsja posledovatel'no obrabotat' neskol'kimi (obychno dvumja-tremja) programmami takogo roda. Kogda takoj nabor programm otlazhen, pol'zovatelju pro detali sistemy mozhno i ne govorit', sprjatav ves' vnutrennij mekhanizm v odin bat-fajl s dvumja parametrami: chto chitat' i kuda pisat'. (Vash nabor makrokomand tozhe ved', skoree vsego, "sprjatan", i pol'zovatelju soobshchaetsja lish', kuda nado nazhat', chtoby vse srabotalo.) (Vyshe bylo POLNOE opisanie programmy, nedostaet lish' opisanija ee opcij i formata samikh komand. No esli ot pol'zovatelja ne trebuetsja pravit' algoritm, to eto i ne nuzhno.) > A vot algoritmy na C, esli vy ikh rano ili pozdno > formalizuete, vse ravno okazhutsja nevostrebovannymi > v Vorde, potomu chto dlja avtomatizacii svoikh dejstvij > u nego est' svoj vstroennyj makrojazyk. Vprochem, esli > vy prenebrezhete "universal'nost'ju" i vse zhe oformite > ikh v dll - imi mozhno budet pol'zovat'sja i iz Vorda. Nikogda dll (i voobshche pod Win) ne programmiroval, poetomu nuzhna informacija o tom, kak organizuetsja interfejs. U menja Borland C++ (pjataja versija). Ne prislal by kto-nibud' "rybu" dlja izgotovlenija etogo samogo dll (dlja kakogo-nibud' prostogo primera, no chtoby bylo vzaimodejstvie s Word'om)? Ili eto uzhe nechto netrivial'noe? > > > Opisanie algoritma zachastuju trudnee sdelat', chem > > > realizovat' sam algoritm. > > > > V nashem sluchae vse zhe eto ne sovsem verno: algoritm > > javljaetsja v osnovnom realizaciej sistemy zamen, i > > pochemu by etu sistemu zamen ne vytashchit' naruzhu, > > prevrativ v dokumentaciju? > > Da potomu, chto, vse vremja ostavljaja eto na potom, my vsju > zhizn' tak i prorabotaem - neformalizovanno i > neorganizovanno - ja v Vorde, a vy v svoej srede. V "moej srede" algoritm uzhe sam po sebe pochti dokumentacija: zapis' tipa A/B// (chashche vsego ispol'zuemaja) oboznachaet "zamenit' A na B". Tak real'no vygljadit stroka v programme moej sistemy. (I nichego, krome takikh strok-komand, v nej net.) > I tak i ne smozhem nikogda pristegnut' k etomu delu menee > kvalificirovannykh ljudej bez riska dlja teksta. Etim nado > zanimat'sja prjamo sejchas, i ne dergat'sja srazu pisat' > vertikal'nye konvertery, chtoby ne obrastat' ballastom, > kotoryj, vozmozhno, pridetsja peredelyvat' dlja sovmestimosti. Sperva nado "zamorozit'" standart predstavlenija teksta. (A na voprosy po HIP otklikov pochti net...) > > Pochti navernjaka eto zainteresuet i filologov: ved' nasha > > cel' -- vyjavit' i v kompaktnoj i konstruktivnoj forme > > zadat' takie svedenija o jazyke, kotorye... > > Soglasen. I imenno dlja udobstva etogo analiza predlagaju > myslit' v kategorijakh urovnej teksta. Urovni - eto > nekorrektnoe slovo, na samom dele imejutsja v vidu > tochki v ochen' mnogomernom prostranstve konechnoj moshchnosti. Konechnoj-to ono konechnoj, no ne to chtoby uzh ochen' malen'koj... Vopros v tom, v kakikh tochkakh sidit osnovnaja massa real'no sushchestvujushchikh tekstov, chtoby nashi "povyshateli" imeli chto povyshat'. > Togda vopros tol'ko v tom, nakhodit' li takie "dyrki", > trebujushchie zatyka, po mere real'nogo prodvizhenija vpered > i softopisanija, ili postarat'sja vse-taki dlja nachala ne > dergat'sja i vyjavit' kak mozhno bol'she "dyrok" uzhe sejchas. Snova vopros sil'no upiraetsja v to, chto zhe my real'no imeem v nabrannykh tekstakh. > I chto kasaetsja konkretno udarenij - dlja nachala kazhdoj > real'noj verstke ponadobitsja svoj algoritm "sobiranija > slivok". Eto esli my ne khotim sozdavat' "spisok vsekh > slov" ot nachala i do konca, chto javljaetsja samo po sebe > ves'ma slozhnoj zadachej. Pochemu svoj? I pochemu "slozhnoj zadachej"? K konvertoru RTF -> HIP dobavit' sokhranenie mjagkikh perenosov truda vovse ne sostavljaet (vstavit' paru strok v programmu), a napisat' sredstvo dlja sostavlenija slovarja perenosov po takomu HIP -- raboty maksimum na poldnja. > =======ZRI======== otdel'noe pis'mo ======== (Budet otdel'nyj otvet.) > > Mozhet byt', popytat'sja svesti voedino informaciju o tom, chto est'? [imeetsja v vidu c.-sl. soft] > > Objazatel'no nuzhno. No prezhde, chem "svodit' voedino > informaciju", ja popytalsja ubedit' narod sozdat' dlja > nachala polochki, po kotorym ee mozhno razlozhit'. Prichem > zhelatel'no dovesti eti polochki do mashinno-uznavaemogo > sostojanija. Imeja ves'ma smutnoe predstavlenie o sushchestvujushchikh sistemakh, vse zhe opasajus' nagorodit' 10000 polochek pod 20 predmetov. Khot' kakoj-nibud' by spisok dlja nachala, pust' samyj neformalizovannyj! (I vtoroj spisok -- real'no sushchestvujushchikh testov.) > > > > > nasha zhe zadacha - chetko opisat', chto nuzhno sdelat' > > > > > algoritmicheski dlja togo, chtoby dostich' sovmestimosti > > > > > s nashej sistemoj. > > > > > > > > Bessporno soglasen, esli eto znachit "ispol'zovat' nash format > > > > fajlov dlja vkhodnoj i vykhodnoj informacii". Esli chto-to drugoe -- > > > > chto imenno? > > > > > > Rovno naoborot: vse sushchestvujushchie formaty fajlov dolzhny stat' "nashimi", > > > obresti mesto v nashej klassifikacii, a postepenno - i obrasti > > > algoritmami dlja izmenenija etogo mesta. > > > > Togda tak: "format nash" oboznachaet "my v/iz nego > > umeem konvertirovat' vo vse ostal'nye nashi formaty" > > (pust' i ne odin shag). Ili snova ne to? > > Ugu. A esli v real'nom tekste est' osobennosti, kotorye > vynuzhdajut ego sil'no uprostit' dlja togo, chtoby my smogli > ego konvertirovat' imejushchimi sredstvami? V predele-to vse > teksty "nashi" putem ikh nizvedenija do gologo russkogo > nabora.... ;-( Skazhem, "TeX s osobennostjami" on i est' "TeX s osobennostjami". Pochti navernjaka v kazhdom tekste budut svoi osobennosti. Dazhe esli v celom ispol'zavalsja odin i tot zhe TeX i odin i tot zhe c.-sl. paket. I "standartizovat' format" v etom sluchae mozhet tol'ko tot, kto eti teksty real'no vidit -- inache nel'zja otlichit' "osobennosti" ot "zakonomernostej". Dazhe "do gologo russkogo nabora" svesti bez etogo ne poluchitsja. Ideja tut takaja: imet' dlja nachala khotja by odin format, v kotorom mozhno predstavit' vsju polnotu tekstovoj informacii (naprimer, HIP). Imet' polnoe i podrobnoe opisanie etogo formata. Togda tot, komu potrebuetsja rabotat' s TeXovskimi tekstami, budut imet' vozmozhnost' napisat' SVOI konvertory (pod SVOI osobennosti nabora), chtoby cherez nash format poluchit' dostup k drugim formatam i (ili) izdatel'skim sistemam. Ot ljudej "so storony" (ne rabotavshikh s DANNYM TeXom i c.-sl. paketom -- a to i s DANNYMI tekstami!) v etom sluchae pomoshch' vrjad li budet. A esli osobennosti sostojat v tom, kakie elementy sobstvenno teksta prisutstvujut ili otsutstvujut -- to eto uzhe sovsem drugoj vopros. Takoj tekst OBJaZAN konvertirovat'sja v HIP (ili drugoj standart) s sokhraneniem vsekh etikh osobennostej, i uzhe v nedrakh nashej sistemy "povyshat'sja urovnem". > Ne luchshe li _vovremja_ prinjat' _pravil'noe_ reshenie - > uproshchat' li teksty s opredelennymi osobennostjami "do > konca", ob'javit' li ikh "uzlovoj tochkoj", t. e. odnim > iz normativnykh sostojanij, podderzhivaemykh nashimi > konverterami (esli takikh tekstov dostatochno mnogo) > ili uproshchat' do blizhajshego normativnogo sostojanija > (a dlja etogo, konechno, nado opredelit'sja s etimi > "uzlovymi tochkami" i s temi parametrami, po kotorym > oni razlichajutsja)? Konvertoru ne dolzhno byt' dela do "sostojanija" teksta. (V Vashej terminologii -- konvertor est' gorizontal'nyj soft, a "normativnye sostojanija" razlichajutsja po vertikali.) > A vot fraza "podrazumevaetsja, chto oba formata kak-to uzhe > standartizovany" oznachaet li, k moej radosti, vashe > priznanie neobkhodimosti _mnozhestvennykh_ standartov? Bez voprosov! No pri uslovii vzaimnoj konvertiruemosti. (I, voobshche govorja, tut s odnim-to formatom uzhe mesjac razbiraemsja...) > > Glavnoe psikhologicheskoe dostizhenie g-na Gejtsa -- porochnyj krug: > > "Vot Vam novaja versija sistemy, tolstaja! i medlennaja! No s kuchej > > fintifljushek. Kupite dlja nee novyj komp'juter! Vy kupili novyj > > komp'juter? Znachit, Vam nuzhna eshche bolee tolstaja i medlennaja versija!" > > Samoe glavnoe, chto rossijane deneg ne berut ;-), i tolstymi sistemami > pol'zujutsja sovershenno besplatno. No pochemu-to burzhuiny vse zhe za nikh > platjat - inache Gejts ne byl by takim bogatym ;) Khotja bud' ja na ikh meste - > sam vser'ez by podumal, platit' ili net. Bol'shej chast'ju potomu, chto na samom dele eto krajne deshevo. Poeliku sam sejchas v "burzhuinstve" obitaju, to po sekretu skazhu: nyneshnij dollar oznachaet nechto srednee mezhdu 1 i 10 "brezhnevskimi" kopejkami. Predstav'te, chto u Vas -- pri sovetskikh cenakh -- byla by vozmozhnost' kupit' vsju etu sistemu rublej za desjat' -- s firmennoj garantiej, dokumentaciej, bez virusov i proch. Pljus k etomu firmennaja besplatnaja spravochnaja sluzhba po telefonu i upgrade na budushchee. (No v celom ves' etot porochnyj krug ne takoj uzh dorogoj; khotja chto eto dejstvitel'no porochnyj krug, a ne progress na blago obshchestva, zdes' schitajut prakticheski ochevidnym.) > Khm. Ja-to sprashival ne ob uvlekatel'nom processe programmirovanija, a o > konechnoj celi. Skol'ko vam potrebuetsja vremeni, chtoby, ne adaptiruja vash > instrumentarij k nashim vindovoznym zaprosam, skonvertirovat' 90% > sushchestvujushchikh CSl tekstov v HIP? I ne javljaetsja li eto vremja neopravdanno > bol'shim, nastol'ko bol'shim, chto, mozhet byt', predpochli by perelozhit' chast' > raboty na nashi i eshche ch'i-to plechi? Bez "povyshenija urovnja" i imeja vse teksty v RTF (v ljubykh shriftakh i kodirovkakh, pust' poka i nevedomykh) -- neskol'ko dnej. (Zavisit, konechno, ot chisla raznykh shriftov i kodirovok.) > > Moe "tekstovoe opisanie" mozhet sostojat' v tom, kakoj format chitaetsja, > > kakoj format pishetsja i chto izmenjaetsja po khodu preobrazovanija. Naprimer: > > < > Absoljutnyj minimum. Ne uchteno dazhe, est' li uzhe rasstavlennye udarenija - a > algoritm, konechno zhe, budet raznym. Ili zhe sleduet ukazat', chto etu operaciju > _zapreshcheno_ primenjat' k tekstu, ne soderzhashchemu udarenija. V dannom sluchae nalichie udarenij nesushchestvenno. Khotja v principe primenimost' preobrazovanija ot sostojanija teksta, konechno, zavisit. > Sootvetstvenno, komu-to vse > ravno pridetsja vzjat' na sebja chernuju rabotu po privedeniju tekstov k > chemu-nibud' podderzhivaemomu nami. Ty vse vremja instinktivno pytaesh'sja > uvil'nut' ot rassmotrenija etogo voprosa i otlozhit' komu-nibud' na potom. A > dumat'-to nado uzhe sejchas.... > Ja mogu skol'ko ugodno poddakivat' tebe na etom etape, no tol'ko nam eto ne > pomozhet: prosto budet rasti risk slishkom sil'no uprostit' mnogie teksty > pered tem, kak ikh kuda-libo konvertirovat'. V rezul'tate real'no na tol'ko > na etom (na ikh obratnom preobrazovanii) poterjat' gody. Tut dva raznykh aspekta -- gorizontal'nyj i vertikal'nyj. Ja snachala khochu ponjat', mozhem li my vse "normalizovat'" po gorizontali i kakie konvertory dlja etogo potrebujutsja. Pri etom kak raz "uproshchat'" krajne ne khochetsja. > > V sluchae obnaruzhenija kakikh-libo problem sootvetstvujushchee mesto v > > vykhodnom fajle budet pomecheno simvolom "?". Tak goditsja? > > Vot eto uzhe khuzhe. Al'ternativnye tegi luchshe odnoznachno, chem eti voprosiki. > Prichem zhelatel'no ne smeshivat' teksty, gde al'ternativnye tegi - rezul'tat > raboty validatora i teksty, gde oni - rezul'tat raboty povyshajushchego uroven' > teksta konvertera. Formal'no mezhdu takimi tekstami raznicy net, no > fakticheski dlja cheloveka-korrektora, snimajushchego rasstavlennye programmoj > tegi, eto krajne vazhno dlja togo, chtoby pravil'no upravljat' svoim vnimaniem. Stop-stop. Vo-pervykh, luchshe by bez "konvertorov, povyshajushchikh uroven'". Pust' kazhdaja programma delaet chto-nibud' odno, no khorosho. A voprosiki mogut voznikat' v trekh sluchajakh: 1) "gorizontal'nyj" konvertor obnaruzhil nechto nekonvertiruemoe 2) validator obnaruzhil nechto strannoe 3) povyshatel' urovnja ne mozhet odnoznachno vybrat' variant Pri etom "al'ternativnyj teg" objazan pojavit'sja v sluchae 3), no v sluchajakh 1) i 2) -- ne vsegda. Naprimer, proverjaet validator bukvu "" -- i vidit slovo "dua" (vmesto "dukha" -- knopki byli rjadom, vot i opechatka). I kakoj al'ternativnyj teg tut stavit'? M. G. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 янв 2000 16:15:09 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Re: RFC9: уЬСзбЮгЫСб ЩХвЯЧЬЩЦЩЫС -------------------------------------------------------------------------------- [vnizu kopija latinicej] Lev Tikhonov wrote: > ... Гм. Насчет "простейшего случая". Идея совершенно левая и нетрадиционная > пришла в голову. А почему бы нам не придумать "иероглифический" способ > хранения ЦСл текста? Перечислить все основы и пронумеровать их. Например, > "агглъ" - (Основа 145 в форме 1), "аггеломъ" - (основа 146 в форме 7), > "творите" - (основа 12345 в форме 44), "сотворите" - ("со"+ основа 12345 в > форме 44). > > В таком случае действительно можно будет создать не очень сложный > синтетический > алгоритм, обеспечивающий полуавтоматическую идентификацию практически любого > ЦСл текста, а вред и тормоза от невнимательности корректора снизятся > многократно. Ой, Лев, тут уж лаборатории не хватит, тут институт нужон... И работы не на один год. Причем не для "тетушек", которые рады нам кусочек текста набрать, а для людей, смыслящих и в филологии, и в кибернетике. (И, к сожалению, идея известная -- особенно для кодированя со сжатием.) > Раз уж мы признаЕм, что все равно не обойдемся без словарей, то почему бы > не создать такой вот единый словарь? > Тем более, что создание его задача весьма увлекательная, и даже, надо > полагать, для филологов. Надо будет лишь перебрать словообразующие форманты и > перечислить основы. "Лишь"... Это на первые два года работы -- и при условии, что все тексты УЖЕ набраны и новых не будет. (Вероятность встретить некий новый элемент по мере увеличения длины уже имеющегося текста убывает, но крайне медленно.) > Следующая стадия - описать сочетаемость слов в соответствующих формах. Еще два года работы. > Хорошо еще, что для практической задачи даже не потребуется полного и > точного алгоритма - достаточно будет некоторого приближения, чтобы > альтернатив возникало не очень много и обретались они не в каждом слове. Смотря что за "практическая задача". Если речь о создании некоего валидатора-спеллчеккера -- то примерно то же качество, но гораздо меньшей кровью можно получить, отлавливая ранее не встречавшиеся трех- или четырехбуквенные комбинации или просто новые слова. > В любом случае нам придется проделать эту работу, только в > сложно-препарированном и неинтересном для филологов виде, и потому > участие их будет для них не очень-то приятным. Совсем не так в случае > принятия "иероглифического" подхода. А не наоборот ли: в конце нашей наборной деятельности филологи получат ц.-сл. тексты, и потом потихоньку будут делать весь этот морфологический и синтаксический анализ делают. Почти наверняка при этом отловится несколько десятков опечаток -- но не более того. А Вы предлагаете всю эту работу делать во время набора -- нам труды, а филологов на пособие по безработице? Если же пытаться их сейчас привлечь к работе с тем, чтобы сотворился инструмент для набора -- то текстов ждите к тому самому 2010-му году, а то и позже. М. Г. Lev Tikhonov wrote: > ... Gm. Naschet "prostejshego sluchaja". Ideja sovershenno levaja i netradicionnaja > prishla v golovu. A pochemu by nam ne pridumat' "ieroglificheskij" sposob > khranenija CSl teksta? Perechislit' vse osnovy i pronumerovat' ikh. Naprimer, > "aggl'" - (Osnova 145 v forme 1), "aggelom'" - (osnova 146 v forme 7), > "tvorite" - (osnova 12345 v forme 44), "sotvorite" - ("so"+ osnova 12345 v > forme 44). > > V takom sluchae dejstvitel'no mozhno budet sozdat' ne ochen' slozhnyj > sinteticheskij > algoritm, obespechivajushchij poluavtomaticheskuju identifikaciju prakticheski ljubogo > CSl teksta, a vred i tormoza ot nevnimatel'nosti korrektora snizjatsja > mnogokratno. Oj, Lev, tut uzh laboratorii ne khvatit, tut institut nuzhon... I raboty ne na odin god. Prichem ne dlja "tetushek", kotorye rady nam kusochek teksta nabrat', a dlja ljudej, smysljashchikh i v filologii, i v kibernetike. (I, k sozhaleniju, ideja izvestnaja -- osobenno dlja kodirovanja so szhatiem.) > Raz uzh my priznaEm, chto vse ravno ne obojdemsja bez slovarej, to pochemu by > ne sozdat' takoj vot edinyj slovar'? > Tem bolee, chto sozdanie ego zadacha ves'ma uvlekatel'naja, i dazhe, nado > polagat', dlja filologov. Nado budet lish' perebrat' slovoobrazujushchie > formanty i perechislit' osnovy. "Lish'"... Eto na pervye dva goda raboty -- i pri uslovii, chto vse teksty UZhE nabrany i novykh ne budet. (Verojatnost' vstretit' nekij novyj element po mere uvelichenija dliny uzhe imejushchegosja teksta ubyvaet, no krajne medlenno.) > Sledujushchaja stadija - opisat' sochetaemost' slov v sootvetstvujushchikh formakh. Eshche dva goda raboty. > Khorosho eshche, chto dlja prakticheskoj zadachi dazhe ne potrebuetsja polnogo i > tochnogo algoritma - dostatochno budet nekotorogo priblizhenija, chtoby > al'ternativ voznikalo ne ochen' mnogo i obretalis' oni ne v kazhdom slove. Smotrja chto za "prakticheskaja zadacha". Esli rech' o sozdanii nekoego validatora-spellchekkera -- to primerno to zhe kachestvo, no gorazdo men'shej krov'ju mozhno poluchit', otlavlivaja ranee ne vstrechavshiesja trekh- ili chetyrekhbukvennye kombinacii ili prosto novye slova. > V ljubom sluchae nam pridetsja prodelat' etu rabotu, tol'ko v > slozhno-preparirovannom i neinteresnom dlja filologov vide, i potomu > uchastie ikh budet dlja nikh ne ochen'-to prijatnym. Sovsem ne tak v sluchae > prinjatija "ieroglificheskogo" podkhoda. A ne naoborot li: v konce nashej nabornoj dejatel'nosti filologi poluchat c.-sl. teksty, i potom potikhon'ku budut delat' ves' etot morfologicheskij i sintaksicheskij analiz delajut. Pochti navernjaka pri etom otlovitsja neskol'ko desjatkov opechatok -- no ne bolee togo. A Vy predlagaete vsju etu rabotu delat' vo vremja nabora -- nam trudy, a filologov na posobie po bezrabotice? Esli zhe pytat'sja ikh sejchas privlech' k rabote s tem, chtoby sotvorilsja instrument dlja nabora -- to tekstov zhdite k tomu samomu 2010-mu godu, a to i pozzhe. M. G. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 янв 2000 16:24:57 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Славянская иероглифика -------------------------------------------------------------------------------- ----- Original Message ----- From: "Lev Tikhonov" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Saturday, January 29, 2000 12:40 PM Subject: RFC9: Славянская иероглифика > ... Гм. Насчет "простейшего случая". Идея совершенно левая и нетрадиционная > пришла в голову. А почему бы нам не придумать "иероглифический" способ > хранения ЦСл текста? Перечислить все основы и пронумеровать их. Например, > "агглъ" - (Основа 145 в форме 1), "аггеломъ" - (основа 146 в форме 7), > "творите" - (основа 12345 в форме 44), "сотворите" - ("со"+ основа 12345 в > форме 44). При условии поддержки этого начинания HIP можно было бы использовать в первую очередь как нормативный алфавит для такого словаря, используемый для его создания и редактирования. Тогда способ получения текста из хранилища был бы такой: 1) текст как последовательность "иероглифов" -> текст как последовательность слов в формате HIP 2) последовательность слов в формате HIP -> конкретное представление текста в издательской системе. HIP же можно разделить на два неперсекающихся подмножества: одно - для представления формантов словарных иероглифов, другое - для представления в инвариантном виде всех без исключения элементов форматирования, в том числе таких деликатных, как концы строк и абзацев ;) Тогда второе подмножество будет влиять только на второй этап преобразования текста. Вероятно, сам "HIP второго уровня" должен содержать, помимо информации о форматировании, также способ обозначения "иероглифов" как таковых (то есть ссылок на соответствющие элементы словаря). Если пойти по этому пути, будет утрачена непосредственная наглядность HIP, но, при наличии готового словаря, визуализатор такого "HIP-2" будет совершенно тривиальным и реализовываться для любой платформы за несколько часов. Зато - за счет утраты "клавиши F3" - мы приобретаем непробиваемую защиту от ошибок корректора и вообще сводим потребность системы в корректоре к потребности в стайке аккуратных десятиклассниц. Левъ. ЗЫ. 2Михаил. Вне зависимости от поддержки этой идеи - возможно, следует выделить в basicHIP еще и некоторый kernel, который используется для представления собственно слов. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 янв 2000 16:54:38 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: O prokisanii -------------------------------------------------------------------------------- [Snova vnizu translit] Lev Tikhonov wrote: > > По-русски хотя бы ясно, дошло сообщение правильно или > > прокисло. А тут есть опасность, что выглядеть оно будет > > как правильное, хотя на самом деле прокисло. > > Это да. Но раз есть опасность - значит просто надо > помнить, что HIP-текст не годится для пересылки открытым > текстом, точно так же, как, допустим, хорошо оформленная > программа на С с десятком-другим вложенных структур. > > > LT> А зачем слать ЦСл текст в теле сообщения? Почему бы > > LT> не перестраховаться маленько и не слать его аттачем? > > > > "Если ошибку можно сделать, то всегда найдется тот, кто > > ее сделает!" С. М. Хозяинов (c) > > Ой, а часто мы пересылаем ЦСл тексты? Наверное, гораздо > реже, чем, например, исполняемые модули программ... Но > никому же не приходит в голову переслать exe-шник, просто > открыв его в текстовом редакторе и вставив содержимое в > текст письма.... > > Полагаю, что и HIP-текст достаточно характерный внешний > вид будет иметь, чтобы не делать с ним таких ошибок. Вид видом, но Postscript, пришедший открытым текстом, несколько раз мне попадался. А это посильнее будет, чем любой наш "Фауст". > > Раз не во всех текстовых редакторах и просмотрщиках > > различимы невооруженным глазом "настоящий" конец > > строки и "наблюдаемый" конец строки, который на самом > > деле просто пробел, то и нам нельзя их различать. (Но > > вот целую пустую строку так сымитировать -- это надо > > очень хотеть и специально добиваться.) > > Да нет, просто строчная организация текста - наследие > "физических" консолей, с физическими же "CR" и "LF". > Еще одна реальная причина для ее удержания - хилость > XT и 286 машин, для того, чтобы динамически пересчитывать > концы строк в зависимости от параметров форматирования > абзаца. И еще причины были (скажем, файловая система, в которой никаких CR и LF не использовалось, но в начале каждой строки стоял ОДИН БАЙТ, содержащий ее длину -- тут уж просто физически строк длиной больше 255 быть не могло). > Так что - не знаю как на Sun, ;) а на PC первым и, > надеюсь, последним редактором со строчной организацией > текста для меня был Лексикон. В промежутке были (очень > давно) редакторы от Борландовских Turbo-сред. Но тут > особая программистская специфика, я ее вчера попытался > охарактеризовать (хранение структурных элементов), и > потому редакторы, рассчитанные на программеров - вовсе > не показатель. Может быть, кто-то с АЦ-терминалом вместо > графического монитора привык только к моноширинному > шрифту - что же, будем всем навязывать и это? Хотя > моноширинный шрифт ИНОГДА, несомненно, удобнее. Вы будете с меня смеяться -- но и на Sun'е, и на PC живу исключительно в моноширинных шрифтах и в редакторах со строчной организацией. > > Еще по поводу полезного софта: не иметь ли средство > > "эстетической настройки" HIP-текста, которое > > единообразно заменяет несколько различных > > HIP-обозначений одного и того же на вариант, который > > конкретному пользователю ближе? Например, то же > > оформление конца абзаца, синтаксис комментариев, > > кириллицу или латиницу в визуально неразличимых > > случаях, максимально допустимую длину "физической" > > строки и т. п. > > Конечно! > Но прежде, чем запускать такой "настройщик", изменяющий, > скажем, оформление конца абзаца, нужно будет иметь > разрешение Супервизора ;-(), то есть гарантию того, что > данное преобразование применимо к данному тексту. То > есть опять-таки, возникает проблема валидации и общих > алгоритмов, которые желательно вызывать из самых разных > утилит, в том числе таких вот валидаторов. Зачем тут валидаторы и проч.? Это как раз такие преобразования, которые никакой HIP-текст в принципе испортить не могут. Но могут оказаться очень полезными, чтобы можно было пользоваться программами, понимающими не любую из этих равноценных обозначений одного и того же. Скажем, Вы сотворили нечто, работающее с чисто абзацным представлением (никаких EOL, но есть символ конца абзаца). А у меня все тексты в строчном представлении и абзацы разделены пустой строкой. Так зачем нам для взаимодействия каких-то еще супервизоров кликать? М. Г. > > Po-russki khotja by jasno, doshlo soobshchenie pravil'no ili > > prokislo. A tut est' opasnost', chto vygljadet' ono budet > > kak pravil'noe, khotja na samom dele prokislo. > > Eto da. No raz est' opasnost' - znachit prosto nado > pomnit', chto HIP-tekst ne goditsja dlja peresylki otkrytym > tekstom, tochno tak zhe, kak, dopustim, khorosho oformlennaja > programma na S s desjatkom-drugim vlozhennykh struktur. > > > LT> A zachem slat' CSl tekst v tele soobshchenija? Pochemu by > > LT> ne perestrakhovat'sja malen'ko i ne slat' ego attachem? > > > > "Esli oshibku mozhno sdelat', to vsegda najdetsja tot, kto > > ee sdelaet!" S. M. Khozjainov (c) > > Oj, a chasto my peresylaem CSl teksty? Navernoe, gorazdo > rezhe, chem, naprimer, ispolnjaemye moduli programm... No > nikomu zhe ne prikhodit v golovu pereslat' exe-shnik, prosto > otkryv ego v tekstovom redaktore i vstaviv soderzhimoe v > tekst pis'ma.... > > Polagaju, chto i HIP-tekst dostatochno kharakternyj vneshnij > vid budet imet', chtoby ne delat' s nim takikh oshibok. Vid vidom, no Postscript, prishedshij otkrytym tekstom, neskol'ko raz mne popadalsja. A eto posil'nee budet, chem ljuboj nash "Faust". > > Raz ne vo vsekh tekstovykh redaktorakh i prosmotrshchikakh > > razlichimy nevooruzhennym glazom "nastojashchij" konec > > stroki i "nabljudaemyj" konec stroki, kotoryj na samom > > dele prosto probel, to i nam nel'zja ikh razlichat'. (No > > vot celuju pustuju stroku tak symitirovat' -- eto nado > > ochen' khotet' i special'no dobivat'sja.) > > Da net, prosto strochnaja organizacija teksta - nasledie > "fizicheskikh" konsolej, s fizicheskimi zhe "CR" i "LF". > Eshche odna real'naja prichina dlja ee uderzhanija - khilost' > XT i 286 mashin, dlja togo, chtoby dinamicheski pereschityvat' > koncy strok v zavisimosti ot parametrov formatirovanija > abzaca. I eshche prichiny byli (skazhem, fajlovaja sistema, v kotoroj nikakikh CR i LF ne ispol'zovalos', no v nachale kazhdoj stroki stojal ODIN BAJT, soderzhashchij ee dlinu -- tut uzh prosto fizicheski strok dlinoj bol'she 255 byt' ne moglo). > Tak chto - ne znaju kak na Sun, ;) a na PC pervym i, > nadejus', poslednim redaktorom so strochnoj organizaciej > teksta dlja menja byl Leksikon. V promezhutke byli (ochen' > davno) redaktory ot Borlandovskikh Turbo-sred. No tut > osobaja programmistskaja specifika, ja ee vchera popytalsja > okharakterizovat' (khranenie strukturnykh elementov), i > potomu redaktory, rasschitannye na programmerov - vovse > ne pokazatel'. Mozhet byt', kto-to s AC-terminalom vmesto > graficheskogo monitora privyk tol'ko k monoshirinnomu > shriftu - chto zhe, budem vsem navjazyvat' i eto? Khotja > monoshirinnyj shrift INOGDA, nesomnenno, udobnee. Vy budete s menja smejat'sja -- no i na Sun'e, i na PC zhivu iskljuchitel'no v monoshirinnykh shriftakh i v redaktorakh so strochnoj organizaciej. > > Eshche po povodu poleznogo softa: ne imet' li sredstvo > > "esteticheskoj nastrojki" HIP-teksta, kotoroe > > edinoobrazno zamenjaet neskol'ko razlichnykh > > HIP-oboznachenij odnogo i togo zhe na variant, kotoryj > > konkretnomu pol'zovatelju blizhe? Naprimer, to zhe > > oformlenie konca abzaca, sintaksis kommentariev, > > kirillicu ili latinicu v vizual'no nerazlichimykh > > sluchajakh, maksimal'no dopustimuju dlinu "fizicheskoj" > > stroki i t. p. > > Konechno! > No prezhde, chem zapuskat' takoj "nastrojshchik", izmenjajushchij, > skazhem, oformlenie konca abzaca, nuzhno budet imet' > razreshenie Supervizora ;-(), to est' garantiju togo, chto > dannoe preobrazovanie primenimo k dannomu tekstu. To > est' opjat'-taki, voznikaet problema validacii i obshchikh > algoritmov, kotorye zhelatel'no vyzyvat' iz samykh raznykh > utilit, v tom chisle takikh vot validatorov. Zachem tut validatory i proch.? Eto kak raz takie preobrazovanija, kotorye nikakoj HIP-tekst v principe isportit' ne mogut. No mogut okazat'sja ochen' poleznymi, chtoby mozhno bylo pol'zovat'sja programmami, ponimajushchimi ne ljubuju iz etikh ravnocennykh oboznachenij odnogo i togo zhe. Skazhem, Vy sotvorili nechto, rabotajushchee s chisto abzacnym predstavleniem (nikakikh EOL, no est' simvol konca abzaca). A u menja vse teksty v strochnom predstavlenii i abzacy razdeleny pustoj strokoj. Tak zachem nam dlja vzaimodejstvija kakikh-to eshche supervizorov klikat'? M. G. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 янв 2000 18:24:57 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: О корректорах и о Супервизорах ;) -------------------------------------------------------------------------------- > > Так что - не знаю как на Sun, ;) а на PC первым и, > > надеюсь, последним редактором со строчной организацией > > текста для меня был Лексикон. В промежутке были (очень > > давно) редакторы от Борландовских Turbo-сред. Но тут > > особая программистская специфика, я ее вчера попытался > > охарактеризовать (хранение структурных элементов), и > > потому редакторы, рассчитанные на программеров - вовсе > > не показатель. Может быть, кто-то с АЦ-терминалом вместо > > графического монитора привык только к моноширинному > > шрифту - что же, будем всем навязывать и это? Хотя > > моноширинный шрифт ИНОГДА, несомненно, удобнее. > > Вы будете с меня смеяться -- но и на Sun'е, и на PC живу > исключительно в моноширинных шрифтах и в редакторах со > строчной организацией. Ну значит, это, как я и предполагал, вопрос программистской привычки. Но настоящий программист должен трудиться на благо пользователя - того самого корректора. ;))) И при этом мягко, но настойчиво ограждать пользователя от неверного, во вред проекту, использования своего блага ;)))))) Я надеюсь, все же, что вы не предполагаете _лично_ в привычном вам строчном и моноширинном редакторе выправить _весь_ корпус ЦСл текстов? А следовательно - должны ориентороваться не на свою привычку, а на привычку среднестатистического корректора ЦСл материалов. > > > Еще по поводу полезного софта: не иметь ли средство > > > "эстетической настройки" HIP-текста, которое > > > единообразно заменяет несколько различных > > > HIP-обозначений одного и того же на вариант, который > > > конкретному пользователю ближе? Например, то же > > > оформление конца абзаца, синтаксис комментариев, > > > кириллицу или латиницу в визуально неразличимых > > > случаях, максимально допустимую длину "физической" > > > строки и т. п. > > > > Конечно! > > Но прежде, чем запускать такой "настройщик", изменяющий, > > скажем, оформление конца абзаца, нужно будет иметь > > разрешение Супервизора ;-(), то есть гарантию того, что > > данное преобразование применимо к данному тексту. То > > есть опять-таки, возникает проблема валидации и общих > > алгоритмов, которые желательно вызывать из самых разных > > утилит, в том числе таких вот валидаторов. > > Зачем тут валидаторы и проч.? Это как раз такие > преобразования, которые никакой HIP-текст в принципе > испортить не могут. Но могут оказаться очень полезными, А если текст чуть-чуть подпорчен невнимательным корректором? Например, пропущены кое-где "абзацы" из двух концов строки? Автоматическая система - Супервизор ;-), когда пользователь захочет подвергнуть такой текст "эстетической настройке" оформления абзацев, должна как минимум предупредить его о том, что в случае наличия в тексте определенных особенностей настройка окажется некорректной и может привести лишь к увеличению хаоса. А если эта система еще и вумная - она должна сама сделать попытку исправить "особенности" или хотя бы громко заверещать при их обнаружении. Собственно, вы тоже полагаетесь на Супервизор, находящийся где-то среди ваших извилин ;)) Но давайте реально смотреть на вещи: мой супервизор - это уже немного не ваш, а у прилежной десятиклассницы, да и у "бумажного" корректора со стажем, такого устройства просто может не оказаться. Интерактивная система, кроме того, должна облегчить пользователю прохождение по тексту, обращая его внимание на все места, где вероятно наличие опасных особенностей. Не замечаете схожесть с той концепцией вертикального софта, что была мною предложена в RFC4? В качестве конкретной реализации интерактивного "эстетического настройщика" абзацев я предложил бы систему, не позволяющую пользователю без суперадминистративных прав запустить реальную подстройку, не просмотрев по отдельности все абзацы, содержащиеся в тексте. Разумеется, он должен иметь возможность перемещаться по абзацам взад и вперед и вряд ли должен иметь право реально при этом что-либо редактировать. Но до тех пор, пока пользователь не просмотрит весь текст - система должна отказываться применить требуемую "эстетическую настройку". > чтобы можно было пользоваться программами, понимающими не > любую из этих равноценных обозначений одного и того же. > Скажем, Вы сотворили нечто, работающее с чисто абзацным > представлением (никаких EOL, но есть символ конца абзаца). > А у меня все тексты в строчном представлении и абзацы > разделены пустой строкой. Так зачем нам для взаимодействия > каких-то еще супервизоров кликать? Потому что в данном случае преобразование тривиально. Хотя впоследствии, по идее, могут появиться требования наподобие запрета определенного начала или конца строки или требования, допустим, на зависимость длины строки от рядом лежащих и т. д. Тогда преобразование становится нетривиальным, и супервизор нужен - до тех пор, пока вы эти внезапно появившиеся требования не алгоритмизировали и не пришили эти алгоритмы "к месту". Помните требование расширяемости? Вот где оно, в частности, оправдывает себя. Но если перед Вашим запросом на такую настройку по тексту погулял сонный корректор - вы будете иметь дело с некоторым количеством разорванных в произвольном месте абзацев (пример из моей _реальной_ практики - поверьте, ужасное воспоминание, если учесть, что текста, который мне предстояло с тем корректором готовить, было без малого 10 мегабайт). А вот обратное преобразование из "строчного" в "абзацное" представление уже с гораздо большей степенью вероятности будет затруднено. По моей оценке - если бы Вы имели дело с той моей корректоршей, которая разрывала мне приблизительно каждый пятидесятый абзац, то в Вашем случае Вы будете иметь слитыми два-три из каждого десятка абзацев. Просто потому, что такое "разбитое" представление менее естественно для большинства людей. А если Вы наорете, настучите и натопаете на своего корректора, с требованием, чтобы он тщательно следил за абзацами - он непременно мало что обидится - но еще и испортит Ваш текст в прочих, самых удивительных местах. Когда я предусмотрительно догадался включить режим Track Changes в Word - я имел полную возможность с ужасом в этом убедиться. (Это я опять о только что упомянутом примере из реальной жизни. Причем текст тот изначально был именно в Вентурном формате - то есть в отношении обозначения абзацев представлял из себя именно то, с чем придется иметь дело в "строчном" HIP. Хорошо, что я догадался начать с эквивалентной конвертации всего хозяйства в Ворд. - Полагаю, что сэкономил на этом не один месяц мучений). ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 янв 2000 19:57:47 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC9: Славянская иероглифика -------------------------------------------------------------------------------- ----- Original Message ----- From: "Lev Tikhonov" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Saturday, January 29, 2000 12:40 PM Subject: RFC9: Славянская иероглифика > ... Гм. Насчет "простейшего случая". Идея совершенно левая и нетрадиционная > пришла в голову. А почему бы нам не придумать "иероглифический" способ > хранения ЦСл текста? Перечислить все основы и пронумеровать их. Например, > "агглъ" - (Основа 145 в форме 1), "аггеломъ" - (основа 146 в форме 7), > "творите" - (основа 12345 в форме 44), "сотворите" - ("со"+ основа 12345 в > форме 44). При условии поддержки этого начинания HIP можно было бы использовать в первую очередь как нормативный алфавит для такого словаря, используемый для его создания и редактирования. Тогда способ получения текста из хранилища был бы такой: 1) текст как последовательность "иероглифов" -> текст как последовательность слов в формате HIP 2) последовательность слов в формате HIP -> конкретное представление текста в издательской системе. HIP же можно разделить на два неперсекающихся подмножества: одно - для представления формантов словарных иероглифов, другое - для представления в инвариантном виде всех без исключения элементов форматирования, в том числе таких деликатных, как концы строк и абзацев ;) Тогда второе подмножество будет влиять только на второй этап преобразования текста. Вероятно, сам "HIP второго уровня" должен содержать, помимо информации о форматировании, также способ обозначения "иероглифов" как таковых (то есть ссылок на соответствющие элементы словаря). Если пойти по этому пути, будет утрачена непосредственная наглядность HIP, но, при наличии готового словаря, визуализатор такого "HIP-2" будет совершенно тривиальным и реализовываться для любой платформы за несколько часов. Зато - за счет утраты "клавиши F3" - мы приобретаем непробиваемую защиту от ошибок корректора и вообще сводим потребность системы в корректоре к потребности в стайке аккуратных десятиклассниц. Левъ. ЗЫ. 2Михаил. Вне зависимости от поддержки этой идеи - возможно, следует выделить в basicHIP еще и некоторый kernel, который используется для представления собственно слов. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 янв 2000 20:03:48 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" , Тема: Re: Православный календарь в интернете -------------------------------------------------------------------------------- Для читателей фонтлиста: ОЧЕНЬ ПОУЧИТЕЛЬНЫЙ ПРИМЕР ТОГО, КАК НЕ СЛЕДУЕТ ВЕСТИ ДЕЛА Два человека - наш постмастер и С. Хозяинов - одновременно сделали почти одинаковые программы "вечного" церковного календаря. Crossposted в font-list "Andrej Volcov" wrote in message news:949157355@p71.f3.n5009.z2.ftn... > *Welcome to the FreeBSD/i386, Lev*. Это к бесенку рогастому и вилястому ты меня приглашаешь в день Воскресный? > >> Я вот только не понимаю - чесо ради два разных человека одновременно > >> делают одно и то же? А потом еще жалуются на тяжелую жизнь и общую > >> перегруженность. > LT> > LT> А это вот - то самое, что я очень хочу не допустить в ЦСл делах. Если > LT> заранее четко не определиться, чего мы добиваемся - неизбежна двойная, > LT> тройная, пятерная работа и общая прегруженность, мешающая довести хотя > LT> одно дело до конца. > > Hе думаю, что мы с Сеpгеем как-то мешаем дpуг-дpугу довести дело до конца. Еще лучше, если бы вы делали одну программу - он красивый интерфейс, а ты для него - логику в dll. А захотел бы еще красивше интерфейс в своем Билдере склепать (если другого занятия себе не придумал бы) - вот и тебе бы пригодились твои же библиотечки. > Во-пеpвых, мы в отличии от господ-цеpковнославянщиков уже пpиблизились к концу. > Сеpгей мне написал позавчеpа, что свою пpогpамму (сам модуль) он уже > пpактически закончил -- тепеpь дело за базами. Я свою: вчеpа за ночь > pеализовал-таки функцию опpеделения пеpеходящих (пасхальных) пpазднований на > год. А зачем ты ее реализовывал параллельно с той же работой, проделанной Сергеем, пусть и в ином ключе? Что, его программа не умеет показывать пасхальные празднования? Hепеpеходящий годовой уже давно сделан. Опpеделение седмичных циклов - > сделано. Опpеделение гласа - такожде. Тепеpь еще тpетий годовой цикл (подвижные > не пасхальные) pеализовать -- и _календаpь_ в пpинципе готов. А интеpфейс я уже А зачем, когда Сергей сегодня вот на наших глазах "за кадром" это доделывает? Чтобы убедить себя самого в том, что ты крутой программист? Не знаю как ты сам - но я тебе заранее верю и считаю, что лучше бы ты сделал то, что еще никто до тебя не делал. И так, чтобы другие - вот хотя бы Сергей - смогли воспользоваться твоими результатами. > поменял. Конечно, я подумываю и о pассчете чтений, и о pазмещении там > тpопаpей/стихиp, поучений, и о житиях с иконами и т.п... Hо это все - в далеком > будущем, не тpебует алгоpитмических pассчетов (кpоме совмещения чтений) и, > собственно, уже не сам календаpь, а его pасшиpения. Интересно, не правда ли: идеи носятся в воздухе? Дело лишь за малым: не кидаться воплощать их всей толпой, расталкивая друг друга локтями. > Во-втоpых, мы пишем pазные вещи. Сеpгей пpислал мне свою пpогpаммку, она > совеpшенно дpугая, дpугой напpавленности. Я так понял -- по твоим наводкам он > делает ее в истоpическом ключе (ты, кстати, сам об этом пpямо и написал в > фоpваpде, насчет истоpиков институтских), с большими пpосчетами взад/впеpед, по Чего там считать, когда в VB есть встроенная фунция, печатающая день, выпадающий на любую дату, начиная с 100 г.? А формула Гаусса - она и в Африке формула.... > гpиг., юл, от сотв.м., ты хотел бы ее еще и в active компонент ее пpевpатить, Я хотел, да не знаю как, и Сергей, похоже, не знает. Хотя, конечно, желательно. В принципе, в VB это достигается выбором типа проекта в его свойствах. Боюсь, правда, что для уже сильно непустого проекта потребуются еще какие-то изменения. > чтобы использовать в сpеде WIN под дpугими пpиложениями. Моя -- я думаю вpед ли > понадобится вашим истоpикам, всевозможные pассчеты в далекое пpошлое (и в том > числе утопические), мне кажутся совеpшенно не нужными. Она pассчитана на > пpостых смеpтных, котоpым не нужно знать о 2 седмице по пентикостии в 7 веке, Андрей, ты же программист. Кая разница между 7 и 17 веком? Ну поставь настройку-ограничитель диапазона, как это сделал Сергей. > но котоpым хотелось бы знать, кто же пpазднуется завтpа, его тpопаpь, житие, > икону. Хорошо, не будем пришивать _этот_ материал к Сергеевой программе. А ты не трогай памяти новомучеников, договорились? От нас тут несколько ближе до институтской базы.... И постарайтесь с Сергеем договориться, чтобы ваши программы могли друг друга вызывать на любом дне по запросу... Можно и распространять их совместно. > Тем более, что последнее вpемя Глеб меня склоняет сделать из календаpя > мультимедийный типикон... Я, конечно, сопpотивляюсь как могу, но, думаю, его > pитоpический пыл таки доведет меня когда-нибудь до кондиции. :-) Тем более желательно взаимопонимание между твоей и сергеевой софтинами. > В свое вpемя, кстати, когда я pассчитал пасхалию и глас - Сеpгей попpосил у > меня нетмылом функцию опpеделения гласа -- я сpазу откликнулся, готов был даже > пpогpамный код (исходник) пpислать, но он у него все pавно не пошел бы, а си он > не знает. Hадеюсь, и он пpи случае, напpимеp, если pассчитает чтения, поступит Ты что, младенец? А dll для чего придуманы? Смотришь в своем билдере хелп "building dlls" или "dynamic-link libraries" - и делаешь, как написано. Скорее всего, тоже надо пару галочек поменять в свойствах проекта. > также. Так что мы pаботаем в несколько pазных напpавлениях, совеpшенно > дpуг-дpугу не мешаем, и не делаем никаких тpойных pабот. Пока что я вижу только планов твоих громадье (совпавших, кстати, с моими планами относительно сотрудничества с Сергеем, что, впрочем, неудивительно). А реально проделанная вами работа - на 90 % одна и та же (если не считать того, что ты, как новичок в Win32, похоже, потратил больше сил с меньшей отдачей). > LT> Справедливости ради надо сказать, что Сергей Хозяинов начал первым, а > LT> Андрей Волков уже потом схватился делать то же самое, > > Я, конечно, точно не знаю, но скоpее всего -- спpаведливости pади замечу -- я > начал пеpвым. Мне эта идея пpишла в голову года тpи назад, совеpшенно > самостоятельно, Ну точно младенец. Кому ж из православных компьютерщиков такая идея не "приходила в голову"? И только вы с Сергеем довели ее до чего-то законченного. Честь вам и хвала, только все же лучше было бы не дублироваться.... > пpо Сеpгея я узнал только месяц назад из этой конфеpенции, даже > когда я был в Москве и показал тебе пеpвую пpимитивную веpсию своего календаpя ....и тогда же я тебе пытался вякать о Сергее, но вяло, потому как не предполагал, что он так близок к результату. И тут же, не успел ты вернуться в Тамбов - Сергей вдруг объявился с предложением оттестировать его программу и поправить колоссальную календарную базу, которую он уже успел изрядно перелопатить самостоятельно. На самом деле впервые я его "протолкнул" сюда в ru.liturgica, когда она только возникла - в августе или сентябре. Удивительно, что ты его не заметил и не заметил моих комментариев по поводу самой идеи. Тогда уже Сергей готов был всех закидать своими вопросами, возникшими у него по поводу подкинутого мной ему кем-то в ПСТБИ набитого календаря за какой-то год. (Тогда же кстати я и решил впервые надолго "заткнуть" его любопытство трехтомником арх. Сергия (Спасского), но Забавин отсоветовал). Честно говоря, я не ожидал от Сергея такой продуктивности, учитывая, что он человек занятой. Предварительно он располагал лишь формулой Гаусса, а в вопросах православного календаря был абсолютная tabula rasa. > -- я еще не знал о pаботе Сеpгея. Идею той, котоpая сейчас, мне подал Слава > Чеpнов года полтоpа назад, когда я ему пpисылал свою пеpвую веpсию. зачем Чернов для того, что носится в воздухе? > Свою пpогpамму я начал писать pовно два года назад -- в янваpе 1998 года, все > тоpопился к Великому посту успеть... Успел? Под WIN32 я стал пpогpаммиpовать только > месяцев 10 назад, поэтому естественно, тогда я ее писал под DOS. Это тебе может > подтвеpдить из наших общих знакомых Чеpнов, моя благочестивейшая супpуга, и, в > каком-то смысле -- Илья Глухов (я ему ее показывал год назад, если он > вспомнит). Писал я именно в таком ключе, в котоpом пpодолжаю сейчас, и тpопаpи > туда вставлял, и жития с иконами собиpался... Hу, тепеpь pеализую это все под > 32 бита. Вот внимательнее читал бы конференцию, где являешься комодератором - был бы у тебя шанс не заниматься мартышкиным трудом и не учиться интерфейсу с кнопочками, а усовершенствовать свои алгоритмы и учиться оформлять их в dll. С тем, чтобы Сергей смог бы ими воспользоваться, и тоже не проделывал бы лишнюю работу. Будем надеяться, что это вам и всем нам послужит уроком, как милые православные тусовщики с успехом могут играть в лебедя, рака и щуку. Извольте впредь согласовывать свою работу, пожалейте силы ради результата. Ведь именно он, в конце концов, важен, а не сам процесс программирования или возни с билдерами. > LT> чтобы доказать, что С - рулез, а VB - маздай. И еще чтобы малость > LT> самоутвердиться как программер. > > :) Экий ты, все задеть ноpовишь... Hу да Господь пpостит! Спаси Господь тебя и Сергея. Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 янв 2000 20:39:52 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Re: я ЫЯввХЫдЯвСШ Щ Я уеаХвзЩкЯвСШ ;) -------------------------------------------------------------------------------- [Translit vnizu] Lev Tikhonov wrote: > > Зачем тут валидаторы и проч.? Это как раз такие > > преобразования, которые никакой HIP-текст в принципе > > испортить не могут. Но могут оказаться очень полезными, > > А если текст чуть-чуть подпорчен невнимательным > корректором? Например, пропущены кое-где "абзацы" > из двух концов строки? Автоматическая система - > Супервизор ;-), когда пользователь захочет > подвергнуть такой текст "эстетической настройке" > оформления абзацев, должна как минимум предупредить > его о том, что в случае наличия в тексте определенных > особенностей настройка окажется некорректной и может > привести лишь к увеличению хаоса. А если эта система > еще и вумная - она должна сама сделать попытку > исправить "особенности" или хотя бы громко заверещать > при их обнаружении. Особенность может возникнуть не только из-за вредных корректоров: вдруг это результат осмысленной правки? Скажем, стояла в конце строки лишняя фраза -- ее и убрали, а в результате получилась короткая строка внутри абзаца. Причем в конце -- точка, а следующая строка начинается с заглавной буквы. Ровно та же ситуация, которая возникает при ошибочной склейке абзацев. И от "вумной системы с попытками" тут один вред будет. > В качестве конкретной реализации интерактивного > "эстетического настройщика" абзацев я предложил > бы систему, не позволяющую пользователю без > суперадминистративных прав запустить реальную > подстройку, не просмотрев по отдельности все абзацы, > содержащиеся в тексте. Разумеется, он должен иметь > возможность перемещаться по абзацам взад и вперед и > вряд ли должен иметь право реально при этом что-либо > редактировать. Но до тех пор, пока пользователь не > просмотрит весь текст - система должна отказываться > применить требуемую "эстетическую настройку". Представим такую ситуацию: получил г-н NN после вредоносной корректорши HIP-файл. Но о HIP-формате он ничего не знает, а работает в своем редакторе ZZZ. Знает только, что HIP в ZZZ можно конвертировать, но перед этим надо пропустить через "эстетизатор" (потому что конвертор "привередливый"). Но "эстетизатор" что-то показывает и что-то требует править. И что бедному NN делать в такой ситуации? (И представляю инструкцию для девушек-наборщиц: "Набрать команду estetize -string novyj.hip когда покажется текст, надо кнопкой PgDn пробежать его до самого конца и выйти". Как в том анекдоте, когда системщик объяснял дамам из бухгалтерии, что пароль должен быть длинный и из разнообразных знаков, а потом увидел бумажку с "правильно выбранным" паролем, пришпиленную на самом видном месте -- "чтобы не забыть".) И еще такое соображение: HIP -- это формат не для наборщиков и корректоров, а скорее для исследователей. Или средство "экономии сил" -- чтобы не писать N(N-1) конвертор из каждого из N возможных форматов в каждый другой (где и чтение, и запись -- процедуры нетривиальные), а всего 2N конверторов, имеющих с одной стороны HIP, который и читается, и пишется без труда. А чтобы корректоры не портили абзацы, надо дать им соответствующий редактор. > > Скажем, Вы сотворили нечто, работающее с чисто абзацным > > представлением (никаких EOL, но есть символ конца абзаца). > > А у меня все тексты в строчном представлении и абзацы > > разделены пустой строкой. Так зачем нам для взаимодействия > > каких-то еще супервизоров кликать? > > Потому что в данном случае преобразование тривиально. Но это ж ровно та же ситуация, что с корректоршей! Из "строчной" эстетики надо сделать "абзацную". > Хотя впоследствии, по идее, могут появиться требования > наподобие запрета определенного начала или конца строки или > требования, допустим, на зависимость длины строки от рядом > лежащих и т. д. Вот это уже совсем не понимаю -- кто и зачем на формат представления ТЕКСТА будет накладывать требования, присущие только ВЕРСТКЕ? > А если Вы наорете, настучите и натопаете на своего > корректора, с требованием, чтобы он тщательно следил за > абзацами - он непременно мало что обидится - но еще и > испортит Ваш текст в прочих, самых удивительных местах. > Когда я предусмотрительно догадался включить режим Track > Changes в Word - я имел полную возможность с ужасом в этом > убедиться. (Это я опять о только что упомянутом примере из > реальной жизни. Причем текст тот изначально был именно в > Вентурном формате - то есть в отношении обозначения абзацев > представлял из себя именно то, с чем придется иметь дело в > "строчном" HIP. Хорошо, что я догадался начать с > эквивалентной конвертации всего хозяйства в Ворд. - Полагаю, > что сэкономил на этом не один месяц мучений). Это точно. Я тоже с некоторых пор, получив "исправленный" вариант текста, начинаю со сверки его со старым, чтобы проверить осмысленность правки. P. S. А что это за 10 мегабайт текста было? Это ж 5000 машинописных страниц! М. Г. > > Zachem tut validatory i proch.? Eto kak raz takie > > preobrazovanija, kotorye nikakoj HIP-tekst v principe > > isportit' ne mogut. No mogut okazat'sja ochen' poleznymi, > > A esli tekst chut'-chut' podporchen nevnimatel'nym > korrektorom? Naprimer, propushcheny koe-gde "abzacy" > iz dvukh koncov stroki? Avtomaticheskaja sistema - > Supervizor ;-), kogda pol'zovatel' zakhochet > podvergnut' takoj tekst "esteticheskoj nastrojke" > oformlenija abzacev, dolzhna kak minimum predupredit' > ego o tom, chto v sluchae nalichija v tekste opredelennykh > osobennostej nastrojka okazhetsja nekorrektnoj i mozhet > privesti lish' k uvelicheniju khaosa. A esli eta sistema > eshche i vumnaja - ona dolzhna sama sdelat' popytku > ispravit' "osobennosti" ili khotja by gromko zavereshchat' > pri ikh obnaruzhenii. Osobennost' mozhet vozniknut' ne tol'ko iz-za vrednykh korrektorov: vdrug eto rezul'tat osmyslennoj pravki? Skazhem, stojala v konce stroki lishnjaja fraza -- ee i ubrali, a v rezul'tate poluchilas' korotkaja stroka vnutri abzaca. Prichem v konce -- tochka, a sledujushchaja stroka nachinaetsja s zaglavnoj bukvy. Rovno ta zhe situacija, kotoraja voznikaet pri oshibochnoj sklejke abzacev. I ot "vumnoj sistemy s popytkami" tut odin vred budet. > V kachestve konkretnoj realizacii interaktivnogo > "esteticheskogo nastrojshchika" abzacev ja predlozhil > by sistemu, ne pozvoljajushchuju pol'zovatelju bez > superadministrativnykh prav zapustit' real'nuju > podstrojku, ne prosmotrev po otdel'nosti vse abzacy, > soderzhashchiesja v tekste. Razumeetsja, on dolzhen imet' > vozmozhnost' peremeshchat'sja po abzacam vzad i vpered i > vrjad li dolzhen imet' pravo real'no pri etom chto-libo > redaktirovat'. No do tekh por, poka pol'zovatel' ne > prosmotrit ves' tekst - sistema dolzhna otkazyvat'sja > primenit' trebuemuju "esteticheskuju nastrojku". Predstavim takuju situaciju: poluchil g-n NN posle vredonosnoj korrektorshi HIP-fajl. No o HIP-formate on nichego ne znaet, a rabotaet v svoem redaktore ZZZ. Znaet tol'ko, chto HIP v ZZZ mozhno konvertirovat', no pered etim nado propustit' cherez "estetizator" (potomu chto konvertor "priveredlivyj"). No "estetizator" chto-to pokazyvaet i chto-to trebuet pravit'. I chto bednomu NN delat' v takoj situacii? (I predstavljaju instrukciju dlja devushek-naborshchic: "Nabrat' komandu estetize -string novyj.hip kogda pokazhetsja tekst, nado knopkoj PgDn probezhat' ego do samogo konca i vyjti". Kak v tom anekdote, kogda sistemshchik ob'jasnjal damam iz bukhgalterii, chto parol' dolzhen byt' dlinnyj i iz raznoobraznykh znakov, a potom uvidel bumazhku s "pravil'no vybrannym" parolem, prishpilennuju na samom vidnom meste -- "chtoby ne zabyt'".) I eshche takoe soobrazhenie: HIP -- eto format ne dlja naborshchikov i korrektorov, a skoree dlja issledovatelej. Ili sredstvo "ekonomii sil" -- chtoby ne pisat' N(N-1) konvertor iz kazhdogo iz N vozmozhnykh formatov v kazhdyj drugoj (gde i chtenie, i zapis' -- procedury netrivial'nye), a vsego 2N konvertorov, imejushchikh s odnoj storony HIP, kotoryj i chitaetsja, i pishetsja bez truda. A chtoby korrektory ne portili abzacy, nado dat' im sootvetstvujushchij redaktor. > > Skazhem, Vy sotvorili nechto, rabotajushchee s chisto abzacnym > > predstavleniem (nikakikh EOL, no est' simvol konca abzaca). > > A u menja vse teksty v strochnom predstavlenii i abzacy > > razdeleny pustoj strokoj. Tak zachem nam dlja vzaimodejstvija > > kakikh-to eshche supervizorov klikat'? > > Potomu chto v dannom sluchae preobrazovanie trivial'no. No eto zh rovno ta zhe situacija, chto s korrektorshej! Iz "strochnoj" estetiki nado sdelat' "abzacnuju". > Khotja vposledstvii, po idee, mogut pojavit'sja trebovanija > napodobie zapreta opredelennogo nachala ili konca stroki ili > trebovanija, dopustim, na zavisimost' dliny stroki ot rjadom > lezhashchikh i t. d. Vot eto uzhe sovsem ne ponimaju -- kto i zachem na format predstavlenija TEKSTA budet nakladyvat' trebovanija, prisushchie tol'ko VERSTKE? > A esli Vy naorete, nastuchite i natopaete na svoego > korrektora, s trebovaniem, chtoby on tshchatel'no sledil za > abzacami - on nepremenno malo chto obiditsja - no eshche i > isportit Vash tekst v prochikh, samykh udivitel'nykh mestakh. > Kogda ja predusmotritel'no dogadalsja vkljuchit' rezhim Track > Changes v Word - ja imel polnuju vozmozhnost' s uzhasom v etom > ubedit'sja. (Eto ja opjat' o tol'ko chto upomjanutom primere iz > real'noj zhizni. Prichem tekst tot iznachal'no byl imenno v > Venturnom formate - to est' v otnoshenii oboznachenija abzacev > predstavljal iz sebja imenno to, s chem pridetsja imet' delo v > "strochnom" HIP. Khorosho, chto ja dogadalsja nachat' s > ekvivalentnoj konvertacii vsego khozjajstva v Vord. - Polagaju, > chto sekonomil na etom ne odin mesjac muchenij). Eto tochno. Ja tozhe s nekotorykh por, poluchiv "ispravlennyj" variant teksta, nachinaju so sverki ego so starym, chtoby proverit' osmyslennost' pravki. P. S. A chto eto za 10 megabajt teksta bylo? Eto zh 5000 mashinopisnykh stranic! M. G. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 янв 2000 21:42:49 От: "S. M. Hozainov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Православный календарь в интернете -------------------------------------------------------------------------------- ----- Original Message ----- From: Lev Tikhonov To: -=ORTHODOX-FONT=- Project Participants ; Sent: 29 января 2000 г. 20:03 Subject: Re: Православный календарь в интернете > Для читателей фонтлиста: ОЧЕНЬ ПОУЧИТЕЛЬНЫЙ ПРИМЕР ТОГО, КАК НЕ СЛЕДУЕТ > ВЕСТИ ДЕЛА > Два человека - наш постмастер и С. Хозяинов - одновременно сделали почти > одинаковые программы "вечного" церковного календаря. Лев, да бросьте это! Подумаешь, великое дело, сделали программы на одну тему. Ну и что? А сколько текстовых редакторов понаписано? А сколько калькуляторов? А сколько календарей разного вида? Программы Андрея и моя, хоть и на одну тему писаны, да разные. Разные подходы, разная реализация. Совпадают заявленные стратегические планы развития программ. Но это все, пока, мечты! Я начал писать программу где-то в августе. Я не ставил никакой цели и не стремился ее достигать (ну, как это происходит на производстве, когда, действительно, избегают дублирования). Мне просто было интересно. Думаю, узнай я о программе Андрея, я все равно писал бы свою. Предполагаю, что и Андрей поступил бы аналогично. Это -- творчество, а не работа! С уважением, Сергей Михайлович Хозяинов. smh@mail.ru http://stop.at/smh ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 янв 2000 22:27:28 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Православный календарь в интернете -------------------------------------------------------------------------------- > > Для читателей фонтлиста: ОЧЕНЬ ПОУЧИТЕЛЬНЫЙ ПРИМЕР ТОГО, КАК НЕ СЛЕДУЕТ > > ВЕСТИ ДЕЛА > > Два человека - наш постмастер и С. Хозяинов - одновременно сделали почти > > одинаковые программы "вечного" церковного календаря. > > Лев, да бросьте это! > Подумаешь, великое дело, сделали программы на одну тему. > Ну и что? > А сколько текстовых редакторов понаписано? > А сколько калькуляторов? > А сколько календарей разного вида? А вот для серьезного дела такой плюрализм смертелен. > Я начал писать программу где-то в августе. Я не ставил никакой цели > и не стремился ее достигать (ну, как это происходит на производстве, когда, > действительно, избегают дублирования). Мне просто было интересно. > Думаю, узнай я о программе Андрея, я все равно писал бы свою. > Предполагаю, что и Андрей поступил бы аналогично. > Это -- творчество, а не работа! Программы Ваша и Андреева - пока игрушки. А вот та система, что задумываем мы - серьезный проект. И если каждый будет относиться к нему как к своему личному творческому самовыражению, проект этот _гарантированно провалится_, нечего и браться. Не мы первые, не мы последние, к сожалению, подтвердим эту закономерность и окажемся просто очередной компанией болтунов. Относиться к такому делу надо как к тяжкой работе, за результаты которой мы несем ответственность - тем лучше, что не перед чьим-то кошельком, а перед Богом... И тем, кстати, страшнее. С уважением, Левъ. ЗЫ. Опять же сошлюсь на личный опыт: из предпринимавшихся в ПСТБИ проектов лишь малая доля была успешна завершена, в основном из-за типичного православного бардака, когда все работают практически забесплатно и потому каждый делает только то, что хочет и всячески самовыражается. Причем завершение каждого успешного проекта состоялось с проваливанием всех сроков и оказывалось практически чудесным событием, по молитвам свв. покровителей и десятикратным перерасходом финансовых вливаний из всяких фондов, после которых институт только чудом не разоряли по суду. Потому я и бьюсь так, чтобы предотвратить воспроизводство этого ужаса: тут никто нас не профинансирует и однократно, и молиться за нас пока что особенно не за что. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 29 янв 2000 22:50:24 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: я ЫЯввХЫдЯвСШ Щ Я уеаХвзЩкЯвСШ ;) -------------------------------------------------------------------------------- > > > Зачем тут валидаторы и проч.? Это как раз такие > > > преобразования, которые никакой HIP-текст в принципе > > > испортить не могут. Но могут оказаться очень полезными, > > > > А если текст чуть-чуть подпорчен невнимательным > > корректором? Например, пропущены кое-где "абзацы" > > из двух концов строки? Автоматическая система - > > Супервизор ;-), когда пользователь захочет > > подвергнуть такой текст "эстетической настройке" > > оформления абзацев, должна как минимум предупредить > > его о том, что в случае наличия в тексте определенных > > особенностей настройка окажется некорректной и может > > привести лишь к увеличению хаоса. А если эта система > > еще и вумная - она должна сама сделать попытку > > исправить "особенности" или хотя бы громко заверещать > > при их обнаружении. > > Особенность может возникнуть не только из-за вредных > корректоров: вдруг это результат осмысленной правки? Скажем, > стояла в конце строки лишняя фраза -- ее и убрали, а в > результате получилась короткая строка внутри абзаца. Причем > в конце -- точка, а следующая строка начинается с заглавной > буквы. Ровно та же ситуация, которая возникает при ошибочной > склейке абзацев. И от "вумной системы с попытками" тут один > вред будет. Ну не только вред. Например, она в таком месте заверещит и предложит корректору-оператору его исправить. В общем-то, это будет разумный совет - такую "осмысленность" надо доводить до конца и довыправлять весь абзац. Подобные места были самым распространенным камнем преткновения для разных "вумнейших" конвертеров из Лексикона. Кстати, в абзацно-ориентированном тексте и править ничего не надо будет в этом случае, а для строчно-ориентированного - это элементарный алгоритм, который можно инициировать путем нажатия на кнопочку в нужном месте. Только не просто можно, а прямо-таки необходимо в нашем случае. > > В качестве конкретной реализации интерактивного > > "эстетического настройщика" абзацев я предложил > > бы систему, не позволяющую пользователю без > > суперадминистративных прав запустить реальную > > подстройку, не просмотрев по отдельности все абзацы, > > содержащиеся в тексте. Разумеется, он должен иметь > > возможность перемещаться по абзацам взад и вперед и > > вряд ли должен иметь право реально при этом что-либо > > редактировать. Но до тех пор, пока пользователь не > > просмотрит весь текст - система должна отказываться > > применить требуемую "эстетическую настройку". > > Представим такую ситуацию: получил г-н NN после вредоносной > корректорши HIP-файл. Но о HIP-формате он ничего не знает, а > работает в своем редакторе ZZZ. Знает только, что HIP в ZZZ > можно конвертировать, но перед этим надо пропустить через > "эстетизатор" (потому что конвертор "привередливый"). Но > "эстетизатор" что-то показывает и что-то требует править. И > что бедному NN делать в такой ситуации? А вот этого именно мы не должны допустить. Передача в свежие руки любого текста на любом уровне и в любом "эстетическом состоянии" должна происходить только тогда, когда в нем гарантированно удалены все неоднозначности и ошибки, он вручную или программно отвалидирован и промаркирован. Если мы будем придерживаться сами такой четкой дисциплины - никому головная боль не грозит. А иначе - именнно наша забота как Супервизоров ;) будет расхлебывать все такие случаи. Не захотели это автоматизировать - так думайте головами и делайте руками каждый раз по новой. > (И представляю инструкцию для девушек-наборщиц: > > "Набрать команду > estetize -string novyj.hip > когда покажется текст, надо кнопкой PgDn пробежать > его до самого конца и выйти". Типично юниксоидное мышление. ;-) Миша, прошу: не поленитесь скачать хозяиновский "вечный" календарик, чтобы вы смогли, наконец, оценить современные стандарты интерактивности программы с пользователем. http://members.xoom.com/sergeymh/orthodox.html Чему там и кого нужно обучать? Внешний вид программы самодокуменирован - не стесняйтесь только мышкой потыкать и даже колесико на мышке покрутить, если имеется. При этом ровно ничего испортить вы там не сможете. А исходные данные - собственно месяцеслов - можете при желании поправить в %Month%.dat файлах. Но это мы с вами, а пользователи даже не должны подозревать об этой возможности. > И еще такое соображение: HIP -- это формат не для наборщиков > и корректоров, а скорее для исследователей. Или средство > "экономии сил" -- чтобы не писать N(N-1) конвертор из > каждого из N возможных форматов в каждый другой (где и > чтение, и запись -- процедуры нетривиальные), а всего 2N > конверторов, имеющих с одной стороны HIP, который и читается, > и пишется без труда. Ясно, что первое назначение HIP - именно то, что вы написали. Но тут же возникают массы сопутствующих задач, взвалив которые на себя, мы еще более приблизим общий результат. Если бы мы были наемниками, выполняющими техзадание - то непонятно, зачем бы нам высовываться и проявлять инициативу. А тут мы сами можем определить себе техзадание, и желательно оптимальным образом - оптимальным не для наших, простите, задниц, а для успеха дела. А чтобы корректоры не портили абзацы, > надо дать им соответствующий редактор. Который они по тому же Хозяиновскому правилу, на которое вы уже ссылались, непременно используют прямо противоположным его назначению способом..... > > > Скажем, Вы сотворили нечто, работающее с чисто абзацным > > > представлением (никаких EOL, но есть символ конца абзаца). > > > А у меня все тексты в строчном представлении и абзацы > > > разделены пустой строкой. Так зачем нам для взаимодействия > > > каких-то еще супервизоров кликать? > > > > Потому что в данном случае преобразование тривиально. > > Но это ж ровно та же ситуация, что с корректоршей! Из > "строчной" эстетики надо сделать "абзацную". > > > Хотя впоследствии, по идее, могут появиться требования > > наподобие запрета определенного начала или конца строки или > > требования, допустим, на зависимость длины строки от рядом > > лежащих и т. д. > > Вот это уже совсем не понимаю -- кто и зачем на формат > представления ТЕКСТА будет накладывать требования, присущие > только ВЕРСТКЕ? Ну например, запрет на дефис-перенос в конце строки, который здесь уже предлагался. Допустим, мы сейчас это не учли, а в некоторый момент необходимость его всплыла, когда соответствующий эстетизатор уже вовсю применяется. И вот у всех заинтересованных лиц появляется лишняя головная боль - помнить о том, что ваш эстетизатор несовершенен, и иногда оставляет недопустимые переносы в концах строк. Накопившись, такие головные боли вызывают застарелую мигрень и общий пофигизм в отношении компьютерных технологий, тетки-корректорши срываются, теряют остатки доверия к вам и становятся полностью неуправляемыми. > > А если Вы наорете, настучите и натопаете на своего > > корректора, с требованием, чтобы он тщательно следил за > > Это точно. Я тоже с некоторых пор, получив "исправленный" > вариант текста, начинаю со сверки его со старым, чтобы > проверить осмысленность правки. Ну не лучше ли употребить наше программерское искусство, чтобы создать защищенную среду для взаимодействия таких вот дэвушек и текста и покончить раз и навсегда с этой порочной практикой? > P. S. А что это за 10 мегабайт текста было? Это ж 5000 > машинописных страниц! См. www.orthodoxy.ru/pstbi - там далее по ссылкам база данных по новомученикам Российским. А занимались ею для бумажного издания. Задание было таково: у нас есть два месяца до сдачи книги, не могу ли я помочь внести правку? И мне был показан текст приблизительно в том виде, в котором он выставлен в интернете, только полнее раза в два, еще с Вентурными тэгами и разбитый на полторы сотни файлов (с тех пор, правда, база разрослась еще чуть ли не в два раза; было 7-8 тыс. человек, а стало 14 тыс). В результате издали книгу не через два месяца, а через полтора года, и не целую базу, а только половину. С тех пор воз и ныне там, второй половины пока что не предвидится, а по хорошему - нужно делать уже не второй том, а новый четырехтомник. А результаты моего труда над второй половиной (частично и над первой) давно расторгнуты и уничтожены озверевшими корректоршами. Знаете ли, одна занимается буквой А, вторая буквой Б, а всего их (корректорш) три с половиной и еще с четвертинкой.... Задача на сообразительность: когда и которая по счету примется, наконец, за букву Я? И если база удваивается за два года, что после этого придется делать с версткой буквы А? Дополнительные условия: буквы А-В к этому моменту будут уже сверстаны, Д, Ж и И приближаться к этому состоянию, остальные еще недовычитаны. Да, а еще главный редактор как раз к концу верстки буквы И велит вставить десяток статей на А.... Альтернатива этому бардаку одна-единственная: готовить текст как единый корпус и не подпускать к нему напрямую ни единого человека, способного сделать текст непригодным для машинной обработки. С уважением, Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 30 янв 2000 02:18:31 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Поддержка латыни как языка в word'е -------------------------------------------------------------------------------- Hi All Есть ли субж? Если нет, то еще меньше надежды на аналогичную поддержку ц.с. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 30 янв 2000 03:53:14 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Поддержка латыни как языка в word'е -------------------------------------------------------------------------------- > Hi All > > Есть ли субж? Если нет, то еще меньше надежды на аналогичную поддержку > ц.с. Non sequitur! Если латиняне не сделали этого, то сие лишь им в укор, а не нам в назидание. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 30 янв 2000 07:05:18 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Постмастеру и пр. умельцам для вебсайта -------------------------------------------------------------------------------- Heute biete ich einen Spezial- Warez Link der Extraklasse: Free Retail CGI- Scripts - http://retailcgi.4u.ru/ Hier finden sich Verkaufsversionen von CGI- Scripts zum Download. Hier gibt es: Ultimate Bulletin Board v5.42 extraclass bulletin board Top Sites Professional v3.04 extraclass top list AutoRank Pro v2.0.4 top list Go2! Search real spidering search engine RedirectPro come.to style redirection service ForwardPro cjb.net style subdomain forwarding service Links Manager v2.0 "mini Yahoo" script Anti-Leech v1.0 protect your links/filez Home Free v1.16 ultimate community building program Banner Manager v2.5 bannerexchange script CyberCart Pro v3.04 internet commerce system The Comish v2.02 advertising script e_Board v2.0 by Mike Bagneski bulletin board e_Chat v3.0 by Mike Bagneski excellent chat script Fantastisch! Einmalige Gelegenheit fur Kenner, die so etwas gebrauchen konnen fur ein Internet Projekt Эти вещи я даже скачивать не стану, потому как если и займусь когда-нибудь вебмастерингом, то только на ASP. Предупреждаю: у меня стоит баннерорезалка, а вообще-то в таких местах бывают порнушные баннеры. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 30 янв 2000 15:39:48 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Постмастеру и пр. умельцам для вебсайта -------------------------------------------------------------------------------- > > Heute biete ich einen Spezial- Warez Link der Extraklasse: > Free Retail CGI- Scripts - http://retailcgi.4u.ru/ Зачем же нам варезными скриптами заниматься. Полно и бесплатных. Не такие уж и хитрые вещи нам необходимы. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 30 янв 2000 19:55:35 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC6: Expert Software Shell & RFC4.1 - Vertical Software -------------------------------------------------------------------------------- Злравствуйте, Михаил! > Поскольку не работал с Word'ом сколько-нибудь серьезно, то > не знаю, насколько мощный в нем макроязык, как набор > макрокоманд взаимодействует между собой и насколько трудно в > нем разбираться и что-нибудь исправлять, если результат > оказывается неверным. Нормальный язык и превосходный встроенный отладчик. Очень похоже на среду более вам близкую - борландовский Билдер. Я считаю, что без визуальной RAD-среды по нашим временам ни одну _сложную_ задачу решить нельзя. Только выбор визуальной среды - все равно вопрос вкуса, и если вы хорошо знаете Борланд - вряд ли нужно осваивать M$. Хотя тем же Вордом как черным ящиком для обработки текста бывает полезно воспользоваться и из Борланда. Надо только проникнуться самим принципом: не изобретать неделями велосипед ради экономии нескольких секунд (а на исключительно сложных задачах - и минут, и даже часов) в рантайме. Хотя как заманчиво бывает ради самоутверждения написать алгоритм, выполняющийся за две секунды вместо четырех, и как многие на это клюют, тратя на это недели! > Перерабатываемый текст рассматривается как > последовательность символов, на которой стоит "активная > точка", постепенно ползущая от начала последовательности к > концу. Эта "активная точка" имеет несколько внутренних > переменных с числовыми значениями; вначале все они равны > нулю, а сама точка стоит в самом начале последовательности. > > "Программа" (набор правил замены) состоит из 5-компонентных > записей (скажем, А-Б-В-Г-Д), где А, Б, В -- конечные > последовательности символов, Г -- набор условий на значения > внутренних переменных (сравнения с константами), Д -- набор > операций над внутренними переменными (присваивание им > констант и увеличение/уменьшение на 1). > > Программы выполняется так: ищется правило, у которого > выполнены все условия (Г) и часть А совпадает с начальным > отрезком обрабатываемой последовательности после активной > точки. Если таких правил несколько, выбирается правило с > самой длинной частью А. После этого часть А из обрабатываемой > последовательности убирается, часть Б вставляется перед > активной точкой, часть В -- после активной точки, и к > внутренним переменным применяется набор операций Д. После > этого процесс повторяется. Вот что-то у меня отказала фантазия, и я тщетно пытаюсь понять, какую роль в вашей системе играет "активная точка"? По-моему, роль эта сводится к тому, что результат очередной замены тут же встраивается в цепочку, и к нему точно так же применяется этот алгоритм. Правильно я понял? Конечно, любой алгоритм воспроизводим в ворде - если хотите, я воспроизведу ваш за денек (предупреждаю сразу: работать будет медленнее в сто крат), но все преимущество Ворда в том, что лн сам по себе - огромная библиотека текстово-ориентированных функций. Все то, что там может сделать мышкой и клавиатурой самый продвинутый пользователь, можно сделать и программно. Мало того, не зная собственно языковой конструкции, можно получить ее прототип в режиме "Macro -> Recording" или, как в любом RAD, поискать его по ключевым словам в броузере объектов. Это я к тому пишу, что гораздо легче (в смысле естественнее) в Ворде применять просто глобальные замены во всем тексте, не утруждая себя заботой о точке вставки, хотя при желании можно помнить и сколько угодно таких точек и участков текста - на то есть объект Range и всякие структуры из него. На этом принципе основан макрос Хозяинова, о котором он здесь уже писал. Такой же, кстати, принцип и у Stand-alone перекодировщика Хамстера АКА Димы Смирнова (см. setup в его архиве, у меня правда на Win2k не встал), хотя я его в свое время тоже предупреждал не изобрететь велосипед, а просто создать таблицы для некоторых шрифтов. Насколько для вашего алгоритма принципиально то, что результат замены может тут же обрабатываться, или Вы, как правило, тут же блокируете эту обработку флажками Г? Причем, даже если в Ворде речь идет об обработке голого текста, естественнее не запоминать в отдельных структурах атрибуты каждого отдельного символа или участка текста, а просто выделять их разнообразными средствами форматирования, присущего Ворду, благо, что поиск и замена работают и по этим атрибутам, и даже по wild-картам. Понятно, что форматированный текст будет полуфабрикатом, а перед выдачей результата все эти специфические Вордовские выделения следует как-то интерпретировать, а то они пропадут при сохранении Text-Only. Хотя, поворюсь, при желании Ворд прекрасно работает и с двоичными файлами, собственно, это не сам Ворд, а VBA- dll., вызываемая из практически любого Офисного приложения, и даже сам VB как виртуальная машина работает через нее. > Сам набор команд хранится в текстовом файле, причем > программа может попутно его отсортировать. В Ворде для сортировки есть один (виртульный, конечно же, но это не заметно) встроенный метод для массы объектов - хоть для строчек текстового файла, хоть для двадцать пятого столбца таблицы. > Обычно для реализации каких-либо преобразований текста > его приходится последовательно обработать несколькими > (обычно двумя-тремя) программами такого рода. Тогда я в прошлом письме погорячился, и сам работаю в другой парадигме. Эта ваша цитата свидетельствует, что вы фактически программируете для созданной вами же виртуальной машины. Конечно, я программирую не для нее, но для более распространенной виртуальной машины - Ворда. Конструктиваное предложение: если вы беретесь реализовать все без исключения алгоритмы над ЦСл текстами в вашей виртуальной машине - я могу сэмулировать вашу машину в Ворде и сделать ваши "программы" исполняемыми там. Это совсем не сложно. Но только если мы останавливаемся на вашей виртуальной машине. Смотрите: я боюсь, что никто, кроме вас, под нее программировать не сможет и не захочет. А под Вордом некоторые текстово-ориентированные вещи гарантированно делаются проще и естественнее, чем у вас. И специалистов по Ворду гораздо больше, чем по вашей системе ;-) > Когда такой набор программ отлажен, пользователю про > детали системы можно и не говорить, спрятав весь > внутренний механизм в один bat-файл с двумя параметрами: > что читать и куда писать. (Ваш набор макрокоманд тоже > ведь, скорее всего, "спрятан", и пользователю сообщается > лишь, куда надо нажать, чтобы все сработало.) Именно так. Но "продвинутый пользователь", как и в случае батника, может исполнять команды и интерактивно из некоей консоли в отладчике в режиме останова программы или пошагово. > (Выше было ПОЛНОЕ описание программы, недостает лишь > описания ее опций и формата самих команд. Но если от > пользователя не требуется править алгоритм, то это > и не нужно.) Если мы остановимся на эмуляции вашей виртуальной машины - я, конечно, попрошу вас выслать эти описания. Хотя ваши батники точно так же могут быть вызваны из Ворда же. Смысл эмуляции Вашей машины - в применении вашей технологии к форматированному, внутри Ворда хранящемуся тексту. > > А вот алгоритмы на C, если вы их рано или поздно > > формализуете, все равно окажутся невостребованными > > в Ворде, потому что для автоматизации своих действий > > у него есть свой встроенный макроязык. Впрочем, если > > вы пренебрежете "универсальностью" и все же оформите > > их в dll - ими можно будет пользоваться и из Ворда. > > Никогда dll (и вообще под Win) не программировал, поэтому > нужна информация о том, как организуется интерфейс. У меня > Borland C++ (пятая версия). Не прислал бы кто-нибудь "рыбу" А на Билдер вы не могли бы перейти? Во всяком случае высылаю вам пример некоей dll на MS C++ с исходниками и некоей тестовой программой на VB же, оценивающей время построения множества Мандельброта. Расчетная часть в dll. Попробуйте эту dll откомпилировать в Борланде. (Предупреждаю, чтобы не вызывать необоснованного восхищения - все это не мое, а взято с компакта к какой-то книжке по VB). > для изготовления этого самого dll (для какого-нибудь > простого примера, но чтобы было взаимодействие с Word'ом)? > Или это уже нечто нетривиальное? Из Ворда эта dll может быть вызвана точно так же, как и из VB, путем использования тех же ее вызывающих исходников на VB(А). И Ворд точно так же сам, без использования сишных dll, умеет строить фракталы, только еще медленнее. А если Вас интересует, как вызывать, наоборот, Ворд - то это тоже можно. Поскольку сам этого не делал, согу лишь отослать к MSDN. Если не найдете сами - могу поискать. В любом случае это многократно проще делать с помощью Билдера. Кстати и в его хелпе это наверняка есть. > > В "моей среде" алгоритм уже сам по себе почти документация: > запись типа > > А/Б// Ну не совсем. "Почти документация" - это скорее у Хозяинова и у Смирнова. А вот у вас сложность в том, что очередное преобразование может применяться немедленно к результату предыдущего. > > И так и не сможем никогда пристегнуть к этому делу менее > > квалифицированных людей без риска для текста. Этим надо > > заниматься прямо сейчас, и не дергаться сразу писать > > вертикальные конвертеры, чтобы не обрастать балластом, > > который, возможно, придется переделывать для совместимости. > > Сперва надо "заморозить" стандарт представления текста. > (А на вопросы по HIP откликов почти нет...) За перепиской я пока только до середины дочитал RFC2.2 Пока все нормально. > Конечной-то оно конечной, но не то чтобы уж очень маленькой... > Вопрос в том, в каких точках сидит основная масса реально > существующих текстов, чтобы наши "повышатели" имели что > повышать. > Снова вопрос сильно упирается в то, что же мы реально > имеем в набранных текстах. Вот я и пытался начать с классификации текстов, а вы, первоначльно поддержав и сделав несколько ценных замечаний, впоследствии перешли к скептическим ухмылкам. Ну что, возвращаемся к совершенствованию RFC3 и RFC5? У всех ли они есть, или повторять? > > И что касается конкретно ударений - для начала каждой > > реальной верстке понадобится свой алгоритм "собирания > > сливок". Это если мы не хотим создавать "список всех > > слов" от начала и до конца, что является само по себе > > весьма сложной задачей. > > Почему свой? И почему "сложной задачей"? К конвертору > RTF -> HIP добавить сохранение мягких переносов труда > вовсе не составляет (вставить пару строк в программу), > а написать средство для составления словаря переносов > по такому HIP -- работы максимум на полдня. Значит, за Вами - стандартизация такого HIP, и настойчивое напоминание всем о том, что тексты, содержащие мягкие переносы, следует конвертировать именно в такой вот расширенный HIP. Кстати, в случае принятия этого подхода - за Вами же поддержка нормативного словаря переносов, который будет лишь пополняться с каждым новым текстом. Идет? > Имея весьма смутное представление о существующих системах, > все же опасаюсь нагородить 10000 полочек под 20 предметов. > Хоть какой-нибудь бы список для начала, пусть самый > неформализованный! > > (И второй список -- реально существующих тестов.) Бросим клич в список и в литургику? Но желательно было бы хоть в общих чертах специфицировать нашу классификацию, чтобы те, кто дает нам информацию о факте наличия текстов, могли бы помочь и сразу хотя бы в какой-то мере их классифицировать. > > Угу. А если в реальном тексте есть особенности, которые > > вынуждают его сильно упростить для того, чтобы мы смогли > > его конвертировать имеющими средствами? В пределе-то все > > тексты "наши" путем их низведения до голого русского > > набора.... ;-( > > Скажем, "TeX с особенностями" он и есть "TeX с особенностями". > Почти наверняка в каждом тексте будут свои особенности. Даже > если в целом использавался один и тот же TeX и один и тот же > ц.-сл. пакет. И "стандартизовать формат" в этом случае может > только тот, кто эти тексты реально видит -- иначе нельзя > отличить "особенности" от "закономерностей". Даже "до голого > русского набора" свести без этого не получится. Конечно, и именно поэтому я предлагаю вам не полагаться целиком на пакетные утилиты - просто потому, что без операторов в этом деле все равно не обойтись. А интересные ваши алгоритмы точно так же могут быть использованы и из Ворда - не знаю, как из ТеХ. Единственное, что вред от деятельности операторов хорошо бы минимизировать, но... я уже зацикливаюсь. ;) > Идея тут такая: иметь для начала хотя бы один формат, в > котором можно представить всю полноту текстовой информации > (например, HIP). Иметь полное и подробное описание этого > формата. Тогда тот, кому потребуется работать с TeXовскими > текстами, будут иметь возможность написать СВОИ конверторы > (под СВОИ особенности набора), чтобы через наш формат > получить доступ к другим форматам и (или) издательским > системам. От людей "со стороны" (не работавших с ДАННЫМ > TeXом и ц.-сл. пакетом -- а то и с ДАННЫМИ текстами!) в > этом случае помощь вряд ли будет. Правильно. Если вернуться к классификации, предложенной в RFC3, то это - уже тексты третьей категории, и для них (пока что) нет другого пути, кроме удаления (или комментирования) форматирования, специфичного для издательской системы. Подробнее о них в RFC5 > А если особенности состоят в том, какие элементы > собственно текста присутствуют или отсутствуют -- > то это уже совсем другой вопрос. Такой текст ОБЯЗАН > конвертироваться в HIP (или другой стандарт) с > сохранением всех этих особенностей, и уже в недрах > нашей системы "повышаться уровнем". А это - тексты категории 2), и о них-то я и пытаюсь вести речь. Почему нельзя заниматься их классификацией параллельно специфицированию HIP? Я ведь именно это пытался делать, публикуя разные по содержанию RFC одновременно. Любой реальный ЦСл текст характеризуется двумя сложными параметрами - местом его в формальной классификации RFC3 и в технологической RFC5 Остается только на основе этих двух документов попытаться создать "опросный лист", с которым и собирать информацию в реальных и виртуальных компаниях. А попутно - совершнствовать сами документы. Самое главное - не превращать работу в жесткую линейную цепочку, когда семеро постоянно ждут одного, и меняется только этот самый один-единственный трудяга. > Конвертору не должно быть дела до "состояния" текста. > (В Вашей терминологии -- конвертор есть горизонтальный > софт, а "нормативные состояния" различаются по вертикали.) Да, здесь я отошел от своей же терминологии. Конечно, я вел речь о вертикальном софте. > > А вот фраза "подразумевается, что оба формата как-то уже > > стандартизованы" означает ли, к моей радости, ваше > > признание необходимости _множественных_ стандартов? > > Без вопросов! Но при условии взаимной конвертируемости. > (И, вообще говоря, тут с одним-то форматом уже месяц > разбираемся...) А попутно выясняем еще множество очень важных вопросов. > (Но в целом весь этот порочный круг не такой уж дорогой; > хотя что это действительно порочный круг, а не прогресс > на благо общества, здесь считают практически очевидным.) IMHO, только из-за повальной любви к свободе "от чего-то", а не "для чего-то". > > Хм. Я-то спрашивал не об увлекательном процессе программирования, а о > > конечной цели. Сколько вам потребуется времени, чтобы, не адаптируя ваш > > инструментарий к нашим виндовозным запросам, сконвертировать 90% > > существующих ЦСл текстов в HIP? И не является ли это время неоправданно > > большим, настолько большим, что, может быть, предпочли бы переложить часть > > работы на наши и еще чьи-то плечи? > > Без "повышения уровня" и имея все тексты в RTF (в любых шрифтах и > кодировках, пусть пока и неведомых) -- несколько дней. (Зависит, > конечно, от числа разных шрифтов и кодировок.) А я спрашивал о реальных, а не о тепличных условиях. Вопрос не снимается. > Тут два разных аспекта -- горизонтальный и вертикальный. > Я сначала хочу понять, можем ли мы все "нормализовать" > по горизонтали и какие конверторы для этого потребуются. > При этом как раз "упрощать" крайне не хочется. Значит, все наше непонимание - из-за того, что мы уделяем первоочередное внимание разным предметам: я вертикальному преобразованию, а вы - горизонтальному. В таком случае, тем более надо уделить первоочередное внимание сбору реальных текстов и их раскладыванию "по полочкам". Ну что, кидаем клич? Только для этого действительно надо создать вебсайт, откуда все желающие могли бы загрузить результаты нашей деятельности по сбору и обработке текстов, хотя бы для того, чтобы сами легче с ними расставались. > > > В случае обнаружения каких-либо проблем соответствующее место в > > > выходном файле будет помечено символом "?". Так годится? > > > > Вот это уже хуже. Альтернативные тэги лучше однозначно, чем эти вопросики. > > Причем желательно не смешивать тексты, где альтернативные тэги - результат > > работы валидатора и тексты, где они - результат работы повышающего уровень > > текста конвертера. Формально между такими текстами разницы нет, но > > фактически для человека-корректора, снимающего расставленные программой > > тэги, это крайне важно для того, чтобы правильно управлять своим вниманием. > > Стоп-стоп. Во-первых, лучше бы без "конверторов, > повышающих уровень". Пусть каждая программа делает Ага, сами себе противоречите? А я в данном случае просто описАлся и имел в виду, конечно же, только вертикальный софт. ;-) > что-нибудь одно, но хорошо. А вопросики могут > возникать в трех случаях: > 1) "горизонтальный" конвертор обнаружил нечто неконвертируемое > 2) валидатор обнаружил нечто странное > 3) повышатель уровня не может однозначно выбрать вариант > > При этом "альтернативный тег" обязан появиться в случае 3), > но в случаях 1) и 2) -- не всегда. Например, проверяет > валидатор букву "ъ" -- и видит слово "дуъа" (вместо "духа" -- > кнопки были рядом, вот и опечатка). И какой альтернативный > тег тут ставить? Если совсем умный - то выбор из "духа", "дуба" или "дума", если просто умный - то вопросик перед словом "духа", если глупый - перед словом "дуъа" или перед знаком "ь". Только, может быть, вместо вопросика ввести специальную альтернативу, означающую запрос ввода? Тогда проверяльщик всегда сможет вызвать эту альтернативу и ввести слово вручную. Если стоит вопрос - эта альтернатива обязательна, а для всех прочих альтернатив - лучше подавить эту возможность, пока не введен администраторский пароль (единственный, конечно, раз за сеанс). Суперадминистратор же должен уметь вызывать эту альтернативу для любого слова. И еще учтите, что виндовый утилизатор тэгов непременно будет вместо вашего вопросика рисовать на экране просто сомнительную букву или слово 20-м, скажем, кеглем и свирепо-ядовитым цветом. С уважением, Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 30 янв 2000 21:16:07 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: OFFTOPIC -------------------------------------------------------------------------------- Пощю сюда, в первую очередь для Волкова и Хозяинова. Актуально в первую очередь пока что для них. Правильнее было бы в ру.литургику, но боюсь, что Забавин заплюсует. Взято вот откуда http://www.orthodoxy.ru/navigator/dareware.htm DareWare - бесплатный сыр? Читал я тут недавно газету "Компьютерная Россия". В ней иногда слово Бог с большой буквы пишут, один раз из десяти, да и то только потому, что издатель - Динар Хисамов(no comment), вобщем, газета из тематических не самая плохая. Сайта своего нет, есть только п/я comprus@services.ru. И вот какую интересную информацию там напечатали. На сайте apollo.mp3-2000.com лежит совершенно бесплатная программа Apollo, предназначенная для прослушивания mp3-файлов. Программа - одна из лучших в своём классе, как говорят те, кто слушал. Но я сам не слушал, и вот почему. Программа бесплатная, но она не freeware, т.е. абсолютно и безусловно бесплатная, и не shareware, которая может поработать немного, а потом вежливо попросить денег. Программа Apollo - dareware. Dare по-английски - осмелиться, дерзнуть. Программисты, пишущие и распространающие эту "дармовщинку", ставят своим пользователям только одно условие: согласиться с неким набором пропагандируемых автором мыслей. Согласился - пользуйся. Пользуешься - согласился. Вот список всего святого, что есть в жизни автора Apollo, молодого финна Хейки Илинена, и с чем должны согласиться пользователи его плейера: "Любой человек волен удовлетворять свои сексуальные потребности, пока это происходит на добровольной основе и при взаимном согласии сторон. Любая женщина имеет право на аборт, если она приняла такое решение. Свобода людей в использовании контрацептивов не должна ограничиваться." Тех, кто со всем этим не соглашается, общечеловеки называют ханжами и лицемерами. А я вот не хочу быть настоящим ханжой и лицемером, поэтому не то, что слушать что-то этим плеером, я и на винт свой его не пущу. Обойдутся. Выводов из существования и развития dareware можно сделать не один, а сразу два. Во-первых, настало время внимательно читать все эти непонятные текстики наподобие лицензионного соглашения при установке новых программ, а не нажимать сразу и без раздумий "I agree", как мы давно уже привыкли. Могут и свинью подсунуть. Во-вторых, византийские программисты уже давно славятся своими freeware и shareware программами, небольшими, но во многом превосходящими качеством зарубежные аналоги. Будем надеяться, что далеко не все они безнадёжные западники и абортолюбы, и появится скоро где-нибудь на download.ru наше, правильное dareware, с нашими, правильными мыслями! А кто сам не может, подскажите друзьям и знакомым ещё один вид борьбы за наши ценности. Пусть наши оппоненты сами становятся ханжами и лицемерами, если начнут пользоваться классными программами, не соглашаясь при этом с авторами. Сильно хуже от этого уже никому не будет. Д.Калугин ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 31 янв 2000 11:33:40 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Kommentarii i rasshirenija - и опять про иероглифику и нормативный словарь -------------------------------------------------------------------------------- Здравствуйте, Михаил. Вот решил перечитать то, что не успел вовремя прокомментировать. > 3. Rasshirenija sistemy. > > 3.1. Vse sushchestvennyje elementy CS-fajla (krome sobstvenno > kommentarijev) mozhno razbit' na dva klassa: te, kotoryje > otnosjatsja k tekstu (simvoly) i te, kotoryje vlijajut na vjorstku > ("vneshnij vid krasivoj raspechatki"), no ne menjajut sam CS-tekst > (komandy ustanovki kakih-nibud' parametrov). Dlja rasshirenija > vtoroj gruppy predlagajetsja ispol'zovat' mehanizm kommentarijev. > Dlja pervoj -- drugoj sintaksis. А на самом деле, есть еще более существенное деление - не морфологию и более высокие элементы организации текста. И морфологемы вполне поддаются кодификации в некоем словаре... это я все опять про иероглифику ;) Соответственно, kernelHIP - обозначения, используемые для кодирования именно морфологем, а все остальное... ну в рабочем порядке именуем HIP-2. При принятии этого подхода (и, т. о., отказе от принципа наглядности текста в пользу его защищенности), у нас значительно вырастает запас символов, ибо для обоих подмножеств HIP становится возможным использовать одни и те же обозначения, ибо, очевидно, любые визуализаторы и любые конвертеры будут работать с двумя независимыми источниками - собственно текстом в HIP-2 и словарем в kernelHIP, ссылки на который необходимо сделать элементом HIP-2. При непринятии - все равно имеет смысл создавать словарь, пусть не морфологический, а тупо накапливающий все формы и действующий по методу brute force. Чтобы каждая конкретная правка обогащала этот словарь новыми нормативными формами слов, и в корруктуры предлагала бы в первую очередь из этого словаря. А еще понадобится механизм централизованного хранения такого словаря и его пополнения пакетами результатов. С другой стороны, если все-таки сэкономить символы, можно будет иметь и визуализацию в виде просто HIP - plain text. А для экономии символов очень правильный принцип введен был ниже в исходном письме. Тогда в чем же проблема с "тэгами незалэжности"? Их ведь тоже можно рассматривать как разновидность комментария. > 3.2. Komanda "konec abzaca" otnositsja k pervoj gruppe, > togda kak "mjagkij perenos" -- skoreje ko vtoroj: naprimer, %{-}. > Iz-za potencial'noj chastoty etogo ob'jekta mozhno dazhe > vvesti osobyj uproshchjonnyj sintaksis %- (punkt 1.5). Конец абзаца делаем элементом HIP-2, а мягкие переносы - kernelHIP. Хотим - показываем их, не хотим - нет. > 3.4. Logicheski raznica mezhdu &{...} i ?{...} takaja: v pervom > sluchaje my znajem, chto za simvol imejetsja v vidu, no, mozhet > byt', poka chto etot simvol v sisteme ne standartizovan i > nazvanije problizitel'noje ili opisatel'noje. A vo vtorom sluchaje -- > simvol sovershenno neizvestnyj, nechitajemyj ili somnitel'nyj. > V chastnosti -- "al'ternativnuj teg". Согласен. Но вот этот ваш "вопрос" - только один из вариантов "альтернативного тэга". Собственно, это и было ваше изначальное предложение, которое я поначалу проморгал. С уважением, Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 31 янв 2000 12:13:10 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Fw: (***) (ПОСТМАСТЕРУ) -------------------------------------------------------------------------------- Привет Lev Tikhonov , -- 28 января 2000 г., 21:08:24, ты писал: >> У.... фидошники блин. Автомат нельзя натравить на мой адрес чтобы >> проблемные письма убивать? LT> Ты Андрей не смотри - он вообще-то не злобный, а просто усталый. Это Димитрий так ругается...? Хорошо....... С сегодняшнего дня "проблемные письма" будут пересылаться на cityline.ru в течении четырех дней, потом удаляться. ФИЧА: Причем даже если будут отосланы, все равно будут и будут пересылаться.... пока 96 часов не иссякнет.. :-))))) >> А как подписаться на hamster@cityline.ru ? LT> Подпиши, а? Уже давно подписал. =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 31 янв 2000 12:16:23 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: O prokisanii -------------------------------------------------------------------------------- Привет Alexander V. Voinov , -- 29 января 2000 г., 5:37:41, ты писал: AVV> Вынужден констатировать, что ни одно письмо в этой кодировке я прочитать AVV> не смог. Несмотря на арсенал разных конвертеров. :-( А я поменял в твое письме кодировку на ISO-8859-5 все почиталось. The Bath! 1.34a AVV> Mikhail Grinchuk wrote: >> >> ґчяЮчу ЦБЮч! >> > > їшчЕч яЦтуБ, уАшь щпХ "ьщрпЮьпщБщКы" БузАБ эчжуБ ъЮчзьАщЦБЛ> =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 31 янв 2000 12:33:21 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: RFC6: Expert Software Shell & RFC4.1 - Vertical Software -------------------------------------------------------------------------------- Привет Mikhail Grinchuk , -- 29 января 2000 г., 15:39:31, ты писал: >> А вот алгоритмы на C, если вы их рано или поздно >> формализуете, все равно окажутся невостребованными >> в Ворде, потому что для автоматизации своих действий > >> у него есть свой встроенный макроязык. Впрочем, если >> вы пренебрежете "универсальностью" и все же оформите >> их в dll - ими можно будет пользоваться и из Ворда. > > Никогда dll (и вообще под Win) не программировал, поэтому > нужна информация о том, как организуется интерфейс. У меня > Borland C++ (пятая версия). Не прислал бы кто-нибудь "рыбу" > для изготовления этого самого dll (для какого-нибудь > простого примера, но чтобы было взаимодействие с Word'ом)? > Или это уже нечто нетривиальное? Поставь не пятый борланд, а четвертый си бильдер (их же) -- там есть и проект, и пример, и т.п. На пятом это неуклюже. =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 31 янв 2000 12:35:24 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: Постмастеру и пр. умельцам для вебсайта -------------------------------------------------------------------------------- Привет A A G , -- 30 января 2000 г., 15:39:48, ты писал: >> Heute biete ich einen Spezial- Warez Link der Extraklasse: >> Free Retail CGI- Scripts - http://retailcgi.4u.ru/ AAG> Зачем же нам варезными скриптами заниматься. Полно и бесплатных. AAG> Не такие уж и хитрые вещи нам необходимы. Да ну их нафик вообще с ихними скриптами. :-) Кстати, то, что ты просил, я уже написал. Как соберешься делать - пиши, пришлю небольшую инструкцию. Ты сервер локально еще не поставил? =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 31 янв 2000 17:50:45 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Re[2]: Постмастеру и пр. умельцам для вебсайта -------------------------------------------------------------------------------- На этой неделе займусь. А над дизайном уже думаю. Хотя, какой из меня дизайнер. > > >> Heute biete ich einen Spezial- Warez Link der Extraklasse: > >> Free Retail CGI- Scripts - http://retailcgi.4u.ru/ > > AAG> Зачем же нам варезными скриптами заниматься. Полно и бесплатных. > AAG> Не такие уж и хитрые вещи нам необходимы. > > Да ну их нафик вообще с ихними скриптами. :-) > Кстати, то, что ты просил, я уже написал. > Как соберешься делать - пиши, пришлю небольшую инструкцию. > Ты сервер локально еще не поставил? > > =postmaster > > > > ---------------------------------------------------------------------- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru > > ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 31 янв 2000 23:19:47 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC9: Славянская иероглифика -------------------------------------------------------------------------------- > > пришла в голову. А почему бы нам не придумать "иероглифический" способ > > хранения ЦСл текста? Перечислить все основы и пронумеровать их. Например, > > "агглъ" - (Основа 145 в форме 1), "аггеломъ" - (основа 146 в форме 7), > > "творите" - (основа 12345 в форме 44), "сотворите" - ("со"+ основа 12345 в > > форме 44). > А сие не ино что, но токмо база корней. Это удобно где-то и как-то и в конвертере крайне надо, но зачем же текст так представлять? Всех основ ты все равно не задашь, обязательно где-то наткнемся на новую (ты переберешь скажем Типикон и все богослужебные книги, а вдруг понадобится какое-нибудь поучение Златоуста конвертить). Кстати мне одна филологиня-славиня сказала что списки корней существуют у преподов в рукописном виде. Следственно надо искать знакомых с компутером студентов-филологов-славистов. Пока отозвался только Тарасов но он в заочном отделении СТБП (тьфу, надоело мне его каждый раз набирать - ну надо было такое название непотребно длинное придумать и заумное? Может покороче есть вариант?) и до такого едва ли доступ найдет. Ищите гражданы и обрящете. > Зато - за счет утраты "клавиши F3" - мы приобретаем непробиваемую защиту от Что за клавиша ф3? > ошибок корректора и вообще сводим потребность системы в корректоре к > потребности в стайке аккуратных десятиклассниц. > А вообще некое здравое зерно в этой бредовой идее имхо есть. Но только при таком многоуровневом хранении не потеряем ли мы доступность? Хип читать со скрипом но можно (наверно с не большим скрипом чем транслит). А вот что-то типа #146$7, что должно читаться "аггеломъ" - это уже никак сам не прочитаешь. И кстати титла куда при таком представлении девать? И получается куча странностей - скажем один и тот же корень имеет несколько кодов из-за того, что туда добавилась какая-нибудь вшивая гласная или выпала оттуда вдруг или заменилась согласная на другую (вам филологам лучше знать как это бывает). Для этого хранить несколько разных корней муторно. Хотя можно пожалуй добавить еще %8, который будет означать что в корне произошла замена Т на С скажем (их же наверно количество конечное и известное этих замен?) Архангельский Г.А. СПб ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 01 фев 2000 01:27:12 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC9: Славянская иероглифика -------------------------------------------------------------------------------- > > > пришла в голову. А почему бы нам не придумать "иероглифический" способ > > > хранения ЦСл текста? Перечислить все основы и пронумеровать их. > Например, > > > "агглъ" - (Основа 145 в форме 1), "аггеломъ" - (основа 146 в форме 7), > > > "творите" - (основа 12345 в форме 44), "сотворите" - ("со"+ основа > 12345 в > > > форме 44). А мне эта идея откровенно не нравится. Да и трудно сие осуществить. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 01 фев 2000 08:08:59 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: RFC9: Славянская иероглифика -------------------------------------------------------------------------------- ----- Original Message ----- From: "AGA" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Monday, January 31, 2000 11:19 PM Subject: Re: RFC9: Славянская иероглифика > > > пришла в голову. А почему бы нам не придумать "иероглифический" способ > > > хранения ЦСл текста? Перечислить все основы и пронумеровать их. > Например, > > > "агглъ" - (Основа 145 в форме 1), "аггеломъ" - (основа 146 в форме 7), > > > "творите" - (основа 12345 в форме 44), "сотворите" - ("со"+ основа > 12345 в > > > форме 44). > > > А сие не ино что, но токмо база корней. > Это удобно где-то и как-то и в конвертере крайне надо, но зачем же текст В том-то и дело, что без этого все равно не обойтись, если мы хотим иметь автоматические средства для проверки текста. Все равно придется такой базой заниматься и многократно по частям применять хранящиеся в ней знания. Почему бы не применить их единократно и тем самым не предохраниться от ошибок недосыпа? Впрочем, надо подождать, что скажет по этому поводу Миша Гринчук. > так представлять? Всех основ ты все равно не задашь, обязательно где-то > наткнемся на новую (ты переберешь скажем Типикон и все богослужебные книги, > а вдруг понадобится какое-нибудь поучение Златоуста конвертить). > Кстати мне одна филологиня-славиня сказала что списки корней существуют у > преподов в рукописном виде. Следственно надо искать знакомых с компутером Это я как раз знаю - потому и предлагаю. Одна тонкость: нужны не корни, а основы. Тогда сложность многих вещей, вроде чередования внутри корней, будет решена методом "грубой силы" путем их перечисления в словаре. Мне кажется, что это разумный компромисс сравнительно с перечислением всех словоформ. Что касается добавления основ - то кто ж мешает добавлять их в словарь? Надо только, чтобы софт это дело поддерживал. Смотри: допустим, словарь - это доступная база ньюсов на новостном сервере. У каждой статьи есть уникальный номер. В то же время и ты, и я одновременно можем эту базу пополнять, и конфликтов номеров не возникает благодаря использованию спец. алгоритма, где-то в интернетовских RFC расписанного. > студентов-филологов-славистов. Пока отозвался только Тарасов но он в > заочном отделении СТБП (тьфу, надоело мне его каждый раз набирать - ну надо > было такое название непотребно длинное придумать и заумное? Может покороче > есть вариант?) и до такого едва ли доступ найдет. Православный Свято-Тихоновский Богословский Институт. Назови хоть горшком, только в печку не ставь. ;) > Ищите гражданы и обрящете. > > > > Зато - за счет утраты "клавиши F3" - мы приобретаем непробиваемую защиту > от > > Что за клавиша ф3? Нортон коммандер или фар знаешь? Основной довод для старых ДОСников против использования специальных форматов файлов. Знаю женщину - кандидата технических наук и быв. системного программиста, ныне референта о. Ректора ПСТБИ, которая в силу этого соображения принципиально работает в Лексиконе. На Пентиуме II c 64 Мб памяти ;-( (лучше б нам под сервер свою тачку отдала - а мы бы ей собрали трешку, да о. Ректор не велит). > > ошибок корректора и вообще сводим потребность системы в корректоре к > > потребности в стайке аккуратных десятиклассниц. > > > А вообще некое здравое зерно в этой бредовой идее имхо есть. Но только при > таком многоуровневом хранении не потеряем ли мы доступность? Хип читать со > скрипом но можно (наверно с не большим скрипом чем транслит). А вот что-то > типа #146$7, что должно читаться "аггеломъ" - это уже никак сам не > прочитаешь. И кстати титла куда при таком представлении девать? Про титла - см внимательнее исходную статью. Для нас это _разные_ основы. Про доступность - да, согласен. Но она будет принесена в жертву защищенности. Впрочем, как только будет принят такой формат - я думаю, что для любого программиста не составит труда за несколько часов сделать и пакетную утилитку для преобразования теста в HIP, и гляделку для только просмотра HIP-2, под все любезные его сердцу платформы. > И получается куча странностей - скажем один и тот же корень имеет несколько > кодов из-за того, что туда добавилась какая-нибудь вшивая гласная или > выпала оттуда вдруг или заменилась согласная на другую (вам филологам лучше > знать как это бывает). Основы надо хранить, а не корни. А по части чередования на стыке морфем - вот это и надо решить с филологами, можно ли их быстро и исчерпывающе алгоритмизовать. В любом случае эта задача на порядок проще, чем формализация всех чередований. Для этого хранить несколько разных корней муторно. > Хотя можно пожалуй добавить еще %8, который будет означать что в корне > произошла замена Т на С скажем (их же наверно количество конечное и > известное этих замен?) Это называется "парадигма склонения/спряжения". По-моему, еще Аристотель придумал. рещи - рекоша, тещи - текоша, и в то же время глаголати - глаголаша, делати - делаша, (пред)варити - (пред)вариша Хотя последнее из-за прочих форм окажется в другой парадигме. А форма одна (номер 1) слева, другая (допустим, номер 7) - справа. По крайней мере, вот такая работа будет очень интересна филологам, они все время ею занимаются на бумажках и без компьютеров. В отличие от наших "вертикальных уровней текста", которые ими просто будут восприняты как компьютерные игры. Ну не бывает для них текстов в промежуточных стадиях, допустим с юсами, но без ударений. Не бывает и все тут. Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 01 фев 2000 09:43:08 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Случайная ссылочка - Unicode шрифт со старой орфографией. -------------------------------------------------------------------------------- Кодировка Unicode, шрифтъ на http://209.224.56.68/Xsuni.TTF (Упомянут и использован на Кураевском форума http://kuraev.vinchi.ru:8101/gb/view.php3?subj=3173, яти там у меня отображаются квадратиками, видимо в связи с отсутствием ятей в Times New Roman - OpenType под Win2k. Хотелось бы знать, как у кого и под какой платформой? ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 01 фев 2000 12:17:29 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Po povodu "slavjanskoj ieroglifiki" -------------------------------------------------------------------------------- [v attache tot zhe tekst v kodirovke Win-1251] Доброе утро! 1. Вношу предложение поименовать предмет обсуждения MIP, сиречь Морфологическое Инвариантное Представление. 2. Его можно строить двумя путями: -- кодировать части слова (приставку-корень-суффикс-окончание) -- кодировать "начальную форму" слова плюс параметры текущей формы 3. Собственно, если кодировать -- так зачем цифирью? Сами же первыми запутаемся. Может быть, пусть длиннее, но читабельнее? Например, для русского языка указанные выше два способа кодирования слова "разбросанными" могли бы быть такие: &{case=lower, prefix=раз, root=брос, suffix=анн, ending=ыми} &{case=lower, base=разбросать, form=прич. страд. прош. мн.ч. тв.п.} ("case" нужно, чтобы различать написания "разбросанными", "Разбросанными" и "РАЗБРОСАННЫМИ") Или во втором подходе можно применить некую "функциональную" запись: Твор(Множ(СтрадПрош(разбросать))) Здесь имеется в виду функция СтрадПрош, которая из неопределенной формы глагола делает стражательное причастие, функция Множ, которая ставит слово во множественное число, и функция Твор, ставящая слово в творительный падеж. Эту систему можно обобщать, включая в нее порой описание не только словоизменения, но и словообразования: Действие(читать) = чтение Деятель(читать) = читатель Место(читать) = читальня 4. Но на многотрудном пути реализации MIP ждут многочисленные подвохи, поскольку надо будет загнать в рамки некой строгой формальной системы существенную часть знаний о языке -- в котором куда ни ткни, непременно обнаружатся какие-нибудь особые случаи и исключения. (Скажем, придется предусмотреть вариантность образования какой-либо формы слова.) Потом в ц.-сл. языке не вся информация содержится внутри слова -- скажем, форма ударения может зависеть от следующего слова. Те же мягкие переносы в это представления ну совсем никак не вгоняются. И наверняка еще много разных сюрпризов. По моему разумению, MIP скорее будет благодатной почвой для исследований филологов-экспериментаторов, но внутри нашей работы оно, скорее, создаст гораздо больше проблем, чем решит. 5. А в принципе можно и дальше пойти, кодируя не признаки отдельных слов, а всю фразу целиком -- как последовательность выборов из возможных структур фразы. Например, в предложении "мама мыла раму" род 2-го слова определяется родом 1-го, а падежи задаются синтаксической конструкцией. Что-нибудь в таком духе (обозначено: ИГ -- именная группа, ГГ -- глагольная группа, x1, x2, x3 -- параметры, которые структурой фразы не определяются, а потому их надо задавать извне) Фраза = ИГ1 ГГ1 /* правило вывода */ ГГ1.число := x1 /* взаимосвязи параметров */ ГГ1.время := x2 ИГ1.число := x1 ГГ1.лицо := 3 ГГ1.род := ИГ1.род ИГ1.падеж := именительный ИГ1 = Сущ1 ИГ1.род := Сущ1.род Сущ1.число := ИГ1.число Сущ1.падеж := ИГ1.падеж ГГ1 = Глаг1 ИГ2 Глаг1.переходность := TRUE Глаг1.число := ГГ1.число Глаг1.время := ГГ1.время Глаг1.лицо := ГГ1.лицо ИГ1.число := x3 ИГ1.падеж := винительный ИГ2 = Сущ2 ИГ2.род := Сущ2.род Сущ2.число := ИГ2.число Сущ2.падеж := ИГ2.падеж Сущ1 = "мама" Сущ2 = "рама" Глаг1 = "мыть" x1 = единственное число x2 = прошедшее время x3 = единственное число М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 01 фев 2000 12:27:46 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Virtual'naja mashina -------------------------------------------------------------------------------- [V attache to zhe samoje v Win-1251] Поля Г и Д на самом деле не так часто используются. Они введены исключительно по той причине, что порой их использование позволяет на один-два порядка уменьшить число команд в программе. В исходном варианте система устроена совсем просто. Можно считать, что имеется некий спецсимвол "*", который в тексте не встречается. Сначала мы его приписываем к самому началу. А дальше запускаем набор замен -- в данном случае вида *А -> Б*В (реально в программе я это записываю как строку "А/Б/В/"), где А, Б, В -- конечные последовательности симвлолов (без "*"). Если одновременно применимо несколько таких замен, то выбираем с самой длинной частью А. Если ни одна не подходит, то: если звездочка в самом конце -- убираем ее и процесс закончен, а если не в самом конце -- продвигаем ее на один символ вперед. Вы совершенно правильно заметили, что "результат очередной замены тут же встраивается в цепочку, и к нему точно так же применяется этот алгоритм". Но это относится только к части В, а часть Б становится недоступной. В ряде случаев части В вообще пустые. Например, возможный алгоритм конвертации транслита в кириллицу может иметь такие команды: S/С// SH/Ш// SHCH/Ч// Собственно, эта система моделируется и механизмом глобальных замен; только надо хранить список замен *А -> Б*В по убыванию длины частей А, пытаться применять все замены по очереди, но после каждой "удачной" попытки применения замены возвращаться к началу списка. Во всей этой системе главное -- контролируемое взаимодействие правил. > Насколько для вашего алгоритма принципиально то, > что результат замены может тут же обрабатываться, > или Вы, как правило, тут же блокируете эту > обработку флажками Г? Флажки тут несущественны, но порой "тут же обрабатываться" бывает полезно. Например, если я хочу заменить ABCDEFG -> ABC[D]EFG FGHIJKL -> FGH[I]JKL то для совместного срабатывания этих правил на слове ABCDEFGHIJKL можно написать такое: ABCDEFG/ABC[D]/EFG/ FGHIJKL/FGH[I]/JKL/ (это тоже довольно типичная ситуация: когда для применимости замены надо "заглянуть вперед", но этот "заглянутый" кусок не хочется делать недоступным для возможной переработки той же программой). > Конструктиваное предложение: если вы беретесь реализовать > все без исключения алгоритмы над ЦСл текстами в вашей > виртуальной машине - я могу сэмулировать вашу машину в > Ворде и сделать ваши "программы" исполняемыми там. Это > совсем не сложно. Заведомо не все -- потому что есть и теоретическое ограничение: эта виртуальная машина эквивалентна не универсальным алгоритмам типа машины Тьюринга, а всего лишь конечным автоматам. (На практике же и расстановку переносов, скажем, явно лучше делать по-другому.) Но очень многие. Самое главное, эта система удобна как исследовательский инструмент; иногда она сама по себе оказывается неприменимой, но по ходу выяснения этого становится понятно, какой же алгоритм преобразования нужен. А вот что было б неплохо иметь в Word'е -- некую визуализацию разночтений: есть исходный текст, а есть текст после попытки что-нибудь в нем автоматически подправить; так нельзя ли их так загрузить, чтобы можно было видеть разночтения, прыгать от одного разночтения к другому, выбирать правильный вариант или (если оба кажутся неправильными) вводить свой? =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 01 фев 2000 12:38:42 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Offtopic -------------------------------------------------------------------------------- K sozhaleniju, ne uspevaju sejchas otvetit' na vse pis'ma. Razve chto skazhu, chto zakazal C-builder (dazhe versiju 5), obeshchajut prislat' v fevrale. I zhdu otvetov na voprosy po HIP -- oni v samom konce fajla http://orthodox.tstu.ru/font-list/invariant.txt M. G. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 02 фев 2000 12:53:19 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Po povodu "slavjanskoj ieroglifiki" -------------------------------------------------------------------------------- Здравствуйте, Миша! > 1. Вношу предложение поименовать предмет обсуждения MIP, > сиречь Морфологическое Инвариантное Представление. > > 2. Его можно строить двумя путями: > -- кодировать части слова (приставку-корень-суффикс-окончание) Да, именно первый подход я и имел в виду. Только суффикс с окончанием можно не разделять, для того, чтобы приблизить практическую значимость такого словаря. > -- кодировать "начальную форму" слова плюс параметры текущей формы Я полагаю, что это все крайне интересно, но нам не поднять. По подобному пути идет лаборатория (или теперь как ее там звать) Апресяна с большим штатом квалифицированного персонала - структурных лингвистов, программистов, просто филологов и весьма нехилым финансированием. И все равно зримых результатов нет уже которое десятилетие (насколько мне известно, Апресян занимался тем, чем занимается буквально всю жизнь, и уж точно не переставая с момента первого издания своего Англо-Русского синонимического словаря). Возможно, что как раз с морфологией-то они уже разобрались, но вряд ли поделятся результатами. > 3. Собственно, если кодировать -- так зачем цифирью? Сами же > первыми запутаемся. Может быть, пусть длиннее, но читабельнее? > Например, для русского языка указанные выше два способа кодирования > слова "разбросанными" могли бы быть такие: > > &{case=lower, prefix=раз, root=брос, suffix=анн, ending=ыми} > &{case=lower, base=разбросать, form=прич. страд. прош. мн.ч. тв.п.} > > ("case" нужно, чтобы различать написания "разбросанными", > "Разбросанными" и "РАЗБРОСАННЫМИ") Сие есть компромисс между человеком и компьютером, допустимый только "по бедности". На самом деле компьютеру (то есть программистам) проще иметь дело с машинно обрабатывемыми цифирьками, а людям - операторам, филологам, любым пользователям - с уже более или менее объединенным словом без лишней лабуды. Желательно удовлетворить всех. Но это так, просто методологическое замечание. > 4. Но на многотрудном пути реализации MIP > ждут многочисленные подвохи, > поскольку надо будет загнать в рамки некой строгой формальной > системы существенную часть знаний о языке -- в котором куда Возможный путь первоначльного обхода сложности, с тем, чтобы можно было быстро начать практическую работу, предложен мною ниже. > ни ткни, непременно обнаружатся какие-нибудь особые случаи > и исключения. (Скажем, придется предусмотреть вариантность > образования какой-либо формы слова.) Потом в ц.-сл. языке > не вся информация содержится внутри слова -- скажем, форма > ударения может зависеть от следующего слова. Те же мягкие да, сходу я об этом не подумал > переносы в это представления ну совсем никак не вгоняются. > И наверняка еще много разных сюрпризов. Переносы вгоняются собственно в словарь, ударения - сложнее. См. ниже. Я имел в виду словарь, где ключом является некий составной параметр (номер основы + номер парадигмы изменения конца слова). При этом независимости этих параметров не стоит добиваться, скорее всего, она недостижима. Всякое славянское слово _без приставки_ может быть скомбинировано из основы и окончания. При этом правила взаимодествия основы и окончания - это весьма незначительная часть структурных правил славянской морфологии, и первое мое предположение состоит в том, что их можно легко описать в сотрудничестве с филологами. Мало того, я утверждаю, что филологи будут заниматься этим _охотно_, в отличие от тех занятий с нашим опросником, которые светят им в результате наших изысканий с уровнями текста. В словарном гнезде помещались пронумерованные по порядку формы. Для начала даже не обязательно маркировать их грамматическую функцию. Точнее - наша задача в сотрудничестве с филологами была бы в том, чтобы найти такое множество парадигм и правил изменения слов по этим парадигмам, которое _в пределе_ исчерпывало бы церковнославянский словарь. При этом некорректность с точки зрения строгой филологии для нас несущественна, например, можно просто нумеровать парадигмы, не классифицируя их по частям речи. Я считаю не обязательным классифицировать парадигмы - дескать, это вот парадигма склонения, эта - спряжения, это - совершенного вида, это -несовершенного и т. д. Следовало бы просто перечислить максимальное количество парадигм, каждый раз давая новые номера даже тем, который отличаются от предыдущих лишь в малейшей мере. Я хотел бы вынести на обсуждение тезис, что в сотрудничестве с филологами возможно _быстро_ построения такого словаря. Тем более, что недостающие формы могут быть сгенерированы автоматически, а установленные правила уточнены, если автоматическая генерация приведет к неверным результатам. Нужно допустить расширяемость словаря за счет вовлечения в оборот новых текстов. Далее следовало бы заняться распознаванием существующих текстов и попутно совершенствовать такой словарь в направлении строго филологическом, группируя зафиксированные в словаре корни, парадигмы и маркируя функции каждой пронумерованной формы и накапливая правила, по которым могут сочетаться рядом стоящие слова. Если сделать все по уму - существенно помогать в работе будет уже словарь из какой-нибудь пары тысяч основ и вовсе даже грамматически необработанный. После того, как он будет готов, уже можно приступать собственно к обработке и вводу текстов. Количество уже обработанных текстов, увеличиваясь, также будет давать совершенно нелинейный эффект как в пополнении словарной базы, так и в отношении грамматического совершенствования словаря. Кстати, если уж говорить о финансировании проекта, то вот такой _словарь_ языка - гораздо более нейтральная с точки зрения "общечеловечности" вещь, чем система технологической поддержки сугубо церковного книгоиздания, которой мы в строгом смысле слова занимаемся. И потому выбить финансирование проекта с таким прикрытием было бы легче. Теперь об ударениях и переносах. В качестве конечной информации в словаре вполне допустимо хранить даже все без исключения словоформы с расставленными переносами, а можно держать их физически отдельно, но при нужде пользоваться таким расширенным словарем. Обладая в гнездах словаря хотя бы в первом приближении исчерпывающим набором основ и парадигм, в первом же приближении правильно грамматически сгруппированных, можно автоматически сгенерировать такой "расширенный" ЦСл словарь. И методом последовательных итераций улучшать его качество, совершенствуя исходную информацию. С ударениями чуть сложнее. Очевидно, их надо хранить "инвариантно", а выводя конкретный текст - модифицировать в зависимости от позиции в предложении. Самое главное, что таким образом можно сильно распараллелить работу и добиться того, что каждый участник проекта будет заниматься тем, к чему у него более лежит душа, при этом нелинейно приближая общий результат. > По моему разумению, MIP скорее будет благодатной почвой для > исследований филологов-экспериментаторов, но внутри нашей > работы оно, скорее, создаст гораздо больше проблем, чем решит. > > 5. А в принципе можно и дальше пойти, кодируя не признаки > отдельных слов, а всю фразу целиком -- как последовательность > выборов из возможных структур фразы. Например, в предложении Вот-вот, это именно то, в чем, по моей информации, безнадежно закопался Апресян. Безнадежно - потому, что он пытается сначала построить исчерпывающую систему, в академических целях. А для нашей работы достаточно и неполного словаря, и неполной грамматической четкости. С уважением, Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 02 фев 2000 14:20:46 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Virtual'naja mashina -------------------------------------------------------------------------------- Здравствуйте, Михаил! > > Поля Г и Д на самом деле не так часто используются. > Они введены исключительно по той причине, что порой > их использование позволяет на один-два порядка уменьшить > число команд в программе. В исходном варианте система > устроена совсем просто. Можно считать, что имеется некий > спецсимвол "*", который в тексте не встречается. Сначала > мы его приписываем к самому началу. А дальше запускаем > набор замен -- в данном случае вида > > *А -> Б*В > > (реально в программе я это записываю как строку "А/Б/В/"), > где А, Б, В -- конечные последовательности симвлолов (без > "*"). Если одновременно применимо несколько таких замен, то > выбираем с самой длинной частью А. Если ни одна не подходит, > то: если звездочка в самом конце -- убираем ее и процесс > закончен, а если не в самом конце -- продвигаем ее на один > символ вперед. Ну правильно, это просто эмуляция "точки вставки". Так, конечно, проще сделать и в Ворде, но даже моя душа халявщика не стерпит такой неэффективности: пытаться в цикле делать глобальные замены, когда в реальности замена будет не более, чем единичной. На самом деле ничего не стоит и вашу "точку встатвки" изобразить, просто программа будет менее наглядной. Или даже изображать ничего не надо, можно в реальности управлять курсором Ворда и исполнять Вашу "пьесу для механического пианино" у оператора на глазах. Выйдет только несколько медленнее "пакетного режима" за счет графического вывода всего этого кино. > Собственно, эта система моделируется и механизмом глобальных > замен; только надо хранить список замен > *А -> Б*В > > по убыванию длины частей А, пытаться применять все замены по > очереди, но после каждой "удачной" попытки применения замены > возвращаться к началу списка. Во всей этой системе главное > -- контролируемое взаимодействие правил. Тогда для Ворда нет ничего проще. Готов на основе Вашей нотации сделать для Ворда соответствующую виртуальную машину. Когда сочтете нужным - можете прислать ее описание. > > Насколько для вашего алгоритма принципиально то, > > что результат замены может тут же обрабатываться, > > или Вы, как правило, тут же блокируете эту > > обработку флажками Г? > > Флажки тут несущественны, но порой "тут же обрабатываться" > бывает полезно. Например, если я хочу заменить > > > ABCDEFG -> ABC[D]EFG > FGHIJKL -> FGH[I]JKL > > то для совместного срабатывания этих правил на слове > > ABCDEFGHIJKL > > можно написать такое: > > ABCDEFG/ABC[D]/EFG/ > FGHIJKL/FGH[I]/JKL/ Вот уже эту систему программирования понять и принять гораздо сложнее, чем смоделировать саму вашу виртуальную машину. Если же посмотреть на все дело со стороны - то непонятно, зачем так "извращаться"? Зачем делать все замены в один проход, когда можно их делать по очереди? Уверены ли Вы, что Ваше правило "убывания длины" имеет не только эмпирическое значение для вашей виртуальной машины? Что оно столь же адекватно всем возможным "вертикальным состояниям" текста, сколь тем преобразованиям, с которыми вы имели дело доселе? > (это тоже довольно типичная ситуация: когда для применимости > замены надо "заглянуть вперед", но этот "заглянутый" кусок > не хочется делать недоступным для возможной переработки той > же программой). > > > Конструктиваное предложение: если вы беретесь реализовать > > все без исключения алгоритмы над ЦСл текстами в вашей > > виртуальной машине - я могу сэмулировать вашу машину в > > Ворде и сделать ваши "программы" исполняемыми там. Это > > совсем не сложно. > > Заведомо не все -- потому что есть и теоретическое > ограничение: эта виртуальная машина эквивалентна не > универсальным алгоритмам типа машины Тьюринга, а всего лишь > конечным автоматам. (На практике же и расстановку переносов, > скажем, явно лучше делать по-другому.) Но очень многие. > Самое главное, эта система удобна как исследовательский > инструмент; иногда она сама по себе оказывается > неприменимой, но по ходу выяснения этого становится понятно, > какой же алгоритм преобразования нужен. Тогда в чем Вам видится конкретное преимущество вашей системы перед моей абстракцией Супервизора? Ведь получается, что вы вручную занимаетесь таким же подбором оптимальной последовательности замен, какую по хорошему следовало бы возложить на Супервизора.... либо доверить лично вам функции такого Супервизора для всех без исключения текстов. Миша, поверьте, я не отобрать пытаюсь у вас вашу любимую изобретенную для себя игрушку, а хочу понять, сможете ли Вы с помошью этой игрушки решить реальный объем задач в достаточно короткий срок. Не обижайтесь на слово игрушка: для меня вот Ворд - такая же любимая игрушка. Она, очевидно, более универсальна, чем Ваша виртуальная машина, но зато у вас есть конкретный опыт программирования для последней полезных всех нам задач. Давайте определимся; целиком ли мы будем полагаться на Ваш опыт и Вашу машину (не забывайте, что речь идет о всем множестве ЦСл текстов со всеми возможными "вертикальными" особенностями) или все-таки обратимся к более универсальным инструментам? Полагаю, что те тексты, которые живут в ТеХе, все равно не минуют Ваши руки. А вот все в совокупности - потянете ли вы лично? Понимаю, что Вас искушает предложить поступить именно так, с оговоркой, что если Вы наткнетесь на нерешаемую в рамках Вашей системы задачу - то ее следует попытаться решить отдельно. Но поймите, что это не выход. Лично я успокоился бы только в том случае, если вы четко возьмете на себя обязательство решать любую возникающую по ходу дела задачу по вертикальному преобразованию любого возможного ЦСл текста. > А вот что было б неплохо иметь в Word'е -- некую визуализацию > разночтений: есть исходный текст, а есть текст после попытки > что-нибудь в нем автоматически подправить; так нельзя ли их > так загрузить, чтобы можно было видеть разночтения, прыгать > от одного разночтения к другому, выбирать правильный вариант > или (если оба кажутся неправильными) вводить свой? Именно такая система просто-напросто по жизни встроена в Ворд. Уже в 6 Ворде она была, а может - и во втором. Принцип такой: вы указываете файл, содержимое которого надо XOR с загруженным в текущее окно текстом. По зашитому где-то в своих недрах алгоритму Ворд производит такое сравнение и показывает цветовым выделением новые места, а зачеркнутым шрифтом - места удаленные. Мало того, это новое представление - не какой нибудь отчет ad hoc, а штатное состояние документа Ворд - режим tracking changes. По этим изменениям можно гулять, принимая по одиночке, а можно принять или отказаться от них всех одним махом. Можно и в любой момент сохранить такой файл, чтобы впоследствии к нему вернуться. Кстати, тексты вовсе не обязательно должны быть в формате Ворда: тот работает с временными файлами в своем формате, а потом, по желанию, сохраняет результат в формате исходном. Но мне этого мало. Я начал в том же Ворде делать аналогичную систему, только более интерактивную и работающую именно с нашей абстракцией альтернативных тэгов - тот самый RFC7 Tags Utilizer, который я предложил в рассылке. Правда, за бесконечной перепиской я почти этим не занимаюсь. Вот сейчас попробую вернуться. С уважением, Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 09:42:44 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Re: рЯФФХвжЫС ЬСдйЮЩ ЫСЫ бкйЫС з word'Х -------------------------------------------------------------------------------- [To zhe samoje v kodirovke Win lezhit v attache] AV> Subject: Поддержка латыни как языка в word'е AV> Есть ли субж? Если нет, то еще меньше надежды на аналогичную AV> поддержку ц.с. Знаю, что существуют компьютерные англо-латинские и латинско-английские словари и латинские программы OCR. Вроде бы видел латинскую проверку правописания (но не уверен). Все это добро на порядок дороже аналогичных программ для "живых" языков. М. Г. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 09:38:25 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: MIP, virtual'naja mashina i procheje -------------------------------------------------------------------------------- [To zhe samoje v kodirovke Win lezhit v attache] Доброе утро! Прощу прощения, что отвечаю на разные письма в одной куче (тем более что темы между собой сильно переплетены). Во первЫх строках просьба ко всем: нельзя ли Subject сообщений писать латиницей? LT> > (И представляю инструкцию для девушек-наборщиц: LT> > LT> > "Набрать команду LT> > estetize -string novyj.hip LT> > когда покажется текст, надо кнопкой PgDn пробежать LT> > его до самого конца и выйти". LT> LT> Типично юниксоидное мышление. ;-) Не в этом дело: если система будет навязывать просмотр чего-то (ожидая разумного решения по каждому конкретному вопросу), то пользователю это скоро надоест и он/она непременно изобретет кнопочку "делай как знаешь и не приставай". LT> Миша, прошу: не поленитесь скачать хозяиновский "вечный" LT> календарик, чтобы вы смогли, наконец, оценить современные LT> стандарты интерактивности программы с пользователем. LT> LT> http://members.xoom.com/sergeymh/orthodox.html LT> LT> Чему там и кого нужно обучать? Внешний вид программы LT> самодокуменирован - не стесняйтесь только мышкой потыкать и LT> даже колесико на мышке покрутить, если имеется. При этом LT> ровно ничего испортить вы там не сможете. А исходные данные LT> - собственно месяцеслов - можете при желании поправить в LT> %Month%.dat файлах. Но это мы с вами, а пользователи даже не LT> должны подозревать об этой возможности. Это все же система скорее справочная, обрабатывающая запросы фиксированной формы, а не система для накопления информации от пользователей (как, например, любой редактор). LT> Ну например, запрет на дефис-перенос в конце строки, который LT> здесь уже предлагался. Допустим, мы сейчас это не учли, а в LT> некоторый момент необходимость его всплыла, когда LT> соответствующий эстетизатор уже вовсю применяется. И вот у LT> всех заинтересованных лиц появляется лишняя головная боль - LT> помнить о том, что ваш эстетизатор несовершенен, и иногда LT> оставляет недопустимые переносы в концах строк. Дефис-перенос -- проблема не для эстетизатора, а для валидатора. Как и вообще сочетание дефис + пробел. Идеальным вариантом был бы редактор, который текст с такого рода незаконными сочетаниями либо вообще ввести не позволяет, либо формально позволяет, но умеет сохранять лишь в специальном draft-режиме -- а для экспорта в "нормальный" HIP высвечивает все такие "грязные" места и ждет их исправления. Это "грязь" того же уровня, как пробелы не с той стороны от знаков препинания, придыхания не над начальной буквой, два ударения над одним словом, невозможные сочетания букв (типа "ъъ") и тому подобные. Наверное, просто "запрещать" их не стоит -- в противном случае правка текста превратится в головоломку. Потому что и "старая", и "новая" редакции текста будут формально допустимыми состояниями, но по ходу редактирования придется следить, чтобы никакая операция (даже изменение или вставка/удаление одного символа!) не выводила в некорректную область. Боюсь, что может возникнуть ситуация, когда в "пространстве состояний" эти две допустимые точки будут просто наглухо закрыты друг от друга некорректными состояниями (или стенку "некорректных состояний" придется долго и хитро обходить, ощупью ища тропинку). А запрещать сохранение текста в некорректном состоянии тоже плохо: мало ли по какой причине бывает нужно срочно прервать работу, сохранив текущее состояние, -- и вернуться к ней на другой день. LT> См. www.orthodoxy.ru/pstbi Непосредственно эта ссылка не работает (но в конце концов в www.orthodoxy.ru я Вашу базу данных нашел). LT> > Имея весьма смутное представление о существующих системах, LT> > все же опасаюсь нагородить 10000 полочек под 20 предметов. LT> > Хоть какой-нибудь бы список для начала, пусть самый LT> > неформализованный! LT> > LT> > (И второй список -- реально существующих тестов.) LT> LT> Бросим клич в список и в литургику? Но желательно было бы LT> хоть в общих чертах специфицировать нашу классификацию, LT> чтобы те, кто дает нам информацию о факте наличия текстов, LT> могли бы помочь и сразу хотя бы в какой-то мере их LT> классифицировать. Так вроде бы для первой прикидки классификация уже годится (для текстов -- анкета из двух групп вопросов: уровень ц.-сл. корректности и в каком машинном представлении текст существует). Не выложить ли ее тоже как отдельный документ? LT> тем более надо уделить первоочередное внимание сбору LT> реальных текстов и их раскладыванию "по полочкам". Ну что, LT> кидаем клич? Угу. LT> Только для этого действительно надо создать вебсайт, откуда LT> все желающие могли бы загрузить результаты нашей LT> деятельности по сбору и обработке текстов, хотя бы для того, LT> чтобы сами легче с ними расставались. Отдельный сайт -- было бы замечательно. Как запасной вариант можно "присоседиться" к Елисавете и/или к сайту с нашим архивом. LT> > > Сколько вам потребуется времени, чтобы, не адаптируя LT> > > ваш инструментарий к нашим виндовозным запросам, LT> > > сконвертировать 90% существующих ЦСл текстов в HIP? И LT> > > не является ли это время неоправданно большим, LT> > > настолько большим, что, может быть, предпочли бы LT> > > переложить часть работы на наши и еще чьи-то плечи? LT> > LT> > Без "повышения уровня" и имея все тексты в RTF (в любых шрифтах LT> > и кодировках, пусть пока и неведомых) -- несколько дней. LT> > (Зависит, конечно, от числа разных шрифтов и кодировок.) LT> LT> А я спрашивал о реальных, а не о тепличных условиях. Вопрос LT> не снимается. Для начала надо бы знать: -- какие тексты существуют? -- в каких форматах? Далее, если формат (не TXT и не TEX) конвертируется "родной" утилитой в RTF, то хотелось бы иметь уже RTF, а не самому коллекционировать все издательские системы и устанавливать все шрифты. Если не конвертируется -- надо разбираться отдельно. Наконец, "повышение уровня" и конвертация -- разные вещи. Я честно ответил про конвертацию. А для "повышения уровня", как ни крути, надо иметь перед глазами "бумажные" копии текстов. (А мне даже обычную ц.-сл. Библию, заказанную через ABS еще в прошлом году, пока не прислали...) LT> > что-нибудь одно, но хорошо. А вопросики могут LT> > возникать в трех случаях: LT> > 1) "горизонтальный" конвертор обнаружил нечто неконвертируемое LT> > 2) валидатор обнаружил нечто странное LT> > 3) повышатель уровня не может однозначно выбрать вариант LT> > LT> > При этом "альтернативный тег" обязан появиться в случае 3), LT> > но в случаях 1) и 2) -- не всегда. Например, проверяет LT> > валидатор букву "ъ" -- и видит слово "дуъа" (вместо "духа" -- LT> > кнопки были рядом, вот и опечатка). И какой альтернативный LT> > тег тут ставить? LT> LT> Если совсем умный - то выбор из "духа", "дуба" или "дума", LT> если просто умный - то вопросик перед словом "духа", если LT> глупый - перед словом "дуъа" или перед знаком "ъ". Имеется в виду как раз "глупый" -- не словарная работа, а минимальный набор формальных правил (запрет на "ъ" после гласной -- правило именно такого сорта). LT> Только, может быть, вместо вопросика ввести специальную LT> альтернативу, означающую запрос ввода? Строго говоря, "голый" вопросик (без {...} сразу за ним) и есть запрос ввода: "обнаружена неведомая гадость, разбирайтесь сами". LT> И еще учтите, что виндовый утилизатор тэгов непременно LT> будет вместо вашего вопросика рисовать на экране просто LT> сомнительную букву или слово 20-м, скажем, кеглем и LT> свирепо-ядовитым цветом. Замечательно. (И лучше даже не "вместо", а "вместе".) ======================================= LT> > сиречь Морфологическое Инвариантное Представление. LT> > LT> > 2. Его можно строить двумя путями: LT> > -- кодировать части слова (приставку-корень-суффикс-окончание) LT> LT> Да, именно первый подход я и имел в виду. Только суффикс с LT> окончанием можно не разделять, для того, чтобы приблизить LT> практическую значимость такого словаря. В таком случае ожидаю своей особой парадигмы для каждой основы. LT> > 3. Собственно, если кодировать -- так зачем цифирью? Сами же LT> > первыми запутаемся. Может быть, пусть длиннее, но читабельнее? LT> LT> Сие есть компромисс между человеком и компьютером, LT> допустимый только "по бедности". На самом деле компьютеру LT> (то есть программистам) проще иметь дело с машинно LT> обрабатывемыми цифирьками, а людям - операторам, филологам, LT> любым пользователям - с уже более или менее объединенным LT> словом без лишней лабуды. У меня позиция простая: если есть два формата записи одной и той же (содержательно) информации, и перевод из одного в другой реализуется без особого напряга, то надо выбирать более понятный человеку. LT> Я имел в виду словарь, где ключом является некий составной LT> параметр (номер основы + номер парадигмы изменения конца LT> слова). При этом независимости этих параметров не стоит LT> добиваться, скорее всего, она недостижима. Не очень понял, что значит "ключом"? Можно иметь в качестве словарной запись пару (основа, номер парадигмы) или даже (начальная форма слова, номер парадигмы) -- во втором случае основа получается из начальной формы отбрасыванием первого (из перечисленных в парадигме) окончания. Например: корова 12345 (это запись в словаре) 12345 а а ы е у ой/ою е ы = ам = ами ах А это запись в списке парадигм: сперва окончание "словарной формы", а потом все "обычные" падежные окончания ("словарное" там может, вообще говоря, быть и не первым); через / записаны варианты одной и той же формы, а = обозначает пустое окончание. Нужен будет также знак для "запрещенной" формы (например, в парадигме для слова "кочерга" нет формы родительного падежа множественного числа). Наличие "начального окончания", во-первых, может быть средством некоторой проверки внутренней корректности словаря, а во-вторых, в случае с ц.-сл. языком почти полностью снимает проблему омонимичных основ. (Однако, хоть сходу пример не изобретается, не думаю, что ц.-сл. язык свободен от омонимичных начальных форм, и как-то различать их придется.) LT> Всякое славянское слово _без приставки_ может быть LT> скомбинировано из основы и окончания. Наличие приставки может влиять на парадигму! Поэтому выносить приставку за скобки трудно. Для "программистского" решения проще всего формально разбивать слово на две части: основу и окончание, объявляя основой самую длинную графически неизменную при склонении/спряжении начальную часть слова. (Некоторые -- немногие -- слова при этом подходе будут иметь пустую основу: скажем, в русском языке имеем идти/шел, человек/люди и т. п. А у слова "кто-нибудь" основа -- одно "к". У слова "опереться" основа -- "о", потому что "обопрусь".) А все "хвосты", приклеиваемые к такой основе, образуют парадигму. LT> Точнее - наша задача в сотрудничестве с филологами была бы в LT> том, чтобы найти такое множество парадигм и правил изменения LT> слов по этим парадигмам, которое _в пределе_ исчерпывало бы LT> церковнославянский словарь. Имея некий опыт аналогичной деятельности (в рамках русского языка), смею утверждать, что "найти" эти множества и правила довольно трудно без сплошной проработки всех текстов. У меня после проработки примерно 1 МБ русских текстов (разной тематики) выявилось примерно 10000 слов и 500 парадигм -- в указанной модели формального разбиения слов на графически неизменную основу и окончание. Причем новые парадигмы обнаруживались хоть и все реже и реже, но все же довольно регулярно. LT> Я считаю не обязательным классифицировать парадигмы - LT> дескать, это вот парадигма склонения, эта - спряжения, это - LT> совершенного вида, это - несовершенного и т. д. Не различать совершенный/несовершенный вид разумно, но со склонением/спряжением -- не согласен. По большому счету, в русском языке разных типов парадигм совсем мало: 1) склонение существительных; 2) склонение полных прилагательных; 3) склонение кратких прилагательных; 4) склонение личных местоимений; 5) склонение количественных числительных; 6) спряжение; 7) неизменяемые слова. В ц.-сл., скорее всего, нечто близкое (но надо посмотреть). LT> Следовало бы просто перечислить максимальное количество LT> парадигм, каждый раз давая новые номера даже тем, который LT> отличаются от предыдущих лишь в малейшей мере. Как уже сказал, без сплошного просмотра всех текстов перечислить парадигмы не получится. LT> Я хотел бы вынести на обсуждение тезис, что в сотрудничестве LT> с филологами возможно _быстро_ построения такого словаря. Насчет "быстро" -- очень сомневаюсь (те самые мои ехидные "два года" не с потолка были взяты). LT> Тем более, что недостающие формы могут быть сгенерированы LT> автоматически, а установленные правила уточнены, если LT> автоматическая генерация приведет к неверным результатам. Возможный подход: 1) видим очередное слово 2) если оно уже нам знакомо (получается из словаря при использовании соответствующей парадигмы), то конвертируем его в пару (начальная форма, номер элемента парадигмы). При возможной омонимии форм спрашиваем пользователя, что же в данном случае имеется в виду (предлагаем выбор из всех вариантов). 3) если слово не найдено или пользователь отверг все наши варианты его подгонки к словарю, пытаемся пополнить словарь. Сперва просим поставить слово в "начальную форму" (здесь можно предложить несколько "автоматически вычисленных" начальных вариантов, но и ручной ввод иногда бывает нужен). Если же тут отловилась опечатка, просим пользователя исправить ее и возвращаемся (после исправления) к пункту 1 -- быть может, даже отступя немного назад, если для исправления пришлось задеть предыдущие слова. 4) ищем все формально подходящие под эту пару форм парадигмы, показывая их в порядке убывания длины окончаний, а при равной длине окончаний -- в порядке убывания частоты их использования. ("Показать парадигму" означает сотворить все соответствующие формы слова и выдать их -- порой лучше не в виде таблички склонения/спряжения, а внутри некой модельной фразы -- в этом случае проще понять, ту ли парадигму мы рассматриваем.) 5) если парадигма найдена -- добавляем новое слово к словарю (указав номер этой парадигмы) и возвращаемся (с тем же словом) к пункту 2 6) в противном случае просим ввести всю парадигму, добавляем ее к списку парадигм, добавляем слово к словарю (со ссылкой на эту новую парадигму) и опять-таки возвращаемся к пункту 2 7) в режиме работы с "неквалифицированным" пользователем вместо такого пополнения словаря и списка парадигм можно все новые слова просто помечать как "неопознанные", чтобы кто-нибудь знающий разобрался с ними позже. Впрочем, средство поддержки "неопознанных" слов нужно в любом случае -- скажем, чтобы при обработке текста <<надо писать не "риба", а "рыба">> не пришлось добавлять в словарь "слово" "риба". LT> Количество уже обработанных текстов, увеличиваясь, также LT> будет давать совершенно нелинейный эффект как в пополнении LT> словарной базы, так и в отношении грамматического LT> совершенствования словаря. На 1 МБ нелинейный эффект еще не виден. LT> Кстати, если уж говорить о финансировании проекта, то вот LT> такой _словарь_ языка - гораздо более нейтральная с точки LT> зрения "общечеловечности" вещь, чем система технологической LT> поддержки сугубо церковного книгоиздания, которой мы в LT> строгом смысле слова занимаемся. И потому выбить LT> финансирование проекта с таким прикрытием было бы легче. Безусловно. ======================================= Описание формата команд "виртуальной машины". (Она делалась под личные нужды, и отсюда все возможные странности в кодировке; для "общественной пользы" можно что-нибудь и поменять.) 1. Она имеет два режима: для текстовых файлов и для двоичных файлов. В текстовом режиме пара CR+LF и одиночное CR не различаются при чтении файла (и то, и другое читаются как EOL), а при выводе EOL превращается в CR+LF. В двоичном режиме CR и LF -- такие же символы, как все прочие. Можно считать, что текстовый режим видит EOL и "непарные" LF (но никаких CR), а в двоичном режиме есть CR и LF, но нет EOL. (В двоичном режиме можно работать, например, с TXT/Unicode текстами.) 2. Внутри этой машины используется некое внутреннее представление текста (перекодировка в/из него выполняется "на лету" в функциях чтения/записи). Перекодировка такая: В файле внутри EOL или CR $ (EOL в текстовом режиме, CR в двоичном) код 0..9 %0..%9 (в режиме обработки двоичных файлов) код 2 %A (в режиме обработки текстовых файлов) \ %B $ %D символ EOF %E FF %P LF %R / %S TAB %T % %% Остальные символы представляют сами себя. (В моем любимом редакторе их можно вводить "как есть" и на экране они различимы, а символ с кодом 2 просто так использовать нельзя (он -- префикс команды переключения шрифтов), потому он и закодирован.) 3. Формат команд: АГ/БД/В/ здесь А, Б, В -- компоненты правила замены *А -> Б*В где "*" обозначает активную точку, Г -- набор условий применимости правила, Д -- набор команд изменения внутренних переменных. Эти условия и команды имеют порой один и тот же синтаксис. Они работают с переменными R0...R9, которые имеют значения от 0 до 2**16 - 1. Список всех возможных форматов команд и условий: запись команда условие \2- R2 := 0 R2 == 0 \2+ R2 := 1 R2 != 0 \2I R2 := R2 + 1 \2D R2 := R2 - 1 \2=7 R2 := 7 R2 == 7 \2<7 R2 < 7 \2>7 R2 > 7 Вместо \2 можно использовать \0...\9 (для R0...R9 соответственно), причем вместо \0 можно просто писать \ (например, \+ означает то же, что \0+ или \0=1 или \=1) Никаких разделителей между этими командами (условиями) нет, условия должны быть выполнены все вместе, а команды выполняются по очереди, слева направо (поэтому \-\I\I означает то же, что \=2) Например: ab%Dc\2=6\6-\+\7<52\7>33/d%B%%ef\3+\4D\-\4D/g$$hi/ обозначает "если после активной точки видим ab$c, причем R2=6, R6=0, R0=1 и 33hi, и выполняем команды R3:=1, R0:=0 и R4:=R4+2". LT> Вот уже эту систему программирования понять и принять LT> гораздо сложнее, чем смоделировать саму вашу виртуальную LT> машину. LT> LT> Если же посмотреть на все дело со стороны - то непонятно, LT> зачем так "извращаться"? Зачем делать все замены в один LT> проход, когда можно их делать по очереди? С ходу -- четыре примера. Получатся ли у Вас хорошие решения с глобальными заменами? Пример 1. Заменить любое число пробелов на один. В моей системе -- это одна команда (для наглядности обозначаю пробел знаком "_"): __//_/ Пример 2. Превратить "строчную" запись в "абзацную", то есть каждую последовательность пробелов и EOL превратить либо в один пробел, либо в пару EOL EOL (если в этой последовательности было больше одного EOL'а). Это всего 7 команд: __//_/ _$//$/ $/_// $_//$/ $$/$$// $$_//$$/ $$$//$$/ Пример 3. К каждому слову добавить символы "начало слова" и "конец слова" (в данном примере использую "|"). Это уже большая программа (по одной команде для каждого возможного символа). Пусть "x" -- символ, который может встречаться внутри слова (это -- буквы и элементы диакритики), а "#" -- символ, который там быть не может (пробел, EOL, знаки препинания, цифры). Команды такие: #\+/|#\-// x\-/|x\+// (не более чем 256 общим числом). Можно без \+ и \- (здесь "?" -- некий символ или последовательность символов, которого в исходном тексте быть не должно): x/|x/?// ?x/x/?// ?/|// (число команд = 1+2*(число символов, допустимых внутри слова)) Пример 4. Некто записал двоичный дамп файла: вместо каждого символа стало 8 нулей и единиц. Надо раскодировать. Программа простая: 256 команд вида <двоичный номер символа>/<символ>// например: 00000000/%0// 00000001/%1// 00000010/%2// 00001010/%R// 00001101/$// 00100000/ // 00100001/!// 00100100/%D// 00101111/%S// 00110000/0// 01000001/A// 01100001/a// Здесь существенно, что переработка идет последовательно. Если же применять глобальные замены, то очень легко получить "ложное узнавание" -- применив замену к 8 цифрам из двух рядом стоящих групп. LT> Уверены ли Вы, что Ваше правило "убывания длины" имеет не LT> только эмпирическое значение для вашей виртуальной машины? LT> Что оно столь же адекватно всем возможным "вертикальным LT> состояниям" текста, сколь тем преобразованиям, с которыми вы LT> имели дело доселе? "Убывание длины" -- самый естественный формальный механизм выбора того преобразования, которое надо осуществлять в данный момент (если применимы сразу несколько). В противном случае возникает некий недетерминизм. LT> Тогда в чем Вам видится конкретное преимущество вашей LT> системы перед моей абстракцией Супервизора? Ведь получается, LT> что вы вручную занимаетесь таким же подбором оптимальной LT> последовательности замен, какую по хорошему следовало бы LT> возложить на Супервизора... либо доверить лично вам функции LT> такого Супервизора для всех без исключения текстов. Миша, LT> поверьте, я не отобрать пытаюсь у вас вашу любимую LT> изобретенную для себя игрушку, а хочу понять, сможете ли Вы LT> с помошью этой игрушки решить реальный объем задач в LT> достаточно короткий срок. Эта система Супервизору никоим образом не противоречит. Просто, по-моему, нерационально сваливать на Супервизор все внутренние шаги преобразования. Скажем, намечающийся алгоритм для восстановления титл состоит из трех прогонов "виртуальной машины", из которых самый сложный состоит примерно из 500 команд. По отдельности эти команды довольно бессмысленны, и впутывать Супервизор в организацию их взаимодействия совершенно ни к чему. А Супервизор пусть видит все преобразование как единый акт: процедуру вставки титл в текст без оных -- при определенных требованиях на начальный уровень: базовый HIP без переносов и без комментариев, полный ц.-сл. алфавит, титл нет (просто выкинуты, а не раскрыты), придыхания есть, ударения могут быть, но не обязательно. LT> Давайте определимся; целиком ли мы будем полагаться на Ваш LT> опыт и Вашу машину (не забывайте, что речь идет о всем LT> множестве ЦСл текстов со всеми возможными "вертикальными" LT> особенностями) или все-таки обратимся к более универсальным LT> инструментам? "Целиком" нельзя, но в чем-то она может быть более удобной, чем универсальные средства (оцените пример 2). На этапе исследования какого-нибудь преобразования она оказывается очень полезной. (Довольно быстро становится видно, где "регулярные" случаи, где исключения из правил, а где и вовсе формально неразрешимые вопросы -- кандидат в "альтернативные теги". И если набор "исключений" обозримый, задачу данного преобразования можно считать решенной.) А уж если Вы ее эмулируете в Word'е... Пример "формально неразрешимого" вопроса -- написание оuбо/оuбw или языкъ/jазыкъ. Есть и "практически неразрешимые" вопросы: например, распознавание единственного/множественного числа (чтобы поставить правильное ударение) -- это на уровне анализа одного слова вовсе не понять, и даже синтаксический (а то и семантический) анализ фразы не всегда помогает. LT> Полагаю, что те тексты, которые живут в ТеХе, все равно не LT> минуют Ваши руки. А вот все в совокупности - потянете ли вы LT> лично? Понимаю, что Вас искушает предложить поступить именно LT> так, с оговоркой, что если Вы наткнетесь на нерешаемую в LT> рамках Вашей системы задачу - то ее следует попытаться LT> решить отдельно. Но поймите, что это не выход. Лично я LT> успокоился бы только в том случае, если вы четко возьмете на LT> себя обязательство решать любую возникающую по ходу дела LT> задачу по вертикальному преобразованию любого возможного ЦСл LT> текста. Вообще-то, скорее всего, единое средство для решения "любой возникающей по ходу дела задачи" -- это просто утопия. (Не считаю таким средством Word или Windows -- хоть к ним можно пристегнуть любую утилиту. "Виртуальная машина" -- это тоже ведь одна из утилит.) LT> > А вот что было б неплохо иметь -- некую визуализацию LT> > разночтений LT> LT> Именно такая система просто-напросто по жизни встроена в LT> Ворд. Уже в 6 Ворде она была, а может - и во втором. Принцип LT> такой: вы указываете файл, содержимое которого надо XOR с LT> загруженным в текущее окно текстом. Имеются в виду только различия типа "вместо буквы А написана буква Б" или это сравнение настолько разумно, что понимает возможные удаления/вставки? (Это уже не XOR!) М. Г. P. S.: жду ответов на вопросы по HIP. (Carthago delenda est!) =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 15:25:11 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: text archive and website -------------------------------------------------------------------------------- Я на выходных займусь сайтом проекта. Считаю нужным расширить тематику сайта, ведь даже название нашего списка рассылки уже не отражает всего объема осуществляемых исследований и экспериментов. И, действительно, надо бы выделить место для текстового архива церковно-славянских текстов. Название сайта у меня пока никак не получается придумать. Есть ли мысли на этот счет. И нет ли у кого возможности обеспечить хостинг на более устойчивом канале? Алексей =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 19:28:16 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: text archive and website -------------------------------------------------------------------------------- ----- Original Message ----- From: "A A G" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Friday, February 04, 2000 3:25 PM Subject: text archive and website > Я на выходных займусь сайтом проекта. Считаю нужным расширить тематику > сайта, ведь даже название нашего списка рассылки уже не отражает всего > объема осуществляемых исследований и экспериментов. И, действительно, надо > бы выделить место для текстового архива церковно-славянских текстов. > Название сайта у меня пока никак не получается придумать. Есть ли мысли на > этот счет. И нет ли у кого возможности обеспечить хостинг на более > устойчивом канале? Самый устойчивый хостинг - на Мреже (admin@mrezha.ru). Бесплатный и быстрый, открытый для всех православных. Она же orthodoxy.ru Одно но: сервер там IIS, надо полагать работают FrontPageExtensions и наверняка ASP. А вот насчет всяких WinCGI и прочих Перлов - сомневаюсь, но спросить стоит. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 19:30:03 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: text archive and website -------------------------------------------------------------------------------- *Welcome to the Windows NT/WS4.0, A A G*. You have new mail. *lux@bigfoot.com $* Friday, February 04, 2000 15:25:11, you wrote to me: AAG> Я на выходных займусь сайтом проекта. Считаю нужным расширить AAG> тематику сайта, ведь даже название нашего списка рассылки уже не AAG> отражает всего объема осуществляемых исследований и AAG> экспериментов. AAG> И, действительно, надо бы выделить место для текстового архива AAG> церковно-славянских текстов. Если это требуется _от меня_ -- проблем нет. AAG> И нет ли у кого возможности обеспечить хостинг на более AAG> устойчивом канале? А чем http://www.orthodoxy.ru не подходит? Они вроде бы, пока никому не отказывали... Попросись туда -- канал у них вполне приличный. Если будешь делать под меня, то скриптик работает так: вставляешь с новой строки в самом начале #include test.txt без всяких лишних символов, и он при отдаче гипертекста вставит в этом месте код из файла test.txt (лежит в той же директории, если в другой - ставь полный путь, типа #include tmp\test.txt #include ..\tmp\test\test.txt) В самих вставляемых файлах графику пиши тоже с полными путями, напр В общем, лучше тебе установить Есерв локально и потренироваться -- там все просто, думаю, разберешься. Если будешь делать под www.orthodoxy.ru (что, конечно же, гораздо разумнее) -- ничем помочь не могу, у них токмо asp скрипты. =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 20:40:17 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: text archive and website -------------------------------------------------------------------------------- > Если будешь делать под www.orthodoxy.ru (что, конечно же, гораздо > разумнее) -- ничем помочь не могу, у них токмо asp скрипты. > Так asp это вполне прогрессивно. Только он нас потребуют данные о нашем приходе и имя батюшки, нас благословившего. Прихода у нас никакого нет, как нет и епархии, к коей наш проект принадлежит. А что им про батюшку сказать? ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 21:03:39 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AG" Тема: Re: text archive and website -------------------------------------------------------------------------------- ----- Original Message ----- From: "AG" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Friday, February 04, 2000 8:40 PM Subject: Re: text archive and website > > Если будешь делать под www.orthodoxy.ru (что, конечно же, гораздо > > разумнее) -- ничем помочь не могу, у них токмо asp скрипты. > > > > Так asp это вполне прогрессивно. Только он нас потребуют данные о нашем > приходе и имя батюшки, нас благословившего. Прихода у нас никакого нет, как > нет и епархии, к коей наш проект принадлежит. А что им про батюшку сказать? Я попробую с ними договориться. Как будем зваться? Предлагаю churchslaviс.orthodoxy.ru и/или www.orthodoxy.ru/churchslaviс Название сайта - Церковнославянский язык, архив текстов и проблемы компьютерного издательства. Идет? ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 21:12:55 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: text archive and website -------------------------------------------------------------------------------- Lev Tikhonov wrote: > Предлагаю churchslaviс.orthodoxy.ru и/или www.orthodoxy.ru/churchslaviс > > Название сайта - Церковнославянский язык, архив текстов и проблемы > компьютерного издательства. А почему slavic а не slavonic. Я прошу прощения, что встреваю по всякой ерунде, вот только недавно компутер домой поставил, так может больше будет времени во все вникнуть. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 21:26:05 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: text archive and website -------------------------------------------------------------------------------- ----- Original Message ----- From: "Alexander V. Voinov" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Friday, February 04, 2000 9:12 PM Subject: Re: text archive and website > Lev Tikhonov wrote: > > Предлагаю churchslaviс.orthodoxy.ru и/или www.orthodoxy.ru/churchslaviс > > > > Название сайта - Церковнославянский язык, архив текстов и проблемы > > компьютерного издательства. > > А почему slavic а не slavonic. Я прошу прощения, что встреваю по всякой Да чуть короче. Считаешь, надо churchslavonic? Какие еще будут предложения? ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 21:23:27 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: text archive and website -------------------------------------------------------------------------------- > Lev Tikhonov wrote: > > Предлагаю churchslaviс.orthodoxy.ru и/или www.orthodoxy.ru/churchslaviс > > > > Название сайта - Церковнославянский язык, архив текстов и проблемы > > компьютерного издательства. > > А почему slavic а не slavonic. Я прошу прощения, что встреваю по всякой > ерунде, вот только недавно компутер домой поставил, так может больше > будет времени во все вникнуть. Я считаю безусловно правильным Slavonic. А вот название надо бы покороче и позвончее. То, что предлагает Лев хорошо звучит как название книжки. А как вы мне прикажете баннер делать с таким названием? "Котенка с таким именем..." Может какое сокращение выдумать. И уж как самую дурацкую мысль могу предложить "Феодор", в честь нашего первопечатника. Это на мотив "Елисаветы". Алексей ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 21:49:36 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AG" Тема: Re: text archive and website -------------------------------------------------------------------------------- > > А почему slavic а не slavonic. Я прошу прощения, что встреваю по всякой > > ерунде, вот только недавно компутер домой поставил, так может больше > > будет времени во все вникнуть. > > Я считаю безусловно правильным Slavonic. А вот название надо бы покороче и Может, просто slavonic.orthodoxy.ru? Тут ведь тоже звонкость не будет лишней. > позвончее. То, что предлагает Лев хорошо звучит как название книжки. А как > вы мне прикажете баннер делать с таким названием? "Котенка с таким > именем..." Может какое сокращение выдумать. И уж как самую дурацкую мысль > могу предложить "Феодор", в честь нашего первопечатника. Это на мотив > "Елисаветы". Вопрос-то не в баннере - потом можно сделать все, что угодно. А вот что поместить в этом ряду: Православные ресурсы интернет Библиотека Православный Свято-Тихоновский Богословский институт Николо-Кузнецкий Храм Православие в Китае Православный медико-просветительский Центр Жизнь Храм св. вмч. Георгия Победоносца на Средней Рогатке (Санкт-Петербург) Сестричество во имя преподобномученицы Великой Княгини Елизаветы Феодоровны Проект Виктора Сударикова Газета Православный Санкт-Петербург Туринская плащаница Православное Патрологическое Общество Лестовка. Некоторые богослужебные тексты. Проект Виктора Забавина. Газета "Вера"-"Эском" - Христианская газета Севера России Кормчий Информационный благотворительный узел "Помочь" Русь Державная - Православная народная газета Тропинка к храму. Православные страницы Александра Вострикова Православный навигатор Православный воин Свято-Никольский храм г.Таганрог Ростовской епархии Радиостанция "Радонеж" Благотворительное общество "Христианское Милосердие" Песни Русского Воскресения Литургика Православное Братство сщмч. Ермогена Возрождение колокольных звонов России. Проект Владимира Петровского ? Лев. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 21:53:57 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: text archive and website -------------------------------------------------------------------------------- Lev Tikhonov wrote: > > > > А почему slavic а не slavonic. Я прошу прощения, что встреваю по всякой > > > ерунде, вот только недавно компутер домой поставил, так может больше > > > будет времени во все вникнуть. > > > > Я считаю безусловно правильным Slavonic. А вот название надо бы покороче и > > Может, просто slavonic.orthodoxy.ru? Тут ведь тоже звонкость не будет > лишней. > > > позвончее. То, что предлагает Лев хорошо звучит как название книжки. А как > > вы мне прикажете баннер делать с таким названием? "Котенка с таким > > именем..." Может какое сокращение выдумать. И уж как самую дурацкую мысль > > могу предложить "Феодор", в честь нашего первопечатника. Это на мотив > > "Елисаветы". > > Вопрос-то не в баннере - потом можно сделать все, что угодно. А вот что > поместить в этом ряду: > > Православные ресурсы интернет А откуда такой странный список? Это все какие-то реальные ссылки на действующие сайты? Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 21:57:10 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: text archive and website -------------------------------------------------------------------------------- безусловно правильным Slavonic. А вот название надо бы покороче и > > Может, просто slavonic.orthodoxy.ru? Тут ведь тоже звонкость не будет > лишней. > Подходит. Или chslav.orthodoxy.ru ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 22:08:27 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AG" Тема: Re: text archive and website -------------------------------------------------------------------------------- ----- Original Message ----- From: "AG" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Friday, February 04, 2000 9:57 PM Subject: Re: text archive and website > безусловно правильным Slavonic. А вот название надо бы покороче и > > > > Может, просто slavonic.orthodoxy.ru? Тут ведь тоже звонкость не будет > > лишней. > > > > Подходит. Или chslav.orthodoxy.ru Это скорее что-то чешское ;) Может, все-таки slavonic? Или cslav? Саше Войнову: список - оттуда же: http://www.orthodoxy.ru Это проект о. Максима Обухова со богатыми чады. Один там р. Б. Александр все это фактически купил на свои деньги. Четырехпроцессорный сервер под NT, подключенный напрямую к M9 - точке обмена траффиком российских провайдеров. Предоставляют виртуальные домены и почтовые эккаунты всем желающим православным. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 21:23:27 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: text archive and website -------------------------------------------------------------------------------- > Lev Tikhonov wrote: > > Предлагаю churchslaviс.orthodoxy.ru и/или www.orthodoxy.ru/churchslaviс > > > > Название сайта - Церковнославянский язык, архив текстов и проблемы > > компьютерного издательства. > > А почему slavic а не slavonic. Я прошу прощения, что встреваю по всякой > ерунде, вот только недавно компутер домой поставил, так может больше > будет времени во все вникнуть. Я считаю безусловно правильным Slavonic. А вот название надо бы покороче и позвончее. То, что предлагает Лев хорошо звучит как название книжки. А как вы мне прикажете баннер делать с таким названием? "Котенка с таким именем..." Может какое сокращение выдумать. И уж как самую дурацкую мысль могу предложить "Феодор", в честь нашего первопечатника. Это на мотив "Елисаветы". Алексей ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 19:25:52 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Перекодировщик -------------------------------------------------------------------------------- 1. Пакет документов и перекодировщик выложен на http://hamster.lgg.ru/ftp/slav.zip Лазил я туда, лазил, а мне упорно отвечает - нет в природе такого урла. Я и просто хттп//хамстер.лгг.ру пробовал, тоже говорит нету. Может мне кто скажет в чем тут дело? Или просто пришлите перекодировщик если он не умопомрачительно огромный. ------------- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 22:47:11 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: text archive and website -------------------------------------------------------------------------------- Голосую за slavonic.orthodoxy.ru. Тут все на месте. Александр Lev Tikhonov wrote: > > ----- Original Message ----- > From: "AG" > To: "-=ORTHODOX-FONT=- Project Participants" > Sent: Friday, February 04, 2000 9:57 PM > Subject: Re: text archive and website > > > безусловно правильным Slavonic. А вот название надо бы покороче и > > > > > > Может, просто slavonic.orthodoxy.ru? Тут ведь тоже звонкость не будет > > > лишней. > > > > > > > Подходит. Или chslav.orthodoxy.ru > > Это скорее что-то чешское ;) > > Может, все-таки slavonic? Или cslav? > > Саше Войнову: список - оттуда же: http://www.orthodoxy.ru > > Это проект о. Максима Обухова со богатыми чады. Один там р. Б. Александр все > это фактически купил на свои деньги. > Четырехпроцессорный сервер под NT, подключенный напрямую к M9 - точке обмена > траффиком российских провайдеров. > > Предоставляют виртуальные домены и почтовые эккаунты всем желающим > православным. > > ---------------------------------------------------------------------- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 23:07:00 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Zajavka na hosting http://slavonic.orthodoxy.ru otpravlena (pusto) -------------------------------------------------------------------------------- ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 23:29:02 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: text archive and website -------------------------------------------------------------------------------- > > Подходит. Или chslav.orthodoxy.ru > > Это скорее что-то чешское ;) > > Может, все-таки slavonic? Или cslav? cslav - оптимальнее всего. > Четырехпроцессорный сервер под NT, подключенный напрямую к M9 - точке обмена > траффиком российских провайдеров. - Вам нравится авиационный бензин? - Нравится, - застенчиво ответил Козлевич. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 04 фев 2000 23:09:43 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AG" Тема: Re: text archive and website -------------------------------------------------------------------------------- > > А почему slavic а не slavonic. Я прошу прощения, что встреваю по всякой > > ерунде, вот только недавно компутер домой поставил, так может больше > > будет времени во все вникнуть. > Я предлагаю славоник - и коротко, и суть отражает. Не всегда ж он черч, мало ли что мы им набирать будем. > могу предложить "Феодор", в честь нашего первопечатника. Это на мотив > "Елисаветы". > Ох уж вы Алексей Анатольич с вашими именными проектами. :-))) Первопечатник-то чать Иван был Федоров. :-))) Я уж не говорю о том что Франциск Скорина на самом деле. :-))))) ------------- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 05 фев 2000 00:05:18 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: text archive and website -------------------------------------------------------------------------------- > > могу предложить "Феодор", в честь нашего первопечатника. Это на мотив > > "Елисаветы". > > > Ох уж вы Алексей Анатольич с вашими именными проектами. :-))) > Первопечатник-то чать Иван был Федоров. :-))) Я уж не говорю о том что > Франциск Скорина на самом деле. :-))))) Так не Иваном же проект называть! "Кто такой Савонарола? - Вероятно, сокращенье. " ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 05 фев 2000 07:06:33 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Поддержка латыни как языка в word'е -------------------------------------------------------------------------------- [To zhe samoje v kodirovke Win lezhit v attache] AV> Subject: Поддержка латыни как языка в word'е AV> Есть ли субж? Если нет, то еще меньше надежды на аналогичную AV> поддержку ц.с. >Знаю, что существуют компьютерные англо-латинские и >латинско-английские словари и латинские программы OCR. Вроде >бы видел латинскую проверку правописания (но не уверен). Все >это добро на порядок дороже аналогичных программ для "живых" >языков. Многое, однако и бесплатно раздают. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 05 фев 2000 07:09:35 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: website -------------------------------------------------------------------------------- У меня пока такие идеи по разделам для сайта. О проекте Рабочие документы Конференция Текстовый архив Шрифтовой архив Архив ПО Ссылки Что еще? =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 05 фев 2000 07:12:38 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: website -------------------------------------------------------------------------------- A A G wrote: > У меня пока такие идеи по разделам для сайта. > > О проекте > Рабочие документы > Конференция > Текстовый архив > Шрифтовой архив > Архив ПО > Ссылки > > Что еще? Кнопка download должна быть на самом видном месте. С уважением Александр ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 05 фев 2000 07:32:01 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: website -------------------------------------------------------------------------------- > Кнопка download должна быть на самом видном месте. > А чего именно download? У меня ведь несколько разделов предложено, где будут разные файлы храниться. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 05 фев 2000 07:58:44 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: website -------------------------------------------------------------------------------- A A G wrote: > > Кнопка download должна быть на самом видном месте. > > > > А чего именно download? У меня ведь несколько разделов предложено, где будут > разные файлы храниться. Ну да, именно они. Я имел в виду, что психология читателя страниц такова, что на детальное разбирательство может не быть времени. Если человек пришел что-то списать, то он должен иметь возможность сделать это максимально быстро. Вот, например, та страница с нотами, там вначале идет много рассуждений о том, что это за ноты, как они появились, кто регент хора и т.д. К счастью, кнопка "взять партитуры" находится тоже где-то наверху. Александр ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 05 фев 2000 10:41:24 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: text archive and website -------------------------------------------------------------------------------- Доброе утро! AGA wrote: > Первопечатник-то чать Иван был Федоров. :-))) Я уж не говорю о том что > Франциск Скорина на самом деле. :-))))) А еще первее был Швайпольт Фиоль. Заодно обнаружено интересное собрание: http://sun450.agir.ru/rslmes/mydisk/MEMORY/cyril.htm (не подскажете кстати, как можно оттуда скачать все картинки, не кликая на каждую отдельно?) М. Г. --------------------------- Dobroe utro! AGA wrote: > Pervopechatnik-to chat' Ivan byl Fedorov. :-))) Ja uzh ne govorju o tom chto > Francisk Skorina na samom dele. :-))))) A eshchjo pervee byl Shvajpol't Fiol'. Zaodno obnaruzheno interesnoe sobranie: http://sun450.agir.ru/rslmes/mydisk/MEMORY/cyril.htm (ne podskazhete kstati, kak mozhno ottuda skachat' vse kartinki, ne klikaja na kazhduju otdel'no?) M. G. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 05 фев 2000 11:07:07 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: text archive and website -------------------------------------------------------------------------------- > А еще первее был Швайпольт Фиоль. > Заодно обнаружено интересное собрание: > > http://sun450.agir.ru/rslmes/mydisk/MEMORY/cyril.htm > > (не подскажете кстати, как можно оттуда скачать все картинки, > не кликая на каждую отдельно?) > Говорят, под Юниксом есть wget - консольная программа с ключиками для этих целей. А еще есть куча виндовых GUI-шных программ, в чт шароварных, втч легко ломающихся. Например, можно скачать Offline Explorer (600кб) www.metaproducts.com и далее по ссылкам. Прекрасно вытянет весь сайт, оглянуться даже не успеешь. Если в системе установлен IE, начиная с какой-то версии - будет еще и в своем окошке показывать то, что успел уже вытянуть. Кроме того, будет сам работать как вебсервер на 800 порту. ENTER REGNAME: Michail Grinchuk REGCODE iS: 446333-572464477-AQ Если ключик не подойдет - вышлю более новый. Впрочем, месяц проработает и без ключика. С уважением, Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 05 фев 2000 11:10:59 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: text archive and website -------------------------------------------------------------------------------- Прошу прощения за ISO-кодировку > А еще первее был Швайпольт Фиоль. > Заодно обнаружено интересное собрание: > > http://sun450.agir.ru/rslmes/mydisk/MEMORY/cyril.htm > > (не подскажете кстати, как можно оттуда скачать все картинки, > не кликая на каждую отдельно?) > Говорят, под Юниксом есть wget - консольная программа с ключиками для этих целей. А еще есть куча виндовых GUI-шных программ, в чт шароварных, втч легко ломающихся. Например, можно скачать Offline Explorer (600кб) www.metaproducts.com и далее по ссылкам. Прекрасно вытянет весь сайт, оглянуться даже не успеешь. Если в системе установлен IE, начиная с какой-то версии - будет еще и в своем окошке показывать то, что успел уже вытянуть. Кроме того, будет сам работать как вебсервер на 800 порту. ENTER REGNAME: Michail Grinchuk REGCODE iS: 446333-572464477-AQ Если ключик не подойдет - вышлю более новый. Впрочем, месяц проработает и без ключика. С уважением, Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 06 фев 2000 20:06:37 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Udivitel'noe r'adom ;-) -------------------------------------------------------------------------------- Я вот сейчас отсканировал и пригладил в Ворде месяцеслов из Календаря МП Наконец-то, похоже, спеллчекер обучали и на церковном календаре тоже. Он и не думает ругаться ни на прилагательное Митилинский, ни на имя Снандулия (Яздунокта) ;-) ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вс, 06 фев 2000 20:09:44 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Udivitel'noe r'adom ;-) -------------------------------------------------------------------------------- > Я вот сейчас отсканировал и пригладил в Ворде месяцеслов из Календаря МП > > Наконец-то, похоже, спеллчекер обучали и на церковном календаре тоже. > Он и не думает ругаться ни на прилагательное Митилинский, ни на имя > Снандулия (Яздунокта) ;-) Mea culpa. Он был просто отключен ;=(( ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 07 фев 2000 05:28:35 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Случайная ссылочка - Unicode шрифт со старой орфографией. -------------------------------------------------------------------------------- У меня этот шрифт работает вполне стабильно на 98 и 95. А один человек по моему наущению использует царскую орфографию в Юникоде постоянно при посылке сообщений на Православную Беседу. У него тоже этот шрифт стоит. Многие жалуются, что не могут прочитать, ну так ведь без подходящего шрифта это мудрено. Кроме Lucida Sans Serif нет шрифтов с ятем более или менее гарантированно присутствующих на всех виндусовых системах. Но в Люсиде , кажется, нет ижицы. Ну, про церковнославянский шрифт, сделанный в Юникоде, мы с Александром уже рассказывали. > Кодировка Unicode, шрифтъ на > > http://209.224.56.68/Xsuni.TTF > > (Упомянут и использован на Кураевском форума > http://kuraev.vinchi.ru:8101/gb/view.php3?subj=3173, яти там у меня > отображаются квадратиками, видимо в связи с отсутствием ятей в Times New > Roman - OpenType под Win2k. > > Хотелось бы знать, как у кого и под какой платформой? > > > ---------------------------------------------------------------------- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru > > =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 07 фев 2000 06:16:53 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Случайная ссылочка - Unicode шрифт со старой орфографией. -------------------------------------------------------------------------------- > моему наущению использует царскую орфографию в Юникоде постоянно при посылке > сообщений на Православную Беседу. У него тоже этот шрифт стоит. Многие :-)))) И как только люди не извращаются... :-))) Вы мне лучше все же скажите: почему вот это -------- 1. Пакет документов и перекодировщик выложен на http://hamster.lgg.ru/ftp/slav.zip -------- есть нахальная дезинформация, и работать данный урл не желает ни в какую? Из того, что на первое мое письмо подобного содержания никто не ответил, я заключаю, что никто туда еще и не заглянул. Стыдно, товарищи, стыдно! Человек писал, старался, а вы - ноль внимания... ------------- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 07 фев 2000 07:27:10 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Случайная ссылочка - Unicode шрифт со старой орфографией. -------------------------------------------------------------------------------- А у меня он не поставился под русскую В98. Почему? Говорит, что оно не является правильным файлом шрифта. Александр A A G wrote: > > У меня этот шрифт работает вполне стабильно на 98 и 95. А один человек по > моему наущению использует царскую орфографию в Юникоде постоянно при посылке > сообщений на Православную Беседу. У него тоже этот шрифт стоит. Многие > жалуются, что не могут прочитать, ну так ведь без подходящего шрифта это > мудрено. Кроме Lucida Sans Serif нет шрифтов с ятем более или менее > гарантированно присутствующих на всех виндусовых системах. Но в Люсиде , > кажется, нет ижицы. Ну, про церковнославянский шрифт, сделанный в Юникоде, > мы с Александром уже рассказывали. > > > Кодировка Unicode, шрифтъ на > > > > http://209.224.56.68/Xsuni.TTF > > > > (Упомянут и использован на Кураевском форума > > http://kuraev.vinchi.ru:8101/gb/view.php3?subj=3173, яти там у меня > > отображаются квадратиками, видимо в связи с отсутствием ятей в Times New > > Roman - OpenType под Win2k. > > > > Хотелось бы знать, как у кого и под какой платформой? > > > > > > ---------------------------------------------------------------------- > > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru > > > > > > ЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪ9г83—ЭSЌ®€чrъЪ1ЁҐ.+-Іг«ѕ'ўs«¶ ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 07 фев 2000 08:52:38 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Случайная ссылочка - Unicode шрифт со старой орфографией. -------------------------------------------------------------------------------- > Вы мне лучше все же скажите: почему вот это > -------- > 1. Пакет документов и перекодировщик выложен на > http://hamster.lgg.ru/ftp/slav.zip Висит сервер ихненский. На всякий случай копирую Диме не работу. > есть нахальная дезинформация, и работать данный урл не желает ни в какую? > > Из того, что на первое мое письмо подобного содержания никто не ответил, я > заключаю, что никто туда еще и не заглянул. Стыдно, товарищи, стыдно! > Человек писал, старался, а вы - ноль внимания... Я лично туда заглянул сразу же, прочитал документы и сразу же попытался установить перекодировщик, но у меня почему-то повис инсталлятор (Win2k). Архив был где-то во временной директории, и сейчас не обретается. Левъ. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 07 фев 2000 09:11:27 От: "S. M. Hozainov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Случайная ссылочка - Unicode шрифт со старой орфографией. -------------------------------------------------------------------------------- ----- Original Message ----- From: Lev Tikhonov To: -=ORTHODOX-FONT=- Project Participants Sent: 7 февраля 2000 г. 8:52 Subject: Re: Случайная ссылочка - Unicode шрифт со старой орфографией. > > > Вы мне лучше все же скажите: почему вот это > > -------- > > 1. Пакет документов и перекодировщик выложен на > > http://hamster.lgg.ru/ftp/slav.zip > > > Висит сервер ихненский. На всякий случай копирую Диме не работу. > > > есть нахальная дезинформация, и работать данный урл не желает ни в какую? Мне удалось скачать этот врхив. 1.7 Mb. Куда и кому его переслать? С уважением, Сергей Михайлович Хозяинов. smh@mail.ru http://stop.at/smh ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 07 фев 2000 09:13:13 От: "Dima A. Smirnov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Subject: Re: Случайная ссылочка - Unicode шрифт со старой орфографией. -------------------------------------------------------------------------------- Здравствуйте. > > Висит сервер ихненский. На всякий случай копирую Диме не работу. Действительно последнюю неделю висит. Обещали, что сегодня заработает.... Это не от меня зависит. > установить перекодировщик, но у меня почему-то повис инсталлятор (Win2k). > Архив был где-то во временной директории, и сейчас не обретается. Специально попробовал -- все поставилось под Вин 98 и под вин 95. А вот про НТ я не знаю -- негде было проверить. Так, что я думаю тут проблемма из-за НТ (Лев ведь на НТ работает, так ведь?). И дело вот в чем. У Си Билдера есть привычка использовать разные библиотеки, которые надо включать в дистрибутив, и то, какие это библиотеки в данном случае определялось опытным путем. В следующей бетте я думаю все будет пофиксено.... кажется имеется обходной маневр, что-бы обойти проблему. > ---------------------------------------------------------------------- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru > Д.С. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 07 фев 2000 09:17:55 От: "Dima A. Smirnov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Convertor -------------------------------------------------------------------------------- В продолжение предыдущего письма. Хотя возможно проблемма в программе-установщике, может у нее какой глюк с НТ. Если Лев не против -- я пошлю ему почтой файлы программы -- распаковать. Может собственно конвертор тут не причем. Д.С. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 07 фев 2000 09:39:09 От: "S. M. Hozainov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Случайная ссылочка - Unicode шрифт со старой орфографией. -------------------------------------------------------------------------------- ----- Original Message ----- From: Dima A. Smirnov To: -=ORTHODOX-FONT=- Project Participants Sent: 7 февраля 2000 г. 9:13 Subject: Re: Случайная ссылочка - Unicode шрифт со старой орфографией. Здравствуйте! > > установить перекодировщик, но у меня почему-то повис инсталлятор (Win2k). > > Архив был где-то во временной директории, и сейчас не обретается. > > Специально попробовал -- все поставилось под Вин 98 и под вин 95. У меня под W98SE также установился без проблем. С уважением, Сергей Михайлович Хозяинов. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 07 фев 2000 17:08:45 От: postmaster Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: text archive and website -------------------------------------------------------------------------------- *Welcome to the Windows NT/WS4.0, Lev Tikhonov*. You have new mail. *leva@des-nt.tstu.ru $* Friday, February 04, 2000 21:03:39, you wrote to me: LT> Предлагаю churchslaviс.orthodoxy.ru и/или www.orthodoxy.ru/churchslaviс LT> Идет? Не идет. Ты бы еще что-нить подлиннее придумал. (и слово еси не забудь применить ;-) =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 07 фев 2000 17:38:06 От: postmaster Кому: font-list@orthodox.tstu.ru Тема: Fwd: Re[2]: text archive and website -------------------------------------------------------------------------------- *Welcome to the Windows NT/WS4.0, AG*. You have new mail. *lux@bigfoot.com $* Friday, February 04, 2000 21:23:27, you wrote to me: www.orthodoxy.ru/feodor самое то! A> Я считаю безусловно правильным Slavonic. А вот название надо бы покороче и A> позвончее. То, что предлагает Лев хорошо звучит как название книжки. А как A> вы мне прикажете баннер делать с таким названием? "Котенка с таким A> именем..." Может какое сокращение выдумать. И уж как самую дурацкую мысль A> могу предложить "Феодор", в честь нашего первопечатника. Это на мотив A> "Елисаветы". =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 07 фев 2000 18:07:34 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Конвертер смирновский -------------------------------------------------------------------------------- > > Мне удалось скачать этот врхив. 1.7 Mb. Куда и кому его переслать? > Ой кошмар какой... Мне переслать, только если можно, кусками. А то мой почтовый сервер, сдается мне, дольше скольки-то минут качать не понимает одно сообщение - прерывается. ------------- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 07 фев 2000 17:52:01 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Случайная ссылочка - Unicode шрифт со старой орфографией. -------------------------------------------------------------------------------- > А у меня он не поставился под русскую В98. Почему? Говорит, что оно не > является правильным файлом шрифта. > > Александр > Я смутно что-то такое вспоминаю. А как Вы его ставили? Копированием или же через менюшку? ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 07 фев 2000 19:39:29 От: "S. M. Hozainov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: Конвертер смирновский -------------------------------------------------------------------------------- ----- Original Message ----- From: AGA To: -=ORTHODOX-FONT=- Project Participants Sent: 7 февраля 2000 г. 18:07 Subject: Конвертер смирновский > > Мне удалось скачать этот врхив. 1.7 Mb. Куда и кому его переслать? > > > Ой кошмар какой... Мне переслать, только если можно, кусками. А то мой > почтовый сервер, сдается мне, дольше скольки-то минут качать не понимает > одно сообщение - прерывается. > ------------- > > Архангельский Г.А. Какого размера куски и с каким интервалом их слать? Многотомный ARJ архив подойдет? С уважением, Сергей Михайлович Хозяинов. smh@mail.ru http://stop.at/smh ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пн, 07 фев 2000 21:22:40 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Конвертер смирновский -------------------------------------------------------------------------------- Мне можно целым куском. Спасибо. Александр > > Мне удалось скачать этот врхив. 1.7 Mb. Куда и кому его переслать? > > > Ой кошмар какой... Мне переслать, только если можно, кусками. А то мой ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 10 фев 2000 15:28:34 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: имя для сайта -------------------------------------------------------------------------------- Кириллу Хрусталеву и мне независимо пришло в голову такое название - ПЕЧАТНЫЙ ДВОР У кого какие соображения на этот счет? Алексей Гришин =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 10 фев 2000 22:39:29 От: "S. M. Hozainov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: имя для сайта -------------------------------------------------------------------------------- ----- Original Message ----- From: A A G To: -=ORTHODOX-FONT=- Project Participants Sent: 10 февраля 2000 г. 15:28 Subject: имя для сайта > Кириллу Хрусталеву и мне независимо пришло в голову такое название - > > ПЕЧАТНЫЙ ДВОР > > > У кого какие соображения на этот счет? > > Алексей Гришин ПЕЧАТНЫЙ ДВОР В самую точку! С уважением, Сергей Михайлович Хозяинов ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 10 фев 2000 21:58:22 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: имя для сайта -------------------------------------------------------------------------------- > ПЕЧАТНЫЙ ДВОР > Одобрямс. А кто такой Кирилл Хрусталев? ------------- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 10 фев 2000 23:26:41 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Re: имя для сайта -------------------------------------------------------------------------------- Т.е. "печатный двор" при Церкви, чтобы в полном названии и соответствующем урл это все было? Тогда да. А то мало ли таких дворов... Александр A A G wrote: > > Кириллу Хрусталеву и мне независимо пришло в голову такое название - > > ПЕЧАТНЫЙ ДВОР > > У кого какие соображения на этот счет? > > Алексей Гришин > > ЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪЪ9г83—ЭSЌ®€чrъЪ1ЁҐ.+-Іг«ѕ'ўs«¶ =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 10 фев 2000 23:36:33 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: имя для сайта -------------------------------------------------------------------------------- > > ПЕЧАТНЫЙ ДВОР > > > Одобрямс. А кто такой Кирилл Хрусталев? > ------------- Соработник мой по "Елисавете". А Печатный Дворъ еще лучше. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 10 фев 2000 23:45:09 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: имя для сайта -------------------------------------------------------------------------------- > Т.е. "печатный двор" при Церкви, чтобы в полном названии и > соответствующем урл это все было? Тогда да. А то мало ли таких дворов... С ером, может, и мало. А официальное название можно расширить. Но суть, кажется, очень хорошо передает. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 11 фев 2000 00:03:53 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Re: имя для сайта -------------------------------------------------------------------------------- AG wrote: > > > Т.е. "печатный двор" при Церкви, чтобы в полном названии и > > соответствующем урл это все было? Тогда да. А то мало ли таких дворов... > > С ером, может, и мало. А официальное название можно расширить. Но суть, > кажется, очень хорошо передает. Нет-нет, надо, чтобы принадлежность к Церкви была четко сформулирована. Как вот было недавно: slavonic.orthodoxy.ru. Так и вспоминаются официальные шапки советского времени: МИНИСТЕРСТВО ВЫСШЕГО И СРЕДНЕГО ОБРАЗОВАНИЯ СССР ЛЕНИНГРАДСКИЙ УНИВЕРСИТЕТ АСТРОНОМИЧЕСКАЯ ОБСЕРВАТОРИЯ и далее название документа. Вот я нечто подобное имел в виду. Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 11 фев 2000 00:31:37 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: имя для сайта -------------------------------------------------------------------------------- > Нет-нет, надо, чтобы принадлежность к Церкви была четко сформулирована. > Как вот было недавно: slavonic.orthodoxy.ru. Так и вспоминаются > официальные шапки советского времени: И как Вы предлагаете? Ведь хочется покороче. Издательский отдел Московской Патриархии уже есть. Кстати, пару недель назад, я получил оттуда письмо, развеявшее один красивый, но беспочвенный миф, что якобы есть в Патриархии чудо-шрифт, которым славянские книги можно вельми хорошо издавать, но они этот шрифт держат для внутреннего употребления. И вот они мне недавно написали и поинтересовались, какими шрифтами я пользуюсь на веб-страницах и можно ли их у меня купить. Ну так как же? Православный Печатный Дворъ? Церковный Печатный Дворъ? Можно, конечно, шапку в советстком стиле, да только к какой организации себя причислить? Не к вольным же каменщикам :) Мне больше нравится Печатный Дворъ как название сайта, а уж подзаголовок может быть любой. Алексей ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 11 фев 2000 00:36:36 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: имя для сайта -------------------------------------------------------------------------------- ----- Original Message ----- From: "Alexander V. Voinov" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Friday, February 11, 2000 12:03 AM Subject: Re: имя для сайта > AG wrote: > > > > > Т.е. "печатный двор" при Церкви, чтобы в полном названии и > > > соответствующем урл это все было? Тогда да. А то мало ли таких дворов... > > > > С ером, может, и мало. А официальное название можно расширить. Но суть, > > кажется, очень хорошо передает. > > Нет-нет, надо, чтобы принадлежность к Церкви была четко сформулирована. > Как вот было недавно: slavonic.orthodoxy.ru. Так и вспоминаются Ну уж от этого мы никуда и не уйдем. admin@mrezha.ru утверждает, что эта запись уже добавлена в DNS (хотя пока что я этого не замечаю). Завтра обещал предоставить l:p для заливки контента. А вот с ером или без ера делать ссылку - это вопрос академический, до тех пор, пока админы не сочтут контент достойным ссылки с главной страницы сайта. Лев. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 11 фев 2000 00:37:54 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Re: имя для сайта -------------------------------------------------------------------------------- Ну, не знаю. Конечно, и так можно, это не принципиально. Вот еще что вспомнил. В СПб есть учреждение с таким же названием. Вряд ли у них есть Интернетовская страница, но наверняка в поисковых системах оно засветилось. Александр AG wrote: > > > Нет-нет, надо, чтобы принадлежность к Церкви была четко сформулирована. > > Как вот было недавно: slavonic.orthodoxy.ru. Так и вспоминаются > > официальные шапки советского времени: > > И как Вы предлагаете? Ведь хочется покороче. Издательский отдел Московской > Патриархии уже есть. Кстати, пару недель назад, я получил оттуда письмо, > развеявшее один красивый, но беспочвенный миф, что якобы есть в Патриархии > чудо-шрифт, которым славянские книги можно вельми хорошо издавать, но они > этот шрифт держат для внутреннего употребления. И вот они мне недавно > написали и поинтересовались, какими шрифтами я пользуюсь на веб-страницах и > можно ли их у меня купить. > Ну так как же? Православный Печатный Дворъ? Церковный Печатный Дворъ? Можно, > конечно, шапку в советстком стиле, да только к какой организации себя > причислить? Не к вольным же каменщикам :) > Мне больше нравится Печатный Дворъ как название сайта, а уж подзаголовок > может быть любой. > > Алексей > > ---------------------------------------------------------------------- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 11 фев 2000 02:16:33 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: имя для сайта -------------------------------------------------------------------------------- > Ну, не знаю. Конечно, и так можно, это не принципиально. > > Вот еще что вспомнил. В СПб есть учреждение с таким же названием. Вряд > ли у них есть Интернетовская страница, но наверняка в поисковых системах > оно засветилось. Хм... У нас вот тут церковь в честь Святителя Николая. Тоже, наверно, не слишком оригинально :) Может нам пока принять Печатный Дворъ за основу, а если в обозримом будущем появится лучшая идея, то переименуем, а Печатный Дворъ можно будет оставить как некого рода подзаголовок? Если у кого есть какая подходящая графика для сайта - шлите мне. Алексей =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 11 фев 2000 02:27:19 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Re: имя для сайта -------------------------------------------------------------------------------- A A G wrote: > > > Ну, не знаю. Конечно, и так можно, это не принципиально. > > > > Вот еще что вспомнил. В СПб есть учреждение с таким же названием. Вряд > > ли у них есть Интернетовская страница, но наверняка в поисковых системах > > оно засветилось. > > Хм... У нас вот тут церковь в честь Святителя Николая. Тоже, наверно, не > слишком оригинально :) Ну, Алексей, разница-то есть. Когда пересекаются имена, возможные самые разные проблемы. Зачем их создавать? Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 11 фев 2000 03:12:45 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: имя для сайта -------------------------------------------------------------------------------- > Ну, Алексей, разница-то есть. Когда пересекаются имена, возможные самые > разные проблемы. Зачем их создавать? Не хотел об этом говорить, но на самом деле конторы с такими названиями есть еще по меньшей мере в Самаре и, кажется, в Томске. Их, видимо, совпадение имен ничуть не смутило. И сильно я сомневаюсь, что им так дороги традиции Печатного Двора. Повторяю, если есть название лучше, то кто же будет тому прекословить! Просто у меня без названия и соответствующего ему логотипа никак не клеится дизайн сайта. Жду других предложений до субботы. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 11 фев 2000 03:18:55 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Subject: Re: имя для сайта -------------------------------------------------------------------------------- A A G wrote: > > > Ну, Алексей, разница-то есть. Когда пересекаются имена, возможные самые > > разные проблемы. Зачем их создавать? > > Не хотел об этом говорить, но на самом деле конторы с такими названиями есть > еще по меньшей мере в Самаре и, кажется, в Томске. А, ну тогда хорошо, проблемы нет. Пусть сами разбираются. Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 11 фев 2000 17:20:01 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: идейка для зубров и монстров -------------------------------------------------------------------------------- Известно, что для обоих популярных браузеров существуют специальные тулкиты для их оптимизации и персонализации. А ведь неплохо было бы сделатъ такие инсталляционные пакеты ориентированные на православных пользователей. С линками, дизайном и, если можно, шрифтами. Доработку идеи оставляю на любителя. Может быть, кто-нибудь загорится желанием попробовать. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 11 фев 2000 17:58:38 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: www.slavonic.orthodoxy.ru -------------------------------------------------------------------------------- Такой сайт уже есть, а вот доступ по фтп по разгильдяйству сделать забыли, так что теперь придется подождать до понедельника. Лев. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 11 фев 2000 18:02:16 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: www.slavonic.orthodoxy.ru -------------------------------------------------------------------------------- А что, без префикса www не будет работать? > Такой сайт уже есть, а вот доступ по фтп по разгильдяйству сделать забыли, > так что теперь придется подождать до понедельника. > > Лев. > > > ---------------------------------------------------------------------- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru > > ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Сб, 12 фев 2000 02:00:10 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AG" Тема: Re: www.slavonic.orthodoxy.ru -------------------------------------------------------------------------------- > А что, без префикса www не будет работать? Пока они сделали так - почему-то у них такой стандарт. Будет контент - сделают ссылку с основной страницы сайта и можно будет еще о чем-то просить. Лев. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 15 фев 2000 05:45:25 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: yet another CS system -------------------------------------------------------------------------------- Давненько уж я эту страницу видел, а теперь снова посетил. Интересно, конечно, да дорого и вряд ли годится на серьезное дело. http://www.worldlanguage.com/search/language/498.html =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 15 фев 2000 07:10:25 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: yet another CS system -------------------------------------------------------------------------------- A A G wrote: > Давненько уж я эту страницу видел, а теперь снова посетил. Интересно, > конечно, да дорого и вряд ли годится на серьезное дело. > > http://www.worldlanguage.com/search/language/498.html Мда. Причем хоть бы скриншоты показали... Александр ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 15 фев 2000 13:57:51 От: "Lev Tikhonov" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: yet another CS system -------------------------------------------------------------------------------- ----- Original Message ----- From: "Alexander V. Voinov" To: "-=ORTHODOX-FONT=- Project Participants" Sent: Tuesday, February 15, 2000 7:10 AM Subject: Re: yet another CS system > A A G wrote: > > > Давненько уж я эту страницу видел, а теперь снова посетил. Интересно, > > конечно, да дорого и вряд ли годится на серьезное дело. > > > > http://www.worldlanguage.com/search/language/498.html > > Мда. Причем хоть бы скриншоты показали... А ты не мог бы с ними списаться и попросить демонстрационные версии? Если не дадут - допросить с пристрастием, какие там использованы кодировки, раскладки клавиатуры и системы набора... Объясни, что у них есть масса конкурентов и на них свет клином не сошелся. Напой, что если их система окажется превосходящей - мы будем двигать их стандарт... итд итп Лев. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 15 фев 2000 15:05:14 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: yet another CS system -------------------------------------------------------------------------------- > > > Давненько уж я эту страницу видел, а теперь снова посетил. Интересно, > > > конечно, да дорого и вряд ли годится на серьезное дело. > > > > > > http://www.worldlanguage.com/search/language/498.html Объясните що це таке - инет дорогой. :-) И кто такие. > Объясни, что у них есть масса конкурентов и на них свет клином не сошелся. Ни, никакоже. Но что они самые единственные, самые лучшие, самые умные и мы убогие хотим приобщиться кусочку их бесценного опыта и знаний. :-) А то все ты Лев Евгеньич со своими комиссарскими методами шокотерапевтическими. :-) > Напой, что если их система окажется превосходящей - мы будем двигать их > стандарт... итд итп > А вот это уже ближе. "Мы думаем что ваша система превосходящая и хотим двигать ваш стандарт. Но может вы посмотрите нашу систему и какие-то крупицы полезности будут и там?" А кончится принятием нашей системы, которая правда сдается мне еще не родилась. :-) ------------- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 15 фев 2000 19:23:54 От: "AG" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: yet another CS system -------------------------------------------------------------------------------- > Объясните що це таке - инет дорогой. :-) И кто такие. > Brief Description: Professional-quality SlavonicLS, OldSlavonicLS, ChurchSlavonicLS, SlavonicExtras, and BookSlavonic Type 1 and TrueType outline fonts and corresponding bitmap fonts in a transliterated system 7 keyboard arrangement. OldSlavonicLS represents the earlier, and perhaps more complete, form of Slavonic, with many letter-forms which were dropped or disappeared over the years. BookSlavonic reproduces the more common form of Slavonic encountered in liturgical and other texts, and is optimized for laser-printing. ChurchSlavonicLS includes the faint sloping calligraphic flavor of the alphabet seen in books today and would therefore be better for those who have 600 dpi or better printers. SlavonicLS is the same as OldSlavonicLS, except that the i and n are replaced with the modern form of these characters for those users who prefer those forms. SlavonicExtras contains rarely used Slavonic characters complementing the other fonts. Includes a remapped, transliterated keyboard arrangement for optimally efficient keyboard entry of overstriking swashes for omitted characters, etc. Includes UserЖs Manual, Keyboard Layout Chart(s), and keycap sticker sheet. И при этим картинка их софта в коробке. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 15 фев 2000 20:15:16 От: "AGA" Кому: "-=ORTHODOX-FONT=- Project Participants" , "AG" Тема: Re: yet another CS system -------------------------------------------------------------------------------- > > Объясните що це таке - инет дорогой. :-) И кто такие. > > > Brief Description: Professional-quality SlavonicLS, OldSlavonicLS, Так а кто это делает-то? (кстати - а что подразумевалось под yet another - еще одна? разве так говорят?) > Slavonic encountered in liturgical and other texts, and is optimized for > laser-printing. ChurchSlavonicLS includes the faint sloping calligraphic Это як же - оптимайзд для лазерпринтер? Вообще странный какой-то подход - подгонять начертание шрифта под оборудование. Или "оптимайзд" не начертания касается? > OldSlavonicLS, except that the i and n are replaced with the modern form of Это как же? N косое на Н прямое? А что за И модерновое? > И при этим картинка их софта в коробке. > Даже в коробке? Так это какая-то крутая контора? ------------- Архангельский Г.А. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Вт, 15 фев 2000 15:11:19 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: yet another CS system -------------------------------------------------------------------------------- Написал. Ждем-с. Кстати, почему-то на их основных страницах этот продукт не прописан. А еще мне казалось, что они делали старославянски-русско-английский словарь. Но, может, не они. У меня где-то валяется двухнедельная демонстрашка. Мне ее, правда, даже крякать не захотелось. А еще, братие, я купил сканер и продолжил эксперименты по сканированию. Дело не так безнадежно. Но нужен FineReader Pro. > > > > > Давненько уж я эту страницу видел, а теперь снова посетил. Интересно, > > > конечно, да дорого и вряд ли годится на серьезное дело. > > > > > > http://www.worldlanguage.com/search/language/498.html > > > > Мда. Причем хоть бы скриншоты показали... > > > А ты не мог бы с ними списаться и попросить демонстрационные версии? Если не > дадут - допросить с пристрастием, какие там использованы кодировки, > раскладки клавиатуры и системы набора... > Объясни, что у них есть масса конкурентов и на них свет клином не сошелся. > Напой, что если их система окажется превосходящей - мы будем двигать их > стандарт... итд итп > > Лев. > > > ---------------------------------------------------------------------- > -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru > > =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 16 фев 2000 01:58:37 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: yet another CS system -------------------------------------------------------------------------------- A A G wrote: > А еще, братие, я купил сканер и продолжил эксперименты по сканированию. Дело > не так безнадежно. Но нужен FineReader Pro. Если ты насканируешь разных букв, я помогу довести это до шрифта. "Я помогу" в данном случае звучит слишком громко, квадратики мышкой кто угодно может перетащить, но во всяком случае я готов это сделать. А то Ижица слегка надоела. А в Ирмологионе такое несоответствие размера шрифта, что даже браться за него не хочется. Да и не самый он изящный. Сканера в нашем храме не будет долго (но будет, наверное уже без меня), а на работе это все-таки трудно. С уважением Александр =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 16 фев 2000 04:57:39 От: "A A G" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re: yet another CS system -------------------------------------------------------------------------------- > Если ты насканируешь разных букв, я помогу довести это до шрифта. "Я > помогу" в данном случае звучит слишком громко, квадратики мышкой кто > угодно может перетащить, но во всяком случае я готов это сделать. А то > Ижица слегка надоела. А в Ирмологионе такое несоответствие размера > шрифта, что даже браться за него не хочется. Да и не самый он изящный. Насканировать-то несложно, да ведь надо еще и всякую хинтовку провести. Возможно ли сие? Алексей =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 16 фев 2000 06:07:33 От: Daniel Tereschenko Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Re[2]: yet another CS system -------------------------------------------------------------------------------- Tuesday, February 15, 2000, 10:45:16 PM, AGA wrote: >> OldSlavonicLS, except that the i and n are replaced with the modern form > of > Это как же? N косое на Н прямое? А что за И модерновое? Наверное, с одной точкой вместо двух. > Архангельский Г.А. С уважением, Даниил Терещенко ---------------------------------- Будет вам и белка, будет и свисток... Pycckue ugym! -- http://distributed.net.ru ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 16 фев 2000 10:27:53 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: yet another CS system -------------------------------------------------------------------------------- A A G wrote: > > Если ты насканируешь разных букв, я помогу довести это до шрифта. "Я > > помогу" в данном случае звучит слишком громко, квадратики мышкой кто > > угодно может перетащить, но во всяком случае я готов это сделать. А то > > Ижица слегка надоела. А в Ирмологионе такое несоответствие размера > > шрифта, что даже браться за него не хочется. Да и не самый он изящный. > > Насканировать-то несложно, да ведь надо еще и всякую хинтовку провести. > Возможно ли сие? Ну, если в программе кнопки есть, то можно попробовать. К сожалению книга про шрифты осталась в России. Александр ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Ср, 16 фев 2000 21:44:24 От: postmaster Кому: font-list@orthodox.tstu.ru Тема: *** произведены профилактические работы -------------------------------------------------------------------------------- *Welcome to the Windows NT/WS4.0, font-list*. You have new mail. Если кто 16.02.2000 (среда) не мог получить/принять письма с сервера, звиняйте, он в связи с сабжем был выключен почти пол дня. Перешел с Eserv/2.7 на Eserv/2.9 и кое что перестраивал по ходу. =postmaster ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 17 фев 2000 07:30:31 От: "Kirill Khroustalev" Кому: "-=ORTHODOX-FONT=- Project Participants" Тема: Predlozhenie ot chainika -------------------------------------------------------------------------------- Братие Я чайник. Посему за свое предложение горой не встану. Тем более и не знаю как за это взяться. Но вот есть такой стандарт, TEI(SGML), может нам попробовать в его рамках сделать и церковнославянский стандарт, а не изобретать велосипед с HIP? Может есть знающие люди которые могут этой идеей воспользоваться? Наверняка ТеХовским фанам идея понравиться:) Вот ссылка http://xtalk.price.ru:8002/SGML/ Бог в помощь Кирилл =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 17 фев 2000 08:08:04 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Predlozhenie ot chainika -------------------------------------------------------------------------------- Kirill Khroustalev wrote: > Братие > > Я чайник. Посему за свое предложение горой не встану. Тем более и не знаю > как за это взяться. Но вот есть такой стандарт, TEI(SGML), может нам > попробовать в его рамках сделать и церковнославянский стандарт, а не > изобретать велосипед с HIP? Может есть знающие люди которые могут этой идеей > воспользоваться? Наверняка ТеХовским фанам идея понравиться:) > Вот ссылка > http://xtalk.price.ru:8002/SGML/ Да, Борис Тоботрас - человек серьезный, хотя и несколько высокомерный: не очень торопится объяснять очевидные с его точки зрения вещи. Он давно работает и с sgml, и с TeX'ом. Он - модератор фидо-эхи ru.linux. Но ASCII-представление в любом случае имеет смысл. Александр ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 17 фев 2000 08:16:53 От: "Alexander V. Voinov" Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Predlozhenie ot chainika -------------------------------------------------------------------------------- Kirill Khroustalev wrote: > Братие > > Я чайник. Посему за свое предложение горой не встану. Тем более и не знаю > как за это взяться. Но вот есть такой стандарт, TEI(SGML), может нам > попробовать в его рамках сделать и церковнославянский стандарт, а не > изобретать велосипед с HIP? Может есть знающие люди которые могут этой идеей > воспользоваться? Наверняка ТеХовским фанам идея понравиться:) > Вот ссылка > http://xtalk.price.ru:8002/SGML/ Тем, кому трудно все облазить на медленном Интернете, вот маленькая цитата: http://xtalk.price.ru:8002/SGML/TEItools/index-ru.html "Добро пожаловать в тоскливый мир подготовки документации :-) TEItools, за отсутствием лучшего названия, называется мой пакет спецификаций для преобразования документов, написанных в SGML или XML, в разнообразные выходные форматы. Я все еще развиваю их, и сейчас они могут генерировать HTML, LaTeX2e, RTF, а также плоский текст (через HTML), PostScript и PDF (через LaTeX). Страница TEItools на WWW находится по адресу http://xtalk.price.ru/SGML/TEItools. TEItools относятся к классу SGML конвертеров. " Смутно припоминаю, что Лев что-то говорил про XML. Александр ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 17 фев 2000 10:31:26 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Predlozhenie ot chainika -------------------------------------------------------------------------------- [Vnizu latinicej] Доброе утро! Alexander V. Voinov wrote: > Kirill Khroustalev wrote: > > > Но вот есть такой стандарт, TEI(SGML), может нам > > попробовать в его рамках сделать и церковнославянский стандарт, а не > > изобретать велосипед с HIP? Может есть знающие люди которые могут этой идеей > > воспользоваться? Наверняка ТеХовским фанам идея понравится:) > > Вот ссылка > > http://xtalk.price.ru:8002/SGML/ > > Да, Борис Тоботрас - человек серьезный, хотя и несколько высокомерный: не очень > торопится объяснять очевидные с его точки зрения вещи. Он давно работает и с sgml, и с > TeX'ом. Он - модератор фидо-эхи ru.linux. > > Но ASCII-представление в любом случае имеет смысл. Более того, одно другому вроде бы вообще не противоречит. Насколько понимаю, SGML есть прежде всего Mark-up Language (а то б по-другому назывался), тогда как HIP есть прежде всего "читабельная" кодировка собственно текста, в пределе вовсе без mark-up. Ее несложно будет перевести и в кодировку для SGML, буде такая появится -- потребуется хотя и несколько сотен (из-за обильной диакритики), но довольно очевидных текстовых замен, превращающих, скажем, слово А=гг~лъ во что-нибудь такое: &Azwithaspiration;&glagol;&glagolwithtitlo;&ljudi;&er; или в лучшем случае &Azwithaspiration;г&glagolwithtitlo;лъ А всю SGMLевскую разметку при таком подходе можно заготовить внутри HIP-комментариев. Скажем, так: %{SGML ...} Здесь на месте многоточия можно написать любой SGML-текст, лишь бы соблюдалась парность фигурных скобок (да и это не столь существенно, ведь их тоже можно как-нибудь закодировать). P. S. Утверждение К. Х. о том, что "наверняка ТеХовским фанам идея понравится", имеет по крайней мере один контрпример в лице Вашего покорного слуги. ;-) P. P. S. Помнится, некогда упоминалось, что для обучения переводчика из новой орфографии в старую можно найти много обучающего материала (текстов, набранных "с ятями"). Не даст ли кто конкретных ссылок? Раз уж на вопросы по HIP ответов нет... М. Г. ===================== Dobroe utro! Alexander V. Voinov wrote: > Kirill Khroustalev wrote: > > > No vot est' takoj standart, TEI(SGML), mozhet nam poprobovat' > > v ego ramkakh sdelat' i cerkovnoslavjanskij standart, a ne > > izobretat' velosiped s HIP? Mozhet est' znajushchie ljudi kotorye > > mogut etoj ideej vospol'zovat'sja? Navernjaka TeXovskim fanam > > ideja ponravitsja:) > > Vot ssylka > > http://xtalk.price.ru:8002/SGML/ > > Da, Boris Tobotras - chelovek ser'eznyj, khotja i neskol'ko > vysokomernyj: ne ochen' toropitsja ob'jasnjat' ochevidnye s ego > tochki zrenija veshchi. On davno rabotaet i s sgml, i s TeX'om. > On - moderator fido-ekhi ru.linux. > > No ASCII-predstavlenie v ljubom sluchae imeet smysl. Bolee togo, odno drugomu vrode by voobshche ne protivorechit. Naskol'ko ponimaju, SGML est' prezhde vsego Mark-up Language (a to b po-drugomu nazyvalsja), togda kak HIP est' prezhde vsego "chitabel'naja" kodirovka sobstvenno teksta, v predele vovse bez mark-up. Ee neslozhno budet perevesti i v kodirovku dlja SGML, bude takaja pojavitsja -- potrebuetsja khotja i neskol'ko soten (iz-za obil'noj diakritiki), no dovol'no ochevidnykh tekstovykh zamen, prevrashchajushchikh, skazhem, slovo A=gg~l' vo chto-nibud' takoe: &Azwithaspiration;&glagol;&glagolwithtitlo;&ljudi;&er; ili v luchshem sluchae &Azwithaspiration;g&glagolwithtitlo;l' A vsju SGMLevskuju razmetku pri takom podkhode mozhno zagotovit' vnutri HIP-kommentariev. Skazhem, tak: %{SGML ...} Zdes' na meste mnogotochija mozhno napisat' ljuboj SGML-tekst, lish' by sobljudalas' parnost' figurnykh skobok (da i eto ne stol' sushchestvenno, ved' ikh tozhe mozhno kak-nibud' zakodirovat'). P. S. Utverzhdenie K. Kh. o tom, chto "navernjaka TeKhovskim fanam ideja ponravitsja", imeet po krajnej mere odin kontrprimer v lice Vashego pokornogo slugi. ;-) P. P. S. Pomnitsja, nekogda upominalos', chto dlja obuchenija perevodchika iz novoj orfografii v staruju mozhno najti mnogo obuchajushchego materiala (tekstov, nabrannykh "s jatjami"). Ne dast li kto konkretnykh ssylok? Raz uzh na voprosy po HIP otvetov net... M. G. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 17 фев 2000 12:02:21 От: Vladimir Volovich Кому: font-list@orthodox.tstu.ru Тема: Re: Predlozhenie ot chainika -------------------------------------------------------------------------------- "MG" == Mikhail Grinchuk writes: >> Но ASCII-представление в любом случае имеет смысл. MG> Более того, одно другому вроде бы вообще не противоречит. MG> Насколько понимаю, SGML есть прежде всего Mark-up Language (а то MG> б по-другому назывался), тогда как HIP есть прежде всего MG> "читабельная" кодировка собственно текста, в пределе вовсе без MG> mark-up. действительно, следует различать языки разметки документов (SGML, XML, LaTeX, etc) от способов представления "текстового наполнения" документов. HIP, по существу, должна лишь обеспечить представление ц.-сл. текстов, со всеми необходимыми "наворотами" для типографски-адекватного представления текста. разметку же изобретать не тмеет никакого смысла. в этом смысле предложения типа такого: MG> А всю SGMLевскую разметку при таком подходе можно заготовить MG> внутри HIP-комментариев. Скажем, так: MG> %{SGML ...} MG> Здесь на месте многоточия можно написать любой SGML-текст, лишь MG> бы соблюдалась парность фигурных скобок (да и это не столь MG> существенно, ведь их тоже можно как-нибудь закодировать). выглядят не совсем логичными. нет никакго смысла перегружать HIP синтаксисом разметки, т.к. получится полная каша. В HIP следует оставить только правила кодирования "голого текста". Способы обозначения комментариев и т.п. --- это тоже в области компетенции системы разметки, а не HIP. MG> P. S. Утверждение К. Х. о том, что "наверняка ТеХовским фанам MG> идея понравится", имеет по крайней мере один контрпример в лице MG> Вашего покорного слуги. ;-) позвольте узнать, почему? ;-) Best regards, -- Vladimir. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 17 фев 2000 13:17:25 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Predlozhenie ot chainika -------------------------------------------------------------------------------- [Latinica vnizu] Vladimir Volovich wrote: > HIP, по существу, должна лишь обеспечить представление ц.-сл. текстов, > со всеми необходимыми "наворотами" для типографски-адекватного > представления текста. разметку же изобретать не тмеет никакого смысла. > > в этом смысле предложения типа такого: > > MG> А всю SGMLевскую разметку при таком подходе можно заготовить > MG> внутри HIP-комментариев. Скажем, так: > > MG> %{SGML ...} > > MG> Здесь на месте многоточия можно написать любой SGML-текст, лишь > MG> бы соблюдалась парность фигурных скобок (да и это не столь > MG> существенно, ведь их тоже можно как-нибудь закодировать). > > выглядят не совсем логичными. Нет никакого смысла перегружать HIP > синтаксисом разметки, т.к. получится полная каша. В HIP следует > оставить только правила кодирования "голого текста". Способы > обозначения комментариев и т.п. --- это тоже в области компетенции > системы разметки, а не HIP. Речь не о том, что так НУЖНО делать -- а лишь о том, что сие возможно в принципе. И, может быть, в каких-то ситуациях и полезно. Скажем, ежели мы имеем некий текст с хорошо сделанной разметкой (в том же SGML, например), но орфографически "грязный", то его можно будет конвертировать в HIP с подобными комментариями, обработать (исправить правописание) как HIP и конвертировать обратно в SGML без затрат на восстановление разметки. (Причем "синтаксис разметки" в данном случае к HIP отношения не имеет -- мало ли что можно написать внутри комментариев. Осмысленно воспринимать их будет только конвертор в SGML, а остальные программы их могут просто игнорировать. И снова оговорюсь, что это лишь один из возможных подходов.) > MG> P. S. Утверждение К. Х. о том, что "наверняка ТеХовским фанам > MG> идея понравится", имеет по крайней мере один контрпример в лице > MG> Вашего покорного слуги. ;-) > > позвольте узнать, почему? ;-) Раз уж "TeXовский фан" дошел до того, чтоб не сажать "ц.-сл. стандарт" на свой родной TeX, то ожидать одобрения идеи привязки к другому языку форматирования было б совсем странно. =============== > HIP, po sushchestvu, dolzhna lish' obespechit' predstavlenie > c.-sl. tekstov, so vsemi neobkhodimymi "navorotami" dlja > tipografski-adekvatnogo predstavlenija teksta. razmetku > zhe izobretat' ne tmeet nikakogo smysla. > > v etom smysle predlozhenija tipa takogo: > > MG> A vsju SGMLevskuju razmetku pri takom podkhode mozhno > MG> zagotovit' vnutri HIP-kommentariev. Skazhem, tak: > > MG> %{SGML ...} > > MG> Zdes' na meste mnogotochija mozhno napisat' ljuboj SGML-tekst, lish' > MG> by sobljudalas' parnost' figurnykh skobok (da i eto ne stol' > MG> sushchestvenno, ved' ikh tozhe mozhno kak-nibud' zakodirovat'). > > vygljadjat ne sovsem logichnymi. Net nikakogo smysla peregruzhat' > HIP sintaksisom razmetki, t.k. poluchitsja polnaja kasha. V HIP > sleduet ostavit' tol'ko pravila kodirovanija "gologo teksta". > Sposoby oboznachenija kommentariev i t.p. --- eto tozhe v oblasti > kompetencii sistemy razmetki, a ne HIP. Rech' ne o tom, chto tak NUZhNO delat' -- a lish' o tom, chto sie vozmozhno v principe. I, mozhet byt', v kakikh-to situacijakh i polezno. Skazhem, ezheli my imeem nekij tekst s khorosho sdelannoj razmetkoj (v tom zhe SGML, naprimer), no orfograficheski "grjaznyj", to ego mozhno budet konvertirovat' v HIP s podobnymi kommentarijami, obrabotat' (ispravit' pravopisanie) kak HIP i konvertirovat' obratno v SGML bez zatrat na vosstanovlenie razmetki. (Prichem "sintaksis razmetki" v dannom sluchae k HIP otnoshenija ne imeet -- malo li chto mozhno napisat' vnutri kommentariev. Osmyslenno vosprinimat' ikh budet tol'ko konvertor v SGML, a ostal'nye programmy ikh mogut prosto ignorirovat'. I snova ogovorjus', chto eto lish' odin iz vozmozhnykh podkhodov.) > MG> P. S. Utverzhdenie K. Kh. o tom, chto "navernjaka TeXovskim > MG> fanam ideja ponravitsja", imeet po krajnej mere odin > MG> kontrprimer v lice Vashego pokornogo slugi. ;-) > > pozvol'te uznat', pochemu? ;-) Raz uzh "TeXovskij fan" doshel do togo, chtob ne sazhat' "c.-sl. standart" na svoj rodnoj TeX, to ozhidat' odobrenija idei privjazki k drugomu jazyku formatirovanija bylo b sovsem stranno. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Чт, 17 фев 2000 20:00:16 От: Vladimir Volovich Кому: font-list@orthodox.tstu.ru Тема: Re: Predlozhenie ot chainika -------------------------------------------------------------------------------- "MG" == Mikhail Grinchuk writes: MG> Речь не о том, что так НУЖНО делать -- а лишь о том, что сие MG> возможно в принципе. И, может быть, в каких-то ситуациях и MG> полезно. Скажем, ежели мы имеем некий текст с хорошо сделанной MG> разметкой (в том же SGML, например), но орфографически "грязный", MG> то его можно будет конвертировать в HIP с подобными MG> комментариями, обработать (исправить правописание) как HIP и MG> конвертировать обратно в SGML без затрат на восстановление MG> разметки. логичнее исправлять правописание в самом SGML тексте (а не в HIP с SGML'евскими мета-комментариями), т.к. существуют уже стандартные и проверенные средства обработки SGML документов. MG> (Причем "синтаксис разметки" в данном случае к HIP отношения не MG> имеет -- мало ли что можно написать внутри комментариев. MG> Осмысленно воспринимать их будет только конвертор в SGML, а MG> остальные программы их могут просто игнорировать. И снова MG> оговорюсь, что это лишь один из возможных подходов.) а зачем вообще перегружать HIP системой мета-комментариев, псевдо-разметки, псевдо-комментариев по смене шрифта и т.п., если это логичнее делать на другом уровне, --- а именно в рамках собственно систем разметки (уже существующих и стандартных)? MG> P. S. Утверждение К. Х. о том, что "наверняка ТеХовским фанам MG> идея понравится", имеет по крайней мере один контрпример в лице MG> Вашего покорного слуги. ;-) >> позвольте узнать, почему? ;-) MG> Раз уж "TeXовский фан" дошел до того, чтоб не сажать MG> "ц.-сл. стандарт" на свой родной TeX, то ожидать одобрения идеи MG> привязки к другому языку форматирования было б совсем странно. ну, начнем с того, что TeX это не есть какой-то конкретный язык разметки. с помощью TeX можно обрабатывать и HTML, и SGML, и XML (см., напр., пакеты typehtml, passivetex, xmltex на CTAN). Вот LaTeX --- это уже некий конкретный язык разметки. Поэтому "другой язык форматирования" абзацем выше не вполне определен. IMHO, гораздо логичнее ограничиться в HIP описанием представления исключительно текстовой информации (ц.-сл. символов, слов), а разметку предоставить уже существующим стандартным системам (хоть тому же LaTeX или SGML, или XML). Best regards, -- Vladimir. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 18 фев 2000 00:02:22 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Predlozhenie ot chainika -------------------------------------------------------------------------------- [Latinica vnizu] Доброе утро! Vladimir Volovich wrote: > MG> Скажем, ежели мы имеем некий текст с хорошо сделанной > MG> разметкой (в том же SGML, например), но орфографически > MG> "грязный", то его можно будет конвертировать в HIP с > MG> подобными комментариями, обработать (исправить > MG> правописание) как HIP и конвертировать обратно в SGML > MG> без затрат на восстановление разметки. > > логичнее исправлять правописание в самом SGML тексте (а не > в HIP с SGML'евскими мета-комментариями), т.к. существуют > уже стандартные и проверенные средства обработки SGML > документов. Не все так просто. Одна из проблем -- то, что в SGML (и в TeXе тоже) есть средства для создания макрокоманд, а потому один и тот же элемент текста можно записать по-разному. Причем число вариантов ничем не ограничено. И попробуйте после этого использовать какую-нибудь автоматизированную правку... А в HIP намеренно введена однозначность -- два варианта набора одного и того же текста после тривиальной нормализации (удаление комментариев, фиксация одного из вариантов рус/лат для неразличимых символов, удаление повторяющихся пробелов и разделителей абзацев -- и больше ничего!) обязаны совпасть полностью. > а зачем вообще перегружать HIP системой мета-комментариев, > псевдо-разметки, псевдо-комментариев по смене шрифта > и т.п., если это логичнее делать на другом уровне, --- а > именно в рамках собственно систем разметки (уже > существующих и стандартных)? 1. С точки зрения HIP никаких метакомментариев и псевдоразметки нет, есть просто комментарии. Из всей разметки в HIP входит лишь разбиение на абзацы. 2. Ну а раз есть просто комментарии, то их ПРИ ЖЕЛАНИИ можно использовать и как носитель некоей содержательной машинно-интерпретируемой информации. > MG> Раз уж "TeXовский фан" дошел до того, чтоб не сажать > MG> "ц.-сл. стандарт" на свой родной TeX, то ожидать > MG> одобрения идеи привязки к другому языку форматирования > MG> было б совсем странно. > > ну, начнем с того, что TeX это не есть какой-то конкретный > язык разметки. с помощью TeX можно обрабатывать и HTML, и > SGML, и XML (см., напр., пакеты typehtml, passivetex, > xmltex на CTAN). Ну, положим, тот TeX, с помощью которого можно нечто обрабатывать -- и вовсе не язык, а программа. И подразумевались, конечно, не эти экзотические возможности, а все же идеология пакетов типа ***-TeX. > Вот LaTeX --- это уже некий конкретный язык разметки. Пока в нем не запрещена команда \def и подобные средства -- это неверно. > IMHO, гораздо логичнее ограничиться в HIP описанием > представления исключительно текстовой информации (ц.-сл. > символов, слов), а разметку предоставить уже существующим > стандартным системам (хоть тому же LaTeX или SGML, или XML). Предположим, что так и сделано. То есть в LaTeXе определено нечто типа \begin{HIP} ... \end{HIP}, в SGML -- ... , в других системах разметки -- тоже что-то подобное. Но тогда на содержимое HIP-текста придется наложить кучу ограничений: там не должно быть символа "\" (чтобы не было конфликтов с LaTeXом), символа "<" -- из-за SGML и так далее. Причем всегда есть опасность, что очередная система разметки "закроет" еще какой-нибудь символ. В результате либо придется иметь много разных HIPов -- свой под каждую систему разметки (пропадает идея инвариантности), либо привязать все к одной из этих систем -- нарушается принцип нейтралитета: "Чтобы не повторяться в репликах, заранее объясню позицию. Прежде всего, у нас тут православныя конфа, а не группа любителей... того или иного софта. (...) И вряд ли удастся убедить меня согласиться с такой организацией работы, чтобы все желающие иметь отношение к священному процессу верстки славянского текста должны были бы предварительно освоить ТеХ, SGML, Вентуру, и т. д. и прочие идеи Чучхэ, да хотя бы и Ворд." (c) Лев Тихонов, 28.12.99, 16:50:15. М. Г. ================================================== Dobroe utro! Vladimir Volovich wrote: > MG> Skazhem, ezheli my imeem nekij tekst s khorosho sdelannoj > MG> razmetkoj (v tom zhe SGML, naprimer), no orfograficheski > MG> "grjaznyj", to ego mozhno budet konvertirovat' v HIP s > MG> podobnymi kommentarijami, obrabotat' (ispravit' > MG> pravopisanie) kak HIP i konvertirovat' obratno v SGML > MG> bez zatrat na vosstanovlenie razmetki. > > logichnee ispravljat' pravopisanie v samom SGML tekste (a ne > v HIP s SGML'evskimi meta-kommentarijami), t.k. sushchestvujut > uzhe standartnye i proverennye sredstva obrabotki SGML > dokumentov. Ne vse tak prosto. Odna iz problem -- to, chto v SGML (i v TeXe tozhe) est' sredstva dlja sozdanija makrokomand, a potomu odin i tot zhe element teksta mozhno zapisat' po-raznomu. Prichem chislo variantov nichem ne ogranicheno. I poprobujte posle etogo ispol'zovat' kakuju-nibud' avtomatizirovannuju pravku... A v HIP namerenno vvedena odnoznachnost' -- dva varianta nabora odnogo i togo zhe teksta posle trivial'noj normalizacii (udalenie kommentariev, fiksacija odnogo iz variantov rus/lat dlja nerazlichimykh simvolov, udalenie povtorjajushchikhsja probelov i razdelitelej abzacev -- i bol'she nichego!) objazany sovpast' polnost'ju. > a zachem voobshche peregruzhat' HIP sistemoj meta-kommentariev, > psevdo-razmetki, psevdo-kommentariev po smene shrifta > i t.p., esli eto logichnee delat' na drugom urovne, --- a > imenno v ramkakh sobstvenno sistem razmetki (uzhe > sushchestvujushchikh i standartnykh)? 1. S tochki zrenija HIP nikakikh metakommentariev i psevdorazmetki net, est' prosto kommentarii. Iz vsej razmetki v HIP vkhodit lish' razbienie na abzacy. 2. Nu a raz est' prosto kommentarii, to ikh PRI ZhELANII mozhno ispol'zovat' i kak nositel' nekoej soderzhatel'noj mashinno-interpretiruemoj informacii. > MG> Raz uzh "TeXovskij fan" doshel do togo, chtob ne sazhat' > MG> "c.-sl. standart" na svoj rodnoj TeX, to ozhidat' > MG> odobrenija idei privjazki k drugomu jazyku formatirovanija > MG> bylo b sovsem stranno. > > nu, nachnem s togo, chto TeX eto ne est' kakoj-to konkretnyj > jazyk razmetki. s pomoshch'ju TeX mozhno obrabatyvat' i HTML, i > SGML, i XML (sm., napr., pakety typehtml, passivetex, > xmltex na CTAN). Nu, polozhim, tot TeX, s pomoshch'ju kotorogo mozhno nechto obrabatyvat' -- i vovse ne jazyk, a programma. I podrazumevalis', konechno, ne eti ekzoticheskie vozmozhnosti, a vse zhe ideologija paketov tipa ***-TeX. > Vot LaTeX --- eto uzhe nekij konkretnyj jazyk razmetki. Poka v nem ne zapreshchena komanda \def i podobnye sredstva -- eto neverno. > IMHO, gorazdo logichnee ogranichit'sja v HIP opisaniem > predstavlenija iskljuchitel'no tekstovoj informacii (c.-sl. > simvolov, slov), a razmetku predostavit' uzhe sushchestvujushchim > standartnym sistemam (khot' tomu zhe LaTeX ili SGML, ili XML). Predpolozhim, chto tak i sdelano. To est' v LaTeXe opredeleno nechto tipa \begin{HIP} ... \end{HIP}, v SGML -- ... , v drugikh sistemakh razmetki -- tozhe chto-to podobnoe. No togda na soderzhimoe HIP-teksta pridetsja nalozhit' kuchu ogranichenij: tam ne dolzhno byt' simvola "\" (chtoby ne bylo konfliktov s LaTeXom), simvola "<" -- iz-za SGML i tak dalee. Prichem vsegda est' opasnost', chto ocherednaja sistema razmetki "zakroet" eshche kakoj-nibud' simvol. V rezul'tate libo pridetsja imet' mnogo raznykh HIPov -- svoj pod kazhduju sistemu razmetki (propadaet ideja invariantnosti), libo privjazat' vse k odnoj iz etikh sistem -- narushaetsja princip nejtraliteta: "Chtoby ne povtorjat'sja v replikakh, zaranee ob'jasnju poziciju. Prezhde vsego, u nas tut pravoslavnyja konfa, a ne gruppa ljubitelej... togo ili inogo softa. (...) I vrjad li udastsja ubedit' menja soglasit'sja s takoj organizaciej raboty, chtoby vse zhelajushchie imet' otnoshenie k svjashchennomu processu verstki slavjanskogo teksta dolzhny byli by predvaritel'no osvoit' TeX, SGML, Venturu, i t. d. i prochie idei Chuchkhe, da khotja by i Word." (c) Lev Tikhonov, 28.12.99, 16:50:15. M. G. =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 18 фев 2000 01:14:04 От: Vladimir Volovich Кому: font-list@orthodox.tstu.ru Тема: Re: Predlozhenie ot chainika -------------------------------------------------------------------------------- "MG" == Mikhail Grinchuk writes: >> логичнее исправлять правописание в самом SGML тексте (а не в HIP >> с SGML'евскими мета-комментариями), т.к. существуют уже >> стандартные и проверенные средства обработки SGML документов. MG> Не все так просто. Одна из проблем -- то, что в SGML (и в TeXе MG> тоже) есть средства для создания макрокоманд, а потому один и тот MG> же элемент текста можно записать по-разному. насколько я понимаю, это не так (в части, касающейся SGML) --- при фиксированном DTD (да и при нефиксированном тоже --- что-то я не припомню в SGML аналога TeXовских амкросов!?!?) никаких макросов нет, и структура документа (синтаксис языка разметки) вполне жесткая. да и в TeX никто не считает хорошим тоном документы, существенно строящиеся при помощи макросов. НЕ ВСЕ ТО, ЧТО РАЗРЕШЕНО И ДОПУСКАЕТСЯ СИСТЕМОЙ TeX, ОБЯЗАТЕЛЬНО ИСПОЛЬЗОВАТЬ. в хорошо составленных документах никаких неоднозначностей не будет. MG> Причем число вариантов ничем не ограничено. И попробуйте после MG> этого использовать какую-нибудь автоматизированную правку... А в MG> HIP намеренно введена однозначность -- два варианта набора одного MG> и того же текста после тривиальной нормализации (удаление MG> комментариев, фиксация одного из вариантов рус/лат для MG> неразличимых символов, удаление повторяющихся пробелов и MG> разделителей абзацев -- и больше ничего!) обязаны совпасть MG> полностью. это безусловно полезное свойство; при желании можно придумать каноническую форму для latex'овского или sgml документов, нормализующую документ аналогичным образом. но в этой "нормализованной" форме полностью отсутствует markup, --- остаются только слова и абзацы. а поэтому разметку следует возложить на уже готовые системы, а не изобретать велосипед. все, что нам по существу нужно --- это представление raw ц.-сл. текста; markup языки уже есть, и вводить свой ни с чем несовместимый язык нет смысла. >> а зачем вообще перегружать HIP системой мета-комментариев, >> псевдо-разметки, псевдо-комментариев по смене шрифта и т.п., если >> это логичнее делать на другом уровне, --- а именно в рамках >> собственно систем разметки (уже существующих и стандартных)? MG> 1. С точки зрения HIP никаких метакомментариев и псевдоразметки MG> нет, есть просто комментарии. Из всей разметки в HIP входит лишь MG> разбиение на абзацы. судя по файлу HIP-003, туда входят такие вещи, как: % * символ начала комментария (конкретный синтаксис комментария зависит от используемого варианта расширенного HIP) %% 1 начало комментария, который идет до ближайшего EOL (включая EOL) %< 1 переход на красный цвет (киноварь) %> 1 переход на черный цвет (конец киновари) %{ 1 начало комментария, который идет до } (внутри { и } возможны, но должны быть парными) & * префикс для возможных обозначений новых символов &= ??=> EOL EOL (конец абзаца) &{...} ?? возможный базовый синтаксис для неограниченного числа новых символов \{...} 2 надстрочный текст (над предыдущей буквой) { 0 начало "видимых" сноски/пояснения {...} 0 текст сноски/пояснения любого рода (внутри него скобки должны быть парными). См. также &{...} \{...} %{...} ?{...} | -? сперва предлагалось использовать этот символ как обозначение для паерка, но \ъ вроде бы нагляднее. Сейчас предлагаю как разделитель вариантов внутри "альтернативных тегов": ?{xxx|yyy|zzz} } 0 конец "видимых" сноски/пояснения необходимость их присутствия в HIP у меня вызывает сомнения. :) MG> 2. Ну а раз есть просто комментарии, то их ПРИ ЖЕЛАНИИ можно MG> использовать и как носитель некоей содержательной MG> машинно-интерпретируемой информации. а нужно ли в HIP закладывать комментарии? возможно, что и не стоит этого делать. и уж если, наскольно я понял, все равно ведь не планируется в принципе специфицировать эту "содержательную машинно-интерпретируемую информацию" --- тогда зачем ее вообще вводить? >> Вот LaTeX --- это уже некий конкретный язык разметки. MG> Пока в нем не запрещена команда \def и подобные средства -- это MG> неверно. в LaTeX нет команды \def :) (под LaTeX подразумевается то, что описано в книге Lamport'а). правда, есть \newcommand; но естественно при злоупотреблении можно наворотить чего угодно, --- благо TeX это позволяет; но вот будет ли это "канонически правильный" LaTeX? сомневаюсь. кроме того, кое-кто даже составил SGML DTD, для которого документы имеют структуру, очень похожую на LaTeX; там уж никакие фокусы с макросами не пройдут. впрочем, наш разговор зашел в почти тупиковое русло. безусловно, рациональное зерно в HIP есть, и его следует использовать; другой вопрос, --- налицо два подхода --- один, в котором на HIP возлагаются некие markup-функции (в виде псевдо-комментариев с "содержательной машинно-интерпретируемой информации"); и второй --- в котором весь markup возлагается на существующие стандартные системы, а от HIP берется лишь система представления букв ц.-сл. текстов посредством русско-латинского алфавита. во втором подходе видна целостность: представление включает в себя как текст, так и вполне полноценную разметку, т.е. из этого представление позволяет получить хорошо сверстанные документы в разных форматах (поддерживаемых тем или иным языком разметки). в первом же варианте никакой разметки нет. и откуда ее взять --- непонятно. если из мета-комментариев --- то возникает вопрос, в каком формате их хранить, для какой системы, и т.п. и почему бы сразу не хранить документы в стандартном формате с разметкой (шрифты, цвета, сноски, ссылки, главы, стихи, и т.д., и т.п.). >> IMHO, гораздо логичнее ограничиться в HIP описанием представления >> исключительно текстовой информации (ц.-сл. символов, слов), а >> разметку предоставить уже существующим стандартным системам (хоть >> тому же LaTeX или SGML, или XML). MG> Предположим, что так и сделано. То есть в LaTeXе определено нечто MG> типа \begin{HIP} ... \end{HIP}, в SGML -- ... , в MG> других системах разметки -- тоже что-то подобное. Но тогда на MG> содержимое HIP-текста придется наложить кучу ограничений: там не MG> должно быть символа "\" (чтобы не было конфликтов с LaTeXом), MG> символа "<" -- из-за SGML и так далее. до некоторой степени это так. но других вариантов я не вижу: каким то образом нам все же придется хранить "разметку", а поэтому придется использовать какую-то систему разметки в кач-ве базовой, а из HIP взять только представление ц.-сл. букв. А полагаться на систему мета-комментариев --- на мой взгляд, тупиковый подход. Можно, в т.ч., использовать unicode представление, где доступно большее кол-во символов, и есть в т.ч. combining characters, напр., для построения буквенных титл. Т.е., в принципе, на мой взгляд, основная задача HIP --- это определить полный набор глифов, необходимых для верстки на ц.-сл., и сопоставить им удобный способ ввода с использованием русско-латинского алфавита, что она и делает (кое-какие нюансы по построению акцентированных символов и т.п. на мой взгляд лучше было бы немного изменить, но это пока не столь актуально). Best regards, -- Vladimir. ---------------------------------------------------------------------- -=ORTHODOX-FONT=- Project // Mail Lists service on Orthodox.tstu.ru =-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=- Date: Пт, 18 фев 2000 04:43:32 От: Mikhail Grinchuk Кому: -=ORTHODOX-FONT=- Project Participants Тема: Re: Predlozhenie ot chainika -------------------------------------------------------------------------------- [Latinica vnizu] Доброе утро! Vladimir Volovich wrote: > MG> Одна из проблем -- то, что в SGML (и в TeXе тоже) есть > MG> средства для создания макрокоманд, а потому один и тот > MG> же элемент текста можно записать по-разному. > > насколько я понимаю, это не так (в части, касающейся SGML) > --- при фиксированном DTD (да и при нефиксированном тоже --- > что-то я не припомню в SGML аналога TeXовских макросов!?!?) > никаких макросов нет, и структура документа (синтаксис языка > разметки) вполне жесткая. Цитирую http://xtalk.price.ru:8002/SGML/p3sg.tei "На самом деле символы, используемые в качестве ограничителей (угловые скобки, косая черта, восклицательный знак) могут переопределяться, но удобно использовать символы, приведенные в этом описании." "После того, как объект объявлен, на него можно ссылаться в любом месте документа. Это делается путем использования его названия, перед которым ставится символ &, а после которого -- точка с запятой... Когда SGML анализатор встречает такую ссылку на объект, он немедленно подставляет вместо названия объекта объявленное значение." > да и в TeX никто не считает хорошим тоном документы, > существенно строящиеся при помощи макросов. НЕ ВСЕ ТО, ЧТО > РАЗРЕШЕНО И ДОПУСКАЕТСЯ СИСТЕМОЙ TeX, ОБЯЗАТЕЛЬНО > ИСПОЛЬЗОВАТЬ. в хорошо составленных документах никаких > неоднозначностей не будет. В том-то и дело, что приходится все время уточнять про "хорошо составленные документы". Система должна быть такой, чтобы "плохо составленных" не могло существовать в принципе. > но в этой "нормализованной" форме полностью отсутствует > markup, --- остаются только слова и абзацы. Совершенно верно. Но -- самое главное -- эта нормализованная форма является корректным HIP-текстом. > а поэтому разметку следует возложить > на уже готовые системы, а не изобретать велосипед. И на здоровье! Можно использовать любой язык разметки, спрятав ее в комментарии. Весь вопрос в том, что стоит на первом месте: разметка или текст. И TeX (LaTeX), и SGML -- системы записи, в которых на первом месте -- разметка, а уж текст спрятан где-то в самой глубине. Тогда как HIP это и есть представление текста -- к которому разметка может быть добавлена как необязательный элемент. > MG> 1. С точки зрения HIP никаких метакомментариев и псевдоразметки > MG> нет, есть просто комментарии. Из всей разметки в HIP входит лишь > MG> разбиение на абзацы. > > судя по файлу HIP-003, туда входят такие вещи, как: > > % * символ начала комментария (конкретный синтаксис комментария > зависит от используемого варианта расширенного HIP) > %% 1 начало комментария, который идет до ближайшего EOL (включая EOL) > %< 1 переход на красный цвет (киноварь) > %> 1 переход на черный цвет (конец киновари) > %{ 1 начало комментария, который идет до } (внутри { и } возможны, > но должны быть парными) > & * префикс для возможных обозначений новых символов > &= ??=> EOL EOL (конец абзаца) > &{...} ?? возможный базовый синтаксис для неограниченного числа > новых символов > \{...} 2 надстрочный текст (над предыдущей буквой) > { 0 начало "видимых" сноски/пояснения > {...} 0 текст сноски/пояснения любого рода (внутри него скобки должны > быть парными). См. также &{...} \{...} %{...} ?{...} > | -? сперва предлагалось использовать этот символ как обозначение > для паерка, но \ъ вроде бы нагляднее. Сейчас предлагаю как > разделитель вариантов внутри "альтернативных тегов": > ?{xxx|yyy|zzz} > } 0 конец "видимых" сноски/пояснения > > необходимость их присутствия в HIP у меня вызывает > сомнения. :) 1. Все вещи, начинающиеся на % -- это комментарии. 2. &{...} -- это не элемент разметки, а система для возможного пополнения набора символов. Причем средств для их определения пользователем не предусматривается. Конвертор из HIP, встретив НЕЗНАКОМУЮ запись такого сорта, может, например, переписать ее "как есть", сохранив символы "&", "{" и "}". 3. \{...} -- также не элемент разметки, а задание более сложных вещей, чем просто буквенные титла. Для стандарта ц.-сл. языка это вообще не нужно, но для точной передачи каких-либо старых рукописей и книг может потребоваться. 4. "{" и "}" также можно считать обычными символами (и с точки зрения конвертора тоже). Разве что с требованием их парного использования. И только при указании каких-либо опций конвертора и (или) специальных комментариев они станут обозначать сноски или что-нибудь еще подобное. (Ровно так же можно в TeXе переопределить, скажем, квадратные скобки, чтобы автоматически заключенный в них текст превращался в сноску.) основной текст%{СНОСКА}{текст сноски} основной текст Здесь спецкомментарий %{СНОСКА} перед текстом в фигурных скобках показывает, что надо сотворить именно сноску. 5. Символ "|" -- пока что лишь предложение. И вообще он самостоятельной роли не играет. 6. По поводу "необходимости присутствия": комментарии как таковые введены были по просьбе трудящихся -- именно как комментарии. Без &{...} система становится слишком ограниченной по числу возможных символов -- либо придется изобретать какую-нибудь лигатурную запись, против чего здесь довольно бурно возражали (кs и пs против &{кс} и &{пс} для букв кси и пси, а при необходимости написать сочетание како+зело -- к\\s против кs). > >> Вот LaTeX --- это уже некий конкретный язык разметки. > > MG> Пока в нем не запрещена команда \def и подобные средства > MG> -- это неверно. > > в LaTeX нет команды \def :) (под LaTeX подразумевается то, > что описано в книге Lamport'а). правда, есть \newcommand; но > естественно при злоупотреблении можно наворотить чего > угодно, --- благо TeX это позволяет; но вот будет ли это > "канонически правильный" LaTeX? сомневаюсь. Что касается TeXов -- то не надо ничего "подразумевать": правильным является то, на что компилятор не ругается. Повторяю: система должна быть такой, чтобы "канонически неправильного" не могло существовать в принципе. <<Но да будет слово ваше "да, да" и "нет, нет", а что сверх того, то от лукавого>>. > безусловно, рациональное зерно в HIP есть, и его следует > использовать; другой вопрос, --- налицо два подхода --- > один, в котором на HIP возлагаются некие markup-функции (в > виде псевдо-комментариев с "содержательной > машинно-интерпретируемой информации"); и второй --- в > котором весь markup возлагается на существующие стандартные > системы, а от HIP берется лишь система представления букв > ц.-сл. текстов посредством русско-латинского алфавита. > > во втором подходе видна целостность: представление включает > в себя как текст, так и вполне полноценную разметку, т.е. из > этого представление позволяет получить хорошо сверстанные > документы в разных форматах (поддерживаемых тем или иным > языком разметки). > > в первом же варианте никакой разметки нет. и откуда ее взять > --- непонятно. если из мета-комментариев --- то возникает > вопрос, в каком формате их хранить, для какой системы, и > т.п. и почему бы сразу не хранить документы в стандартном > формате с разметкой (шрифты, цвета, сноски, ссылки, главы, > стихи, и т.д., и т.п.). 1. Текст без разметки тоже должен существовать. 2. "Из какой системы брать метакомментарии" -- вопрос менее острый, чем "на какой системе строить само представление текста". При наличии SGML-комментариев конвертация из HIP в SGML будет тривиальной, но для конвертации в TeX при этом не потребуется иметь SGML-софт. Да, при этом в TeXе мы потеряем разметку -- но можем ее при желании не терять, конвертируя через SGML. Иначе говоря, имея SGML-софт, мы в обоих случаях получим размеченный TeX, но без оного софта в Вашем случае просто останемся ни с чем. > MG> Предположим, что так и сделано. То есть в LaTeXе > MG> определено нечто типа \begin{HIP} ... \end{HIP}, в SGML -- > MG> ... , в других системах разметки -- тоже что-то > MG> подобное. Но тогда на содержимое HIP-текста придется > MG> наложить кучу ограничений: там не должно быть символа "\" > MG> (чтобы не было конфликтов с LaTeXом), символа "<" -- из-за > MG> SGML и так далее. > > до некоторой степени это так. но других вариантов я не > вижу: каким-то образом нам все же придется хранить > "разметку", а поэтому придется использовать какую-то систему > разметки в кач-ве базовой, а из HIP взять только > представление ц.-сл. букв. А полагаться на систему > мета-комментариев --- на мой взгляд, тупиковый подход. Чем же тупиковый? С их помощью можно представить любую реальную систему разметки. И при этом очень просто выделить собственно текст (например, для какого-нибудь формального филологического анализа), тогда как при базировании на системах разметки для этого потребуется сочинять соответствующие парсеры. > Можно, в т.ч., использовать unicode представление, где > доступно большее кол-во символов, и есть в т.ч. combining > characters, напр., для построения буквенных титл. В Уникоде нет однозначности. > Т.е., в принципе, на мой взгляд, основная задача HIP --- это > определить полный набор глифов, Скорее не глифов, а символов. > необходимых для верстки на ц.-сл., и сопоставить им удобный > способ ввода с использованием русско-латинского алфавита, > что она и делает (кое-какие нюансы по построению > акцентированных символов и т.п. на мой взгляд лучше было бы > немного изменить, но это пока не столь актуально). Люди! Что ж это деется! Уж которую неделю жду конкретных предложений по поводу ентих самых нюансов -- а Вы мне "не столь актуально"... :-( Как только кодировка зафиксируется, так сразу выдам в ней всю Елисавету и кое-что еще (например, кусок Супрасльской рукописи, водящийся в Интернете в совершенно нечитаемой -- и неоднозначной! -- 7-битовой кодировке). А также кой-какие утилиты по конвертации и "повышению уровня". Всс упирается в кодировку. P. S. Может быть, разумным было бы -- как некий внутренний формат -- двухбайтовое представление, отражающее существенную двухэтажность нашего ц.-сл. текста. При этом каждый символ состоит из "базы" и "акцента" (в том числе пустого). P. P. S. Никто не встречал ц.-сл. "Пространных житий" Кирилла и Мефодия? В сети водится, похоже, только современный болгарский перевод. М. Г. =========================================== Dobroe utro! Vladimir Volovich wrote: > MG> Odna iz problem -- to, chto v SGML (i v TeXe tozhe) est' > MG> sredstva dlja sozdanija makrokomand, a potomu odin i tot > MG> zhe element teksta mozhno zapisat' po-raznomu. > > naskol'ko ja ponimaju, eto ne tak (v chasti, kasajushchejsja SGML) > --- pri fiksirovannom DTD (da i pri nefiksirovannom tozhe --- > chto-to ja ne pripomnju v SGML analoga TeXovskikh makrosov!?!?) > nikakikh makrosov net, i struktura dokumenta (sintaksis jazyka > razmetki) vpolne zhestkaja. Citiruju http://xtalk.price.ru:8002/SGML/p3sg.tei "Na samom dele simvoly, ispol'zuemye v kachestve ogranichitelej (uglovye skobki, kosaja cherta, vosklicatel'nyj znak) mogut pereopredeljat'sja, no udobno ispol'zovat' simvoly, privedennye v etom opisanii." "Posle togo, kak ob'ekt ob'javlen, na nego mozhno ssylat'sja v ljubom meste dokumenta. Eto delaetsja putem ispol'zovanija ego nazvanija, pered kotorym stavitsja simvol &, a posle kotorogo -- tochka s zapjatoj... Kogda SGML analizator vstrechaet takuju ssylku na ob'ekt, on nemedlenno podstavljaet vmesto nazvanija ob'ekta ob'javlennoe znachenie." > da i v TeX nikto ne schitaet khoroshim tonom dokumenty, > sushchestvenno strojashchiesja pri pomoshchi makrosov. NE VSE TO, ChTO > RAZREShENO I DOPUSKAETSJa SISTEMOJ TeX, OBJaZATEL'NO > ISPOL'ZOVAT'. v khorosho sostavlennykh dokumentakh nikakikh > neodnoznachnostej ne budet. V tom-to i delo, chto prikhoditsja vse vremja utochnjat' pro "khorosho sostavlennye dokumenty". Sistema dolzhna byt' takoj, chtoby "plokho sostavlennykh" ne moglo sushchestvovat' v principe. > no v etoj "normalizovannoj" forme polnost'ju otsutstvuet > markup, --- ostajutsja tol'ko slova i abzacy. Sovershenno verno. No -- samoe glavnoe -- eta normalizovannaja forma javljaetsja korrektnym HIP-tekstom. > a poetomu razmetku sleduet vozlozhit' > na uzhe gotovye sistemy, a ne izobretat' velosiped. I na zdorov'e! Mozhno ispol'zovat' ljuboj jazyk razmetki, sprjatav ee v kommentarii. Ves' vopros v tom, chto stoit na pervom meste: razmetka ili tekst. I TeX (LaTeX), i SGML -- sistemy zapisi, v kotorykh na pervom meste -- razmetka, a uzh tekst sprjatan gde-to v samoj glubine. Togda kak HIP eto i est' predstavlenie teksta -- k kotoromu razmetka mozhet byt' dobavlena kak neobjazatel'nyj element. > MG> 1. S tochki zrenija HIP nikakikh metakommentariev i psevdorazmetki > MG> net, est' prosto kommentarii. Iz vsej razmetki v HIP vkhodit lish' > MG> razbienie na abzacy. > > sudja po fajlu HIP-003, tuda vkhodjat takie veshchi, kak: > > % * simvol nachala kommentarija (konkretnyj sintaksis kommentarija > zavisit ot ispol'zuemogo varianta rasshirennogo HIP) > %% 1 nachalo kommentarija, kotoryj idet do blizhajshego EOL (vkljuchaja EOL) > %< 1 perekhod na krasnyj cvet (kinovar') > %> 1 perekhod na chernyj cvet (konec kinovari) > %{ 1 nachalo kommentarija, kotoryj idet do } (vnutri { i } vozmozhny, > no dolzhny byt' parnymi) > & * prefiks dlja vozmozhnykh oboznachenij novykh simvolov > &= ??=> EOL EOL (konec abzaca) > &{...} ?? vozmozhnyj bazovyj sintaksis dlja neogranichennogo chisla > novykh simvolov > \{...} 2 nadstrochnyj tekst (nad predydushchej bukvoj) > { 0 nachalo "vidimykh" snoski/pojasnenija > {...} 0 tekst snoski/pojasnenija ljubogo roda (vnutri nego skobki dolzhny > byt' parnymi). Sm. takzhe &{...} \{...} %{...} ?{...} > | -? sperva predlagalos' ispol'zovat' etot simvol kak oboznachenie > dlja paerka, no \' vrode by nagljadnee. Sejchas predlagaju kak > razdelitel' variantov vnutri "al'ternativnykh tegov": > ?{xxx|yyy|zzz} > } 0 konec "vidimykh" snoski/pojasnenija > > neobkhodimost' ikh prisutstvija v HIP u menja vyzyvaet > somnenija. :) 1. Vse veshchi, nachinajushchiesja na % -- eto kommentarii. 2. &{...} -- eto ne element razmetki, a sistema dlja vozmozhnogo popolnenija nabora simvolov. Prichem sredstv dlja ikh opredelenija pol'zovatelem ne predusmatrivaetsja. Konvertor iz HIP, vstretiv NEZNAKOMUJu zapis' takogo sorta, mozhet, naprimer, perepisat' ee "kak est'", sokhraniv simvoly "&", "{" i "}". 3. \{...} -- takzhe ne element razmetki, a zadanie bolee slozhnykh veshchej, chem prosto bukvennye titla. Dlja standarta c.-sl. jazyka eto voobshche ne nuzhno, no dlja tochnoj peredachi kakikh-libo starykh rukopisej i knig mozhet potrebovat'sja. 4. "{" i "}" takzhe mozhno schitat' obychnymi simvolami (i s tochki zrenija konvertora tozhe). Razve chto s trebovaniem ikh parnogo ispol'zovanija. I tol'ko pri ukazanii kakikh-libo opcij konvertora i (ili) special'nykh kommentariev oni stanut oboznachat' snoski ili chto-nibud' eshche podobnoe. (Rovno tak zhe mozhno v TeXe pereopredelit', skazhem, kvadratnye skobki, chtoby avtomaticheski zakljuchennyj v nikh tekst prevrashchalsja v snosku.) osnovnoj tekst%{SNOSKA}{tekst snoski} osnovnoj tekst Zdes' speckommentarij %{SNOSKA} pered tekstom v figurnykh skobkakh pokazyvaet, chto nado sotvorit' imenno snosku. 5. Simvol "|" -- poka chto lish' predlozhenie. I voobshche on samostojatel'noj roli ne igraet. 6. Po povodu "neobkhodimosti prisutstvija": kommentarii kak takovye vvedeny byli po pros'be trudjashchikhsja -- imenno kak kommentarii. Bez &{...} sistema stanovitsja slishkom ogranichennoj po chislu vozmozhnykh simvolov -- libo pridetsja izobretat' kakuju-nibud' ligaturnuju zapis', protiv chego zdes' dovol'no burno vozrazhali (ks i ps protiv &{ks} i &{ps} dlja bukv ksi i psi, a pri neobkhodimosti napisat' sochetanie kako+zelo -- k\\s protiv ks). > >> Vot LaTeX --- eto uzhe nekij konkretnyj jazyk razmetki. > > MG> Poka v nem ne zapreshchena komanda \def i podobnye sredstva > MG> -- eto neverno. > > v LaTeX net komandy \def :) (pod LaTeX podrazumevaetsja to, > chto opisano v knige Lamport'a). pravda, est' \newcommand; no > estestvenno pri zloupotreblenii mozhno navorotit' chego > ugodno, --- blago TeX eto pozvoljaet; no vot budet li eto > "kanonicheski pravil'nyj" LaTeX? somnevajus'. Chto kasaetsja TeXov -- to ne nado nichego "podrazumevat'": pravil'nym javljaetsja to, na chto kompiljator ne rugaetsja. Povtorjaju: sistema dolzhna byt' takoj, chtoby "kanonicheski nepravil'nogo" ne moglo sushchestvovat' v principe. <>. > bezuslovno, racional'noe zerno v HIP est', i ego sleduet > ispol'zovat'; drugoj vopros, --- nalico dva podkhoda --- > odin, v kotorom na HIP vozlagajutsja nekie markup-funkcii (v > vide psevdo-kommentariev s "soderzhatel'noj > mashinno-interpretiruemoj informacii"); i vtoroj --- v > kotorom ves' markup vozlagaetsja na sushchestvujushchie standartnye > sistemy, a ot HIP beretsja lish' sistema predstavlenija bukv > c.-sl. tekstov posredstvom russko-latinskogo alfavita. > > vo vtorom podkhode vidna celostnost': predstavlenie vkljuchaet > v sebja kak tekst, tak i vpolne polnocennuju razmetku, t.e. iz > etogo predstavlenie pozvoljaet poluchit' khorosho sverstannye > dokumenty v raznykh formatakh (podderzhivaemykh tem ili inym > jazykom razmetki). > > v pervom zhe variante nikakoj razmetki net. i otkuda ee vzjat' > --- neponjatno. esli iz meta-kommentariev --- to voznikaet > vopros, v kakom formate ikh khranit', dlja kakoj sistemy, i > t.p. i pochemu by srazu ne khranit' dokumenty v standartnom > formate s razmetkoj (shrifty, cveta, snoski, ssylki, glavy, > stikhi, i t.d., i t.p.). 1. Tekst bez razmetki tozhe dolzhen sushchestvovat'. 2. "Iz kakoj sistemy brat' metakommentarii" -- vopros menee ostryj, chem "na kakoj sisteme stroit' samo predstavlenie teksta". Pri nalichii SGML-kommentariev konvertacija iz HIP v SGML budet trivial'noj, no dlja konvertacii v TeX pri etom ne potrebuetsja imet' SGML-soft. Da, pri etom v TeXe my poterjaem razmetku -- no mozhem ee pri zhelanii ne terjat', konvertiruja cherez SGML. Inache govorja, imeja SGML-soft, my v oboikh sluchajakh poluchim razmechennyj TeX, no bez onogo softa v Vashem sluchae prosto ostanemsja ni s chem. > MG> Predpolozhim, chto tak i sdelano. To est' v LaTeXe > MG> opredeleno nechto tipa \begin{HIP} ... \end{HIP}, v SGML -- > MG> ... , v drugikh sistemakh razmetki -- tozhe chto-to > MG> podobnoe. No togda na soderzhimoe HIP-teksta pridetsja > MG> nalozhit' kuchu ogranichenij: tam ne dolzhno byt' simvola "\" > MG> (chtoby ne bylo konfliktov s LaTeXom), simvola "<" -- iz-za > MG> SGML i tak dalee. > > do nekotoroj stepeni eto tak. no drugikh variantov ja ne > vizhu: kakim-to obrazom nam vse zhe pridetsja khranit' > "razmetku", a poetomu pridetsja ispol'zovat' kakuju-to sistemu > razmetki v kach-ve bazovoj, a iz HIP vzjat' tol'ko > predstavlenie c.-sl. bukv. A polagat'sja na sistemu > meta-kommentariev --- na moj vzgljad, tupikovyj podkhod. Chem zhe tupikovyj? S ikh pomoshch'ju mozhno predstavit' ljubuju real'nuju sistemu razmetki. I pri etom ochen' prosto vydelit' sobstvenno tekst (naprimer, dlja kakogo-nibud' formal'nogo filologicheskogo analiza), togda kak pri bazirovanii na sistemakh razmetki dlja etogo potrebuetsja sochinjat' sootvetstvujushchie parsery. > Mozhno, v t.ch., ispol'zovat' unicode predstavlenie, gde > dostupno bol'shee kol-vo simvolov, i est' v t.ch. combining > characters, napr., dlja postroenija bukvennykh titl. V Unikode net odnoznachnosti. > T.e., v principe, na moj vzgljad, osnovnaja zadacha HIP --- eto > opredelit' polnyj nabor glifov, Skoree ne glifov, a simvolov. > neobkhodimykh dlja verstki na c.-sl., i sopostavit' im udobnyj > sposob vvoda s ispol'zovaniem russko-latinskogo alfavita, > chto ona i delaet (koe-kakie njuansy po postroeniju > akcentirovannykh simvolov i t.p. na moj vzgljad luchshe bylo by > nemnogo izmenit', no eto poka ne stol' aktual