txt2dsl

  • Тема закрыта
  • 5,8K Просмотров
  • Последнее сообщение 03 марта 2007 03:57
epotapov написал 25 августа 2006 10:09

Уважаемы специалисты!

Необходимо конвертировать файл txt в dsl (макрос не помогает).
Орфографический словарик вес 10МБ http://www.phallologia.narod.ru/ch/sl/RusOrfD.zip
Заранее благодарен,
Евгений

epotapov@km.ru

Сортировка: Стандарт | Новые | Голоса
Klaus-Peter (LingvoDa) написал 05 октября 2006 04:25

Вы ошиблись. Макрос помогает. Им замените # на перенос плюс пробел (или знак табуляции)
Получается следующая структура условной первой карточки:
а.е.д.
астрономическая единица длины
вторая карточка ...
и т.д.

Перед всем нужно написать три строка
#NAME "RUSORFO (Ru-Ru)"
#INDEX_LANGUAGE "Russian"
#CONTENTS_LANGUAGE "Russian"

Это в принципе "исходник", сохранить его как текстовый файл RusOrfo.DSL; скомпилировать и готов словарь.
Примечание:
Отдельно преобразовать те части, которые двуязычные и туда записать соответствующую заголовку с указанием языков. Обратите внимание на ##, их заменить на #.

vladd (LingvoDa) написал 29 октября 2006 11:27

Уважаемый Peter-Klaus, можно ли при помощи этого макроса превратить "исходник" на 56,5 тыс. слов (в текстовом формате) в словарь Lingvo не вручную, а автоматически, "списком"? Внешний вид карточки меня не интересует, равно как и словарные пометы, ссылки, шрифт и т.д. Это должен быть просто список вида
flange
_[m1][trn]фланец[/trn][/m]
range
_[m1][trn]диапазон[/trn][/m] (underscore обозначает пробел).

Klaus-Peter (LingvoDa) написал 30 октября 2006 11:53

А как выглядит ваш исходник? Представте пожалуйста допустим первых 20 строк.
Какая версия Lingvo у вас?

assa написал 01 марта 2007 04:57

Вопрос в тему:

А что если выглядит вот так:
不可替代 bùkětìdài незаменимый
初具规模 chūjùguīmó начинать воплощаться
房地产 fángdìchǎn недвижимое имущество
合成橡胶 héchéng xiàngjiāo синтетический каучук

(хочу создать кит-рус словарик)

Только вот не пойму как:
1. Просто поставить кодировку Юникод
2. Подключить макрос (который и документов Ворд делает ДСЛ-ки)

Klaus-Peter (LingvoDa) написал 02 марта 2007 01:44

Если вопрос ко мне, то должен сказать, что чувствую себя не компетентным в части китайского - просто не могу читать и не достаточно знаю особенности. Поэтому я надеюсь на то, чтобы посмотрели наши востоковеды на мои предложения и исправили бы при необходимости.
Для того, чтобы дело двигалось вперед, вы сначало должны будете определить подход более конкретно. Это значит:
1. какая версия Лингво у вас есть
если 12ая многоязычная (9 языков) - она поддерживает китайский язык, в качестве "NDEX_LANGUAGE" и "CONTENTS_LANGUAGE" можно использовать китайский
если 11ая многоязычная (6 языков) - в данном случае нужно "злоупотреблять" другой язык, который поддерживается данной версии. В таком случае сортировка производится по соответствующему алфавиту (транскрипции).
2. Как вы будете построить процесс ввода и нахождения искомого слова? Это непосредственно связано с вопросом 1 (по иероглифам или по транскрипции и с помощью какой версии Лингво?)
3. Если вы составляли словарь с помощью Ворд-а, то "поставить кодировку Юникод" преостое дело: Все форматировать шрифтом Arial Unicode MS, сохранять как Текст и постабить галочку около "Unicode", полученный файл переименовать от *.txt на *.dsl, компилировать в *.lsd.
4. В зависимости от объема словаря и как часто вы хотите компилировать словари, можно и отказатьса от применения макроса. Для начала берите допустим 20 терминов словаря и откроете в ворд-е соответствующий файл (берем ваш пример), при этом предполагаю, что у вас китайская версия словаря и знаки §,#,% нигде в тексте словаря не применяются:

不可替代§bùkětìdài #незаменимый%
初具规模 §chūjùguīmó #начинать воплощаться%
房地产 §fángdìchǎn #недвижимое имущество%
合成橡胶 §héchéng xiàngjiāo #синтетический каучук%

На местах, где показаны красные буквы § и # с помощью авто замены в Ворд-е замените их следующим образом: знаки § и # на магкий перенос + знаком табуляции, знак % твердым переносом (т.е. каждая строка должна быть закончена этим твердым, а не магким, переносом.
В итоге получаемисходник, который выглядит примерно так:

不可替代
bùkětìdài
незаменимый(_)
初具规模
chūjùguīmó
начинать воплощаться(_)
房地产
fángdìchǎn
недвижимое имущество(_)
合成橡胶
héchéng xiàngjiāo
синтетический каучук(_)

Маркировку (_) я поставил, чтобы отметить конец строки. У вас там должен быть твердый перенос.
Конечно вы можете строить исходный текст и в виде таблицы и из нее создать указанную структуру DSL-словаря.
Рекомендую дополнительно читать инструкцию по созданию словарей, в этом топике ниже (niccolo).

assa написал 02 марта 2007 07:15

1. Лингва 10 (многоязычная версия). Для кит.яз. надо поставить следующее направление перевода «англ-англ», и в словаре прописывать англ. и англ.
2. Процесс ввода – иероглиф, поиск – по ним же.
3. Не понял слов «мягкий и твердый перенос».

Klaus-Peter (LingvoDa) написал 03 марта 2007 03:57

Следите рекомендации pknv в соседнем топике, где вы также поместили вопрос.
Твердый перенос (абзац) - это клавиша ENTER; магкий (переход на следующую строку) - одновременно нажатие на SHFT + ENTER.

Тема закрыта

Close