Книжный мир
Печатное дело

Lorian Moderator [1792]
15 мая 2011, 11:47

На форуме и в личке у меня очень часто спрашивают ,как перекодировать в книгу в fb2 формат,так как на сегодняшний день это самый популярный формат.

Общая последовательность действий

Получение первичного fb2 из txt|doc|html|etc.
Программы для создания fb2
Простой импорт с использованием Any2FB
Доработка тела документа
Удаление контейнеров
Корректировка fb2, выделение стихов и т.п.
Оформление сносок (инструкция пока не готова, но Any2FB сразу создает нормальные сноски из сносок вида [текст сноски])
Заполнение заголовка
Работа с xml-исходником
Чего НЕТ в этом документ

Получение первичного fb2

Этот этап требует наибольшей сноровки. Тут вам могут пригодиться следующие программы:

BookDesigner (и его клон Fiction Book Designer)- монстроподобный и не очень эстетичный инструментище. Среди его неоспоримых достоинств - уникальная в своем роде всеядность. Он может достаточно корректно распознать многие экзотически изуродованные тексты, читает всеразличные prc, pdf и даже lit (для этого, впрочем, придется пошаманить). Последняя версия включает достаточно удобный fb2 section editor и умеет работать с регулярными выражениями. Снабжен справкой. Неплохой выбор для начинающих, полезный инструмент в руках мастера. Лично я его на дух не переношу (GribUser).
Any to FB2 - не столь всеядный, но куда более легковесный и немного более управляемый инструмент. Замысловатые тексты на входе могут потребовать ...
Читать далее
-------
Lorian Moderator [1792]
15 мая 2011, 11:49

После того, как мы увидим на вкладке Log обнадеживающую фразу Export finished , нажимаем кнопку ?Done?. Документ передается в FBE и мы можем увидеть, что получилось при импорте. Были распознаны заголовки, была распознана одна сноска. Параграфы выглядят неплохо. Единственная претензия - заголовок всего документа был преобразован в отдельную пустую секцию плюс как заголовок была распознана строка про OCR.
---

Размер файла: 29.6 Kб
-------
Lorian Moderator [1792]
15 мая 2011, 11:52

Доводка тела документа в FBE
[править]
Базовые операции по корректировке и облагораживанию fb2.


Приступим к тому, ради чего все и затевалось - к доводке. Первую строку исходного документа я предлагаю просто удалить (некоторые делают из нее title для body, но я не считаю это разумным). Простая операция удаления лишней секции с title, однако, сопряжена с известными трудностями в редакторе FBE. Удаление элементов структуры (как то: стихов, секций, эпиграфов) можно производить только из предыдущего элемента.

Установите курсор над заголовком Аркадий и Борис Стругацкие. Частные предположения и нажмите клавишу ?Del?.
---

Размер файла: 16.5 Kб
-------
Lorian Moderator [1792]
15 мая 2011, 11:53

В результате текст перешел в предыдущий элемент, а старый структурный элемент удален. Жмите ?Del?, пока текст не удалиться. Этот метод работает для любых элементов FB2 и использовать его вы будете широко.
---

Размер файла: 17.5 Kб
-------
Lorian Moderator [1792]
15 мая 2011, 11:55

прежде, чем аналогичным образом мы разделаемся с секцией ?/* Scaned...? полезно будет заглянуть в редактор заголовка. Среди прочего он предлагает ввести и информацию о OCR. Перенесем туда (Copy+Paste) информацию из тела документа и теперь уже со спокойной совестью удалим текст об OCR - никто не забыт. Не забыто так же и то, что удалять секцию нужно из предыдущего элемента.
---

Размер файла: 23.5 Kб
-------
Lorian Moderator [1792]
15 мая 2011, 11:57

Аннотация, эпиграфы, стихи, картинки

В режиме ?body? в начале документа цветными маркерами слева отмечаются разделы ?annotation? (серо-голубой) и ?history? (малиновый). Очень желательно заполнить annotaion (аннотация), тем самым существенно облегчив жизнь будущим читателям). Если вы меняли что-то в готовом fb2 документе, заполните историю - например, укажите, что документ вычитан, добавлена пропущенная при сканировании страница и т.п. Не забудьте изменить и номер версии документа (см. ниже).

При необходимости можно добавить эпиграф: поставить курсор туда, где он должен быть (эпиграф должен следовать сразу за началом секции и ее названием, если оно есть) и нажать Ctrl+N (или Edit=>Add=>Epigraph). Появится фиолетовая полоска, в которую и надо скопировать эпиграф (можно просто перетащить). Если эпиграфом служит стихотворение, то внутри фиолетовой полоски (тега <epigraph>) надо нажать Ctrl+P (или Edit=>Insert=>Poem), появятся чёрная (<poem>) и тёмно-красная (<stanza>) полоски, в тёмно-красную следует перетащить стихотворение. <stanza> ? это строфа, и таких тегов может быть несколько подряд. У эпиграфа наверняка есть автор: перетаскиваем его имя в конец стихотворения, выделяем, нажимаем Ctrl+D (Edit=>Add=>Text Author) ? тёмно-красная полоска заканчивается, а чёрная продлевается на одну строчку; копируем имя автора в чёрную полоску (тег <text-author> после </stanza>). Всё, операция завершена (примечание: после эпиграфа ...
Читать далее
-------
Lorian Moderator [1792]
15 мая 2011, 12:02

Обратите внимание, что обложку не нужно вставлять в начало документа. Обложка указывается один раз, в description-е.

На закуску можно переименовать сноску ?Note_1? в, скажем ?[1]?. На этом наши злоключения с телом документа завершены.

Однако, кое-что еще на нашу долю осталось. А именно - заголовок, в котором пока есть только информация об OCR, а фамилия автора обозначена как ?Борис Стругацкие?. Не есть гуд

Доводка заголовка

Опять переключаемся в режим заголовка (меню ?View?->?Description?) и приступаем к работе. Для начала выберем жанр. При размещении в библиотеке книга будет помещена на соответствующую ?полку? в соответствии с этим полем.
---

Размер файла: 30.2 Kб
-------
Lorian Moderator [1792]
15 мая 2011, 12:04

После этого переходим к оформлению авторов. В нашем случае это Аркадий Натанович и Борис Натанович Стругацкие.
---

-------
Lorian Moderator [1792]
15 мая 2011, 12:05

В таком же духе следует заполнить весь заголовок. Ниже приведен рисунок с заполненными обязательными и необязательными полями. Обязательные поля помечены красным, где необходимо даны комментарии. Помните, что чем больше достоверной информации вы предоставите, тем лучше. Потратьте время на поиск даты написания произведения, имени переводчика, издательства, выпустившего книгу. Часто такая информация говорит о многом.
---

Размер файла: 92 Kб
-------
Lorian Moderator [1792]
15 мая 2011, 12:08

Обратите внимание на название серии. Не нужно вводить название книги как ?Приключения пупкина I: Пупкин на Луне?, ?Приключения пупкина II: Пупкин на Марсе? и т.п. Вместо этого введите Book title ?Пупкин на Луне?, а в поле Sequence Name введите ?Приключения пупкина?. Не забудьте указать номер книги в серии, это позволит автоматически разложить книги по полочкам в библиотеке - сперва на луну, потом на марс, не наоборот.

Обратите также внимание на поле ID ? если вы будете загружать в библиотеку обновлённую версию своей книги, значение в этом поле (комбинация букв и цифр) должно оставаться прежним, а номер версии - возрасти. Это позволит обновить книгу даже, если вы поменяли название - книга все равно опознается как обновление к существующему документу и старый документ будет корректно заменен. Побочным эффектом такого способа идентификации книг является возможность удалить любую свою книгу из библиотеки - вы просто присваиваете новой книге ID намеченной на заклание жертвы и заливаете книгу в библиотеку поверх старой. Мир жесток.
[править]
Работа с исходным xml-кодом

Этот режим служит для исправления ошибок, сделанных в предыдущих двух а так же для выполнения всяких продвинутых (и не продвинутых) задач (типа вложения section) не имеющих удобной реализации в графическом интерфейсе :) . Например, отсюда легко избавиться от лишних тегов <section> (а они наверняка появятся при экспорте). Имя автора и название книги не ...
Читать далее
-------

Ответить на тему

стр. 1,2 След.

Книжный мир
Список форумов
На главную

Последние темы

Регистрация
Вход

0.037 сек
SQL: 6