Книжный мир
Текстовые форматы

Morik (off) VIP [1755]
10 января 2009, 18:29

fictionbook
На мой взгляд, лучше всего подходит для художественной литературы. Он прекрасно позволяет организовать структуру книги (главы, подзаголовки, стихи, цитаты и т.д) Он позволяет вставлять в текст иллюстрации. Он без проблем читается как на PC, так и на КПК. Под него есть достаточное количество хорошего софта. Он открыт и стремительно развивается.
Сам я читаю книги именно в этом формате, поэтому все остальные форматы меня не очень беспокоят.
Под катом информация, достаточная для комфортного общения с форматом fb2
Начнем с программ, позволяющих читать формат fb2 "как он есть", не изменяя и не конвертируя его во что-то другое.
Для "большого брата" - PC -есть две лидирующих программы: Cool Reader и AlReader
Cool Reader
- Переформатирование текста под любой размер шрифта, сглаживание (антиалиасинг) экранных шрифтов, полностью настраиваемая палитра, текстурированный фон, плавный скроллинг, позволят снизить нагрузку на зрение.
- Оптимизирован для чтения художественной литературы.
- Понимает формат большинства книг, скачанных с сайтов электронных библиотек. Распознает границы абзаца, заголовки, цитаты с использованием элементов AI. Поддерживает распаковку книг из архивов ZIP, RAR, ARJ, HA, LZH.
- Читает форматы html, rtf, doc (MS Word), txt, fb2(FictionBook). Автоматически распознает русские кодировки ...
Читать далее
-------
Morik (off) VIP [1755]
10 января 2009, 20:17

FictionBook (FB2) - формат представления электронных версий книг в виде XML-документов. Стандарт призван обеспечить совместимость с любыми устройствами и форматами. XML позволяет легко создавать документы, готовые к непосредственному использованию и программной обработке (конвертации, хранению, управлению) в любой среде. Документы, обычно имеющие расширение.fb2, могут содержать структурную разметку основных элементов текста, некоторое количество информации о книге, а также могут содержать вложения с двоичными файлами, в которых могут храниться иллюстрации или обложка.
Основное преимущество FictionBook(.fb2) - возможность без труда создавать (в том числе и автоматически) книги в этом формате из файлов всех популярных текстовых форматов (*.txt, *.doc, *.rtf. *.html и пр.).
Программы для чтения:
Многоплатформенные:
FBReader - свободная программа чтения электронных книг как для десктопов (Windows и GNU/Linux). В число поддерживаемых форматов входит FB2.
POSIX-системы
PyBookReader - интерфейс GTK+, требуются Python, PyGTK, ...
Читать далее
-------
Morik (off) VIP [1755]
11 января 2009, 11:44

Немного о fb3
FictionBook 3.0 beta - краткое описание
Цель создания формата
Формат fb3 разрабатывается для удовлетворения возросших требований к форматированию текста книг и возможностям их каталогизации. Современное состояние стандартов и технологий позволяет, помимо простого расширения набора тегов, привести формат к совместимости с наиболее удачными и перспективными наработками. В частности, в основу fb3 положен стандарт Open Packaging Convention ( ECMA- 376 Part 2 ) . Помимо этого в качестве картинок можно использовать SVG-файлы (и GIF-файлы, патент на которые закончился).

Преемственность с форматом fb2
Приоритеты , на которых основан формат fb2, остаются, но частично расширяются:
Принцип одна книга - один файл сохраняется. Более того, fb3 полноценно поддерживает "подшивки" - несколько книг в одном fb3- файле.
Минимализм форматирования сохраняется, но для работы со сложными документами (например, с учебниками) в fb3 вводится минимально- необходимый набор тегов, обеспечивающий максимальное качество верстки при максимально возможной простоте.
Вся мета-информация является неотъемлемой частью файла. В соответствии с возросшими требованиями к полноте и точности мета-информации была разработана новая, прямо не совместимая с ...
Читать далее
-------
Morik (off) VIP [1755]
15 января 2009, 14:27

Формат pdf

PDF ( аббревиатура от англ. Portable Document Format - переносимый формат документов; произносится пи- ди-эф) - кроссплатформенный формат электронных документов, созданный фирмой Adobe Systems с использованием ряда возможностей языка PostScript . В первую очередь предназначен для представления в электронном виде полиграфической продукции, - значительное количество современного профессионального печатного оборудования может обрабатывать PDF непосредственно. Для просмотра можно использовать официальную бесплатную программу Acrobat Reader , а также программы сторонних разработчиков. Традиционным способом создания PDF-документов является виртуальный принтер , то есть документ как таковой готовится в своей специализированной программе - графическом или текстовом редакторе , САПР и т. д. А затем экспортируется в pdf для распространения в электронном виде, передачи в типографию и т. п. А затем экспортируется в pdf для распространения в электронном виде, передачи в типографию и т. п.
PDF является открытым стандартом ISO 32000 [1] .
Формат PDF позволяет внедрять необходимые шрифты (построчный текст), векторные и растровые изображения, формы и мультимедиа-вставки. Поддерживает RGB , CMYK , Grayscale , Lab , Duotone , Bitmap , несколько типов сжатия растровой информации. Имеет собственные технические форматы для полиграфии: PDF/X-1 , PDF/X-3. Включает механизм электронных подписей для защиты и проверки подлинности документов. В этом формате распространяется большое количество сопутствующей документации.
-------
Morik (off) VIP [1755]
15 января 2009, 18:21

Формат fb2

FictionBook - формат представления электронных версий книг в виде XML - документов, где каждый элемент книги описывается своими тегами. Стандарт призван обеспечить совместимость с любыми устройствами и форматами. XML позволяет легко создавать документы, готовые к непосредственному использованию и программной обработке (конвертации, хранению, управлению) в любой среде. Документы, обычно имеющие расширение.fb2, могут содержать структурную разметку основных элементов текста, некоторое количество информации о книге, а также могут содержать вложения с двоичными файлами, в которых могут храниться иллюстрации или обложка.
Правильно подготовленный электронный текст в формате FictionBook содержит в себе всю необходимую информацию о книге - структурированный текст, иллюстрации, информацию об авторе и издании, но не содержит информацию о внешнем виде документа. Как будет выглядеть текст, полученный из формата.fb2, зависит либо от настроек программы- просмотрщика этого формата, либо от параметров, заданных при конвертации файла в другой формат.
К примеру, в тексте документа.fb2 содержатся фразы, оформленные как заголовки. Программа, в которой откроют файл, в зависимости от настроек может отобразить их, в отличие от остального текста, либо крупным шрифтом, либо другим цветом, или как-то иначе. Так, при конвертации в формат ...
Читать далее
-------
Morik (off) VIP [1755]
16 января 2009, 02:01

Формат RTF

Rich Text Format ( RTF , «формат обогащённого текста» (rich с английского - богатый) - свободный межплатформенный формат хранения размеченных текстовых документов, предложенный Microsoft . Первая версия стандарта RTF появилась в 1987 году, с тех пор спецификация формата несколько раз изменялась. RTF- документы поддерживаются большинством современных текстовых редакторов (под Microsoft Windows это, как правило, осуществляется с помощью стандартных библиотек, входящих в состав системы).

Пример RTF- документа
В качестве примера, рассмотрим следующий код в формате RTF:

{\rtf1 Привет! \par {\i Это} некий отформатированный {\b текст}.\par End }

который будет выглядеть в текстовом редакторе с поддержкой RTF как

Привет!
Это некий отформатированный текст .
End
Символ
\
указывает на начало управляющего кода. Код
\par
означает переход к новой строке,
\b
- переключение на полужирный шрифт. Фигурные скобки обозначают группу; например, в приведённом выше примере группой ограничивается действие кода
\b
. Всё остальное, кроме фигурных скобок и управляющих кодов - это обычный текст. Правильный RTF-документ должен состоять из группы, начинающейся с управляющего кода
\rtf
.
Как видно из примера, основой формата является простой текст, то есть формат является человеко- читаемым. Но в большинстве случаев файлы RTF, генерируемые автоматически такими редакторами как MS Word содержат столько ...
Читать далее
-------
Morik (off) VIP [1755]
16 января 2009, 03:22

Формат DjVu

DjVu (от фр. d?j? vu «уже виденное») - технология сжатия изображений с потерями , разработанная специально для хранения сканированных документов - книг, журналов, рукописей и пр., где обилие формул, схем, рисунков и рукописных символов делает чрезвычайно трудоёмким их полноценное распознание . Также является эффективным решением, если необходимо передать все нюансы оформления, например, исторических документов где важное значение имеет не только содержание, а цвет и фактура бумаги; дефекты пергамента: трещинки, следы от складывания; исправления, кляксы, отпечатки пальцев; следы, оставленные другими предметами.
DjVu стал основой для нескольких библиотек научных книг, правомерность существования некоторых из них, впрочем, вызывает сомнения с точки зрения законов об авторских правах . Огромное количество книг в этом формате доступно в файлообменных сетях .
Формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать ещё до завершения скачивания. DjVu-файл может содержать текстовый ( OCR ) слой, что позволяет осуществлять полнотекстовый поиск по файлу. Кроме того, DjVu-файл может содержать встроенное интерактивное оглавление и активные области - ссылки, что позволяет реализовывать удобную навигацию в DjVu-книгах.
Для сжатия цветных изображений в DjVu применяется специальная технология, разделяющая исходное изображение на три слоя: передний план, задний план и чёрно-белую (однобитовую) маску. ...
Читать далее
-------
Morik (off) VIP [1755]
16 января 2009, 04:10

Формат txt

Те?кстовый файл - разновидность файла , содержащая текстовые данные , как правило организованные в виде строк. Текстовый файл, как и прочие файлы, хранится в файловой системе.
В отличие от термина «текстовый формат», характеризующего содержимое данных, термин «текстовый файл» относится к контейнеру, хранящему эти данные. Текстовый файл может содержать не только чистый текст, но и производные форматы - к примеру, HTML -текст.
Текстовым файлам противопоставляются двоичные (бинарные) файлы , в которых информация организована по иным принципам.
Текстовый файл представляет из себя последовательность символов (принадлежащих некому набору символов ). Символы сгруппированы в строки ( англ. lines, rows). В современных системах строки разделяются переводом строки , хотя в прошлом применялось хранение строк в виде записей постоянной или переменной длины.
Иногда конец текстового файла, особенно если в файловой системе не хранится информация о размере файла, также отмечается одним или более специальными знаками, известными как маркеры конца файла .
Формат текстового файла крайне прост, и его можно изменять текстовым редактором - стандартной программой, присутствующей во всех ОС.
Текстовые файлы, особенно если речь идёт об однобайтных кодировках вроде ASCII , не подвержены многим проблемам, характерным для других форматов файлов. Так, для них не важна разница в порядке байтов или длине машинного слова на разных ...
Читать далее
-------
Брат
26 февраля 2009, 12:12

Вы скачали книжку или сохранили с помощью браузера (например, в UCWEB) страничку, после чего хотите почитать в читалке, но отображаются "краказябры" (непонятные символы). Проблема решается так: открываешь x-plore, находишь нужный текстовый файл, далее: Меню-Файл-Правка или просто жмешь цифру 8. Нужно, при необходимости, сменить кодировку в настройках (нажав цифру 0), чтобы текст был читаемым (например, выбрав utf-8'). Далее, в текстовом файле пишешь любую букву или просто жмешь пробел и тут же удаляешь. То есть, текст остается прежним, без видимых изменений. И тут же проверяешь, нажав Меню, стоит ли галочка "Сохранить в Юникоде". Нужно поставить! Далее жмем "Сохранить" в Меню или жмем "Назад", выйдет окно "Сохранить изменения?" Отвечаешь "Да". Все, теперь можно читать текст в QReader.
-------
Lorian Moderator [1792]
3 марта 2009, 21:33

utes96961, в папку Text.
-------

Ответить на тему

стр. 1,2,3,4 След.

Книжный мир
Список форумов
На главную

Последние темы

Регистрация
Вход

0.044 сек
SQL: 4