Владимир Вуль
Электронные издания
Рекомендовано УМО вузов по университетскому политехническому образованию в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению 654600 – "Информатика и вычислительная техника", специальности 220200 – "Автоматизированные системы обработки информации и управления"
Группа подготовки издания:
Главный редактор Екатерина Кондукова
Зав. редакцией Григорий Добин
Редактор Юрий Рожко
Компьютерная верстка Константина Ушакова
Корректор Евгений Камский
Дизайн обложки Игоря Цырульникова
Зав. производством Николай Тверских
Предисловие
В настоящее время производство печатной продукции все больше интегрируется в единое пространство медиа-индустрии. Составной частью этого процесса является интеграция печатных и электронных изданий. Причин такой интеграции несколько. Прежде всего, практически все информационные технологии перешли на цифровую форму, оснастились компьютерной техникой, программным обеспечением профессионального уровня, техническими средствами обработки изображений. С другой стороны, тот же процесс происходит и с распространением любых видов информационной продукции: появились компакт– и DVD-диски с электронными изданиями, а также диски содержащие различную музыкальную и видеоинформацию. Издательства внедрили новейшие сетевые технологии, связанные с распространением медиа-информации по интра– и экстрасетям, в глобальной сети Интернет.
Электронная книга значительно дешевле печатной и ее изготовление не связано с расходом трудновозобновляемых ресурсов (леса) и загрязнением окружающей среды. Во многих случаях электронные издания оказываются даже более функциональными, чем печатные. Так, справочное или учебное электронное издание позволяет более динамично построить процесс изучения материала и усилить его мотивацию, что, в конечном счете, позволяет ускорить процесс восприятия и запоминания информации. Электронные карты и путеводители помогают туристам и экскурсантам ориентироваться в незнакомых городах и впервые посещаемых музеях.
Художественная литература преимущественно распространяется в привычной для нас форме типографских изданий. Однако детские электронные издания уже существенно потеснили книги, так как последние не обладают многими возможностями электронных компьютерных технологий. Постепенно, но неуклонно продолжается наступление электронных изданий в учебной сфере, начиная со школьного обучения и до высшего образования.
Важнейшим преимуществом электронных изданий по сравнению с печатными является возможность их интерактивного оформления. Это относится не только к детским игровым, но и к любым изданиям сценарного типа. Такое издание может быть учебным, научно-популярным и даже художественным произведением, в котором потребителю отводится не пассивная роль читателя, а активная роль участника. Все фрагменты электронных изданий, моделирующие процессы, могут быть построены по этому типу, т. е. читатель сам становится участником событий и в определенных рамках может влиять на их исход, что сближает процесс работы с таким изданием с деловыми играми. Естественно, что такой эффект невозможно достигнуть при традиционной книжной форме представления информации.
Еще одним проявлением интерактивности является возможность моделирования и визуализации достаточно сложных физических явлений, таких, например, как ток и напряжение в электронных цепях, квантовое состояние атомов, их ядер и электронов, прохождение световых лучей в различных средах, включая анизотропные и т. п. Работая с соответствующими фрагментами электронного издания и самостоятельно определяя, например, величины входных и выходных сигналов или углы падения и преломления световых лучей, читатель чувствует себя полноправным участником компьютерного эксперимента, исследователем происходящих процессов и явлений. В учебном процессе такие операции вполне могут быть названы виртуальными лабораторными работами.
В последние годы непрерывно возрастает роль электронных изданий учебного и словарно-справочного характера вследствие возможности их быстрой модификации в соответствии с изменением достигнутого уровня знаний, т. е. достигается чрезвычайно высокий уровень оперативности электронного издания. Особенно это заметно для изданий, распространяемых по сетям. Если прибавить к сказанному возможность дистанционного общения преподавателя с одним или несколькими обучаемыми, дистанционного тестирования и оценки уровня знаний, то можно придти к выводу, что электронный учебник преобразуется в постоянно развивающуюся обучающую, справочную и контролирующую уровень знаний специализированную информационную среду.
Электронные издания не только публикуются в базах данных, но и могут применятся в форме баз данных – реферативных и библиографических. Эти два вида изданий объединяет то обстоятельство, что они предназначены для квалифицированных пользователей, среди которых присутствуют как библиографы – работники крупных библиотек, так и научные работники, скрупулезно следящие за изданиями в своей предметной области. Неудивительно, что первые электронные издания были связаны именно с этой предметной областью.
База данных, в которой хранятся (или публикуются) электронные издания, поддерживает каталогизацию и другие виды библиотечной деятельности, в частности, одну из важнейших – доступ читателей в публичный каталог, причем никаких специальных знаний помимо своей предметной области от читателей не требуется. База данных позволяет преодолеть основное ограничение в обслуживании читателей в библиотеках – она дает возможность многим пользователям работать с одним и тем же материалом одновременно.
Наконец, здесь проявилось и другое очень существенное преимущество электронного издания в сравнении с любым изданием на бумаге – качество хранимого материала (текста, иллюстраций и пр.) никак не зависит от интенсивности его использования: этот материал не изнашивается и не стирается. Еще один фактор – электронное издание занимает значительно меньшие площадь и объем, что также является немаловажным экономическим фактором.
Роль электронных изданий в составе издательской продукции постоянно растет. По прогнозам к 2010 году мировое производство печатной продукции в стоимостном отношении снизится с 60—70% до 35—50% от общего производства продукции медиа-индустрии, а производство электронных изданий в стоимостном выражении достигнет 25—30%. Естественно, что и в нашей стране следует учесть эти тенденции развития издательского дела.
Хотя в периодических изданиях множество материалов посвящены производству и распространению электронных изданий, в том числе и с мультимедийными компонентами, пока отсутствуют как учебные пособия, так и монографии, в которых были бы рассмотрены соответствующие проблемы. В результате в настоящее время возникла настоятельная потребность в издании книги по теме "Электронные и мультимедиа книжные издания". Автором накоплен определенный опыт в чтении этого курса или его фрагментов студентам различных специальностей. Опыт преподавательской, научно-исследовательской и методической работы, многочисленные доклады и публикации в этой области позволили автору освоить все аспекты данной темы, а в некоторых случаях – внести свой определенный вклад. Именно это послужило информационной основой предлагаемой книги. Кроме того, автор счел целесообразным включить в книгу ряд разделов по смежной и близкой тематике, а именно:
✓ распространение электронных изданий;
✓ HTML-формы (Hyper Text Markup Language);
✓ CGI-технологии (Common Gateway Interface) и их применение;
✓ организация баз данных для хранения электронной литературы;
✓ метаинформация и ее использование при поиске электронных изданий в локальных и сетевых базах данных;
✓ семантический анализ электронных изданий;
✓ современные поисковые стратегии и их применение при работе с электронной книгой;
✓ электронная учебная книга.
Автор надеется, что книга будет полезна не только специалистам в области современных издательских технологий, но и студентам и учащимся старших классов в процессе изучения различных дисциплин, связанных с современными информационными и сетевыми технологиями. В частности, включение отдельных разделов книги поможет сделать гораздо более интересным и наглядным обычный курс "Информатики" не только в высшей, но и в средней школе. Книга окажется полезной всем интересующимся гипертекстовыми документами и системами, Web-дизайном, мультимедийными технологиями и базами данных, стратегиями индексации электронных документов и их поиском в локальных и распределенных базах данных. Все перечисленные направления активно внедряются в повседневную практику работы различных фирм и предприятий.
Глава 1. Общая характеристика электронных изданий
В первой главе рассмотрены особенности электронных изданий и их место в современной медиа-индустрии. Обсуждаются составные элементы и форматы электронных изданий. Предложена классификация электронных изданий и показаны пути и перспективы их дальнейшего совершенствования и развития. Отдельно рассмотрено состояние и перспективы развития электронных средств массовой информации.
1.1. Что такое "электронное издание"
Книгопечатание появилось в XV веке благодаря изобретению Иоганна Гутенберга. Несколько веков печатные издания, т. е. книги, газеты и журналы были основным средством распространения визуальной информации. Большую часть этого периода основой изготовления печатной продукции служил оригинальный металлический набор, а металлическая матрица (в заключительной части периода – стереотип) являлся информационной основой для тиражирования.
Во второй половине XX века появилось новое понятие – "машинный носитель", под которым понималось любое электронное средство длительного хранения информации, на котором записано издание в целом или его часть. Чаще всего информация хранилась на магнитном носителе: магнитной ленте или магнитном диске. Однако такие носители оставались несовершенными: надежность хранения и плотность записи информации были низки. Поэтому такие средства в издательской практике использовались достаточно редко. В большинстве отечественных издательств процесс подготовки изданий основывался на использовании "бумажных" технологий. Автор сдавал рукопись, напечатанную на пишущей машинке. В издательстве она редактировалась и в окончательном виде также перепечатывалась машинистками издательства и этот издательский машинописный оригинал использовался в качестве основы для типографского набора.
Последние десятилетия XX века характеризуются быстрым совершенствованием и развитием электроники и компьютерных информационных технологий. Именно в этот период практически все издательства перешли на компьютерный набор и верстку газет, журналов и книг. В этом случае издание хранится в памяти компьютера во время набора и верстки книги, т. е. остается в электронной (машинной) форме в течение всего процесса подготовки, вплоть до вывода на принтер так называемого постраничного оригинал-макета. Полностью сверстанное и подготовленное к печати издание, хранимое в памяти компьютера (на жестком магнитном диске) или в специальном запоминающем устройстве долговременного типа можно назвать "электронным изданием".
Однако для того, чтобы электронная книга, журнал или газета действительно могли соперничать со своими печатными аналогами, необходимы средства их распространения, доведения до читателя. В конце XX века эти средства фактически стали массовыми, т. е. получили самое широкое распространение. Периодические электронные издания стали распространяться преимущественно по сетям, в частности, по глобальной сети Интернет. Информационной средой для распространения книг стали и остаются последние 15 лет компакт-диски.
Итак, вначале электронные издания существовали как аналог печатных, но на машинном носителе. Естественно, что для чтения электронных изданий, распространяемых по сетям, требовался персональный компьютер. Если же электронное издание подготовлено на компакт-диске, то дополнительно был еще нужен дисковод для чтения компакт-диска. Таким образом, издание на машинном носителе или электронное издание не может быть прочитано непосредственно, то есть требуется специальное дополнительное оборудование, чтобы сделать такое издание видимым для человеческого зрения или обеспечить его визуализацию.
Далее понятие "электронные издания" стало включать в себя тексты книг, журналов и газет, распространяемые в любом текстовом или ином формате, например, в гипертекстовом (HTML – Hypertext Markup Language) или одном из сжатых форматов (ZIP, ARJ, RAR, WINZIP и т. п.). В последнее десятилетие XX века в составе электронных изданий стали применяться еще и мультимедийные компоненты, под которыми подразумеваются цифровые звуковые или видеофрагменты, а также анимационные вставки в основную часть издания. В результате электронные издания стали средством комплексного информационного воздействия на человека, сравнимого с радио, кино и телевидением, а в чем-то даже превосходящем эти важные средства массовой коммуникации. Принципиальным отличием печатных изданий от электронных является возможность интерактивной реализации последних, при которой пользователь (читатель) может не только перемещаться по встроенным в текст гиперссылкам, но и активно вмешиваться в ход событий, моделировать процессы, в том числе производственные.
В последние несколько лет появились сетевые электронные издания. Большинство молодых людей еще в школьные годы знакомятся с глобальной сетью Интернет и встречаются с понятиями Web-сайт и Web-страница. Последняя определяется как электронная страница в соответствующем формате, а Web-сайт – это набор связанных друг с другом Web-страниц, объединенных общими признаками или назначением. Другое определение: Webсайт – многоуровневая структурированная комбинация электронных страниц, с внутренними связями и ссылками, позволяющая перемещаться с одной страницы на любую другую, а также на другие сайты. В настоящее время в сети Интернет существует значительное количество сайтов, представляющих собой, по существу, электронные издания, т. е. аналоги книг или брошюр, но только в электронном сетевом представлении. В качестве примера можно сослаться на сайт "Электронные каталоги Российских библиотек", верхняя часть главной страницы которого представлена на рис. 1.1.
Размер этой страницы достаточно велик, так как содержит перечень из нескольких десятков библиотек с указанием тематики изданий, представленных в данной библиотеке, и особенностей поиска и извлечения информации из ее каталога. Название библиотеки, с точки зрения пользователя, подобно заголовку многотомного справочника, в котором описаны все книги, хранимые в этой библиотеке. Если подвести указатель мыши к названию библиотеки, то он приобретет форму указателя (кисть руки с вытянутым указательным пальцем). Таким образом, название служит указателем перехода к Web-странице, на которой организован поиск издания в соответствующей библиотеке. Для осуществления перехода следует щелкнуть левой кнопкой мыши по этому указателю перехода. Как создаются такие указатели и осуществляются переходы, мы рассмотрим во второй главе книги.
В описании каталога Государственной публичной научно-технической библиотеки есть ссылка на Сводный каталог по научно-технической литературе, который также служит указателем перехода. Щелкнув мышью по соответствующему фрагменту текста, мы переместимся на страницы этого сводного каталога. Таким образом, с помощью электронных страниц и гиперссылок в сети Интернет создан мощный электронный справочник, заменяющий много толстых книг, содержащих соответствующие библиотечные каталоги нескольких крупных библиотек. Причем поиск в этом справочнике вместо нас производит специальная поисковая система, которая работает во много тысяч раз быстрее и эффективней.
Рис. 1.1. Фрагмент лицевой страницы сайта Электронные каталоги Российских библиотек
Назначение Web-сайтов достаточно разнообразно. Большей частью они используются как представительства в сети различных фирм, производственных предприятий, учебных институтов и университетов. Есть свои сайты и у большинства учебных заведений: университетов, академий, институтов. Достоинства Web-сайта:
✓ конкретность представленных данных, возможность использования самых различных форматов, простота и удобство навигации между страницами сайта;
✓ неограниченное тиражирование информации с сайта, вследствие чего финансовые затраты на единицу информации оказываются на несколько порядков ниже по сравнению с печатной продукцией, радио и телевидением;
✓ удобство восприятия и доходчивость представленной информации;
✓ высокая оперативность и низкие затраты на обновления информации, в частности, на обновление учебных планов, программ и учебных пособий по отдельным курсам;
✓ постоянная обратная связь с посетителями сайта на основе специальных технологий, включающих обработку форм (см. разд. 2.8 и 9.5) и электронную почту, что, в частности, позволяет студентам дистанционно выполнять практические и лабораторные работы, а преподавателям дистанционно проверять уровень знаний как студентов, так и школьников;
✓ дистанционная связь и конфиденциальность информации для сотрудников, работающих вне главного офиса, и для партнеров на основе специальных интра– и экстрасетей.
1.2. Составные элементы электронного издания
1.2.1. Тексты
Основной частью большинства электронных изданий, так же как и книг, выпущенных типографским способом, являются текстовые фрагменты. Некоторые издания вообще целиком текстовые. Если такое издание набрано на компьютере в любом текстовом редакторе, то его можно назвать электронным изданием. Разновидностью такого издания являются так называемые гипертекстовые документы – издания в специальном HTML-формате. Язык HTML и методика создания HTML-документов будет рассмотрена в главе 2, поэтому здесь мы не останавливаемся на этом подробно.
Если заглянуть во Всемирную сеть Интернет, то там можно обнаружить некоммерческие электронные библиотеки [4]. Большинство изданий в этих библиотеках представлены в текстовых или упакованных (архивированных) текстовых файлах. Последние получены в результате предварительного сжатия исходного файла специальными программами – архиваторами. Такие издания характеризуются минимальным объемом и могут быть быстро загружены по сети на компьютер пользователя.
Простейший текстовый формат использует кодировку отдельных символов текста в ASCII-стандарте, в соответствии с которым каждый символ кодируется одним байтом. ASCII – это аббревиатура от American Standard Code Information Interchange или – в переводе – “Американский стандартный код для информационного взаимодействия”. Чем сложнее текстовый редактор, в котором набирается текстовые фрагменты, тем большее количество управляющих символов используется для форматирования текста, в результате чего объем текстового фрагмента заметно увеличивается. В графической оболочке Windows для кодирования каждого символа используется не менее 2 байт. В частности, в текстовом редакторе Word 97, в котором набирался этот учебник, на каждый кодируемый символ текста в среднем приходится около 5 байт, причем в состав редактора включены средства внутреннего сжатия информации в файлах документов. Тот же текст, набранный в редакторе Word 6 или Word 7 (Word 95) под Windows, занимает еще существенно большее информационное пространство.
В некоторых случаях текст кодируется в графическом формате (например, формат PDF (Portable Document Format), который будет рассмотрен далее). Это обеспечивает качественный визуальный интерфейс при просмотре издания, его независимость от шрифтовых гарнитур, установленных на компьютере пользователя, но требует применения специальных программных средств для его просмотра.
1.2.2. Иллюстративный материал
Известно, что издательства и полиграфисты очень осторожны при включении иллюстраций, особенно цветных, в тиражируемые книги. Это связано с тем обстоятельством, что иллюстрации требуют специальной обработки, в том числе – растрирования, а цветные – еще и цветоделения, в результате чего усложняется и удорожается производство книг.
В электронных изданиях этой проблемы не существует, так как абсолютное большинство компьютеров снабжены цветными мониторами и программными средствами для воспроизведения иллюстративного материала. Поэтому в электронных изданиях следует использовать такое количество иллюстраций, которое требуется для наилучшего восприятия и понимания материала, причем эта величина всегда больше, чем в изданиях, тиражируемых печатным способом. Иллюстративный материал содержит на несколько порядков больше информации, чем текст, занимающий то же самое пространство на странице, и гораздо эффективней воздействует на человека.
Скорость восприятия иллюстративной информации также многократно выше, чем текста. Это связано с особенностями визуального восприятия информации человеком. Зрительные образы в виде графических объектов воспринимаются целиком и непосредственно обрабатываются и сохраняются в долговременной памяти человека, без промежуточного преобразования в понятия, как это происходит с текстом.
Форматы графических файлов, особенности работы с цветом, количество используемых в изображении цветовых оттенков и многие другие вопросы будут рассмотрены в последующих главах.
1.2.3. Звуковое сопровождение
Неотъемлемой частью многих изданий является звуковое сопровождение. Звуковое сопровождение может представлять собой авторский текст или ремарки, шумовые эффекты, иллюстрирующие происходящие события и делающие их описание более реалистичным. Звук может синхронно сопровождать включенные в издание видеокадры или анимацию, что будет подробно изложено в последующих разделах книги.
Скорость восприятия человеком звуковой информации имеет тот же порядок величин, что и для текста. Однако, одновременная работа с текстовой и звуковой информацией не только увеличивает общую скорость восприятия, но и способствует лучшему ее долговременному запоминанию, вероятно в результате образования определенных ассоциативных связей.
1.2.4. Анимация и видео
Все мы смотрим телевидение, однако телевизионное вещание на всех отечественных каналах, кроме коммерческого канала НТВ+ и некоторых каналов кабельного телевидения, ведется в аналоговом формате. Цифровой формат, используемый в компьютерном видео, отличается несравненно более высоким качеством воспроизведения и разрешающей способностью, но требует большого объема памяти для хранения видеоинформации и высокой пропускной способности для ее воспроизведения с необходимой частотой кадров.
Поэтому гораздо чаще, чем видеофрагменты, в электронных изданиях используется компьютерная мультипликация или простые анимационные файлы. Они же очень часто встречаются на различных Web-страницах, причем, во многих случаях, применяются в качестве рекламы. Однако, даже такая простая мультипликация может использоваться для иллюстрации последовательности выполнения технологических операций, работы полиграфических машин и комплексов и даже последовательности выполнения операций в компьютерных программных пакетах. Во всех перечисленных случаях анимация играет вспомогательную роль, способствуя наглядности описания соответствующих процессов и лучшему пониманию и запоминанию этого описания. Широкое использование анимации связано с тем, что информационный объем анимационных файлов и требуемые для их воспроизведения информационные ресурсы сравнительно невелики, в то же время анимация оживляет страницы электронного издания, делает их более динамичными, способствует лучшему их восприятию. Цифровое компьютерное видео может успешно использоваться лишь на компьютерах с процессором и видеокартой высокой производительности, обеспечивающих скорости следования информационных потоков, достигающих, а иногда и превышающих 1 Гбайт/с. Его воспроизведение требует значительных аппаратных и программных ресурсов, причем эти требования пропорциональны площади, на которой воспроизводится видео.
1.3. Форматы электронных изданий
В предыдущем параграфе уже упоминались форматы электронных изданий. Здесь мы поговорим об этом подробнее, впрочем, и позднее мы будем еще не раз обращаться к этому вопросу. В электронном издании формат описывает то, каким образом в файле представлена информация. В настоящее время для современных и качественных электронных изданий используются два основных формата, а именно: