Общая характеристика и структура HTML-документа
На заре компьютеризации приходилось работать с простыми текстовыми редакторами, такими как WordStar, для которых информация, отображаемая на экране, отличалась от выводимой на бумагу с помощью принтера. В текст документа вставлялись специальные управляющие символы, которые не отображались на экране, но обеспечивали вывод на печать в нужном формате отдельных фрагментов документа. При форматировании одна группа символов определяла начало фрагмента, затем следовал текст, к которому применялось это форматирование, а после него следовали символы конца фрагмента. Так задавались разрядка, курсив, полужирный шрифт и пр. Аналогичные способы применялись и при работе с первыми версиями СУБД dBase (например, dBase II), о чем автор может судить по своему личному опыту.
Тот же принцип положен в основу структуры



Для просмотра HTML-документов используют специальные программы, которые называются браузерами (Browser, т. е. средство просмотра в дословном переводе). Такие программы нуждаются в графической оболочке. В частности, значительное число браузеров (Microsoft Internet Explorer, Netscape Communicator, Opera и др.) работают в среде Windows 95, 98 и 2000.
Популярность


Широкое использование HTML-документов в сети Интернет привело к появлению международных стандартов на этот язык, называемых спецификациями языка HTML. Этой работой занялась широко известная организация

Основой спецификации HTML 4.0 стало отделение параметров описания документов от параметров представления отдельных его фрагментов на экране монитора. Такое разделение облегчает адаптацию языка к различным платформам передам (Windows, UNIX, DOS и пр.) и упрощает процесс внесения изменений в документы. В соответствии с такой концепцией для описания документа следует использовать таблицу стилей, причем это понятие сходно с используемым в современных текстовых редакторах, таких как Word 97 или 2000. Использование же данных о форме представления документа вперемежку с содержанием самого документа не рекомендуется.
Спецификация HTML 4.0 отменяет ряд ранее использовавшихся тегов. Отмена тега означает, что этот тег по-прежнему поддерживается браузерами, но его применение в современных документах не рекомендуется. В дальнейшем такие теги могут быть переведены в разряд устаревших, которые уже могут не поддерживаться браузерами. Информация такого рода может быть получена на сайте http://www.w3.org/TR/.
Любой HTML-документ заключен в контейнер <HTML> и </HTML>. Сам документ, как уже говорилось выше, представляет собой обычный текстовый файл. Его можно просматривать в DOS'e с помощью стандартных редакторов и средств просмотра текстовых документов, при этом вместе с самим текстом мы будем видеть и теги.
Структурно документ распадается на две части: заголовочную и основную, ил и тело документа. Первая часть находится внутри контейнера <HEAD> и </HEAD>, а основная часть - внутри контейнера <BODY> и </BODY>.
Единственный обязательный тег, который используется в заголовочной части,- <ТIТLE>, причем он образует контейнер, внутри которого размещается текст заголовка. При загрузке документа в браузер текст заголовка загружается в первую очередь в окно заголовка браузера. Если текст заголовка достаточно информативен, пользователь в процессе поиска релевантных документов уже на этапе загрузки документа может определить, действительно ли ему нужен этот документ, а если не нужен, то сразу отказаться от его загрузки и перейти к загрузке следующего. Текст названия используется и при создании закладки для данного документа, с этой точки зрения также очень важна его информативность.
Многие HTML-документы связаны друг с другом, и ссылки от одного документа на другие могут быть абсолютные и относительные, причем последние формируются относительно того каталога, в котором расположен документ - источник ссылки. Абсолютные ссылки длинные, а относительные - перестают работать при перемещении основного документа. Можно включать сразу обе ссылки, чтобы связи между документами не нарушались в любых условиях.
Для формирования ссылок в заголовочной части применяется тег <ВАSЕ>, в котором используется один единственный параметр HREF, в качестве значения которого указывается URL (Universal Resours Locator) - адрес файла, на который производится ссылка. Адрес может быть локальным, т. е. задавать размещение файла в каталогах и подкаталогах на том же самом компьютере, или сетевым, например <BASE HREF='http:// www.uprint.spb.ru/main.htm'>.
Для организации логической связи и соподчиненности электронных изданий может использоваться тег <LINK>. В этом теге могут использоваться четыре параметра: HREF, REL, REV и TYPE. С помощью первого из них задается URL связанного с данным документа.
Параметр REL определяет вид отношения между текущим и связанным с ним документом, a REV -обратное отношение (между другим и текущим документами). Последний параметр TYPE задает тип и параметры присоединяемой к документу таблицы стилей. Примеры тега <LINK>:
<LINK REL='contents' HREF='(адрес)'>
<CLINK HREF='mailto: (адрес автора)' REV='made'>
Другими значениями параметра REL могут быть bookmark, copyright, glossary, help. Значение made параметра REV является признаком обратного отношения. Другие его значения: autor, editor, publisher.
Позднее в состав заголовочной части был добавлен специальный тег <МЕТА>, с помощью которого задается метаинформация, связанная с данным электронным изданием, или атрибуты для ускоренного поиска. Частные случаи метаинформации - это имя автора, издателя, редактора, название издательства, время публикации и другие характерные признаки издания. Тег <МЕТА> имеет два параметра: NAME, которым задается имя атрибута, и CONTENT, определяющий значение этого атрибута. Например:
<MЕТА NAME='author' CONTENT='B. А. Вуль'>
<СМЕТА NAME='description' СОМТЕМТ='Электронные издания'>
Как нам кажется, приведенные примеры не нуждаются в каких-либо комментариях.
Итак, внутри контейнера <HEAD> и </HEAD>, ограничивающего заголовочную часть HTML-документа, обычно используется один контейнер <TITLE> и </TITLE>, внутри которого размещается текст заголовка, и могут быть включены теги <BASE>, <LINK> и <МЕТА>. Отметим, что HTML-документ, содержащий только заголовочную часть, будет нормально отображаться браузерами как пустой документ. Пример такого документа представлен на рис. 2.1

<HTML>
<HEAD><ТIТLE>Пустой документ </TITLE></HEAD>
<BODY></BODY>
</HTML>
2.2.