Наименьшая адресуемая единица информации в www
§ 12. World Wide Web — Всемирная паутина
Системные основы WWW
Рассмотрим более подробно, что же такое World Wide Web (WWW). Обычно это словосочетание переводят как «Всемирная паутина». Каждый представляет себе паутину — это сеть, которую плетет паук. По смыслу слово «паутина» (Web) является синонимом слова «сеть».
World Wide Wеb (WWW) — это сеть документов, связанных между собой гиперссылками.
Таким образом, за использованием разных терминов закрепился разный смысл: сеть — это система взаимосвязанных компьютеров, т. е. техническая система, а паутина (Web) — это система взаимосвязанных документов, т. е. структура данных.
Разумеется, «паутина» документов существует на базе компьютерной сети.
Каждый отдельный документ, имеющий собственный адрес, называется wеЬ-страницей.
Каждая wеb-страница может иметь множество связей с другими страницами, которые хранятся как на том же самом компьютере, так и на других компьютерах сети. На рис. 2.5 схематически показано наложение паутины документов на компьютерную сеть. Сплошными линиями обозначены wеb-серверы и связи между ними, пунктирными — wеb-документы и их связи.
Рис. 2.5. Компьютерная сеть и «паутина» документов
Wеb-сервер — это компьютер, на котором работает сервер-программа WWW. В его дисковой памяти хранятся wеb-страницы.
Wеb-страница (документ) может содержать самую разную информацию: текст, рисунок, звукозапись, видео. Каждая страница хранится в отдельном файле, имя которого имеет расширение htm или html.
Гиперссылка — это некоторое ключевое слово или объект в документе, с которым связан указатель для перехода на другую страницу в паутине. Обычно изображение гиперссылки на странице каким-то образом выделяется, например цветом или подчеркиванием. При подведении к гиперссылке указателя мыши он принимает вид руки с указывающим пальцем. Если при этом щелкнуть левой кнопкой мыши, то произойдет переход по указателю к связанному документу. Текст, в котором используются гиперссылки, называется гипертекстом. Гиперссылки могут быть связаны не только с текстом, но и с другими видами объектов: рисунок, фото, видео, звукозапись, телеканал и др.
В основе технологии WWW лежат следующие понятия:
- НТТР (HyperText Transfer Protocol, протокол передачи гипертекста);
- адрес URL (Universal Resource Locator, универсальный указатель ресурса);
- язык HTML (HyperText Markup Language, язык разметки гипертекста).
НТТР (HyperText Transfer Protocol) — протокол передачи гипертекста. Используется службой WWW. Браузер — клиент-программа WWW посылает запрос wеb-серверу, хранящему файл с необходимым документом. В ответ на запрос сервер высылает клиенту требуемый файл или сообщение об ошибке, если файл недоступен. Протокол НТТР регулирует данный вид взаимодействия между клиентом и сервером.
URL-aдpec. Уже рассказывалось о системе адресации в компьютерном пространстве Сети. Это IP-адреса, доменные адреса.’ В пространстве информационных ресурсов Интернета используется своя система адресации. Она называется URL (Uniformed Resource Locator) — универсальный указатель ресурса. Каждая wеb-страница или файл имеют свой уникальный URL-адpec, который состоит из трех частей: имя используемого для доступа протокола; имя сервера, на котором хранится ресурс; полное имя файла (путь+имя) на сервере. Например, URL-адрес главной страницы wеb-сайта газеты «Первое сентября» выглядит так:
Префикс «www» образовался больше 20 лет назад и обозначал то, что на соответствующем домене работает именно wеb-сервер, а не какой-либо иной сервис. Но теперь, когда WWW стал доминирующим сервисом, смысл в его указании почти пропал.
Следует заметить, что имя составлено по правилам операционной системы Unix, под управлением которой работают серверы Интернета. В отличие от Windows вместо символа «» (обратный слеш) здесь используется символ «/» (слеш). Кроме того, строчные и прописные буквы не являются взаимозаменяемыми.
Web-сайт (другое название — web-узел) — это совокупность взаимосвязанных страниц, принадлежащих какому-то одному лицу или организации. Wеb-сайт организуется на wеb-сервере провайдера сетевых услуг. Всякий сайт имеет главную страницу, являющуюся своеобразным титульным листом сайта. Как правило, главная страница представляет владельца сайта и содержит гиперссылки на разные его разделы. Пример главной страницы wеb-узла издательства «БИНОМ. Лаборатория знаний» приведен на рис. 2.6.
Рис. 2.6. Фрагмент главной страницы сайта издательства БИНОМ
HTML — стандартный язык описания wеb-страниц. Теги (метки) языка HTML интерпретируются браузером, который на их основе строит в памяти компьютера объектную модель документа, а затем выводит эти объекты на экран. В результате пользователь видит отображение wеb-страницы в окне браузера. Язык HTML является основой любого гипертекстового документа, даже если он был создан в одном из конструкторов сайтов или визуальном редакторе.
Wеb-браузер — программа-клиент WWW. Слово browser можно перевести как «обозреватель». Наиболее распространенными программами этого типа являются Netscape Navigator, Internet Explorer, Opera, Google Chrome.
Средства поиска информации в WWW
Как уже говорилось выше, WWW — это система web-страниц, связанных между собой гиперссылками. Однако эти связи не имеют регулярности, как, например, в иерархической структуре данных. В этом смысле можно говорить о том, что система wеb-страниц не структурирована.
Единственной координатой web-документа является его URL-aдpec. Однако URL-aдpec никак не связан с содержанием документа. Но поиск данных осуществляется именно по содержанию. Как же в такой ситуации можно выполнять поиск нужной информации в паутине?
В поиске информации в WWW пользователю помогает поисковая служба Интернета — услуга поисковых серверов. Существуют две разновидности поисковых серверов: поисковые каталоги и поисковые указатели.
Поисковые каталоги. Если вам приходилось пользоваться услугами больших библиотек, то вы знаете, что такое библиотечный каталог. Существуют алфавитные и предметные каталоги. В алфавитных каталогах карточки с библиографическими данными книг разложены в алфавитном порядке фамилий авторов. В предметных каталогах карточки систематизированы по содержанию книг.
Систематизация в предметном каталоге производится по иерархическому принципу. На первом уровне иерархии весь книжный фонд делится на крупные разделы: художественная литература, учебная литература, общественно-политическая литература, научно-техническя литература и т. п. Каждый из этих разделов делится на подразделы; например, учебная литература делится на разделы высшего, среднего, дошкольного образования. Книги для среднего образования могут делиться по предметам, которые, в свою очередь, делятся по классам. Чтобы подобрать литературу по нужной теме, читатель должен понимать принцип организации каталога.
Поисковые каталоги WWW организованы по аналогичному иерархическому принципу. Только в них систематизируется информация не о книгах, а о документах, хранящихся в World Wide Web. На главной странице поискового каталога располагается список основных тематических разделов (рубрик). Например: финансы и экономика, государство и право, наука и образование, компьютеры, политика и т. д. Каждое имя в этом списке является внутренней гиперссылкой поискового каталога. Щелчок мышью по гиперссылке вызывает на экран список заголовков следующего подраздела и т. д. Очевидно, такая система подобна дереву файловой системы. Перемещаясь по дереву внутренних гиперссылок каталога, пользователь в конечном итоге получает список внешних ссылок на искомые wеb-документы.
Поисковые каталоги заполняются вручную специалистами, обслуживающими данную службу. При ручном способе отбора невозможно получить в каталоге исчерпывающую информацию о ресурсах Сети, и в этом состоит основной недостаток каталогов. Однако такой способ классификации исключает ссылки на случайные документы, не имеющие отношения к указанной теме. Таким образом, поисковые каталоги при относительно небольшом охвате ресурсов Сети обеспечивают хорошее качество подборки документов.
Поисковые указатели. Другое название этого вида поисковой службы — поисковые машины. Очень часто в учебной и научной литературе в конце книги присутствуют предметные указатели — это перечень основных терминов с указанием страниц, на которых они встречаются. Например, в учебнике по информатике вы ищете в таком списке слово «процессор», напротив которого указаны номера страниц. Затем на этих страницах читаете всё, что написано о процессоре.
Принцип работы поисковых указателей заключается в создании и использовании индексных списков — аналогов книжных предметных указателей.
Задачи поисковых машин состоят в формировании индексных списков, охватывающих как можно большее число документов паутины, а также в ответах на запросы клиентов. Ясно, что таким способом проиндексировать вручную все документы WWW невозможно. Их число давно перевалило за миллиард. Поэтому поисковые машины строят индексные списки автоматически.
Основной составляющей поисковых машин являются программы просмотра wеb-документов, которые называют по-разному: роботами, червяками, пауками и пр. Наверное, наиболее подходящим названием является «пауки», если уж сеть WWW называть паутиной! Непрерывно, днем и ночью, они сканируют всё информационное пространство WWW, просматривая все документы, определяя в них ключевые слова и записывая в свою базу индексов данное слово с указателем на документ, в котором оно присутствует. Этот процесс не прерывается, поскольку содержание паутины всё время меняется и дополняется. Даже в уже просмотренные документы авторы могут внести изменения или вообще удалить их. Поисковая машина всё время должна поддерживать информацию в актуальном состоянии.
Эффективность работы поисковой машины зависит от используемых алгоритмов формирования базы указателей. Эти алгоритмы представляют «know how», т. е. объекты интеллектуальной собственности авторов, и обычно держатся в секрете. Число указателей к некоторым ключевым словам составляет многие тысячи. Чем лучше алгоритм, тем меньше в индексный список попадает «мусора» — случайных документов, не имеющих отношения к теме поиска.
В отборе наиболее важных документов пользователю помогает рейтинговый принцип, используемый некоторыми поисковыми указателями. На запрос пользователя по ключевому слову система выдает список ссылок на документы, расположенные по убыванию рейтинга. Pейтинг определяется по числу обращений к документу, которые были сделаны ранее. Самые популярные документы попадают в начало списка.
Число поисковых указателей превышает число поисковых каталогов. Популярными в Pоссии указателями являются:
Поисковая служба Google работает как в международном, так и в российском секторе Интернета и является самой популярной.
Что является наименьшей адресуемой единицей информации www
1.Каково смысловое различие терминов «сеть» и «паутина» в контексте системы компьютерных коммуникаций?
2.Что является наименьшей адресуемой единицей информации в WWW? 3.Сопоставьте структуру полного имени файла (адреса файла) на автономном компьютере и URL-адрес в сети. Отметьте сходство и различие.
4.Обоснуйте необходимость существования поисковых служб в Интернете.
5.В чем различие между поисковыми каталогами и поисковыми указателями? 6.Какую работу выполняют роботы (пауки) поисковых машин?
Заполнить таблицу:ice cream, like, biscuits, rice, big, milk nine, fish, kite, chicken (ai), (I) Помогите задать вопросы к ответам 1) My name is Anna. 2) I am twelve. 3) I am from Moscow. 4) I am Russian.5) i am at home in the evening.6) I am happy today because it’s my birthday.7) My favourit… Кто Ваш фаворит:ученый, спортсмен, модель, певец, актер? Выберите известного человека и опишите его/ее.о Используйте Коробку Информации пожалуйста опишите внешность любого человека.Сразу говорю на … Пожалуйста сделайте по этим картинкам краткую биографию Ливингстона Рецепт украинского национального блюда на английском умоляю написшите мне уже нужно на завтра Look at the picture. Write down what these people are doing. Example: Bob is his computer. помогите пожалуйста , если можно с переводом помогите какиекачества наиболее важны для удачной карьеры, напишите на английском языке с переводом))) Доповідь про глобальні проблеми на английском языке Задание:замените формы глаголов continuous active формами глаголов indefinite active1.It is raining now2.It is snowing at the moment3.Boris is washing hands at this moment4.The alarm clock is ringi… Помогите пожалуйста ответить на вопросыDo you like bread? Does the monkey eat bananas? Do you like tea? Does the tiger like meat? Do you like corn? Does the fish eat butter? Do you like fish? Does … Твір на тему»Моя найкраща співачка» Помогите с ответами на вопрос The United Kingdom of G.B. and Northern Ireland is situated on the British Isles. The British Isles consists of two large islands, G.B. and Ireland, and about five tho…
§ 12. World Wide Web — Всемирная паутина
Учебник для 11 класса
Информатика
Системные основы WWW
Рассмотрим более подробно, что же такое World Wide Web (WWW). Обычно это словосочетание переводят как «Всемирная паутина». Каждый представляет себе паутину — это сеть, которую плетет паук. По смыслу слово «паутина» (Web) является синонимом слова «сеть».
World Wide Wеb (WWW) — это сеть документов, связанных между собой гиперссылками.
Таким образом, за использованием разных терминов закрепился разный смысл: сеть — это система взаимосвязанных компьютеров, т. е. техническая система, а паутина (Web) — это система взаимосвязанных документов, т. е. структура данных.
Разумеется, «паутина» документов существует на базе компьютерной сети.
Каждый отдельный документ, имеющий собственный адрес, называется wеЬ-страницей.
Каждая wеb-страница может иметь множество связей с другими страницами, которые хранятся как на том же самом компьютере, так и на других компьютерах сети. На рис. 2.5 схематически показано наложение паутины документов на компьютерную сеть. Сплошными линиями обозначены wеb-серверы и связи между ними, пунктирными — wеb-документы и их связи.
Рис. 2.5. Компьютерная сеть и «паутина» документов
Wеb-сервер — это компьютер, на котором работает сервер-программа WWW. В его дисковой памяти хранятся wеb-страницы.
Wеb-страница (документ) может содержать самую разную информацию: текст, рисунок, звукозапись, видео. Каждая страница хранится в отдельном файле, имя которого имеет расширение htm или html.
Гиперссылка — это некоторое ключевое слово или объект в документе, с которым связан указатель для перехода на другую страницу в паутине. Обычно изображение гиперссылки на странице каким-то образом выделяется, например цветом или подчеркиванием. При подведении к гиперссылке указателя мыши он принимает вид руки с указывающим пальцем. Если при этом щелкнуть левой кнопкой мыши, то произойдет переход по указателю к связанному документу. Текст, в котором используются гиперссылки, называется гипертекстом. Гиперссылки могут быть связаны не только с текстом, но и с другими видами объектов: рисунок, фото, видео, звукозапись, телеканал и др.
В основе технологии WWW лежат следующие понятия:
- НТТР (HyperText Transfer Protocol, протокол передачи гипертекста);
- адрес URL (Universal Resource Locator, универсальный указатель ресурса);
- язык HTML (HyperText Markup Language, язык разметки гипертекста).
НТТР (HyperText Transfer Protocol) — протокол передачи гипертекста. Используется службой WWW. Браузер — клиент-программа WWW посылает запрос wеb-серверу, хранящему файл с необходимым документом. В ответ на запрос сервер высылает клиенту требуемый файл или сообщение об ошибке, если файл недоступен. Протокол НТТР регулирует данный вид взаимодействия между клиентом и сервером.
URL-aдpec. Уже рассказывалось о системе адресации в компьютерном пространстве Сети. Это IP-адреса, доменные адреса.’ В пространстве информационных ресурсов Интернета используется своя система адресации. Она называется URL (Uniformed Resource Locator) — универсальный указатель ресурса. Каждая wеb-страница или файл имеют свой уникальный URL-адpec, который состоит из трех частей: имя используемого для доступа протокола; имя сервера, на котором хранится ресурс; полное имя файла (путь+имя) на сервере. Например, URL-адрес главной страницы wеb-сайта газеты «Первое сентября» выглядит так:
Префикс «www» образовался больше 20 лет назад и обозначал то, что на соответствующем домене работает именно wеb-сервер, а не какой-либо иной сервис. Но теперь, когда WWW стал доминирующим сервисом, смысл в его указании почти пропал.
Следует заметить, что имя составлено по правилам операционной системы Unix, под управлением которой работают серверы Интернета. В отличие от Windows вместо символа «» (обратный слеш) здесь используется символ «/» (слеш). Кроме того, строчные и прописные буквы не являются взаимозаменяемыми.
Web-сайт (другое название — web-узел) — это совокупность взаимосвязанных страниц, принадлежащих какому-то одному лицу или организации. Wеb-сайт организуется на wеb-сервере провайдера сетевых услуг. Всякий сайт имеет главную страницу, являющуюся своеобразным титульным листом сайта. Как правило, главная страница представляет владельца сайта и содержит гиперссылки на разные его разделы. Пример главной страницы wеb-узла издательства «БИНОМ. Лаборатория знаний» приведен на рис. 2.6.
Рис. 2.6. Фрагмент главной страницы сайта издательства БИНОМ
HTML — стандартный язык описания wеb-страниц. Теги (метки) языка HTML интерпретируются браузером, который на их основе строит в памяти компьютера объектную модель документа, а затем выводит эти объекты на экран. В результате пользователь видит отображение wеb-страницы в окне браузера. Язык HTML является основой любого гипертекстового документа, даже если он был создан в одном из конструкторов сайтов или визуальном редакторе.
Wеb-браузер — программа-клиент WWW. Слово browser можно перевести как «обозреватель». Наиболее распространенными программами этого типа являются Netscape Navigator, Internet Explorer, Opera, Google Chrome.
Средства поиска информации в WWW
Как уже говорилось выше, WWW — это система web-страниц, связанных между собой гиперссылками. Однако эти связи не имеют регулярности, как, например, в иерархической структуре данных. В этом смысле можно говорить о том, что система wеb-страниц не структурирована.
Единственной координатой web-документа является его URL-aдpec. Однако URL-aдpec никак не связан с содержанием документа. Но поиск данных осуществляется именно по содержанию. Как же в такой ситуации можно выполнять поиск нужной информации в паутине?
В поиске информации в WWW пользователю помогает поисковая служба Интернета — услуга поисковых серверов. Существуют две разновидности поисковых серверов: поисковые каталоги и поисковые указатели.
Поисковые каталоги. Если вам приходилось пользоваться услугами больших библиотек, то вы знаете, что такое библиотечный каталог. Существуют алфавитные и предметные каталоги. В алфавитных каталогах карточки с библиографическими данными книг разложены в алфавитном порядке фамилий авторов. В предметных каталогах карточки систематизированы по содержанию книг.
Систематизация в предметном каталоге производится по иерархическому принципу. На первом уровне иерархии весь книжный фонд делится на крупные разделы: художественная литература, учебная литература, общественно-политическая литература, научно-техническя литература и т. п. Каждый из этих разделов делится на подразделы; например, учебная литература делится на разделы высшего, среднего, дошкольного образования. Книги для среднего образования могут делиться по предметам, которые, в свою очередь, делятся по классам. Чтобы подобрать литературу по нужной теме, читатель должен понимать принцип организации каталога.
Поисковые каталоги WWW организованы по аналогичному иерархическому принципу. Только в них систематизируется информация не о книгах, а о документах, хранящихся в World Wide Web. На главной странице поискового каталога располагается список основных тематических разделов (рубрик). Например: финансы и экономика, государство и право, наука и образование, компьютеры, политика и т. д. Каждое имя в этом списке является внутренней гиперссылкой поискового каталога. Щелчок мышью по гиперссылке вызывает на экран список заголовков следующего подраздела и т. д. Очевидно, такая система подобна дереву файловой системы. Перемещаясь по дереву внутренних гиперссылок каталога, пользователь в конечном итоге получает список внешних ссылок на искомые wеb-документы.
Поисковые каталоги заполняются вручную специалистами, обслуживающими данную службу. При ручном способе отбора невозможно получить в каталоге исчерпывающую информацию о ресурсах Сети, и в этом состоит основной недостаток каталогов. Однако такой способ классификации исключает ссылки на случайные документы, не имеющие отношения к указанной теме. Таким образом, поисковые каталоги при относительно небольшом охвате ресурсов Сети обеспечивают хорошее качество подборки документов.
Поисковые указатели. Другое название этого вида поисковой службы — поисковые машины. Очень часто в учебной и научной литературе в конце книги присутствуют предметные указатели — это перечень основных терминов с указанием страниц, на которых они встречаются. Например, в учебнике по информатике вы ищете в таком списке слово «процессор», напротив которого указаны номера страниц. Затем на этих страницах читаете всё, что написано о процессоре.
Принцип работы поисковых указателей заключается в создании и использовании индексных списков — аналогов книжных предметных указателей.
Задачи поисковых машин состоят в формировании индексных списков, охватывающих как можно большее число документов паутины, а также в ответах на запросы клиентов. Ясно, что таким способом проиндексировать вручную все документы WWW невозможно. Их число давно перевалило за миллиард. Поэтому поисковые машины строят индексные списки автоматически.
Основной составляющей поисковых машин являются программы просмотра wеb-документов, которые называют по-разному: роботами, червяками, пауками и пр. Наверное, наиболее подходящим названием является «пауки», если уж сеть WWW называть паутиной! Непрерывно, днем и ночью, они сканируют всё информационное пространство WWW, просматривая все документы, определяя в них ключевые слова и записывая в свою базу индексов данное слово с указателем на документ, в котором оно присутствует. Этот процесс не прерывается, поскольку содержание паутины всё время меняется и дополняется. Даже в уже просмотренные документы авторы могут внести изменения или вообще удалить их. Поисковая машина всё время должна поддерживать информацию в актуальном состоянии.
Эффективность работы поисковой машины зависит от используемых алгоритмов формирования базы указателей. Эти алгоритмы представляют «know how», т. е. объекты интеллектуальной собственности авторов, и обычно держатся в секрете. Число указателей к некоторым ключевым словам составляет многие тысячи. Чем лучше алгоритм, тем меньше в индексный список попадает «мусора» — случайных документов, не имеющих отношения к теме поиска.
В отборе наиболее важных документов пользователю помогает рейтинговый принцип, используемый некоторыми поисковыми указателями. На запрос пользователя по ключевому слову система выдает список ссылок на документы, расположенные по убыванию рейтинга. Pейтинг определяется по числу обращений к документу, которые были сделаны ранее. Самые популярные документы попадают в начало списка.
Число поисковых указателей превышает число поисковых каталогов. Популярными в Pоссии указателями являются:
Поисковая служба Google работает как в международном, так и в российском секторе Интернета и является самой популярной.
Наименьшая адресуемая единица информации в www
Тема 4 Всемирная паутина. Средства поиска данных в Интернете
Всемирная паутина (World Wide Web, WWW) — это система (сеть) документов, связанных между собой гиперссылками.
Каждый отдельный документ, имеющий собственный адрес, называется Web-страницей.
На рис. 5.11 схематически показано «наложение» паутины документов на компьютерную сеть. Сплошными линиями обозначены Web-серверы и связи между ними, пунктирными — Web-документы и их связи.
Web-сервер — это компьютер, на котором работает сервер-программа WWW. В его дисковой памяти хранятся Web-страницы. В доменном имени Web-сервера младший домен обычно обозначается как www.
Web-страница (документ) может содержать самую разную информацию: текст, рисунок, звукозапись. Каждая страница хранится в отдельном файле, имя которого имеет расширение htm или html.
Гиперссылка — это некоторое ключевое слово или объект в документе, с которым связан указатель для перехода на другую страницу в « паутине». Обычно изображение гиперссылки каким-то образом выделяется на странице, например цветом или подчеркиванием. При подведении к гиперссылке указателя мыши он принимает вид руки с указывающим пальцем. Если при этом щелкнуть левой кнопкой мыши, то произойдет переход по указателю к связанному документу. Текст, в котором используются гиперссылки, называется гипертекстом.
Протокол, который используется службой WWW, называется HTTP (HiperText Transfer Protocol — протокол передачи гипертекста). Его основное назначение — обработка гиперссылок, поиск и передача документов клиенту.
Web-сайт — это совокупность взаимосвязанных (обычно тематически) страниц. Сайт принадлежит некоторому лицу или учреждению. Web-сайт организуется на Web-сервере провайдера сетевых услуг. Всякий сайт имеет главную страницу, являющуюся своеобразным титульным листом сайта. Как правило, главная страница представляет владельца сайта и содержит гиперссылки на разные разделы сайта.
URL-адрес. В пространстве информационных ресурсов Интернета используется своя система адресации. Она называется URL (Uniformed Resource Locator) — универсальный указатель ресурсов. Каждая Web-страница или файл имеют свой уникальный URL-адрес, который состоит из трех частей: имя используемого для доступа протокола; имя сервера, на котором хранится ресурс; полное имя файла (путь) на сервере.
Web-браузер — клиент-программа WWW. Слово «browser» можно перевести как «обозреватель». Наиболее распространенными программами этого типа являются Netscape Navigator компании Netscape Communications и Internet Explorer компании Microsoft.
В поиске информации в WWW пользователю помогает поисковая служба Интернета. Поисковая служба основана на услугах поисковых серверов. Существуют две разновидности поисковых серверов: поисковые каталоги и поисковые указатели.
Поисковые каталоги. Поисковые каталоги WWW организованы по иерархическому принципу. На главной странице поискового каталога располагается список основных тематических разделов (рубрик). Каждое имя в этом списке является внутренней гиперссылкой, т. е. ссылкой на внутренний документ сайта, поискового каталога. Щелчок мышью на гиперссылке вызывает на экран список заголовков следующего подраздела и т. д. Очевидно, что такая система подобна дереву файловой системы ОС. Перемещаясь по дереву внутренних гиперссылок каталога, пользователь в конечном итоге получает список внешних ссылок на искомые Web-документы.
Поисковые каталоги заполняются вручную специалистами, поддерживающими данную службу. При ручном способе отбора невозможно получить в каталоге исчерпывающую информацию о ресурсах Сети, и в этом состоит основной недостаток каталогов. Однако такой способ классификации исключает ссылки на случайные документы, не имеющие отношения к указанной теме. Таким образом, поисковые каталоги при относительно небольшом охвате ресурсов Сети обеспечивают хорошее качество подборки документов.
Поисковые указатели. Другое название этого вида поисковой службы — поисковые машины. Очень часто в учебной и научной литературе в конце книги присутствуют предметные указатели (о них было сказано выше).
Принцип работы поисковых указателей заключается в создании и использовании индексных списков — аналогов книжных предметных указателей.
Задачи поисковых машин состоят в формировании индексных списков, так чтобы охватить ими как можно большее число документов «паутины», а также в ответах на запросы клиентов. Ясно, что таким способом проиндексировать вручную все документы WWW невозможно. Их число давно перевалило за миллиард. Поэтому поисковые машины строят индексные списки автоматически.
Основной составляющей поисковых машин являются программы просмотра Web-доку ментов, которые называют по-разному: роботами, червяками, пауками и пр.
Непрерывно, днем и ночью, они сканируют все информационное пространство WWW, просматривая все документы, определяя в них ключевые слова и записывая в свою базу индексов данное слово с указателем на документ, в котором оно присутствует. Этот процесс не прерывается, поскольку содержание паутины все время меняется. Даже в уже просмотренные документы авторы могут внести изменения или вообще удалить их. Поисковая машина все время должна поддерживать информацию в актуальном состоянии.
Эффективность работы поисковой машины зависит от используемых алгоритмов формирования базы указателей. Эти алгоритмы являются интеллектуальной собственностью их авторов и обычно держатся в секрете. Число указателей к некоторым ключевым словам составляет многие тысячи. Чем лучше алгоритм, тем меньше в индексный список попадает «мусора» — случайных документов, не имеющих отношения к теме поиска.
В отборе наиболее важных документов пользователю помогает рейтинговый принцип, используемый некоторыми поисковыми указателями. На запрос пользователя по ключевому слову система выдает список ссылок на документы, расположенных по убыванию рейтинга. Рейтинг определяется по числу обращений к документу, которые были сделаны ранее. Самые популярные документы попадают в начало списка.
Число поисковых указателей превышает число поисковых каталогов.
Система основных понятий
Вопросы и задания:
- Каково смысловое различие терминов «сеть» и «паутина» в контексте системы компьютерных коммуникаций?
- Что является наименьшей адресуемой единицей информации в WWW?
- Сопоставьте структуру полного имени файла (адреса файла) на автономном компьютере и URL-адрес в сети. Отметьте сходство и различие.
- Представьте себе, что вы проектируете сайт своей школы. Какую информацию вы бы поместили на главной странице?
- Обоснуйте необходимость существования поисковых служб в Интернете.
- В чем различие между поисковыми каталогами и поисковыми указателями?
- Какую работу выполняют роботы (пауки) поисковых машин?
МЕТОДЫ И МОДЕЛИ;
ЭКОНОМИКО-МАТЕМАТИЧЕСКИЕ
ЗНАТЬ
Услуги, предоставляемые пользователям Сети, делятся на коммуникационные и информационные.
Службой Интернета называют средства поддержки данного вида услуг.
Программное обеспечение Сети включает сервер и клиент-программу, работа которых подчиняется определенным протоколам.
Основные коммуникационные службы Сети: электронная почта, телеконференции, сhat-конференции, Интернет-телефония, электронные доски объявлений.
Основные информационные службы: FТР — передача файлов; WWW — Всемирная паутина.
Информационной базой службы WWW является сеть документов, связанных между собой гиперссылками, хранящаяся на Wеb-серверах Интернета.
Основная адресуемая единица WWW — Wеb-страница (документ).
URL-адрес документа указывает его точные координаты в Сети, а также используемый протокол.
НТТР — протокол службы WWW; его основная функция — обработка гиперссылок и формирование запросов документов.
Web-браузер (обозреватель) — клиент-программа WWW, организующая доступ пользователя к информационным ресурсам «Всемирной паутины».
Web-страница хранится и передается в файле типа *.htm или *.html. Это текстовые файлы, содержащие описание Web-страницы.
1. Объясните различие между коммуникационными и информационными службами Сети.
2. Объясните различие между понятиями: базовый протокол Интернета и прикладные протоколы.
3. Почему сервер и клиент электронной почты используют разные протоколы?
4. Чем отличается сhat-конференция от телеконференции?
5. В чем преимущество Интернет-телефонии по сравнению с традиционной телефонной связью?
6. Для каких целей используется FТР-служба?
7. Какое значение для развития Интернета имело появление службы WWW?
8. Какое смысловое различие подразумевается в использовании терминов «сеть» и «паутина»?
9. Что является наименьшей адресуемой единицей информации в WWW?
10. По какому признаку можно отличить адрес Wеb-сервера от других адресов в Сети?
для студентов специальностей
1-25 01 10 «Коммерческая деятельность»
1-25 01 09 «Товароведение и экспертиза товаров»
1-27 01 01 «Экономика и организация производства»
Рассмотрен и утвержден на заседании кафедры
«Товароведение и организация торговли»
Протокол № 10 от «12» мая 2005 года
Рекомендован к печати
по специальности 25 01 10
Протокол № 4 от «01» июня 2005 года
Рекомендован к печати
Научно-методическим Советом МГУП
Протокол № 7 от «07» июля 2005 года
Составители: ассистент О.В. Сидорова
к.т.н., доцент С.Л. Масанский
Рецензент: к.э.н., доцент Л.В. Наркевич
© УО «Могилевский государственный университет продовольствия»
СОДЕРЖАНИЕ
Лекция 1. Теоретические основы экономико-математического моделирования. 5
1 Объекты изучения и методы исследования курса «Экономико-математические методы и модели». 5
2 Понятие экономико-математической модели и моделирования. 6
3 Классификация экономико-математических моделей. 8
4 Основные этапы экономико-математического моделирования. 9
5 Программное обеспечение экономико-математического моделирования. 10
Лекция 2. Система экономико-математических моделей оптимального планирования и управления. 12
1 Понятие оптимизационных задач и оптимизационных моделей. 12
2 Методика построения оптимизационной модели. 14
3 Основные типы линейных экономико-математических моделей. 15
Лекция 3. Экономико-статистическое моделирование и прогнозирование. 26
1 Понятие экономико-статистической модели. 26
2 Основные инструменты анализа экономических данных. 27
3 Применение корреляционного анализа для решения экономических задач. 29
4 Применение регрессионного анализа для решения экономических задач. 31
5 Трендовые модели прогнозирования экономических процессов. 35
Лекция 4. Модели оптимального управления товарными запасами. 39
1 Основные понятия экономико-математических моделей управления запасами. 39
2 Модели управления однономенклатурными запасами. 42
3 Модели управления многономенклатурными запасами. 43
Лекция 5. Модели систем массового обслуживания. 44
1 Понятие о системах массового обслуживания (СМО). 44
2 Основные характеристики СМО. 45
3 Классификация СМО. 48
4 Экономико-математическая постановка задач массового обслуживания. 50
Лекция 6. Методы и модели сетевого планирования и управления. 52
1 Особенности и назначение систем сетевого планирования и управления. 52
2 Основные понятия, определения и графические обозначения СПУ. 53
3 Правила построения сетевых графиков. 55
4 Основные параметры сетевых моделей и методы их расчета. 58
5 Постановка задач для решения методами СПУ. 60
6 Виды и сущность оптимизации сетевых моделей. 62
Лекция 7. Экономико-математические методы и модели теории игр. 65
1 Предмет и задачи теории игр. 65
2 Матричные игры с нулевой суммой. 67
3 Решение матричных игр в чистых стратегиях. 68
4 Решение матричных игр в смешанных стратегиях. 69
5 Решение статистических игр по различным критериям. 70
Лекция 8. Модели межотраслевого баланса. 73
1 Общие понятия балансового метода. 73
2 Принципиальная схема межотраслевого баланса. 74
3 Экономико-математическая модель межотраслевого баланса. 76
Единицы информации
Во всех рассмотренных нами до сих пор командах, будь то команды сравнения, пересылки или арифметические команды, требовалось указание двух полных слов в качестве операндов, каждое из которых располагалось в регистре общего назначения. В целях подготовки к изучению команд иного типа, один или оба операнда которых находятся в памяти, рассмотрим более подробно вопросы, касающиеся структуры памяти и адресации находящихся в памяти операндов в Системе 360. В частности, нас будет интересовать вопрос об основных единицах хранимой в памяти информации.
Мы уже знаем, что основной единицей информации в современных ЭВМ является двоичный разряд, или бит. Операнды команд формата RR являются 32-разрядными словами, содержимое которых в командах сравнения и арифметических командах рассматривается как двоичное целое со знаком. Другой важной единицей информации является байт, состоящий из 8 битов.
Байты являются фундаментальными единицами информации в Системе 360, поскольку именно на них основывается вся адресация памяти. Память рассматривается как набор байтов, расположенных в порядке возрастания порядковых номеров, начиная с 0:
Говоря об адресе фиксированного места памяти, мы обычно имеем в виду номер соответствующего байта: если, например, адрес байта есть 30АС (если не оговорено противное, все адреса даются в шестнадцатеричной системе счисления), то этот байт имеет порядковый номер 30АС.
Мы вовсе не хотим этим сказать, что любой операнд в Системе 360 имеет длину один байт. Но байт является наименьшей единицей информации, которая может быть непосредственно записана в память или считана из нее. При задании адресов операндов с большей длиной необходимо просто указывать адрес первого байта, входящего в операнд. Адресом полного слова, например, является адрес первого входящего в это слово байта. Количество байтов в операнде определяется либо выполняемой операцией, либо специальным указанием в команде.
Поскольку байт является наименьшей адресуемой единицей, то ясно, что адресация, например, битов или полубайтов невозможна. Таким образом, для изменения элементов информации, меньших байта, требуется использование иных средств. Более подробно этот вопрос будет рассмотрен в гл. 14. Вернемся к адресации байтов и более крупных единиц.
32-битовое слово состоит из 4 байтов по 8 битов каждый. При использовании команд, работающих с полными словами, их адреса определяются адресами первых входящих в них байтов. Мы можем представлять себе память как набор полных слов, каждое из которых имеет адрес на 4 больший, чем предыдущее. Первое полное слово имеет адрес 0, за ним следуют слова с адресами 4, 8, С, 10, 14 и т. д. При использовании команд работы с полными словами мы должны придерживаться следующего правила: адрес полного слова должен быть кратен 4.
Подобные правила применяются и для адресации других единиц информации, по размерам превосходящих байт. Эти правила определяются физическими, а не логическими правилами. Так мы можем работать с полями информации, логическая длина которых равна 4 байтам, и при этом не беспокоиться о соблюдении этого правила, если нам не приходится использовать команды, требующие 4-байтовых операндов. Но тот факт, что некоторая единица информации начинается с границы какого-либо полного слова, вовсе не означает, что для работы с ней нужно использовать лишь команды с 32-разрядными операндами. Информация часто записывается в память полными словами, а затем модифицируется с помощью команд, работающих с отдельными байтами. Указанное выше правило можно переформулировать так: в командах работы с полными словами адреса операндов должны быть кратны 4. Невыполнение этого или других правил расположения операндов приводит к особому случаю спецификации, фиксирующему ошибку определения операнда.
Обычно при формулировании правил расположения применяется термин выравнивание информации. Единица информации считается выровненной по границе полного слова, если ее начало совпадает с началом какого-либо полного слова, т.е. ее адрес кратен 4.
Во многих случаях использование полных слов в качестве операндов не требуется. Например, 32-разрядные слова почти никогда не используются для арифметических операций над счетчиками циклов. В связи с этим предусмотрен целый набор арифметических команд с операндами длиной вполуслово. Каждое полуслово состоит из двух байтов и так же, как и полное, адресуется указанием адреса первого из них.
Нетрудно догадаться, что для полуслов должно выполняться следующее правило: адрес полуслова должен быть кратен 2.
Двойные слова (64 бита) используются в операциях арифметики с плавающей точкой двойной точности и операциях преобразования данных (гл. 19 и 15 соответственно).
Правило выравнивания для двойных слов выглядит так: адрес двойного слова должен быть кратен 8.
На рис. 6.1 схематически представлен участок памяти и его деление на части, соответствующие единицам информации.
Очевидно, возможна адресация полных слов, полуслов и байтов, входящих в состав произвольного двойного слова, при этом действующее правило выравнивания зависит от используемой команды. Список правил выравнивания представлен в табл. 6.1.
Иными словами, программисту предоставлен выбор команд, требующих выравнивания операндов по границам байтов, полуслов, полных или двойных слов. Этот выбор зависит от необходимых действий и удобства. Часто приходится рассматривать один и тот же сегмент памяти как состоящий из различных по длине единиц информации на различных этапах вычислений. Таким образом, можно загрузить полное слово, используя команды побайтовой пересылки, затем обработать накопленную информацию с помощью команд с 32-разрядными операндами (это могут быть команды арифметики с фиксированной точкой, с плавающей точкой или иные), затем использовать вновь побайтовую обработку и побайтовую пересылку результатов. Правила выравнивания представляют собой не что иное как ограничения на адресацию различных единиц информации при использовании их в качестве операндов в определенных командах.
Рис. 6.1. Схематическое представление основных единиц информации и их расположения в памяти.