Индексирование Web-узлов

это способ, которым пользователи Интернета

Занятие 3. Запросы

(продолжительность занятия 55 минут)

  • Элементы формы запроса
  • Процесс запроса
  • Наборы результатов
  • Построение запросов и результатов
  • Объявление параметров с помощью IDQ-файлов
  • Раздел имен
  • Раздел запроса
  • Оформление результатов запроса средствами HTX-файлов
  • Упражнение
  • Резюме
  • Запросы — это способ, которым пользователи Интернета и интрасети выполняют поиск интересующего их фрагмента текста или свойства документов Вашего сервера. На этом занятии Вы познакомитесь с запросами и их обслуживанием.
    Изучив материал этого занятия, Вы сможете:
  • перечислить и описать средства запросов Index Server;
  • описать этапы процесса обслуживания запроса в Index Server;
  • описать роль .idq, .htx, .asp-файлов в выполнении запросов.
  • Формы запросов позволяют пользователям Вашего Web-узла искать документы, отвечающие заданным критериям. Index Server позволяет снабдить форму запроса дополнительными средствами, упрощающими его обработку и улучшающими отображение результатов, а также контролирующими использование запроса.
  • Область запроса —
  • задает набор документов, который будет просматриваться средствами поиска при выполнении запроса. Область обычно описывается путем к папке на томе носителя, например D:\Docs.
  • Ограничения на запрашиваемое содержимое —
  • позволяют сузить круг поиска, задавая текст, который нужно найти.
  • Ограничения на свойства документов -
  • задают атрибуты файлов, которые должны просматриваться при поиске, например размер файла, даты создания и изменения, имя или автор.
  • Выделение искомого текста в найденных документах —
  • это средство помогает создать HTML-страницу со списком документов, отвечающих критериям запроса, с выделением искомых слов красным курсивом. Кнопки Show Highlights (condensed) и Show Highlights (full text), расположенные под резюме каждого из найденных документов, позволяют посмотреть выделенные слова.
  • Протоколирование запросов —
  • Internet Information Server протоколирует весь трафик между клиентом и сервером. В стандартном режиме протоколирования регистрируется такая информация, как IP-адрес автора запроса и число запросов, обработанных сервером. В состав Index Server включен образцы форм запросов. Вы вправе использовать его для поиска в индексированных файлах. Эти формы можно сделать доступными посетителям Web-узлов и воспользоваться ими при разработке собственных форм. Чтобы открыть образец формы запроса, в меню Start выберите команды Programs, Windows NT 4.0 Option Pack, Microsoft Index Server, Index Server Sample Query Form.
    Элементы формы запроса
    Простейшая форма запроса состоит из следующих элементов.
    HTML-файл — отображает Web-страницу, на которой пользователь вводит параметры запроса. Это же файл отображает результат запроса, выполненного Index Server,
    Файл запроса данных
    (Internet Data Query, IDQ) — IDQ-файл (файл с расширением .idq); это промежуточная форма пользовательского запроса, которую Index Server использует при просмотре индекса, Файл HTML-расширения (НТХ) —
    НТХ-файл (файл с расширением .htx) представляет собой HTML-файл результатов запроса. Эти данные затем добавляются в HTML-страницу, которая передается Web-обозревателю для предоставления клиенту. Примечание
    Index Server использует еще один файл, с расширением .htw — шаблон для форматирования страницы с выделением вхождений искомого текста. Содержимое HTW- и НТХ-файлов форматируется в виде Web-страницы и передается Web-обозревателю. Кроме того, для создания форм запросов можно применять активные страницы сервера (ASP) и язык структурированных запросов (SQL). Поддержку SQL S обеспечивают активные объекты данных (Microsoft Active Data Objects, ADO).
    Создавая формы запросов средствами ASP, Вы вправе использовать сценарные возможности ActiveX. Запросы с применением asp-файлов позволяют воспользоваться преимуществами сценарных языков Microsoft VBScript и JScript для достижения большей гибкости в отображении результатов запроса. Активные страницы сервера подробно описаны в главе II, “Активные страницы сервера”.
    Вместо стандартных форм Index Server допустимо создание SQL-запросов в приложениях, использующих ADO. Таким образом, ASP-файл может применять расширения SQL для формирования запроса, ADO для выбора данных и сценарный язык (например, VBScript) для их отображения.
    Примечание
    . Если производительность сервера Index Server недостаточна, ограничьтесь базовыми формами (.idq-, .htx- и .htm-файлы). Запросы с применением ASP и SQL требуют больших вычислительных мощностей, чем базовые формы. Процесс запроса
    В отличие от индексирования, выполняющегося в фоновом режиме, процесс запроса инициируется пользователем и взаимодействует с Internet Information Server для передачи запроса, его обработки и возврата результатов клиенту.
    это способ, которым пользователи Интернета
    Как показано на рисунке, Index Server начинает работу с преобразования поступившего запроса из формы во внутреннее представление, совместимое с индексами Index Server. Затем Index Server выполняет запрос и возвращает результаты пользователю в формате HTML.
    Index Server использует IDQ-файлы для преобразования запроса из Web-формы во внутреннее представление, а НТХ-файлы — для форматирования результатов выполнения запроса.
    Наборы результатов
    Index Server помещает ссылки на документы, удовлетворяющие условиям запроса, в набор результатов, который возвращается клиенту.
    В форме запроса можно ограничить максимальное число документов, отвечающих условиям отбора, размещаемых на одной странице результатов. Например, Вы вольны так организовать набор результатов, состоящий из 200 элементов, чтобы клиент получил информацию на 10 страницах, каждая из которых содержит по 20 найденных соответствий. Кроме того, в форму можно включить элемент, позволяющий клиенту ограничить число возвращаемых документов. Index Server способен расположить элементы набора результатов в порядке, определяемом любым свойством документа.
    Если для обеспечения безопасности Internet Information Server применяются списки контроля доступа (Access Control Lists, ACL), а индексируемая совокупность документов хранится на томе NTFS, Index Server учтет эти ограничения, проверяя списки контроля доступа. Пользователь не получит в наборе результатов ссылку на документ, если у него нет права чтения этого документа.
    Если список контроля доступа разрешает доступ к документу, клиент может указать, информацию о каких свойствах сервер должен вернуть в наборе результатов (эта информация определяет столбцы набора результатов).
    это способ, которым пользователи Интернета
    Кроме информации о свойствах документов, Index Server способен возвращать аннотации к документам, причем аннотации могут значительно сузить область поиска.
    Построение запросов и результатов
    Файлы запроса данных по Интернету (файлы с расширением .idq) служат для преобразования запросов. Обладающие большими возможностями НТХ-файлы в сочетании с IDQ-файлами форматируют результаты запроса. Как показано на приведенном ниже рисунке, НТХ-файлы могут содержать расширения, позволяющие воспользоваться уникальными особенностями запросов Index Server.
    это способ, которым пользователи Интернета
    К папке, где хранятся IDQ-файл и соответствующий ему НТХ-файл, должен быть разрешен доступ для выполнения.
    Объявление параметров с помощью IDQ-файлов
    IDQ-файл преобразует параметры HTML-формы в запрос, который выполняет Index Server.
    Примечание
    Все пути к IDQ-файлам должны быть полными, а не относительными или физическими путями от виртуального сервера. Другими словами, все пути должны начинаться с символа косой черты “/” и не могут включать символы “.” или “..”. Допустимые и недопустимые варианты приведены ниже. Допустимый вариант
    /scripts/myquery.idq
    /scripts/samples/search/query, idq
    Недопустимый вариант
    c:\inetsrv\scripts\myquery. Idq
    scripts/query, idq
    /samples/../scripts/query, idq
    IDQ-файлы нельзя хранить на виртуальном сервере, заданном UNC-именем.
    IDQ-файл состоит из двух разделов: имен и запроса.
    Раздел имен
    Всю работу выполняет раздел запроса, однако раздел имен позволяет задать нестандартные имена столбцов, к которым можно обращаться в запросе. Эти столбцы соответствуют свойствам ActiveX, определенным в файлах документов с помощью интерфейса IPropertyStorage или механизма пользовательских и итоговых свойств Microsoft Office. Раздел имен — мощный инструмент, позволяющий настроить поиск для конкретных нужд Вашей организации.
    Присутствие раздела имен в IDQ-файле не обязательно; в стандартных запросах он просто не нужен.
    Раздел запроса
    В разделе запроса задаются его фактические параметры. В этом качестве могут выступать такие свойства, как область запроса, ограничения на содержимое, наборы результатов либо переменные форм, включая условные выражения, изменяющие значения переменной в зависимости от какого-либо условия. Раздел запроса начинается с тэга [Query], за которым следует набор параметров. Ниже приведен пример простого, но вполне типичного IDQ-файла.
    [Query]
    CiColumns=filename, size, rank, characterization, vpath, DocTitle, write CiFlags=DEEP
    CiRestriction=%CiRestrlction%
    CiMaxRecordslnResultSet=150
    CiMaxRecordsPerPage=10
    CIScope=\
    CiTemplate=/scripts/spdc1. Htx
    CISort=rank[d]
    CiCatalog=d:\
    Смысл строк этого файла поясняется в приведенной ниже таблице.
    Строка запроса Описание
    [Query] Тэг начала тела запроса
    CiColumns= filename, size, rank, characterization, vpath, DocTitle, write Свойства, которые должны быть возвращены в наборе результатов (имя файла, размер, аннотация и т. п.)
    CiFlags=DEEP Запрос должен выполняться над всеми дочерними папками области запроса
    CiRestriction=%CiRestriction% Условия, по которым выполняется поиск
    CiMaxRecordslnResultSet=150 Возврат не более 150 результатов
    CiMaxRecordsPerPage==10 Возврат не более 10 результатов на одной Web- странице
    CiScope=\ Запуск запроса в корневой папке
    CiTemplate=/scripts/spdcl.htx Для форматирования результатов используется файл Spdcl.htx
    CiSort=rank[dl Сортировка результатов в порядке убывания (“d”) ранга
    CiCatalog=d:\ При обработке запроса должен использоваться индекс, хранящийся в корневом каталоге диска D
    Оформление результатов запроса средствами НТХ-файлов
    НТХ-файл — это HTML-файл, переменные которого ссылаются на данные результата запроса. Например, приведенный ниже код НТХ-файла определяет заголовок страницы, который отображает заданные в запросе условия поиска и диапазон документов на текущей странице. После примера кода показан форматированный HTML-текст, получившийся в результате его работы.
    <%if CiMatchedRecordCount eq 0%>
    <Н4>Нет документов, удовлетворяющих критерию поиска "<%CiRestrictionHTML%>" .
    <%else%>
    <Н4>Документы с <%CiFirstRecordNumber%> по %CiLastRecordNumber%> из
    <%if CiMatchedRecordCount eq CiMaxRecordslnResultSet%>
    первых
    <%endif%>
    <%CiMatchedRecordCount%>, удовлетворяющих критерию поиска "<%CiRestrictionHTML%>".
    <%endif%>
    Результат работы этого кода:
    Документы с 1 по 10 из первых 150, удовлетворяющих критерию поиска "systems management".
    Здесь переменная <%CiFirstRecordNumber%> имеет значение 1, а <%CiMatchedRecordCount%> —150.
    НТХ-файл — это стандартный HTML-файя, использующий расширения Internet Information Server и Index Server для работы с именами переменных и другой информацией. Index Server использует НТХ-файл в качестве шаблона для форматирования результатов обработки запроса.
    Упражнение
    В этом упражнении Вы выполните поиск по примеру индекса. Образцы страниц запросов Index Server дают достаточно полное представление о его средствах работы с запросами. Для успешного выполнения упражнений этой главы должен быть запущен процесс Index Server (Cidaemon.exe).
    8 Проверка работы процесса Index
    Server 1. Нажмите клавиши CTRL+ALT+DELETE и щелкните кнопку Task Manager.
    2. Откройте вкладку Processes. Если Index Server работает, Вы увидите в списке процесс Cidaemon.exe. Закройте Task Manager.
    8 Запуск процесса создания индекса
    1. В меню Start выберите команды Programs, Windows NT 4.0 Option Pack, Microsoft Index Server, Index Server Sample Query Form. Будет запущен Microsoft Internet Explorer, а в его окне появится форма запроса.
    2. В поле Enter your query below наберите ftp.
    3. Нажмите Go. Этот запрос запускает процесс Cidaemon.exe, который приступает к созданию индекса.
    Примечание
    . Если на экране появится сообщение системы защиты, щелкните кнопку Yes. На странице результатов будет перечислено около 100 найденных документов.
    4. Закройте Internet Explorer.
    это способ, которым пользователи Интернета
    Теперь Вы поупражняетесь в администрировании Index Server, проверив текущее состояние индексирования с помощью утилиты Performance Monitor и Internet " Explorer.
    8 Проверка состояния индексирования средствами Performance Monitor
    1. В меню Start выберите команды Programs, Administrative Tools, Performance Monitor.
    2. Нажмите CTRL+R чтобы открыть окно представления Report.
    3. Щелкните кнопку со значком (+), чтобы добавить в отчет счетчики. Появится диалоговое окно Add to Report.
    4. В списке Object выберите Content Index.
    5. В списке Counters выберите все счетчики, а затем нажмите кнопку Add.
    6. Нажмите кнопку Done.
    Performance Monitor покажет состояние индекса. Выполняя дальнейшее задание, Вы можете время от времени средствами Performance Monitor проверять, не завершился ли процесс индексирования.
    Сейчас Вы скопируете файлы в виртуальный корень Web-узла, а затем выполните операцию слияния, чтобы отфильтровать и проиндексировать новые документы. Этот процесс увеличит значения нескольких счетчиков.
    8 Обновление индекса средствами Index Server Manager
    1. С помощью Проводника Windows NT скопируйте содержимое папки \lis\Practice\lndex, расположенной на прилагаемом к книге компакт-диске, в папку C:\lnetpub\Wwwroot.
    2. Нажмите клавиши ALT+TAB, чтобы вернуться в окно Performance Monitor.
    3. Нажмите клавиши CTRL+U, чтобы обновить отчет.
    Теперь отчет показывает, что число файлов, подлежащих фильтрованию, отлично от нуля. Запишите число отфильтрованных документов, число файлов, подлежащих фильтрованию, и общее число документов.
    Примечание
    . Так как Вы скопировали файлы в виртуальный корень Web-узла, для фильтрования и индексирования новых документов необходимо выполнить операцию слияния. 4. В меню Start выберите команды Programs, Windows NT 4.0 Option Pack, Microsoft Index Server, Index Server Manager.
    5. В левой панели окна щелкните узел Index Server on Local Machine.
    6. В столбце Catalog раздела Scope щелкните правой кнопкой папку Web.
    7. Выберите в меню команду Merge. Появится диалоговое окно с вопросом, хотите ли Вы выполнить операцию слияния в каталоге.
    8. Нажмите Yes.
    9. Когда операция слияния завершится, нажмите клавиши ALT+TAB для возврата в окно Performance Monitor.
    10. Нажмите клавиши CTRL+U, чтобы обновить отчет Performance Monitor.
    11. Сравните записанные ранее значения трех счетчиков с текущими. Общее число документов должно увеличиться, число отфильтрованных документов также должно возрасти, а число файлов, подлежащих фильтрованию, должно стать равным нулю.
    8 Проверка состояния индекса средствами Internet Explorer
    1. В меню Start выберите команды Programs, Windows NT 4.0 Option Pack, Microsoft Index Server, Index Server Manager (HTML). Страница Index Server Administration будет открыта в окне Internet Explorer.
    2. Нажмите кнопку Refresh, чтобы посмотреть статистику индексирования (Index Statistics). На административной странице отображается два набора статистических данных: статистика кэша и статистика индекса.
    3. Ознакомьтесь со статистикой индекса. Если появилось сообщение “Index is up to date”, то процесс индексирования завершен. Сообщение “Index is not up to date” означает, что индексирование еще продолжается.
    4. Если значение счетчика Wordlists больше нуля, нажмите кнопку Merge Index. Это позволяет оптимизировать поисковые возможности Index Server. По выполнении операции Internet Explorer в окне появится страница Index Server Administration.
    И в завершение Вы создадите два запроса — один из них будет выполнять поиск по тексту, а второй по свойствам документов — и исследуете различия между ними.
    Примечание
    Результаты этого упражнении зависят от того, на какой стадии индексирования находится Ваша совокупность документов. 8 Выполнение расширенных запросов
    1. В меню Start выберите команды Programs, Windows NT 4.0 Option Pack, Microsoft Index Server, Index Server Sample Query Form. В окне Internet Explorer откроется форма запроса.
    2. В левой части страницы щелкните ссылку Advanced ASP Sample.
    3. В поле Document author наберите Smith
    это способ, которым пользователи Интернета
    4. Нажмите кнопку Execute. В окне результатов запроса будет указано, что критерию “smith” отвечают пять документов.
    Примечание
    . Если на экране появится сообщение системы защиты, в ответ щелкните кнопку Yes 5. В меню Start выберите команды Programs, Windows NT 4.0 Option Pack, Microsoft Index Server, Index Server Manager (HTML). В окне Internet Explorer появится страница Administration - Index Statistics. Заметьте, что значение счетчика Total queries со времени последнего обращения к странице увеличилось.
    Резюме
    Процесс запроса инициируется пользователем и взаимодействует с Internet Information Server для передачи ему запроса, его обработки и возврата результаты клиенту. Index Server использует IDQ-файлы для преобразования запроса из Web-формы во внутреннее представление, а НТХ - файлы — для форматирования результатов обработки запроса. Вы также можете создавать формы запросов средствами ASP. Использование сценарных языков позволяет достичь большей гибкости в отображении результатов запроса.

    это способ, которым пользователи Интернета это способ, которым пользователи Интернета это способ, которым пользователи Интернета

    Создание и анализ краткого отчета

    1. В чем различие между видами Tree и Cyberbolic плана Web-узла?
    Тreе — стандартное древовидное представление Web-узла, аналогичное тому, что используется в Проводнике. Cyberbolic — более динамичное представление. Tree позволяет раскрывать или скрывать отдельные уровни иерархической структуры узла, обеспечивая) например, просмотр ресурсов, связанных непосредственно с основной страницей, или всех ресурсов узла. Представление Cyberbolic позволяет сосредоточить внимание на отдельных объектах узла, но не поддерживает разворачивание/свертывание различных уровней иерархии.
    2. Позволяет ли отчет Site Summary выяснить количество изображений, видео- и аудиофайлов на Web-узле? В каких случаях эта информация будет полезной?
    Да, в разделе статистики объектов приводятся сведения о количестве изображений, видео- и аудиофайлов на Web-узле. Эта информация поможет Вам оценить, достаточность (или, может быть, избыточность) объема материалов этого типа на узле.
    3. Каково назначение функции Quick Search компонента Content Analyzer? Можно ли стандартными средствами поиска найти на узле объекты, большие размеры которых отрицательно сказываются на скорости их загрузки?
    Функция Quick Search компонента Content Analyzer позволяет выявлять ошибки и потенциальных проблемы узла. Ресурсы, создающие при загрузке трафик, превышающий 32 кб, можно найти с помощью средства поиска Load Size Over 32 К. Такие ресурсы стоит оптимизировать для сокращения времени их загрузки.
    4. Какой из подробных отчетов позволяет получить информацию об отдельных пользователях, посещающих Ваш Web-узел? Какого рода информацию предоставляет этот отчет?
    Эту информацию получают с помощью подробных отчетов User и Visits. В них отражено число пользователей, посетивших узел за все время его работы, и число новых посетителей, а также среднее количество запросов и длительность посещения в расчете на одного пользователя. Их средствами Вы сумеете выявить степень популярности узла у зарегистрированных и незарегистрированных пользователей, выяснить, обращаются ли к Вашему узлу те, кто его уже ранее посещал, есть ли завсегдатаи узла и становится ли со временем Ваш узел более популярным.


    Административные запросы

    Административные запросы ничем не отличаются от обычных за исключением того, что административные параметры хранятся в IDA-, а не в IDQ-файле. IDA-файлы позволяют пользователям, имеющим соответствующие полномочия, администрировать узел Internet Information Server.
    В состав Index Server включен пример административной страницы. Вы найдете его по адресу http://имя_компьютера/iisadmin/isadmin/admin.htm.

    Анализ Webузлов

    Ответы на вопросы к упражнениям этой главы

    Аппаратура

    По мере совершенствования и усложнения Web-серверов вопросы их производительности приобретают все большую важность. Сегодня, с появлением Web-приложений для работы с базами данных, индексирования содержимого узла и коллективной работы, увеличение производительности аппаратных и программных средств стало приоритетным направлением.


    ASP

    Активные страницы сервера обладают значительными преимуществами по сравнению со сценарными системами CGI и PERL. ASP поддерживают интерфейс Open Script, позволяя разработчику пользоваться любым языком написания сценариев, отвечающим этому стандарту. В число языков, удовлетворяющих требованиям Open Script, входят VBScript и Microsoft JScript. Для изучения этих сценарных языков требуется гораздо меньше времени, и поэтому они широко распространены среди программистов и пользователей.
    ASP позволяет добавлять сценарии непосредственно в HTML-текст Ваших Web-страниц. Более того, встроенные таким образом сценарии выполняются непосредственно, не требуя предварительной компиляции, что позволяет изменять содержимое страницы без ее повторной компиляции.


    Аутентификация

    Для корректной работы средств контроля доступа необходима предварительная аутентификация клиентов (до выполнения запросов). Самый простой способ гарантировать аутентификацию клиента — это встроить контроль доступа в форму, создающую запрос. Вы также можете снабдить списком контроля доступа IDQ-, НТХ- или HTW-файл, используемый в запросе.
    В зависимости от конфигурации Internet Information Server Вы вправе применить один или несколько из перечисленных ниже методов аутентификации:
  • анонимную регистрацию;
  • базовую аутентификацию;
  • аутентификацию по методу Challenge/Response Windows NT.
  • Если разрешена анонимная регистрация, она будет применяться по умолчанию, пока клиент обращается к файлам, к которым разрешен доступ по анонимной учетной записи. При попытке обратиться к документу, закрытому для анонимных пользователей, на экране появится диалоговое окно аутентификации (если используется какой-либо другой механизм аутентификации). После этого клиент, указав свои идентификационные данные, получит доступ к тем файлам, которые ранее были ему недоступны.
    Примечание.
    Если Вы запрещаете клиентам доступ к защищенным файлам путем отключения аутентификации в виртуальном каталоге — то есть разрешая анонимную регистрацию, Вам также следует отключить аутентификацию для HTW-файла. В противном случае содержимое защищенных файлов во фрагментах с выделенными вхождениями искомого текста, возвращенных в результате выполнения запроса, окажется недоступным клиенту.

    CGI

    CGI и язык создания сценариев PERL предлагают другой, более простой, метод создания Web-приложений. Internet Information Server поддерживает и CGI, и PERL, что особенно полезно в ситуациях, когда необходимо обеспечить совместимость с существующими Web-серверами на базе UNIX.
    CGI и PERL более подробно обсуждаются в главе II, “Активные страницы сервера”.


    Добавление и удаление папок

    Средствами интегрируемого модуля Index Server можно добавлять и удалять папки, подлежащие индексированию. Эта операция не затрагивает физические папки, а только лишь инструктирует Index Server, что их нужно включить (или исключить) из списка папок, подлежащих индексированию.


    Дополнительная информация

  • Дополнительная информация о Microsoft Transaction Server: на Web-узле Microsoft - http://www.microsoft.com/ntserver/giiide/trans_mtro.asp




  • Другие средства мониторинга производительности

    В состав Windows NT включены более развитые средства сбора информации о производительности.


    Фильтры ISAPI

    ISAPI-фильтры выполняют предварительную обработку сообщений, тем самым снижая нагрузку на сервер. Например, ISAPI-фильтр может отказать в доступе к Web-серверу пользователям, не имеющим необходимых полномочий. В этом случае ISAPI-фильтр взаимодействует с Диспетчером защиты (Security Accounts Manager, SAM), чтобы непосредственно аутентифицировать пользователей, минуя процесс Inetinfo IIS.
    Однако если Вы добавите, например, ISAPI-фильтр SSL, соответствующая библиотека будет затрачивать дополнительное процессорное время на шифрование/расшифровку данных и на аутентификацию пользователей.
    Фильтры ISAPI более подробно обсуждаются в главе 5, “Настройка службы WWW”.


    Фильтры содержимого

    Фильтры содержимого — это программы, позволяющие индексировать файлы различных типов. Обычно документы, созданные конкретным приложением, хранят в файлах специального формата. Например, формат файлов документов WordPerfect отличается от формата файлов документов Microsoft Word. Для индексирования фай лов специальных форматов Index Server использует фильтры содержимого. Фильтры, как следует из их назначения, “умеют”:
  • извлекать из документа текстовые фрагменты;
  • распознавать смену языка в многоязычных документах;
  • обрабатывать встроенные объекты.
  • Когда фильтр содержимого встречает в документе встроенный объект, он определяет его тип и активизирует соответствующий фильтр. Таким образом, Index Server может индексировать не только текст документа Word, но и любой текст встроенной в него таблице Microsoft Excel.
    Поскольку за обработку всех деталей конкретного файлового формата означает фильтр, для индексирования файлов конкретного формата достаточно добавить соответствующий фильтр. Таким образом, Вы легко расширите список форматов, которые поддерживает Index Server.


    Хранение журналов

    Internet Information Server позволяет выбрать как место для хранения файлов журнала, так и типы данных, которые нужно включать в эти файлы. Можно хранить журнал за прошедший день, неделю или месяц, либо сохранять все элементы журнала до тех пор, пока файл не достигнет определенного размера.
    8 Выбор параметров хранения журналов
    1. Убедитесь, что протоколирование включено.
    2. В левой панели окна Internet Service Manager выберите Web- или FTP-узел и нажмите кнопку Properties на панели инструментов.
    3. На вкладке свойств Web Site или FTP Site нажмите кнопку Properties. Появится диалоговое окно Logging Properties.
    4. В поле Log file directory укажите папку, в которой будут храниться файлы журнала: согласитесь с папкой, предложенной по умолчанию, или нажмите Browse и выберите папку вручную.
    5. Нажмите ОК. Под значком папки появится имя файла.
    6. Нажимайте кнопку ОК до тех пор, пока не закроете все диалоговые окна.


    файлы на виртуальном сервере, соответствующем


    файлы на виртуальном сервере, соответствующем Примечание.
    Не размещайте IDA- файлы на виртуальном сервере, соответствующем сетевому ресурсу (заданному UNC-именем). Некоторые административные операции изменяют состояние индекса. Вы вправе ограничить доступ к административным операциям с помощью списков контроля доступа.


    файлы на виртуальном сервере, соответствующем Для поддержки транзакций необходимы следующие компоненты:
  • логика клиентского сервиса —
  • пользовательский интерфейс и поддержка форм;
  • сетевой протокол
  • — связывает клиента с сервером;
  • сетевой ресивер —
  • отслеживает пакеты, принимает входящие вызовы от клиентов и отвечает за решение проблем перегрузки;
  • диспетчер очереди —
  • распределяет запросы клиентов, если они начинают накапливаться;
  • диспетчер соединения —
  • отслеживает действия каждого клиента и используемые им ресурсы;
  • диспетчер контекста
  • — поддерживает контекст и состояние для каждого из клиентов;
  • диспетчер защиты —
  • предотвращает несанкционированный доступ к приложению или данным;
  • пул потоков —
  • избавляет от необходимости создавать отдельный поток для каждого клиента;
  • логика приложения
  • — выполняет фактические функции приложения;
  • диспетчер синхронизации —
  • координирует выполнений транзакций; диспетчер конфигурации — управляет ресурсами потоков и сервера;
  • диспетчер подключения к базе данных —
  • создает подключения к базе данных для различных пользователей;
  • данные —
  • информация, необходимая для выполнения транзакции.

    После завершения слияния вместо нескольких


    После завершения слияния вместо нескольких После завершения слияния вместо нескольких исходных индексов формируется один результирующий.


    После завершения слияния вместо нескольких Это простой пример приложения, использующего все преимущества передовой серверной инфраструктуры — транзакции, независимость от физического местонахождения компонентов, управление потоками и процессами, а также пул подключений к базе данных — посредством интеграции с Microsoft Transaction Server. Как показано на приведенном выше рисунке, в рамках приложения выполняется несколько процессов.
    1. Клиент инициирует банковскую транзакцию, вызывая компонент MoveMoney.
    2. Компонент MoveMoney вызывает компонент Account для каждой базы данных, которую ему нужно модифицировать, а также компонент Receipt для каждой банковской транзакции.
    3. Microsoft Transaction Server гарантирует, что действия всех компонентов будут объединены в единое целое (транзакцию), даже если эти компоненты написаны на разных языках.
    Даже в случае, когда каждый из компонентов построен как простой однопользовательский компонент ActiveX, транзакция выполняется как многопользовательская с помощью средств управления потоками и процессами Microsoft Transaction Server.
    4. Компоненты Account обращаются к базе данных SQL Server посредством распределителей ресурсов ODBC Microsoft Transaction Server — механизма обеспечения высокопроизводительного доступа к базам данных.
    Чтобы выполнить следующее задание, Вам придется установить Microsoft SQL Server 6.5. Ознакомительная версия SQL Server 6.5 находится в папке Mssql прилагаемого к книге компакт-диска.
    8 Установка ознакомительной версии SQL Server 6.5
    1. Запустите двойным щелчком файл setnp.bat, расположенный в папке Mssql компакт-диска. Появится приглашение командной строки.
    2. Нажмите клавишу ENTER для продолжения установки. Появится диалоговое окно Welcome.
    3. Нажмите Continue. Появится диалоговое окно Enter Name and Organization.
    4. В поле Name наберите Student, а в поле Company name — Microsoft. Оставьте поле Product ID пустым.
    5. Нажмите Continue. Появится диалоговое окно Verify Name and Organization.
    6. Нажмите Continue. Появится диалоговое окно Microsoft SQL Server 6.5 — Option.
    7. Убедитесь, что установлен флажок Install SQL Server & Utilities.
    8. Нажмите Continue. Появится диалоговое окно SQL Server 6.5 — Evaluation Edition.
    9. Нажмите Continue. Появится диалоговое окно SQL Server Installation Path.
    10. Нажмите Continue, чтобы принять значения по умолчанию. Появится диалоговое окно MASTER Device Creation.
    11. Нажмите Continue, чтобы принять значения по умолчанию. Появится диалоговое окно SQL Server Books Online.
    12. Нажмите Continue. Появится диалоговое окно SQL Installation Options
    13. Установите флажок Auto Start SQL Server at boot time.
    14. Установите флажок Auto Start SQL Executive at boot time.
    15. Нажмите Continue. Появится диалоговое окно SQL Executive Log On Account.
    16. Выберите Install для регистрации по учетной записи Local System Account.
    17. Нажмите Continue. Файлы будут скопированы, а в конфигурацию системы внесены необходимые модификации, после чего появится диалоговое окно Microsoft SQL Server 6.5 — Completed.
    18. Нажмите кнопку Exit to Windows NT.
    19. Перезагрузите компьютер.
    8 Установка примера банковских компонентов
    1. В меню Start выберите команды Programs, Windows NT 4.0 Option Pack, Windows NT 4.0 Option Pack Setup.
    2. Нажмите кнопку Next.
    3. Нажмите Add/Remove.
    4. В списке Components выберите Transaction Server.
    5. Нажмите Show Subcomponents.
    6. Выберите Transaction Server Development.
    7. Нажмите OK.
    8. Нажмите кнопку Next и следуйте дальнейшим инструкциям.
    В этом задании Вы подготовите среду Microsoft Transaction Server для мониторинга банковских компонентов и транзакций из нашего примера.
    8 Настройка Microsoft Transaction Server Explorer
    1. В меню Start выберите команды Programs, Windows NT 4.0 Option Pack, Microsoft Transaction Server, Transaction Server Explorer. В окне консоли Microsoft Management Console появится интегрируемый модуль Microsoft Transaction Server Explorer.
    2. Раскройте папку Microsoft Transaction Server.
    3. Раскройте папку Computers.
    4. Раскройте узел My Computer.
    5. Выберите папку Packages Installed.
    6. Сверните окно Microsoft Management Console.
    7. В правой панели дважды щелкните значок Sample Bank.
    8. Дважды щелкните папку Components.
    9. В меню View выберите команду Status View. Эта команда отобразит информацию об использовании различных компонентов пакета.
    10. В меню Window выберите команду New Window.
    11. В меню Window выберите команду Tile Horizontally. Консоль Microsoft Management Console отобразит два окна — под номерами 1и2.
    12. Прокрутите информацию в левой панели нового окна (2) и щелкните Transaction Statistics. Во время работы компонентов будет отображаться статистика транзакций.
    13. В окне 2 щелкните Action. Появится меню.
    14. Выберите Scope Pane. Левая панель окна 2 исчезнет.
    15. В окне 1 щелкните Action. Появится меню.
    16. Выберите Scope Pane. Левая панель окна 1 исчезнет. Теперь Вы сконфигурируете источник данных ODBC.
    8 Настройка источника данных ODBC
    1. Откройте Панель управления.
    2. Дважды щелкните значок ODBC. Появится диалоговое окно ODBC Data Source Administrator с открытой вкладкой User DSN.
    3. Нажмите Add.

    в списке пункт SQL Server


    в списке пункт SQL Server 4. Выберите в списке пункт SQL Server и нажмите Finish. Появится диалоговое окно Create a New Data Source to SQL Server.
    5. В поле Name введите MtxSamples, затем в поле Server выберите (local).
    6. Нажмите Next. Появится диалоговое окно Create a New Data Source to SQL Server.
    7. Три раза нажмите кнопку Next, затем — кнопку Finish.
    8. Нажмите ОК. Появится диалоговое окно ODBC Data Source Administrator.
    9. Нажмите ОК.
    10. Закройте Панель управления.
    8 Убедитесь, что Microsoft SQL Server запущен
    1. В меню Start выберите команды Programs, Microsoft SQL Server 6.5, SQL Service Manager. Если значок “стоп-сигнала” зеленого цвета, то SQL Server запущен.
    2. Закройте окно SQL Service Manager.
    Эта часть упражнения посвящена мониторингу компонентов и транзакций Microsoft Transaction Server.
    8 Мониторинг компонентов и транзакций Microsoft Transaction Server
    1. В меню Start выберите команды Programs, Windows NT 4.0 Option Pack, Microsoft Transaction Server, Bank Client. Расположите окно компонента Bank Client так, чтобы оно не перекрывалось с окном Microsoft Transaction Server Explorer. На форме по умолчанию выбрана операция кредитования счета 1 суммой в $1.
    2. Нажмите Submit. На экране должен появиться обновленный баланс.
    Ознакомьтесь с содержимым окна Microsoft Transaction Server Explorer: окна использования компонентов и статистики транзакций обновлены.
    Поэкспериментируйте с компонентом клиента банка и изучите статистику, используя различные типы транзакций, серверы и итерации. Вы заметите, что первая транзакция занимает больше времени, чем остальные. Это объясняется тем, что она создает таблицы базы данных нашего примера и добавляет в них временные записи. Допустимые номера счетов — 1 и 2.
    Попробуйте выполнить другие действия, например:
  • перевести сумму более $500;
  • использовать недопустимые номера счетов (0, 3, 4, 5);
  • положить на счет отрицательную сумму (-$100).
  • 5. Закройте компонент Bank Client.
    6. Закройте Microsoft Transaction Server Explorer.


    в списке пункт SQL Server 9. Перейдите в папку C:\Website\Logfile и выберите все восемь файлов журнала.
    10. Нажмите Open.
    11. Нажмите кнопку Start Import (зеленый треугольник) на панели инструментов. Примерно через две минуты отобразится время, которое потребовалось на импорт.
    12. Нажмите ОК. Обратите внимание на содержимое диалогового окна Import Statistics.
    13. Нажмите Close.
    14. Закройте окно Usage Import.

    отображает объем информации, передаваемой ежечасно,


    отображает объем информации, передаваемой ежечасно, Bandwidth
    (Полоса пропускания) — отображает объем информации, передаваемой ежечасно, ежесуточно и еженедельно. Этот отчет помогает выявить временные закономерности, а также получить средние значения для дня недели и времени суток. Такая информация полезна для планирования поддержки узда или его модернизации; кроме того, она иногда сигнализирует о необходимости расширить мощности Web-узла в связи с ростом активности пользователей. Browser and Operating System
    (Обозреватель и операционная система) — перечисляет обозреватели, которыми пользуются посетители узла, тенденции применения различных версий обозревателей Netscape и Microsoft, поддержку обозревателями средств защиты и операционные системы, используемые посетителями узла. Такая информация полезна для адаптации Web-узла к возможностям типичного посетителя. Для этого отчета необходима регистрация в файлах журнала сервера данных об агентах. Geography
    (География) — перечень городов и регионов, пользователи которых обращаются к Вашему Web-узлу. Эта информация полезна для определения районов, где Ваш бизнес наиболее успешен, а также для определения оптимальных мест для расположения зеркальных копий узлов. Для создания этого отчета необходимо предварительно выполнить запросы IP resolution и Who-is. Hit
    (Число обращений) — показывает число обращений к серверу в течение часа, суток и недели, а также среднее число обращений за день недели или час суток. Этот отчет помогает выбрать оптимальное время для проведения работ по обслуживанию и модернизации узла, а также планировать расширение его мощностей. Organization
    (Организации) — перечень организаций, обращавшихся к Вашему Web-узлу. Такая информация позволит Вам составить представление о своей аудитории, расширить ее и выявить потенциальных клиентов из числа часто посещающих узел организаций. Для создания этого отчета необходимо предварительно выполнить запросы IP resolution и Who-is. Referrer
    (Переадресация) — показывает имена и URL-адреса внешних узлов, с которых пользователи попадают на Ваш Web-узел. Эту информация пригодится и для оценки эффективности рекламы узла и для выбора оптимального варианта ее размещения. Отчет требует регистрации данных о переадресации в файлах журнала сервера; кроме того, необходимо предварительно выполнить запрос IP resolution. Request
    (Запросы) — выявляет наиболее и наименее популярные документы (в заданном интервале времени или для каждой из папок). Этот отчет показывает, нет ли на узле ненужных материалов, а также какие именно документы привлекают внимание посетителей узла. User
    (Пользователи) — показывает число пользователей, посетивших узел за все время его работы, количество новых посетителей узла, среднее число посещений одним пользователем, среднее число пользователей в одной организации, а также среднее количество запросов и длительность посещения в расчете на одного пользователя. Этот отчет также позволяет выявить тенденции в популярности узла у зарегистрированных и незарегистрированных пользователей. Он поможет Вам выяснить, обращаются ли к Вашему узлу те, кто его уже посещал, есть ли завсегдатаи узла и становится ли со временем Ваш узел более популярным. Visits
    (Посещения) — показывает число запросов, которое за одно посещение выполняют наиболее активные пользователи, среднюю продолжительность посещения, а также страницы узла, к которым чаще всего обращаются в начале посещения и непосредственно перед тем, как покинуть узел. Этот отчет позволяет отслеживать тенденции, связанные с посещениями узла, а также выявить основные характеристики пользователей узла и выяснить, привлекает или оставляет равнодушными пользователей конкретное содержимое.

    показывает среднюю для каждых суток


    показывает среднюю для каждых суток
  • Bandwidth (Полоса пропускания) — показывает среднюю для каждых суток полосу пропускания и анализ ее использования по дням недели, времени суток и по рабочим и нерабочим часам. Это помогает выявить какие проблемы пропускной способности вызывают падение производительности узла.
  • Browser and Operating System (Обозреватель и операционная система) — показывает, какие обозреватели и операционные системы используют гости Вашего узла. Это отчет позволяет проанализировать необходимость оптимизации содержимого узла с учетом характеристик типичного посетителя.
  • Executive (Сводка) — сводка наиболее важной информации из подробных отчетов.
  • Executive Summary for Extended Logs (Сводка по расширенным журналам) -наиболее важные данные из подробных отчетов, основанных на журналах в расширенном формате.
  • Geography (География) — сводка информации подробного отчета Geography,
  • Hits (Обращения) — сводка информации подробного отчета Hits.
  • Organization (Организация) — сводка информации подробного отчета Organization.
  • Path (Путь) — показывает последовательность запросов, которые выполнял пользователь, перемещаясь по Вашему узлу. Эти данные позволяют выяснить, не нужно ли изменить расположение ссылок, чтобы упростить доступ к содержимому узла.
  • Referrer (Переадресация) — сводка информации подробного отчета Referrer.
  • Request (Запросы) — сводка информации подробного отчета Request. User (Пользователи) — подробный отчет User. Visit (Посещения) — сводка информации подробного отчета Visit.


  • Импорт журнала

    Чтобы создать отчет на основе данных из файла журнала, Вам придется сначала импортировать этот журнал в базу данных Site Server Express. На следующем занятии Вы проанализируете отчет.

    Индексирование Webузлов

    Закрепление материала
    1. Что необходимо для индексирования документов специальных форматов (например, файлов Microsoft Word)?
    Для индексирования документов специальных форматов необходимы соответствующие фильтры содержимого. В состав Index Server входят несколько фильтров по умолчанию: для текстовых файлов, для HTML-файлов, для файлов Word 95, Word 97, Excel 95, Excel 97, PowerPoint 95 и PowerPoint 97, а также фильтр свойств двоичных файлов.
    Для индексирования документов другого типа необходимо приобрести и установить соответствующий фильтр содержимого.
    2. Какие факторы влияют на производительность Index Server?
    Число индексируемых документов, объем данных, частота запросов и их тип.
    3. Что можно сделать, чтобы уменьшить время обработки запросов к часто используемым документам?
    Добавьте часто используемые документы в кэш свойств с помощью встраиваемого административного модуля Index Server. Извлечение свойств запрашиваемых документов из кэша, а не из самого документа значительно повышает производительность обслуживания запросов.
    4. Какие средства Index Server позволяют отображать ту часть документа, которая удовлетворяет Вашему запросу?
    Выделение искомого текста в найденных документах позволяет создать HTML-страницу со списком документов, отвечающих критериям Запроса, с выделением искомых слов красным курсивом. Кнопки Show Highlights (condensed) и Show Highlights (full text), расположенные под резюме каждого из найденных документов, позволяют посмотреть выделенные слова в выбранном документе.
    5. Как исключить некоторые папки из процесса индексирования?
    Индексирование и поиск документов ведется в так называемой области индексирования, отсчитываемой от виртуального корня. Чтобы исключить виртуальную папку из области индексирования, в Диспетчере служб Интернета откройте окно свойств Directory этой папки и снимите флажок Index This Resource.
    Кроме того, в соответствующем IDQ-файле Вы можете перечислить файлы, не подлежащие включению в результат запроса.
    6. Если пользователь не имеет доступа к конкретному файлу на узле Интернета или интрасети, может ли этот файл фигурировать среди возвращаемых пользователю результатов запросов?
    В процессе фильтрования документов Index Server сохраняет информацию из соответствующих списков кот-роля доступа файловой системы Windows NT. На основании этой информации Index Server выясняет есть ли у автора запроса права доступа к найденным файлам. Если права доступа к какому-либо из файлов нет, он не попадает в результат выполнения запроса, что предотвращает несанкционированный доступ.


    Индексируемая совокупность документов

    Набор подлежащих индексированию документов на узле Internet Information Server называется индексируемой совокупностью. Вы можете хранить файлы совокупности на одном или нескольких физических носителях на локальной машине или на сетевом сервере; каждую из папок, содержащих нужные файлы, Вам придется сконфигурировать как виртуальный сервер или как виртуальный каталог. Выбирая папки, подлежащие индексированию, Вы тем самым задаете область индексирования.
    Примечание. Чтобы повысить производительность, разместите данные Index Server на другом диске, отдельно от индексируемых файлов.


    Индексы

    Index Server поддерживает индексы двух видов: словари и постоянные индексы. Слова и свойства, выделенные из документа, сначала заносятся в словарь, а затем — в постоянный индекс. Такая организация позволяет улучшить обработку запросов и повысить производительность, а также обеспечивает оптимальное использование ресурсов. Даже бели Index Server работает с несколькими индексами, эти подробности полностью скрыты от пользователя: пользователь видит лишь список документов, отвечающих сформулированному им запросу.


    Index Server Manager

    Интегрируемый модуль Index Server Administration консоли управления Microsoft Management Console предлагает Вам семь инструментальных средств для администрирования Index Server.


    Интеграция с активными страницами сервера

    Internet Information Server 4.0 интегрирует технологию активных страниц сервера (Active Server Pages, ASP) и Microsoft Transaction Server. Встроенная в Internet Information Server технология ASP позволяет применять модель клиент-сервер в Web-приложениях, в результате повышая производительность выполнения запросов и уменьшая сетевой трафик.
    Дальнейшее развитие ASP обеспечило поддержку масштабируемых трехуровневых приложений. Теперь в основе технологии активных страниц сервера лежит Microsoft Transaction Server, и в результате ASP-приложения могут выполняться в отдельных адресных пространствах для обеспечения безопасности и надежности. Транзакция не способна охватывать несколько ASP-страниц, поэтому, если для выполнения транзакции необходимы объекты нескольких компонентов, сгруппируйте эти объекты на одной ASP-странице.


    Internet Information Server

    Перечисленные ниже глобальные счетчики Internet Information Server полезны при мониторинге использования кэша Internet Information Server:
  • Cache Flushes (число обновлений кэша);
  • Cache Hits % (процент запросов, обслуженных из кэша);
  • Cache Misses (число запрошенных объектов, не найденных в кэше);
  • Cache Size (размер кэша);
  • Cache Used (использованный размер кэша);
  • Cached File Handles (число кэшированных файлов) ;
  • Folder Listings (число оглавлений папок);
  • Objects (объекты)..


  • ISAPI CGI u ASP

    Internet Information Server поддерживает два уровня программирования сервера.. На более сложном предполагается использование ISAPI, а уровень попроще базируется на CGI-сценариях и новом интерфейсе ASP.


    ISAPI

    Архитектура ISAPI позволяет создавать многопоточные приложения в виде динамически подключаемых библиотек, допускающие повторное использование. В результате ISAPI-приложения могут повторно работать с уже загруженными ресурсами, экономя ОЗУ и процессорные ресурсы. Применение ISAPI позволяет также фильтровать поток пакетов и расширять возможности сервера. Обладая чрезвычайной мощностью и гибкостью, интерфейс ISAPI в то же время требует от программиста высокой квалификации. ISAPI подробно обсуждается в главе 5, “Настройка службы WWW”.


    Исключающее слияние

    Это разновидность промежуточного слияния, которая выполняется, только если система находится в состоянии простоя, а общее число постоянных индексов превышает значение, заданное в ключе реестра Maxidleindexes. Ключ реестра MinMergeldleTime задает пороговое значение неиспользуемого объема процессорного времени (в процентах), по достижении которого активизируется процесс исключающего слияния. Эта операция повышает эффективность обслуживания запросов и использования жесткого диска, уменьшая число промежуточных индексов, образованных из словарей.


    Использование Index Server

    Index Server устанавливается на компьютер под управлением ОС Microsoft Windows NT Server 4.0 с помощью программы Setup из состава Windows NT 4.0 Option Pack. Если Вы устанавливали Internet Information Server в соответствии с инструкциями, приведенными в главе “Установка IIS”, Index Server уже установлен.

    Изменения конфигурации в результате установки

    При установке Index Server Вы задаете папку каталога. Каталог (catalog) — это высший организационный уровень иерархии папок Index Server. Программа Setup создает в указанной папке каталога папку CATALOG.WCI, где будут храниться Индексы и кэш свойств. Эта папка может занимать до 40% от общего объема совокупности индексируемых файлов, поэтому разместите ее на разделе, где достаточно свободного места.
    Во время установки файлы Index Server копируются в следующие папки Вашего компьютера:

    файлы примеров HTML и сценариев — в папку /Iissamples/Issamples;
    административные файлы — в папку /Iisadmin/Isadmin;
    файлы документации — в папку /Iishelp/Ix. После установки запускается служба Content Index (Cisvc.exe), которая выполняет индексирование всех документов в каждом из виртуальных каталогов Web-сервера на базе Internet Information Server, включая виртуальные каталоги для удаленных ресурсов.
    Index Server запускается автоматически при включении Internet Information Server. Средствами апплета Services Панели управления Вы можете проверить, запустилась ли служба Content Index. Если нет, запустите ее вручную, выбрав ее и нажав кнопку Start. Работа Index Server не завершается автоматически при закрытии Internet Information Server.
    После выполнения первоначального индексирования служба Content Index будет определять только новые и изменившиеся документы сервера под управлением Internet Information Server. Вы можете добавить новые документы в уже существующие виртуальные каталоги, либо добавить новые виртуальные каталоги и поместить документы в них. Служба Content Index отслеживает и индексирует все виртуальные каталоги сервера, даже когда служба World Wide Web (WWW) не работает.


    Изучив материал этого занятия

    Index Server позволяет индексировать файлы нескольких Web-серверов — для этого достаточно выделиь папку на удаленном компьютере в совместное использование и создать виртуальный каталог на сервере индексирования. Точно также Вы сможете индексировать и файлы, расположенные на серверах Novell NetWare или на разделах FAT.
    Index Server способен также индексировать содержание и свойства форматированных документов (например, созданных в Microsoft Word или Microsoft Excel), что позволяет публиковать такие документы в интрасети непосредственно, без предварительного преобразования в формат HTML. Index Server индексирует файлы следующих форматов:
  • текстовые файлы (.txt);
  • файлы HTML 3.0 или более ранних версий (.htm);
  • файлы Microsoft Word 95/97 (.doc);
  • файлы Microsoft Excel 95/97 (.xls);
  • файлы Microsoft PowerPoint® 95/97 (.ppt);
  • двоичные файлы (только свойства).
  • Связи OLE также индексируются. Установив дополнительные фильтры содержания, поставляемые независимыми разработчиками, Вы расширите число файловых форматов, которые могут быть индексированы. Такой фильтр считывает документ соответствующего формата, выделяет из него текст и свойства и передает их Index Server для индексирования. Index Server способен также индексировать NNTP-документы, хранящиеся на сервере новостей. Index Server в настоящее время поддерживает индексирование и запросы на следующих языках:
  • голландском;
  • французском;
  • немецком;
  • итальянском;
  • японском;
  • испанском;
  • шведском;
  • международном английском;
  • американском английском;
  • традиционном и упрощенном китайском.
  • Index Server позволяет индексировать многоязычные документы и переключаться между языками по мере необходимости. Например, он может проиндексировать абзац на английском, затем абзац на французском и затем снова переключиться на английский. Вся индексная информация хранится в кодировке Unicode, а все запросы перед их обработкой также преобразуются в эту кодировку. После того как Вы установите и запустите Index Server, он автоматически проиндексирует все файлы Вашего Web-узла Internet Information Server. При изменении файлов узла Index Server автоматически обновит индекс. В состав Index Server включены средства автоматического исправления наиболее распространенных орфографических ошибок.


    Каталог по умолчанию

    Исходное местонахождение каталога, заданное во время установки, хранится в элементе реестра IsapiDefaultCatalogDirectory. Этот каталог используется, пока Вы не укажете другой каталог в .idq-файле. Каталог по умолчанию содержит индекс всех виртуальных серверов, к которым разрешен доступ на чтение. Область, охватываемая каталогом, задается административными средствами.


    Каталоги

    Каталог — это высший организационный уровень иерархии данных Index Server . Каждый каталог является полностью автономной единицей, содержащей индекс и кэшированные списки свойств для одной или нескольких областей данных (виртуальных серверов). Запросы Index Server не могут охватывать несколько каталогов.


    Кэш Internet Information Server

    Internet Information Server снабжен собственным кэшем, отдельным от кэша операционной системы Windows NT Server. Кэш Internet Information Server занимает часть физической памяти для хранения объектов, которые могут понадобиться при обслуживании последующих запросов.
    Увеличение размера кэша позволит Internet Information Server обслуживать больше запросов из кэша. Это один из самых действенных способов оптимизации производительности сервера. Имейте в виду, однако, что если размер кэша превышает объем физической памяти, скорость работы других процессов резко упадет.


    Компонентное программирование

    При использовании компонентного подхода можно собирать приложения из доступных компонентов, как из кубиков. Приложения больше не обязаны быть монолитными, что позволяет ослабить связи между кодом, использующим компоненты, и самими компонентами.
    СОМ позволяет получать информацию о функциях объектов во время выполнения или во время разработки. Это положение имеет несколько важных следствий:
  • пользователь объекта вправе отложить принятие решения об использовании услуг, предоставляемых объектом, до момента выполнения, что позволяет компоненту и клиенту работать асинхронно;
  • если компонент предоставляет дополнительные услуги, это никак не сказывается на клиентах, пользующихся только базовыми функциями объекта;
  • если клиент, желающий использовать расширенные возможности объекта (например, включенные в последнюю версию), сталкивается с его предыдущей версией, он может умерить свои потребности.
  • Таким образом, разработчики, расширяя функциональные возможности объектов, не беспокоятся о нарушении работоспособности уже используемого кода.
    Применение СОМ позволяет клиенту не заботиться о физическом местонахождении компонента в файловой системе или в сети за счет самосогласованного метода взаимодействия с внутри- и внепроцессными компонентами.
    Кроме того, клиентский код не обязательно писать на том же языке, что и компонент. Необходимо лишь, чтобы язык, на котором написан СОМ-клиент, позволял вызывать функции с помощью указателей на них. Для сценарных языков выполнение таких вызовов берет на себя среда выполнения сценариев.
    Компонент СОМ, зарегистрированный в Microsoft Transaction Server, выполняется в отдельном процессе. При этом вызов lnProcServer32 в его коде заменяется на вызов LocalServer32, который определяет Mtx.exe в качестве замены внутри процессного сервера, что позволяет Microsoft Transaction Server создать оболочку для реального компонента.
    СОМ предусматривает новую спецификацию для описания объектов, называемую метаданными. Все объекты СОМ обязаны описывать свои функции с помощью метаданных, что позволяет всем объектам предоставлять клиентам информацию о своих услугах и о любых возможных требованиях.
    Примечание
    . Существуют методы, позволяющие сохранять состояние клиента. Например, средствами массивов типа variant можно передать данные клиенту для локального редактирования. Другой способ — скопировать объекты клиенту для локального использования, а затем переписать их обратно на сервер для обновления состояния. Этот подход позволяет серверным компонентам не хранить состояние, однако сами объекты при этом доступны локально, так что обращение к их свойствам и методам не будет порождать дополнительный сетевой трафик.

    Компоненты Microsoft Transaction Server

    Службы Microsoft Transaction Server можно классифицировать по четырем категориям. Прежде всего, это брокер объектных запросов (Object Request Broker, ORB). Когда сервер получает запрос объекта, ORB обрабатывает этот вызов, проверяет 1 доступность объекта и, наконец, предоставляет объект клиенту.
    Следующий компонент — монитор обработки транзакций (Transaction Processing Monitor, TP Monitor), который можно упрощенно описать как промежуточный слой между клиентом и ресурсами сервера, берет на себя управление транзакциями и ресурсами, а также обеспечивает равномерное распределение нагрузки и; устойчивость к сбоям. Монитор транзакций не взаимодействует с объектами — он лишь обрабатывает запросы наиболее эффективным способом.
    Microsoft Transaction Server объединяет функции брокера объектных запросов и мониторинг обработки транзакций на базе модели распределенных компонентных объектов (Distributed Component Object Model, DCOM). В качестве монитора обработки транзакций Microsoft Transaction Server использует Microsoft Distributed Transaction Coordinator (DTC).
    Вот пример типичного процесса: запросы объектов поступают с помощью DCOM; Microsoft Transaction Server обрабатывает их, выделяет ресурсы сервера и инициирует транзакцию средствами координатора распределенных транзакций. Затем монитор транзакций возвращает объект клиенту. После этого клиент использует объект для выполнения необходимых действий. Microsoft Transaction Server функционирует между объектом и клиентом, отслеживая все действия последнего и тем самым играя роль монитора обработки транзакций. Например, Transaction Server может упорядочивать запросы и накапливать ресурсы во время ожидания запросов. Закончив работу с объектом, клиент освобождает его, что заставляет Microsoft Transaction Server завершить транзакцию и освободить ресурсы (или вернуть их в пул).


    Компоненты транзакции

    Компонент — это единица кода технологии ActiveX, предоставляющая опред^ ленный набор услуг посредством своего интерфейса. Компоненты предоставляют клиентам запрашиваемые ими объекты.

    Компромисс между объемом памяти и скоростью реакции

    Для оптимизации использования памяти или увеличения скорости реакции на запросы клиентов Вы можете задействовать целый ряд различных свойств. Обычно для ускорения реакции на запрос требуется выделить индивидуальным подключениям больше памяти или ресурсов процессора, что уменьшает ресурсы, доступные другим приложениям. Оптимизация использования памяти иногда влечет за собой небольшое снижение скорости реакции на запросы клиентов узла.
    Internet Information Server позволяет найти баланс между использованием памяти и временем реакции. Оценив число подключений к узлу, которое Вы планируете обслужить, Вы позволите Internet Information Server автоматически оценит объем памяти, необходимый для работы с новыми запросами. Если Вы установите значение, немного превосходящее реальное число подключений, производительность сервера возрастет. Если же Вы зададите его со значительным превышением, то память сервера будет расходоваться впустую, уменьшая его общую производительность.


    Контроль доступа к документам

    Когда документ фильтруется, вся информация о контроле доступа к нему заносится в каталог; при обработке запроса она сопоставляется с правами клиента. Если у клиента нет разрешения на доступ к данному документу, этот документ не включается в результаты запроса, возвращаемые клиенту; в этом случае клиент даже не узнает о существовании документа. Чтобы избежать этого, пользователя надо надлежащим образом аутентифицировать до начала обработки запроса.


    Краткие отчеты

    В состав стандартных отчетов Report Writer входят двенадцать кратких; их описание приведено далее.

    Мониторинг производительности

    В состав Index Server входит целый ряд средств измерения производительности, которые помогут Вам оптимизировать обслуживание запросов. Эти средства измеряют такие параметры, как число документов, которые необходимо проиндексировать, и скорость обслуживания запросов.
    В упражнении предыдущего занятия Вы научились использовать Performance Monitor для администрирования Index Server. Другой метод отслеживания производительности — применение сценария IDA-файла. Информация, полученная обоими методами, практически не отличается, но сами методы сбора статистики в корне различны. Оба они доступны и на локальной машине, и на удаленном клиенте.
    Преимущество Performance Monitor — в автоматическом обновлении информации и более развитых средствах графического представления статистики и протоколирования. Кроме того, для работы с этой утилитой Windows NT не требуется какое-либо дополнительное программное обеспечение.
    Однако использование IDA-сценариев обеспечивает более гибкое форматирование результата с помощью НТХ-файлов; кроме того, результаты в этом случае доступны клиентам, работающим под управлением других операционных системам. Для того чтобы применить IDA-сценарий, Вам придется создать IDA-файл с параметром CiAdminOperation=GetState. В состав Index Server входит пример страницы, использующей такой сценарий.


    MSMQ

    Сервер очереди сообщений (Microsoft Message Queue Server, MSMQ) может работать в качестве диспетчера ресурсов Microsoft Transaction Server. Он обеспечивает асинхронную передачу сообщений в корпоративной системе обслуживания очереди. Этот подход позволяет масштабировать приложения, так как системам обработки транзакций (например, Microsoft Transaction Server) не приходится полагаться на постоянную) доступность всех диспетчеров ресурсов, а эффективность выполнения
    транзакций больше не определяется скоростью работы самого медленного диспетчера — достаточно просто поместить сообщение в очередь для доставки. MSMQ поддерживает даже независимых клиентов, отправляющих сообщения только при подключении к сети сервера MSMQ.
    MSMQ поддерживает ActiveX, динамическую маршрутизацию и конфигурирование, множество вариантов доставки сообщений и уведомления, а также интеграцию со средствами защиты Microsoft Windows NT.


    Наиболее важные счетчики

    При мониторинге различных аспектов сети Вам доступно множество счетчиков. Они подразделяются на четыре категории: счетчики полосы пропускания, счетчики ISAPI и CGI, счетчики ASP и счетчики кэша Internet Information Server.


    Настройка и мониторинг Internet Information Server

    В этой главе
    В этой главе приведен краткий обзор инструментальных средств и методов мониторинга, использованных в книге. Здесь рассказано, как выполнять мониторинг и оптимизацию Microsoft Internet Information Server (IIS), а также описаны основные причины, вызывающие снижение производительности. На занятиях рассматриваются средства и методы поиска и устранения этих проблем.

    Netstat

    Netstat предоставляет администратору моментальный “снимок” статистических данных протокола и сетевых соединений по протоколу Transmission Control Protocol/ Internet Protocol (TCP/IP). Используя netstat, Вы получите “мгновенную” информацию о работе ТСРДР: например, число неудачных попыток подключения, переданных пакетов или компьютеров, подключенных к Вашему Web-узлу в данный момент.


    Network Monitor

    Network Monitor собирает информацию о входящем и исходящем трафике компьютера и предоставляет в распоряжение администратора подробные сведения о передаваемых и получаемых кадрах. Этот инструмент позволяет тщательно проанализировать сетевой трафик.


    Нормализатор

    Нормализатор “причесывает” поток слов, поступающий от разделителя, выполняя такие функции, как перевод всех символов в один и тот же регистр, удален знаков пунктуации и удаление неинформативных слов.
    В большинстве языков письменный текст содержит достаточно много неинформативных слов. В английском языке, например, это “the”, “of”, “and”, “you” и около сотни других. По очевидным причинам, такие слова нет смысла включать в индекс. Для каждого из поддерживаемых языков Index Server располагает общесистемным списком неинформативных слов, который Вы можете настроить с учетом местного диалекта и терминов. Когда разделитель слов во время анализа потока символов обнаруживает неинформативное слово, нормализатор обеспечивает его пропуск при индексировании. Так как неинформативные слова составляют большую часть письменного текста, их удаление может значительно уменьшить размер результирующего индекса.
    Только после того, как поток слов нормализован, Index Server включает слова в индекс.


    Обнаружение и исправление ошибок

    Microsoft Index Server автоматически распознает ошибки нескольких типов. Большинство из них устранимы. Если ошибка не связана со сбоем аппаратуры или с нехваткой свободного места на диске, где хранится каталог, то Вам, скорее всего, вообще не придется вмешиваться в процесс обнаружения и устранения ошибки.


    Ограничение числа подключений и установка таймаутов

    Ограничивая число допустимых подключений, Вы можете принудительно сохранить часть полосы пропускания для других целей. Например, лимитировав число подключений к Internet Information Server, Вы увеличите полосу пропускания для остальных служб — скажем, для серверов электронной почты, или новостей или для другого Web-узла, работающего на этом же компьютере. Если задано предельное число одновременных подключений, по его достижении Internet Information Server будет отвергать все последующие попытки подключения. Если обозреватель неожиданно прекращает работу или соединение с ним разрывается во время работы, узел продолжает обрабатывать данные до тех пор, пока не исчерпается установленный тайм-аут подключения. Этот параметр уменьшает затраты ресурсов и полосы пропускания на обслуживание разорванных подключений.


    Ограничение доступа к каталогам

    Когда Вы устанавливали Index Server, каталог был снабжен списком контроля доступа (ACL), который разрешает доступ к нему только администраторам системы и системным службам. В частности, это гарантирует, что, если папка каталога находится в виртуальном корне, неавторизованные пользователи не смогут увидеть файлы этого каталога в результатах своих запросов.
    Защита папки каталога важна также для того, чтобы не позволить неавторизованным пользователям (которые могут обратиться к серверу через общие сетевые ресурсы) увидеть содержимое каталога. Хотя информация в каталоге находится в форме, с трудом поддающейся расшифровке без знания используемого формата, все же, исследовав каталог, можно считать содержимое файлов на сервере. Если папка дополнительного каталога создается вручную, следует побеспокоиться, чтобы она и содержащиеся в ней файлы были снабжены соответствующими списками контроля доступа. Папка каталога должна быть доступна администраторам и учетной записи System (Index Server функционирует как системная служба, поэтому последнее требование обязательно).


    Ограничения накладываемые ОЗУ

    Обычно когда Вы запускаете приложение, компьютер копирует необходимые файлы приложения с жесткого диска в ОЗУ, после чего приложение запускается уже из ОЗУ. Так как ОЗУ имеет гораздо меньшее время доступа, чем жесткий диск, то чем реже компьютер обращается к жесткому диску, тем быстрее будет запущено приложение. При запуске Internet Information Server использует некоторую часть ОЗУ. Ее объем зависит от многих факторов, включая:
  • объем ОЗУ, используемый для кэша;
  • размер файла подкачки; объем свободного места на диске;
  • число работающих служб;
  • тип процессора;
  • типичный размер файлов на сервере;
  • число файлов на сервере;
  • наличие других активных приложений, занимающих ОЗУ.
  • Совет Task Manager показывает, какой объем ОЗУ задействован в данный момент времени.
    Обрабатывая запрос, Internet Information Server обычно кэширует возвращаемый файл в ОЗУ. При поступлении последующих запросов того же файла Internet Information Server использует копию файла, находящуюся в кэше, не обращаясь к жесткому диску. Тем самым уменьшается время, которое Internet Information Server затрачивает на обслуживание запроса, и ускоряется доступ клиентов к узлу. Однако время, в течение которого файл остается в кэше, зависит и от ряда других факторов.
    По мере поступления новых запросов старые файлы удаляются из кэша, чтобы освободить место для новых. Это означает, что если Вы разрешите загружать со своего узла большое количество файлов, располагая небольшим объемом ОЗУ, доступ может замедлиться, поскольку Internet Information Server будет практически всегда считывать необходимые файлы с жесткого диска. Кроме того, другие приложения, работающие на том же компьютере и использующие его ОЗУ, вытеснят оттуда кэшированные копии файлов, очищая кэш для своих нужд. В результате Internet Information Server не сможет держать кэшированные файлы в ОЗУ, что также приведет к замедлению доступа к узлу.
    Так как большие файлы занимают больше места в ОЗУ, чем маленькие, то запросы на них (например, на аудио- и видеоинформацию) могут ускорить ротацию файлов в кэше при незначительном объеме ОЗУ. Если Вы публикуете большие документы или их просто много, либо запускаете на компьютере, где работает Internet Information Server, другие приложения, интенсивно использующие память, Вы можете значительно повысить производительность системы, увеличив объем ОЗУ. Если же Вы публикуете на узле несколько файлов сравнительно малого размера, расширение объема ОЗУ практически не скажется на быстродействии.


    Ограничения связанные с платами сетевых адаптеров

    Разные платы сетевых адаптеров работают по-разному. Драйверы и параметры устройства, используемые Вами при настройке платы сетевого адаптера, также могут влиять на ее производительность. Регулярно связывайтесь с производителем Вашей платы сетевого адаптера ^выясняйте, не появились ли новые версии драйверов.
    На узле со средней загрузкой Internet Information Server обычно полностью занимает ресурсы 10-мегабитного адаптера Ethernet. Чтобы сервер не перегрузил сеть, используйте либо несколько таких адаптеров, либо установите 100-мегабит-ный Ethernet-адаптер или адаптер FDDI. Если Вы подозреваете, что ресурсы повышения производительности узла исчерпаны, проверьте процент использования процессора на клиенте и на сервере. Если и там, и там процессор не загружен, то проблема в чем-то ином. Воспользуйтесь утилитой Network Monitor из состава Windows NT и выясните степень использования сети. Если на клиенте или на сервере используется около 100% ресурсов сети, то узким местом, по-видимому, является сеть.


    Ограничения связанные с жесткими дисками

    Частота обращений Internet Information Server к жесткому диску прямо пропорциональна объему ОЗУ, а также числу и размеру запрашиваемых файлов. Если в Вашем распоряжении лишь сравнительно небольшой объем памяти, а пользователи обращаются ко множеству разных файлов или размер запрашиваемых файлов достаточно велик, Internet Information Server не сможет хранить копии файлов в ОЗУ, чтобы ускорить доступ к ним. В этом случае ему придется считывать файлы с жесткого диска, и поэтому скорость обслуживания запросов будет определяться скоростью доступа к жесткому диску и его объемом.
    Ограничения, накладываемые жестким диском, чаще всего заметны на тех узлах, где хранится очень много файлов, причем пользователи узла обращаются к ним хаотично. Если проблемы производительности узла связаны с доступом к жесткому диску, то процент использования процессора остается небольшим, плата сетевого адаптера не перегружается, но значение счетчика Physical Disk % Disk Time велико. Чтобы исправить положение, воспользуйтесь дисковым массивом (Redundant Array of Inexpensive Drives, RAID) и средствами организации дисковых массивов Windows NT.


    Оптимизация использования процессора

    С помощью Диспетчера задач можно выяснить, какие процессы занимают процессорное время. Для вызова Диспетчера задач достаточно нажать комбинацию клавиш CTRL+ALT+DEL и щелкнуть кнопку Task Manager.
    Открыв в окне Диспетчера задач вкладку Processes, обратите внимание на процесс Inetinfo.exe. Он объединяет все службы Internet Information Server: HTTP, FTP, кэш Internet Information Server, пул потоков и задачи SNMP.
    Чтобы оптимизировать сервер, на котором работает Internet Information Server, запускайте только те процессы, которые необходимы для Web-сервера. Откажитесь от идеи использовать сервер IIS в качестве файл-сервера или сервера печати и не запускайте на нем другие службы, не имеющие отношения к серверу Интернета и интрасети.


    Основное слияние

    Исходные данные этой операции — текущие промежуточные индексы и основной индекс (если таковой имеется). По завершении операции основного слияния Index Server заменяет все исходные индексы одним результирующим основным индексом. Хотя само по себе основное слияние — чрезвычайно ресурсоемкая операция (как для процессора, так и для жесткого диска), в результате ее выполнения освобождаются системные ресурсы и уничтожаются избыточные данные, что резко повышает эффективность обслуживания запросов.
    Примечание
    Если совокупный размер исходных индексов велик, основное слияние может выполняться довольно долго. При возникновении сбоев в работе системы или ее отключении эту операцию можно запустить повторно — после перезапуска выполнение основного слияния продолжится с того места, на котором оно было прервано. Запуск, перезапуск и приостановка выполнения основного слияния регистрируются в журнале событий.
    Выполнение операций основного слияния управляется несколькими ключами реестра.
  • MaslerMergeTime (время регулярного выполнения регулярного основного слияния) — этот параметр позволяет указать число минут после полуночи, по истечении которых автоматически запускается ночная операция основного слияния. Время запуска по умолчанию — полночь. Этот параметр следует выбирать так, чтобы основное слияние выполнялось во время минимальной загрузки сервера.
  • MaxFresh Count — Index Server выполняет основное слияние, если число документов, изменившихся со времени последнего основного слияния, превысило значение этого параметра. Увеличение числа изменившихся документов приводит к дополнительному расходу памяти при обслуживании запросов. После выполнения основного слияния значение счетчика FreshCount уменьшается до нуля.
  • MinDiskFreeForceMerge и MaxShadowFreeForceMerge —
  • если объем свободно го места на диске, содержащем каталог, меньше, чем значение параметр MinDiskFreeForceMerge, а суммарный объем дискового пространства, занимаемый промежуточными индексами, превосходит значение MaxSha-dowFreeForceMerge, Index Server выполняет основное слияние, чтобы объединить промежуточные индексы и освободить место на диске.
  • MaxShadowIndexSize —
  • если суммарный объем дискового пространства, занимаемого промежуточными индексами, превосходит значение параметр MaxShadowIndexSize, Index Server выполняет основное слияние, чтобы объединить промежуточные индексы. Приоритет этого условия выше, чем предыдущего. Кроме того, Вы имеете право принудительно запустить операцию основного слияния, используя административную Web-страницу (httр://имя_компьютеpа/srсhadm/admin.htm). Основное слияние повышает эффективность обслуживания запросов, поэтому можно и не дожидаться, пока будет выполнено одно и; описанных выше условий.


    Параметры кэша свойств

    Чтобы уменьшить время выборки информации для часто используемых запросов, добавьте свойства в кэш на своем сервере. Если свойства не кэшируются, Index Server при каждом запросе будет обращаться непосредственно к документам АсtiveX (например, к документам Microsoft Office), входящим в результате запроса, и извлекать их свойства. В кэш свойств можно добавить и свойства, которые не индексируются по умолчанию, — например, добавив в кэш свойство, соответствующее тэгу META=="ServerProduct" VALUЕ="название продукта, и снабдив этим тэгом HTML-документы, Вы обеспечите возможность поиска серверных продуктов по названию.
    Примечание
    Если Ваш индекс был поврежден и его приходится создавать заново, Вам придется возобновить и кэш свойств.

    Переполнение диска

    Если диск, на котором находится каталог, близок к переполнению, Index Server временно приостанавливает индексирование. Фильтрование не может продолжиться пока Вы не освободите дополнительное место на диске. При возникновении этой ситуации Index Server записывает в журнал событий соответствующее сообщение. Периодически проверяйте журнал событий на предмет появления такого сообщения и, обнаружив его, принимайте соответствующие меры.
    Примечание
    Вы можете закрыть Index Server на время очистки места на диске.

    План Webузла

    План Web-узла (WebMap) отображает все ресурсы узла: Web-страницы, изображения, аудио- и видеофайлы, Java-приложения и т. д. Способ представления этих объектов отражает их назначение и взаимосвязи между ними-.
    План Web-узла отображается в одном из двух графических представлений: Tree или Cyberbolic.


    Подробные отчеты

    В состав стандартных отчетов Report Writer входят девять подробных; их описание приведено ниже.

    Постоянные индексы

    Индекс, хранящийся на жестком диске, называется постоянным. В отличие от словарей, постоянные индексы нечувствительны к отключениям и перезагрузкам системы. Так как данные постоянных индексов хранятся на жестком диске, Index Sever эффективно сжимает их. Постоянный индекс бывает либо промежуточным, либо основным.
    Промежуточный индекс создается путем слияния словарей и иногда других; промежуточных индексов. Каталоги могут содержать несколько промежуточных индексов. Index Server использует промежуточные индексы в качестве временных областей хранения данных, предназначенных для слияния в основной индекс. Применение промежуточных индексов позволяет поддерживать актуальность индексов без выполнения ресурсоемких операций. Однако в силу того1 что промежуточные индексы сжаты не так сильно, как основные, они занимают больший объем на жестком диске.
    Основной индекс содержит индексные данные для множества документов, Обычно это самая большая постоянная структура данных. Основной индекс содержит все данные, которые уже проиндексированы на момент его создания. Для основных индексов используются гораздо более мощные средства сжатия, чем для промежуточных. Это обеспечивает значительную степень сжатия данных, однако такие средства требуют для своей работы больше ресурсов.
    Index Server создает основной индекс с помощью одноименного процессе слияния, который объединяет все промежуточные и текущий основной индекс (если таковой имеется) в новый основной индекс. По завершении слияния Indexi Server удаляет все исходные индексы, оставляя только новый основной индекс! После этого запросы обслуживаются с максимальной эффективностью. Процесс создания основного индекса описан ниже в этой главе. Общее число постоянных индексов (как промежуточных, так и основных) в любом каталоге не может превышать 255.


    Потеря уведомлений о файлах

    Во время обычной работы — и если индексируемые файлы находятся на компьютеpax под управлением Windows NT — Index Server автоматически отслеживает все изменения в документах соответствующих папок. Если файлы меняются часто, некоторые уведомления могут быть потеряны из-за переполнения буфера.
    В случае переполнения буфера Index Server автоматически запускает процессу инкрементального сканирования совокупности документов, уведомления об изменении которых были утрачены. Никакого участия, администратора в этом требуется.


    Повреждение данных и нарушение внутренней структуры

    При сбоях питания или других столь же разрушительных событиях данные индекса могут быть необратимо повреждены. В этом случае Index Server удаляет все существующие индексные данные и заново фильтрует всю совокупность документов. Если повреждение обнаруживается при запуске Index Server, этот процесс запускается автоматически. Если же о повреждении данных стало известно только во время работы, в журнал событий записывается соответствующее сообщение, а все последующие запросы запрещаются.
    При появлении в журнале событий этого сообщения следует остановить и перезапустить службу Content Index (Cisvc.exe).
    Выполнив автоматическое восстановление, Index Server записывает сообщение в журнал событий. Если каталог, обозначенный в сообщении журнала событий, имеет параметры по умолчанию, а все виртуальные корни были проиндексированы, никаких действий от администратора не потребуется.


    Повреждение кэша свойств

    Если Index Server некорректно завершит свою работу или же обнаружит повреждение во время работы, то кэш свойств будет помечен как поврежденный. При следующем запуске Index Server выполнит операцию восстановления кэша свойств. Index Server записывает в журнал событий одно сообщение в начале операции восстановления и еще одно — после ее завершения. Во время автоматического восстановления Index Server продолжает обслуживать запросы, но не запускает новых процессов фильтрования до завершения операции восстановления кэша. Никакого участия администратора в этой процедуре не требуется.


    Поврежденные файлы и сбойные DLL фильтров

    Если процесс CiDaemon обнаруживает поврежденные файлы, Index Server помечает их как нефильтрованные. Список нефильтрованных файлов можно посмотреть административными средствами. Причина возникновения подобной ситуации иногда кроется в некорректной работе библиотеки фильтра, применяемого для файлов этого типа.
    Если проблемы с фильтрованием файлов определенного типа возникают постоянно, свяжитесь с поставщиком библиотеки фильтра


    Представление Ciberbolic

    Представление Cyberbolic отображает Web-узел в виде графа объектов и ссылок; это — динамическое, нелинейное изображение структуры узла. Оно показывает взаимоотношения между объектами Web-узла, начиная с любого выбранного Вами элемента. Такое представление позволяет “окинуть взглядом” всю структуру узла, как показано на приведенном ниже рисунке.
    По умолчанию, щелкнув объект в представлении Cyberbolic, Вы переместите его в левую часть представления. Объекты, связанные с выбранным, расположены правее него.
    По умолчанию представление Cyberbolic отображает только Web-страницы (игнорируя остальные ресурсы и кратчайшие маршруты между ними и основной страницей. Этот метод позволяет) упростить представление узла и оставляет достаточно места для меток страниц. Чтобы выбрать объекты для отображения, измените параметры в окне Display Options (меню View).
    Все объекты снабжены краткими метками. Более подробное пояснение появится, когда Вы установите курсор мыши на объект.

    Представление Tree

    Представление Tree (дерево) — это иерархия объектов; тем, кто работает с Проводником Microsoft Windows NT, хорошо знаком его внешний вид. Представление Tree информативно и интуитивно понятно, но отображает на экране только небольшую часть всей информации.
    Любой объект в представлении Tree — это значок и текстовая метка. Как показано на рисунке, значок основной страницы (home page) находится на вершине иерархии. Ресурсы второго уровня — страницы или другие объекты, связанные ссылками с основной страницей, — отображаются в виде значков, сдвинутых вправо относительно значка основной страницы. Значки ресурсов третьего уровня (на расстоянии двух ссылок от основной страницы) точно так же смещены вправо относительно второго уровня. В результате представление узла очень похоже на структуру документа.
    Управляющий значок — это небольшой серый квадратик слева от значка объекта со знаком “плюс”, “минус” или знаком вопроса. Щелкнув значок с символом “+”, Вы раскроете представление, отображая объекты следующего уровня, непосредственно связанные с данным. Щелкнув “минус”, Вы свернете раскрытое представление, сократив видимую часть дерева до прежнего размера. Значки со знаком вопроса указывают, что ссылки и объекты данной страницы еще не исследованы. Отсутствие управляющего значка означает, что страница просмотрена,. но никаких ссылок на другие страницы она не содержит и, следовательно, является нижним уровнем данной ветви иерархии.

    Прежде всего Для изучения этой главы нет никаких предварительных требований Занятие

    1. Мониторинг служб (продолжительность занятия 15 минут)
  • Perfomance Monitor
  • Журналы Internet Information Server и Event Viewer
  • Другие средства мониторинга производительности
  • Netstat
  • Network Monitor
  • Наиболее важные счетчики
  • Счетчики полосы пропускания
  • Счетчики ISAPI и CGI
  • Счетчики ASP
  • Счетчики кэша Internet Information Server
  • Резюме
  • Мониторинг — важнейшая составляющая процесса администрирования сервера. Используя соответствующие средства, Вы сможете обнаружить проблемы Web-сервера, оценить результаты изменения содержимого Web-узла, а также планировать модернизацию, которая позволит улучшить доступ к Вашим Web-узлам. На этом занятии описываются средства мониторинга, которые помогут Вам получить как детальную, так и краткую информацию.

    Прежде всего Для изучения занятий

    . В ходе этой процедуры устанавливается и Index Server. Для корректной работы Index Server необходима файловая система Windows NT (NTFS);
  • прилагаемый к книге компакт-диск, содержащий необходимые для упражнений файлы.




  • Принудительное сканирование

    Для повторного обзора виртуального корневого каталога необходимо выполнить его повторное сканирование. Эта операция необходима после глобальных изменений, например:
  • изменения размера описаний файлов;
  • добавления или удаления фильтра;
  • изменения метода фильтрования документов;
  • добавления нового разделителя слов.
  • 8 Выполнение принудительного сканирования
    1. В меню Start выберите команды Programs, Windows NT 4.0 Option Pack, Microsoft Index Server, Index Server Manager. Раскройте каталог, чтобы отобразить папку Directories.
    2. Щелкните значок Directories.
    3. В правой панели щелкните папку, которую нужно отсканировать.
    4. В меню Action выберите команду Rescan.
    5. Если Вам нужно выполнить полное сканирование, в диалоговом окне Full Rescan щелкните кнопку Yes; если достаточно инкрементального сканирования, щелкните кнопку No.


    Принудительное слияние

    Если время обслуживания запросов начинает увеличиваться, Вы можете освободить ресурсы, объединив индексы. Время от времени мелкие индексы следует объединять в более крупные, что позволяет освободить место (как в памяти, так и на диске) и ускорить обработку запросов. Для этого необходимо выполнить операцию принудительного слияния.
    8 Выполнение принудительного слияния
    1. В левой панели окна Microsoft Management Console выберите каталог, индексы которого нужно объединить.
    2. В меню Action выберите команду Merge. Появится диалоговое окно Merge Catalog?.
    3. Щелкните кнопку Yes.

    Процесс CiDaemon

    Это дочерний процесс, порождаемый ядром индексирования Index Server. Ядро индексирования передает этому процессу список документов, а процесс CiDaemon отвечает за фильтрование документов и, в частности, за поиск необходимых динамических библиотек фильтра и разделителя слов для каждого конкретного документа.
    Фильтрование выполняется в фоновом режиме, чтобы не мешать основным операциям. Если документ, открытый процессом CiDaemon на локальном жестком диске, требуется другому процессу для записи, то процесс CiDaemon откладывает его фильтрование и закрывает документ так быстро, насколько это возможно. Для совместно используемых сетевых папок такой вариант невозможен.
    Если процесс CiDaemon завершается, Index Server автоматически перезапускает его.


    Процессорные ограничения

    Скорость, с которой информация перемещается между различными компонентами компьютера, (например, центральным процессором, жестким диском и ОЗУ), зависит от тактовой частоты процессора и от разрядности шины данных, используемой для передачи информации. Чем больше тактовая частота, тем больше операций передачи данных по шине может быть выполнено за один и тот же интервал времени. Тактовая частота обычно измеряется в мегагерцах (МГц). Шина данных за одну операцию посылки данных может передать 16, 32 или 64 бита, в зависимости от разрядности. Скорость передачи данных зависит также от используемой операционной системы и от быстродействия приложения.
    Процессор становится “узким” местом, когда задействована большая доля его ресурсов, в то время как плата сетевого адаптера используется далеко не на полную мощность. Если процессор занят “на полную катушку”, Вы можете установить более быстрый процессор, добавить в компьютер дополнительные процессоры или установить новые компьютеры, на которых можно создать копию узла,' и распределить нагрузку между ними. Если Вы запускаете на Web-сервере приложения, сильно загружающие процессор, — например, приложение базы данных, перенесите остальные приложения на другой компьютер.


    Промежуточное слияние

    При промежуточном слиянии несколько словарей и промежуточных индексов объединяются в один промежуточный индекс. Index Server выполняет промежуточное слияние для освобождения памяти, используемой для хранения слова рей, и чтобы зафиксировать результаты фильтрования; обычно эта операция выполняется достаточно быстро.
    В роли исходных индексов для операции промежуточного слияния чаще всего выступают словари. Однако если общее число постоянных индексов превышай максимальное значение, заданное ключом реестра Maxindexes (по умолчанию -50), промежуточному слияния подлежат и промежуточные индексы. Процесс промежуточного слияния автоматически запускается при выполнении хотя бы одного из перечисленных ниже условий:
  • число списков слов превосходит значение параметра MaxWordLists;
  • общий размер списков слов превышает значение параметра MinSizeMeige Wordlists;
  • выполняется основное слияние;
  • перед этой операцией всегда осуществляется промежуточное слияние, объединяющее все имеющиеся словари в промежуточный индекс;
  • выполняется исключающее слияние.


  • Пропускная способность сети

    Тип используемой сети самым непосредственным образом сказывается на производительности сервера. Она снижается, когда пропускной способности сети недостаточно для передачи всех данных, которые необходимо переслать. Кроме того, другие работающие на компьютере приложения (например, система электронной почты), которые занимают часть полосы пропускания, уменьшают ширину полосы, доступную Internet Information Server.
    8 Скольких одновременно работающих пользователей “выдержит” Ваше соединение
    1. Предположим, что Вы хотите уложиться в 5 секунд при передаче текстовой страницы и что размер передаваемого пользователю файла страницы составляет 63 360 бит. Разделите 63 360 бит на 5 секунд. Получится, что каждому пользователю необходимо передавать 12 672 бит/с.
    2. Разделите скорость подключения на скорость передачи, необходимую каждому пользователю. Например, для линии Т1 разделите 1 540 000 бит/с на 12 672 бит/с на пользователя. В результате Вы получите число пользователей, которые одновременно смогут работать с сервером (в нашем примере — 121).
    Примечание.
    Здесь предполагается, что передаются лишь текстовые страницы, не содержащие дополнительной графики, и что страница передается не дольше пяти секунд. Если к серверу попытается подключиться слишком много пользователей, то им не будет отказано в обслуживании, но скорость передачи файлов может значительно уменьшиться. В приведенной ниже таблице примерно указано, сколько одновременно работающих пользователей могут поддерживать различные типы подключений.
    Тип подключения Число пользователей
    Выделенное PPP/SLIP 2-3
    56 К (Frame Relay) 10-20
    ISDN (с применением РРР) 10-50
    Т1 100-500
    Т3 >5000


    Протоколирование ODBC

    Протоколирование работы сервера в ODBC-совместимую базу данных требует больше ресурсов, чем запись протокола в простой текстовый файл (например, с разделением полей запятыми). Чтобы избежать перегрузки процессора сервера, записывайте протокол в базу данных на другом компьютере.
    ODBC-коннектор подробно обсуждается в главе “Активные страницы сервера”.

    Проверка состояния

    Средствами интегрируемого модуля Index Server Вы можете выяснить текущее состояние выполнения задач индексирования, а также посмотреть свойства индексируемых папок и кэша свойств документов. Выделив папку Index Server в в левой панели окна Microsoft Management Console, в правой Вы увидите число индексированных файлов, размер каталога, список документов, подлежащих фильтрованию, а также другую информацию,


    Разделители слов

    Результат работы фильтра содержимого — поток символов, тогда как Index Sea индексирует слова. Поэтому, чтобы индексирование выполнялось корректно, Ind Server должен уметь выделять слова из потока символов. Эта задача усложняет тем, что в различных языках по-разному трактуют ее слова и разделители слов.
    Чтобы справиться с этой задачей, Index Server задействует языково-зависимые программные разделители слов, которые корректно разделяют поток символов на слова. Разделители слов учитывают особенности структуры и синтаксиса конкретного языка для выделения слов из потока символов.
    Примечание
    . Во избежание проблем с кодовыми страницами и других трудностей, связанных с однобайтовыми наборами символов, Index Server использует для хранения всех своих индексных данных двухбайтовую кодировку Unicode

    Разорванные сетевые соединения

    В случае, когда виртуальный корень представляет собой удаленный сетевой ресурс и соединение с этим ресурсом разрывается, возможно отключение пути. Index Server отслеживает возникновение подобных ситуаций и периодически опрашивает удаленные ресурсы, чтобы проверить, не восстановилось ли соединение с ними. Никакого участия администратора в этом не требуется.


    Microsoft Index Server позволяет индексировать

    Microsoft Index Server позволяет индексировать документы, хранящиеся на узле Internet Information Server, и поддерживает контекстный поиск в этих документах. Index Server способен индексировать многоязычные документы различных форматов, хранящиеся на нескольких Web-серверах. Он также автоматически обновляет индекс при изменении исходных файлов. Минимальные требования к конфигурации системы для Index Server обычно совпадают с требованиями, предъявляемыми Microsoft Windows NT Server 4.0. Вы можете запускать Index Server и прекращать его работу средствами апплета Services Панели управления.

    Счетчики ASP

    При мониторинге работы активных страниц сервера полезны следующие счетчики:
  • Memory Allocated (объем выделенной памяти);
  • Request Execution Time (время выполнения запроса);
  • Request Wait Time (время ожидания запроса);
  • Requests Executing (число выполняющихся запросов);
  • Requests Failed Total (общее число неудачных запросов);
  • Requests Queued (число запросов, помещенных в очередь);
  • Requests Succeeded (число удачных запросов);
  • Requests Total (общее число запросов);
  • Requests/Sec (число запросов в секунду).


  • Счетчики ISAPI и CGI

    Перечисленные ниже счетчики Performance Monitor для службы Web полезны при мониторинге работы приложений ISAPI и CGI:
  • Bytes Received/sec (число байт, принимаемых в секунду);
  • Bytes Sent/sec (число байт, передаваемых в секунду);
  • Bytes Total/sec (общее число байт в секунду);
  • Current CGI Requests (текущее число CGI-запросов);
  • Current ISAPI Extension Requests (текущее число запросов ISAPI-расширений);
  • Maximum CGI Requests (максимальное число CGI-запросов);
  • Maximum Connections (максимальное число подключений);
  • Maximum ISAPI Extension Requests (максимальное число запросов ISAPI-расширений);
  • Total CGI Requests (общее число CGI-запросов);
  • Total Files Sent (общее число отправленных файлов);
  • Total Files Transferred (общее число переданных файлов);
  • Total Get Requests (общее число запросов Get);
  • Total ISAPI Extension Requests (общее число запросов ISAPI-расширений);
  • Total Other Request Methods (общее число запросов другими методами);
  • Total Post Requests (общее число запросов Post).


  • Счетчики полосы пропускания

    Перечисленные ниже счетчики Performance Monitor для службы Web полезны при мониторинге полосы пропускания Вашего узла:
  • Bytes Received/sec (число байт, принимаемых в секунду);
  • Bytes Sent/sec (число байт, передаваемых в секунду);
  • Bytes Total/sec (общее число байт в секунду);
  • Connection Attempts/sec (число попыток подключения в секунду);
  • Current Anonymous Users (число анонимных пользователей);
  • Current Connections (число подключений);
  • Current .NonAnonymous Users (число неанонимных пользователей);
  • Maximum Connections (максимальное число подключений);
  • Maximum NonAnonymous Users (максимальное число неанонимных пользователей);
  • Total Anonymous Users (общее число анонимных пользователей);
  • Total Connection Attempts (общее число попыток подключения);
  • Total NonAnonymous Users (общее число неанонимных пользователей).


  • Скорость работы сетевых приложений

    Некоторые сетевые технологии требуют больших ресурсов, чем другие. Например, служба FTP использует меньше памяти, чем служба Web, а ASP-приложения, CGI-сценарии, запросы к базам данных и видеофайлы требуют больше процессорных ресурсов, нежели статические HTML-страницы.


    Словари

    Словари — это небольшие временные индексы, хранящиеся в памяти. Каждый словарь содержит сведения о нескольких документах. Когда Index Server фильтрует документ, он сохраняет данные в словаре. Создание словарей занимает очень мало времени и не требует обновления информации на жестком диске. Словари выполняют роль области промежуточного хранения данных при индексировании. Для управления поведением словарей можно воспользоваться ключами реестра, которые находятся в разделе
    \HKEY_LOCAI_MACHINE\SYSTEM\CurrentControlSet\Control\Content Index . В приведенной ниже таблице перечислены ключи реестра, относящиеся к словарям, и их описание.
    Параметр Описание
    MaxWordLists Максимальное число одновременно существующих словарей
    MaxWordlistSize Максимальный объем памяти, занимаемый отдельным словарем. По достижении этого значения в словарь добавляются только слова того документа, который фильтруется в данный момент. Слова других документов будут позднее помещены в другие файлы. Единица измерения — 128 кб (например, значение 20 эквивалентно 2,5 Мб).
    MinSizeMergeWordlists Минимальный общий размер словарей, по достижении которого выполняется их слияние в промежуточный индекс
    MinWordlistMemory Минимальный объем памяти для создания словаря
    Когда число словарей превосходит значение параметра MaxWordLists, Index Server объединяет их в промежуточный индекс с помощью процесса, называемого промежуточным слиянием (Вы познакомитесь с ним позже на этом занятии). Хотя при хранении слов в словаре применяется сжатие данных, оно не слишком эффективно, поскольку словари — всего лишь временные структуры. Кроме того, поскольку словари хранятся в памяти, документы, на основе которых они построены, придется фильтровать заново при следующем запуске Internet Information Server Index Server самостоятельно определяет, когда необходимо повторное фильтрование, и выполняет его автоматически.


    Создание и конфигурирование каталогов

    Во время установки Index Server создает каталог Web. Вы можете создавать дополнительные каталоги, а также распределить индексные данные по нескольким каталогам.


    Создание нескольких каталогов

    Вы можете создать несколько каталогов для распределения запросов и поддержки виртуальных серверов.
    Поскольку Index Server не поддерживает запросы, охватывающие более одного каталога, Вам следует продумать возможные последствия создания нескольких каталогов. Увеличение их числа приведет к невозможности охватить все содержимое узла Internet Information Server одним запросом; кроме того, наличие нескольких каталогов осложняет стандартную поддержку каталога.
    Распределение нескольких физических серверов по нескольким каталогам повышает производительность запросов, но только в том случае, когда большинство запросов ограничено подобластью (одним или несколькими физическими серверами) Web-узла. Повышение производительности в этом случае обусловлено снижением числа ложных ответов со ссылками на документы, расположенные за пределами интересующей Вас области.


    Средства защиты

    Index Server пользуется встроенными средствами защиты Windows NT Server 4.0 и Internet Information Server. Для поддержания безопасности узла и предотвращения доступа неавторизованных пользователей необходимы средства аутентификации и контроля доступа. Даже на узлах, содержащих только общедоступную информацию, внимание к вопросам защиты помогает предотвратить взлом сервера.


    Статистика объектов число и размер

  • Pages
  • (Страницы) — не слишком ли велики страницы для компьютеров с минимальными аппаратными возможностями и для стандартных обозревателей?
  • Images
  • (Изображения) — достаточно ли имеющихся изображений для представления узла?
  • Gateways
  • (Шлюзы сценариев) — при каком количестве ссылок обозреватели смогут запускать на сервере CGI-сценарии средствами команд GET или POST?
  • Internet
  • (Интернет) — сколько ссылок используют службы Интернета (например, Telnet)?
  • Java —
  • оправданно ли нынешнее количество ссылок на Java-приложения при существующем разнообразии обозревателей, используемых для доступа к узлу?
  • Applications
  • (Приложения) — каково возможное влияние числа ссылок на приложения на объем узла?
  • Audio
  • (Звук) — оправданно ли нынешнее количество ссылок на звуковые данные при существующем уровне наличия звуковоспроизводящего оборудования у посетителей Web-узла?
  • Video (Видео) — оправданно ли текущее число ссылок на видеоинформацию при существующем уровне наличия оборудования для воспроизведения видео у посетителей Web-узла?
  • Text
  • (Текст) — оправданно ли текущее число текстовых объектов при таком проценте посетителей, использующих Lynx или другие текстовые обозреватели на устаревших платформах?
  • WebMaps (Карты узла) — достаточно ли на узле навигационных карт для упрощения перемещения пользователей по узлу?
  • Other Media
  • (Информация других типов) — есть ли ссылки на информацию других типов?
  • Totals
  • (Всего) — насколько сложен узел? Не станет ли он работать эффективнее, если Вы будете отбирать содержимое более рационально?



    Сводка число объектов и ссылок

    На узле (On-site)
  • OK—
  • каково состояние внутренних ссылок? Не следует ли выделить дополнительные ресурсы на их исправление и поддержку?
  • Not Found (code 404)
  • (Не найденные) — каково состояние внутренних ссылок? Не следует ли выделить дополнительные ресурсы на их исправление и поддержку?
  • Other Errors
  • (Другие ошибки) — каково состояние внутренних ссылок? Не следует ли выделить дополнительные ресурсы на их исправление и поддержку?
  • Unverified
  • (Непроверенные) — каково состояние внутренних ссылок? Не следует ли выделить дополнительные ресурсы на их исправление и поддержку?

    Свойства плана узла

  • Map Date
  • (Дата сбора информации) — актуален ли отчет? Не нужно ли обновить статистику по узлу?
  • Levels
  • (Уровни) — сколько “шагов” требуется, чтобы добраться от основной страницы до “конца” узла?
  • Average Links per Page
  • (Среднее число ссылок на странице) — хорошо ли структурирован узел? Не слишком ли запутаны ссылки? Не стоит ли их упорядочить, чтобы упростить наблюдение за “путешествием” пользователей по узлу?



    Тип подключения к Интернету

    Полоса пропускания подключения к Интернету определяет скорость загрузки данных в Ваш компьютер и число запросов, которые могут обрабатываться одновременно. Если пропускной способности недостаточно для обслуживания всех поступающих запросов, возникают задержки или даже отказы. Ширина доступной Вам полосы пропускания определяется типом выбранного Вами подключения.
    Чтобы правильно задать тип соединения, определите средний размер файлов узла, время, необходимое для передачи файла такого размера, и среднее число пользователей, одновременно работающих с Вашим узлом.
    В общем случае на передачу страницы должно уходить не более пяти секунд, Это время не учитывает передачу дополнительной графической, звуковой и видеоинформации. Как правило, дополнительные файлы загружаются после текста в о6щем случае это должно занимать не более 30 секунд.
    Выяснив ширину полосы пропускания, необходимую Web- или FTP-серверу, решите, будете ли Вы предоставлять дополнительные услуги, также занимающие часть полосы пропускания, — например, электронную почту, новости или аудио- и видеопотоки. Если да, обеспечьте им достаточную ширину полосы пропускания. Обычно для подключения к Интернету используется маршрутизатор, с которым Ваш компьютер связан посредством платы сетевого адаптера. Вам потребуется высокопроизводительный сетевой адаптер, чтобы предотвратить возникновение “узких” мест между Интернетом и Вашим компьютером. Например, если Ваш компьютер подключен к Интернету по линии Т1, имеющей полосу пропускания 1,54 Мбит/с, то достаточно обычной 10-мегабитной локальной сети Ethernet. Однако если для подключения к Интернету используется линия ТЗ, следует подумать о соединении посредством оптоволоконной сети, так как 45-мегабитная полоса пропускания ТЗ значительно превышает пропускную способность стандартной сети Ethernet.


    Типы слияния

    Слияние — это процесс объединения нескольких индексов в один. Слияние уменьшает объем избыточных данных и освобождает системные ресурсы. Кроме того Index Server обслуживает запросы тем быстрее, чем меньше существует индексов.
    Возможны три типа операций слияния:
  • промежуточное;
  • исключающее;
  • основное.


  • Требования к ресурсам системы

    Программные файлы Index Server требуют от 3 до 12 Мб дискового пространства в зависимости от числа поддерживаемых языков. Для данных Index Server потребуется дополнительное место на диске; объем определяется числом и типом индексируемых документов. Данные Index Server могут занимать до 40% от общего; размера индексируемых документов. Хотя среднее значение объема используемого дискового пространства около 30%, в отдельных случаях может достигаться и 40-процентный рубеж.
    Другими словами, для узла, обеспечивающего поддержку нескольких языков и нуждающегося в индексировании файлов общим объемом 100 Мб, может потребоваться 52 Мб дополнительного дискового пространства (40 % от 100 Мб = 40 Мб+12 Мб для программных файлов).
    Примечание
    По соображениям безопасности компания Microsoft рекомендует хранить данные Index Server на разделе NTFS. Использование NTFS является одним из ключевых факторов обеспечения безопасности Internet Information Server и Index Server, так как NTFS позволяет ограничивать доступ к файлам и папкам. Минимальные требования к конфигурации системы, предъявляемые Index Server, обычно совпадают с требованиями Microsoft Windows NT Server 4.0, однако конфигурация, соответствующая оптимальной производительности, определяется следующими факторами:
  • числом документов;
  • размером совокупности индексируемых документов;
  • тем, насколько занят сервер операциями поиска.
  • Компьютер на базе процессора 486/DX4-100 с 32 Мб ОЗУ, работающий под управлением ОС Windows NT Server 4.0, справляется с обработкой запросов, лишь если их число в один момент времени не слишком велико. Такой аппаратной конфигурации достаточно для маленькой организации, но для обслуживания большого числа пользователей придется установить Index Server на более мощном компьютере.
    Приведенная ниже таблица поможет Вам оценить, какой объем памяти необходим для работы Index Server в Вашей организации.
    Число документов Рекомендуемый объем памяти (в мегабайтах)
    Менее 100 000 100000-250000
    250000-500000
    500 000 и более
    32 64-128
    128-256
    256 и более
    Более мощный процессор и больший объем памяти значительно увеличивают производительность операций индексирования и обслуживания запросов. Если число документов велико, нехватка памяти серьезно уменьшает быстродействие. Если во время работы Index Server Вы заметили спад производительности, воспользуйтесь утилитой Performance Monitor для определения его причин.


    Трехуровневая архитектура

    Трехуровневые приложения, в которых сервер приложений, клиентский компьютер и источник данных отделены друг от друга, характеризуются гораздо большей гибкостью при развертывании, чем двухуровневые приложения архитектуры клиент-сервер, в которых код приложения зависит от местонахождения данных. Трехуровневая архитектура состоит из перечисленных ниже звеньев.
  • Пользовательские сервисы —
  • клиентское приложение представляет собой в основном графический пользовательский интерфейс (GUI), а функции подключения к базе данных и обработки данных выполняют сервисы среднего звена. Этот подход ускоряет работу пользователей, но увеличивает сетевой трафик при разнесении компонентов системы по разным компьютерам.
  • Компоненты бизнес-логики и данных —
  • компоненты среднего уровня реализуют правила работы с данными и логику приложения. Последняя состоит из алгоритмов бизнес-операций и, например, законодательных ограничений. Правила работы с данными предназначены для сохранения целостности структур данных одной или нескольких БД (например, находящихся на сервере, чтобы упростить совместное использование ресурсов). Сервисы среднего уровня применяются и для принудительного обеспечения соблюдения бизнес-правил и правил работы с данными. Поскольку они не привязаны к конкретному клиенту, их можно использовать в любых приложениях. Примечание
    Централизованное расположение объектов деловой логики эффективно с точки зрения затрат средств и времени. Этот подход позволяет различным приложениям совместно использовать объекты и проводить тестирование до развертывания компонентов. Кроме того, затраты на сопровождение уменьшаются, так как в случае изменения правил модифицировать придется только код на сервере.
  • Сервисы доступа к данным
  • — это уровень доступа к системе управления базой данных. К нему могут обращаться сервисы среднего уровня и, при необходимости, пользовательские сервисы. Этот слой не обеспечивает прямого подключения к базе данных — напротив, он состоит из компонентов доступа к данным, призванных облегчить совместное использование ресурсов и конфигурирование клиентов без установки библиотек или драйверов на каждый клиентский компьютер. Независимо от типа используемых пользовательских интерфейсов важно помнить, что приложения строятся из одних и тех же основных частей. Трехуровневая архитектура определяет логическую организацию приложения и не требует обязательного использования трех разных компьютеров. Другими словами, не обязательно, чтобы логические уровни трехуровневой архитектуры соответствовали физической топологии Вашей сети. Способ развертывания составных частей приложения определяется Вашими требованиями и возможностями сети.


    В этом упражнении Вы активизируете

    В этом упражнении Вы активизируете средства защиты Index Server и протестируете их работу, используя различные учетные записи пользователей. Для выполнения этого упражнения нужно сначала создать учетные записи пользователей и изменить разрешения на Вашем сервере; этому посвящена первая часть упражнения.
    8 Создание учетных записей пользователей
    1. В меню Start выберите команды Programs, Administrative Tools, User Manager for Domains.
    2. Создайте две учетные записи пользователей в соответствии с приведенной ниже таблицей.
    Свойство Пользователь1 Пользователь2
    User Name Laurel Megan
    Password Laurel megan
    User Must Change Password Флажок сброшен флажок сброшен
    3. Закройте Windows NT User Manager.
    8 Изменение разрешений для файла Security.doc
    1. Запустите Проводник Windows NT и выберите папку C:\lnetpub\Wwwroot \lndex.
    2. Откройте папку Confidential.
    3. Щелкните правой кнопкой мыши файл Security.doc и выберите в меню команду Properties. Появится диалоговое окно Security.doc Properties.
    4. Откройте вкладку Security.
    5. Нажмите кнопку Permissions. Появится диалоговое окно File Permissions.
    6. Нажмите кнопку Add. Появится диалоговое окно Add Users and Groups.
    7. Нажмите кнопку Show Users.
    8. Прокрутите список имен и выберите строки Laurel и Megan.
    9. Нажмите кнопку Add. Учетные записи Laurel и Megan будут добавлены в список Add Names.
    10. Нажмите ОК. Появится диалоговое окно File Permissions.
    11. Выберите в списке учетную запись Laurel.
    12. В списке Type of Access выберите No Access. Появится диалоговое окно, сообщающее, что у учетной записи Laurel нет доступа.
    13. Нажмите ОК.
    14. Закройте User Manager. Теперь Вы включите средства защиты Internet Information Server.
    8 Включение средств защиты Internet Information Server
    1. Запустите Internet Service Manager.
    2. Щелкните правой кнопкой мыши узел Default Web Site.
    3. Выберите в контекстном меню команду Properties. В группе Anonymous Access and Authentication Control вкладки Directory Security щелкните кнопку Edit. Появится диалоговое окно Authentication Methods. Настройте методы аутентификации в соответствии с приведенной ниже таблицей.
    Метод аутентификации Положение флажка
    Allow Anonymous Сброшен
    Basic (Clear Text) Установлен
    Windows NT Challenge/Response Сброшен
    На экране появится предупреждение.
    6. Нажмите кнопку Yes.
    7. Два раза нажмите кнопку ОК.
    8. В поле Inheritance Overrides выберите запись IISADMIN и нажмите кнопку ОК.
    Базовая аутентификация используется здесь только в учебных целях — она ускоряет выполнение упражнения, предотвращая отключение пользователя от узла.
    9. Сверните окно Internet Service Manager.
    10. В меню Start выберите команды Programs, Windows NT 4.0 Option Pack, Microsoft Index Server, Index Server Manager (HTML).
    Примечание
    Если на экране появится диалоговое окно запроса имени; пользователя и пароль, введите имя и пароль администратора. 11. Прокрутите страницу до раздела Index Statistics и щелкните кнопку Refresh.Обратите внимание на число измененных документов (# Documents changed) — 163.
    Примечание
    Если на экране появится предупреждение системы защиты, щелкните кнопку Yes. 12. В левой части страницы Index Statistics нажмите кнопку Merge Index.
    13. На странице Index Statistics нажмите кнопку Refresh.
    Обратите внимание, что число отредактированных документов (# Documents changed) изменилось. Это свидетельствует, что изменение прав доступа к файлy Security.doc учтено в индексе.
    8 Тестирование средств защиты Index Server
    1. Закройте все копии Internet Explorer.
    2. В меню Start выберите команды Programs, Microsoft Index Server, Index Server Sample Query Form. Появится диалоговое окно Basic Authentication.
    3. В поле Useroame введите laurel.
    4. В поле Password введите laurel.
    5. Нажмите OK.
    6. В поле Enter your query below введите confidential document.
    7. Нажмите Go. Index Server не найдет ни одного документа, так что пользователь Laurel н узнает, что файл Security.doc существует.
    8. Закройте Internet Explorer.
    9. В меню Start выберите команды Programs, Microsoft Index Server, Index Server Sample Query Form. Появится диалоговое окно Basic Authentication.
    10. В поле Username введите megan.
    11. В поле Password введите megan.
    12. Нажмите ОК.
    13. В поле Enter your query below введите confidential document.
    14. Нажмите Go. Index Server должен найти файл Security.doc.
    15. Закройте Internet, Explorer.
    8 Восстановление параметров парольной аутентификации службы WWW
    1. Запустите Internet Service Manager. Щелкните правой кнопкой мыши узел Default Web Site. Выберите в контекстном меню команду Properties.
    4. В группе Anonymous Access and Authentication Control вкладки Directory Security щелкните кнопку Edit. Появится диалоговое окно Authentication Methods.
    5. Настройте методы аутентификации в соответствии с приведенной ниже таблицей.
    Метод аутентификации Положение флажка
    Allow Anonymous Установлен
    Basic (Clear Text) Сброшен
    Windows NT Challenge/Response Установлен
    6. Трижды щелкните кнопку ОК.
    7. Закройте Internet Service Manager.


    Установка глобальных свойств

    На уровне Index Server можно настроить свойства для всех каталогов — например, отключить создание описаний. В этом случае для файлов, перечисленных на странице результатов поиска, не будут создаваться аннотации. В Вашей воле также изменить значение для конкретного каталога. Значения, установленные на уровне каталога, отменяют значения, заданные на уровне Index Server.


    Вне узла (Offsite)

  • OK—
  • каково состояние внешних ссылок? Не следует ли выделить дополнительные ресурсы на их исправление и поддержку?
  • Not Found (code 404)
  • (Не найденные) — каково состояние внешних ссылок? Не следует ли выделить дополнительные ресурсы на их исправление и поддержку?
  • Other Errors
  • (Другие ошибки) — каково состояние внешних ссылок? Не следует ли выделить дополнительные ресурсы на их исправление и поддержку?
  • Unverified
  • (Непроверенные) — каково состояние внешних ссылок? Не следует ли выделить дополнительные ресурсы на их исправление и поддержку?



    Закрепление материала

    Приведенные ниже вопросы помогут Вам лучше усвоить основные темы данной главы. Если Вы не сумеете ответить на вопрос, повторите материал соответствующего занятия. Правильные ответы приведены в части “Вопросы и ответы”, в конце книги.
  • Что необходимо для индексирования документов специальных форматов (например, файлов Microsoft Word)?
  • Какие факторы влияют на производительность Index Server?
  • Что можно сделать, чтобы уменьшить время обработки запросов к часто используемым документам?
  • Какие средства Index Server позволяют отображать ту часть документа, которая удовлетворяет Вашему запросу?
  • Как исключить некоторые папки из процесса индексирования?
  • Если пользователь не имеет доступа к конкретному файлу на узле Интернета или интрасети, может ли этот файл фигурировать среди возвращаемых пользователю результатов запросов?


  • Microsoft Index Server поддерживает индексирование

    1. Знакомство c Index Server (продолжительность занятия 20 минут)
  • Возможности Index Server
  • Использование Index Server
  • Требования к ресурсам системы
  • Изменения конфигурации в результате установки
  • Резюме
  • Microsoft Index Server поддерживает индексирование содержимого узла под управлением Internet Information Server и поиск информации в документах, хранящихся на узле. На этом занятии Вы познакомитесь с возможностями Index Server и его требованиями к системным ресурсам.

    Журналы Internet Information Server и Event Viewer

    В состав Windows NT входит служба протоколирования, регистрирующая различные события (например, ошибки или успешные запуски служб). Для просмотра журналов этой службы предназначена утилита Event Viewer. Чтобы запустить ее, выберите в меню Start команды Programs, Administrative Tools, Event Viewer.
    Event Viewer позволяет просматривать журналы системных событий, событий конкретного приложения, а также событий, связанных с безопасностью. Пользуясь этой информацией, Вы выясните, какие события и в какой последовательности привели к падению производительности сервера.


    Знакомство с Microsoft Transaction Server

    Закрепление материала
    1. Предположим, вновь созданный банк Woodgrove Bank планирует производить операции в 16-ти отделениях. Каждое отделение хранит информацию о счетах в своей базе данных Microsoft SQL Server. Управляющий банком нанял группу программистов для разработки ПО синхронизации транзакций между всеми 16-ю базами данных, а Вас — в качестве консультанта для наблюдения за работой программистов. Вы хотите убедить управляющего использовать Microsoft Transaction Server. Какие доводы Вы приведете?
    Microsoft Transaction Server обеспечивает синхронизацию транзакций между базами данных, что позволяет значительно снизить затраты времени на разработку, тестирование и отладку кода.
    Microsoft Transaction Server обеспечивает целостность транзакций, тем самым гарантируя, что транзакция никогда не будет находиться в неизвестном состоянии.
    Microsoft Transaction Server поддерживает технологию ActiveX, что обеспечивает возможность разработки приложений средствами Microsoft Visual Basic, Microsoft Visual C++ и Visual J++.
    Microsoft Transaction Server управляет низкоуровневыми ресурсами системы, как то потоками и файловым обменом, освобождая разработчика от необходимости заботиться о решении этих вопросов.
    2. Назовите три уровня трехуровневой' модели приложения и опишите функции каждого из них.
    Пользовательские сервисы — клиентское приложение, в основном реализующее фун1фии графического пользовательского интерфейса (например, Web-обозреватель). Функции подключения к базе данных и обработки данных выполняют сервисы среднего звена. Этот подход ускоряет работу пользователей, но увеличивает сетевой трафик при разнесении компонентов системы по разным компьютерам.
    Компоненты бизнес-логики и данных — компоненты среднего уровня реализуют правила обработки данных и логику приложения. Последняя состоит из алгоритмов бизнес-операций и например, законодательных ограничений. Правила работы с данными предназначены для обеспечения целостности структур данных одной или нескольких БД (например, расположенных на сервере, дабы упростить совместное использование ресурсов). Сервисы среднего уровня применяются и для принудительного обеспечения соблюдения бизнес-правил и правил работы с данными. Поскольку они не “привязаны” к конкретному клиенту, их можно использовать в любых приложениях.
    Сервисы доступа к данным — это уровень доступа к системе управления базой данных. К нему могут обращаться сервисы среднего уровня и, при необходимости пользовательские сервисы. Этот слой не обеспечивает прямого подключения к базе данных — напротив, он состоит из компонентов доступа к данным, призванных облегчить совместное использование ресурсов и конфигурирование клиентов без установки библиотек или драйверов на каждый клиентский компьютер.
    3. Предположим, один из членов правления банка Woodgrove Bank все еще сомневается в необходимости использования Microsoft Transaction Server. Он хочет, чтобы Вы провели на следующем заседании правления банка презентацию, на которой рассказали о преимуществах Microsoft Transaction Server. Он попросил Вас на этой презентации привести пример некорректной транзакции, заканчивающейся отказом. Какой пример Вы приведете?
    В примере важно отразить все компоненты, участвующие в транзакции. Для банковской транзакции подойдет следующий пример.
    Клиент с помощью Web-обозревателя подключается к Web-узлу банка. На этой стадии используются следующие компоненты: клиент, сеть и приемник запросов (в этом качестве выступает соответствующий компонент Microsoft Transaction Server).
    В течение нескольких минут после первого запроса еще 100 пользователей точно также подключаются к Web-узлу банка. Для обработки их запросов Microsoft Transaction Server использует следующие компоненты: приемник и диспетчеры очереди, соединений, контекста и защиты.
    Приемник управляет входящими соединениями. Диспетчер очереди отвечает за очередность обслуживания запросов. Диспетчер соединений отслеживает работу каждого клиента. Диспетчер контекста регистрирует клиентов. Диспетчер защиты предотвращает несанкционированный доступ клиентов к данным и приложениям,
    Пользователь переводит деньги с одного счета на другой, так что операция затрагивает несколько бах данных. Для выполнения транзакции Microsoft Transaction Server привлекает пул потоков, процедуры бизнес-логики, диспетчер конфигурации, диспетчер подключения к БД, компоненты диспетчера синхронизации и собственно данные.
    Пул потоков организует потоки, необходимые для выполнения клиентской операции. Процедуры бизнес-логики выполняют дебитные, кредитные и трансферные функции. Диспетчер синхронизации координирует транзакцию между базами данных. Диспетчер конфигурации управляет потоками пула и другими ресурсами. Диспетчер подключения к БД выполняет необходимые подключения к конкретным базам данных.
    В качестве примера экстренной ситуации возможен следующий: соединения между SQL-серверами разрываются до завершения транзакции. В этом случае диспетчер синхронизации регистрирует незавершенную транзакцию и восстанавливает исходное состояние контекста.


    

        Бизнес в интернете: Сайты - Софт - Языки - Дизайн