ПОИСК ИНФОРМАЦИИ • Большая российская энциклопедия

Поиск информации. Поисковые системы

Код ОГЭ по информатике:  Компьютерные энциклопедии и справочники; информация в компьютерных сетях, некомпьютерных источниках информации. Компьютерные и некомпьютерные каталоги, поисковые машины, формулирование запросов

Поиск информации (информационный поиск) — это информационный процесс, цель которого — получение информации из информационного объекта или из хранилища информационных объектов. Поиск информации является разновидностью процесса обработки информации. Для ускорения информационного поиска создают и используют информационно-поисковые системы.

Информационно-поисковая система (ИПС) — система, выполняющая функции хранения больших объёмов информации, быстрого поиска требуемой информации и её вывода в удобном для человека виде.

Видео

Виды поиска

Полнотекстовый поиск — поиск по всему содержимому документа. Пример полнотекстового поиска — любой интернет-поисковик, например , www.google.com. Как правило, полнотекстовый поиск для ускорения поиска использует предварительно построенные индексы. Наиболее распространенной технологией для индексов полнотекстового поиска являются инвертированные индексы.

Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе (например, MS Windows).

Поиск по изображению — поиск по содержанию изображения. Поисковая система распознает содержание фотографии (загружена пользователем или добавлен URL изображения). В результатах поиска пользователь получает похожие изображения. Так работают поисковые системы:

  • Xcavator
  • Retrievr
  • PolarRose
  • Picollator Online by Recogmission

Как искать в Интернете информацию через Google

В браузере Гугл вы так же легко найдете информацию. Запускаете его на компьютере и в поиске пишете запрос, например, фильмы (рисунок 5).

Будут допущены варианты запросов. Выбираете любой

Будут допущены варианты запросов. Выбираете любой из них и продолжаете поиск (рисунок 6).

Первые сайты показывают те фильмы, которые мы може

Первые сайты показывают те фильмы, которые мы можем использовать для просмотра. Если хотите найти конкретное кино, то пишите со словом «фильм» название фильма. После этого нажмите «Enter» на клавиатуре, чтобы Гугл быстро нашел данные. Поиск видео, картинок или музыки осуществляется по аналогии с браузером Яндекс.

Задачи информационного поиска

Центральная задача ИП — помочь пользователю удовлетворить его информационную потребность. Так как описать информационные потребности пользователя технически непросто, они формулируются как некоторый запрос, представляющий из себя набор ключевых слов, характеризующий то, что ищет пользователь.

Классическая задача ИП, с которой началось развитие этой области, — это поиск документов, удовлетворяющих запросу, в рамках некоторой статической коллекции документов. Но список задач ИП постоянно расширяется и теперь включает:

  • Вопросы моделирования;
  • Классификация документов;
  • Фильтрация документов;
  • Кластеризация документов;
  • Проектирование архитектур поисковых систем и пользовательских интерфейсов
  • Извлечение информации, в частности аннотирования и реферирования документов;
  • Языки запросов и др.

Релева́нтность (англ. relevant) — применительно к результатам работы поисковой системы и экспертной системы — степень соответствия запроса и найденного, то есть уместность результата. В более общем смысле, одно из наиболее близких понятию качества «релевантности» — «адекватность», то есть оценка степени соответствия, но и степени практической применимости результата, а также степени социальной применимости варианта решения задачи.

Пертине́нтность (англ. pertinent) — cоотношение объёма полезной информации к общему объёму полученной информации. Коротко — это пользосоответствие может быть выражено в виде процента наподобие КПД (коэффициент полезного действия).

Пертине́нтность (англ. pertinent) — соответствие найденных информационно-поисковой системой документов информационным потребностям пользователя

Теги