5 октября, вторник, 14:00, к.430

С.Капулкин (АУ)

DIR - Distributed Information Retrieval

В общем виде проблема распределенного поиска ставится следующим образом.
Есть несколько (возможно различных) поисковых систем, каждая из которых
ведет поиск в своей коллекции документов. Коллекции могут пересекаться.
Задача поиска - перенаправить поисковый запрос этим системам и корректно
обработать полученные результаты.

В интернете далеко не все документы на сайтах могут быть легко найдены и
проиндексированы. Многие сайты не дают прямого доступа к списку своих
документов и самим документам. Взамен предоставляется внутренняя поисковая
система сайта, к которой можно делать слепые запросы. Такая ситуация
является одним из примеров возникновения задачи распределенного поиска.

В данной лекции будут рассмотрены методы оценочной индексации подобных
сайтов и принципы, по которым строится распределенный поиск.