5 октября, вторник, 14:00, к.430
С.Капулкин (АУ)
DIR - Distributed Information Retrieval
В общем виде проблема распределенного поиска ставится следующим образом.
Есть несколько (возможно различных) поисковых систем, каждая из которых
ведет поиск в своей коллекции документов. Коллекции могут пересекаться.
Задача поиска - перенаправить поисковый запрос этим системам и корректно
обработать полученные результаты.
В интернете далеко не все документы на сайтах могут быть легко найдены и
проиндексированы. Многие сайты не дают прямого доступа к списку своих
документов и самим документам. Взамен предоставляется внутренняя поисковая
система сайта, к которой можно делать слепые запросы. Такая ситуация
является одним из примеров возникновения задачи распределенного поиска.
В данной лекции будут рассмотрены методы оценочной индексации подобных
сайтов и принципы, по которым строится распределенный поиск.