Описано построение и применение модели отсеивания нерелевантной информации в рамках решения задачи повышения эффективности поиска научно-технической информации в условиях присутствия в выдаче поисковых систем большого количества поискового спама и искусственно раскручиваемых сайтов. Рассмотрены основные группы сайтов, генерирующих поисковый спам. Показана эффективность построенной модели при отсеивании поискового спама.
展开▼