Решение задачи качественного поиска информации на основе представленных подходов приближает поисковую платформу Retrieval-Ware компании Convera к получению результатов, которые можно ожидать от идеальной семантической индексации и поиска документов, при работе которой происходит следующее. В процессе индексирования: получение массива документов; автоматизированное определение семантических значений лексических единиц в документах и устранение полисемии; при необходимости устранение полисемии экспертами; создание инвертированного индекса семантических значений. В процесее выполнения запроса: ввод запроса пользователем; автоматизированное "определение семантических значений лексических единиц, введенных в запрос, и устранение полисемии; при необходимости: устранение полисемии пользователем; выполнение поиска соответствующих семантических значений в индексах; качественное сравнение найденных семантических значений в документах; сортировка найденных документов на основе семантической близости между документами и запросом пользователя. В соответствии с описанными принципами, а именно: совмещение лингвистического и статистического подходов, учет особенностей терминологии предметной области, адаптация этой терминологии к массиву документов клиента, разработка и применение стратегии поиска, ее оптимизация в соответствии с информационными потребностями клиента и его массивом документов, интеллектуальный анализ запросов - все это обеспечивает системе RetrievalWare компании Convera дальнейшее продвижение по пути к достижению заветной цели - осмысленному поиску и извлечению знаний.
展开▼