UkrReferat.com
найбільша колекція україномовних рефератів

Всього в базі: 75834
останнє поновлення: 2016-11-29
за 7 днів додано 10

Реферати на українській
Реферати на російській
Українські підручники

$ Робота на замовлення
Реклама на сайті
Зворотній зв'язок

 

ПОШУК:   

реферати, курсові, дипломні:

Українські рефератиРусские рефератыКниги
НазваПошук інформації в Інтернет (реферат)
Автор
РозділІнформатика, компютерні науки
ФорматWord Doc
Тип документуРеферат
Продивилось9558
Скачало803
Опис
ЗАКАЧКА
Замовити оригінальну роботу

ок.

 

Зрозуміло, пропонований метод пошуку не можна назвати універсальним.

Далеко не всі пошукові машини покажуть високий результат пошуку при його

застосуванні. Якими ж властивостями повинна володіти пошукова система,

щоб застосування методу було виправдано? Безліч факторів впливають на

результат. Це і загальний обсяг бази даних, і механізм індексації,

структура даних і так далі, тощо. Але найбільш важливими, на мій погляд,

є два уміння пошукової системи: здатність розуміти запити, складені на

різних мовах (для нас — на російському), і могутнє ранжирування

результатів. З російською мовою всі зрозуміло — без неї нам в Інтернеті

не цікаво. Але чому так важливе ранжирування? Ми домовилися вводити

запит з логікою АБО. Це сильно збільшує кількість документів, що

повертаються пошуковою машиною. Без ранжирування всякий пошук утрачає

зміст. Найкращі результати дає ранжирування за схемою: точна

відповідність — усі слова запиту — усі слова, крім останнього, — усі

слова, крім двох останніх, — ... — усі слова, крім останніх, — перше

слово (плюс, зрозуміло, ранжирування по кількості термінів у тексті).

Алгоритм може бути і більш могутнім, але навіть при такій послідовності

ми можемо бути упевнені, що, скільки б документів знайдено ні було,

найбільш удалі виявляться перед.

 

Найкращі результати в пошуку по пропонованому методі продемонструвала

система AltaVista (www.altavista.com). Хоча на тестовий запит система

видала більш 5 мільйонів посилань, для англомовного запиту на перших

трьох сторінках усі посилання виявилися абсолютно релевантними! (Причому

документ-джерело з'явилося тільки на третій сторінці.). Крім AltaVista

дуже гарний результат у пошуку англійською мовою показав HotBoot

(www.hotbot.com). Більш скромні пошукові машини Northern Light, Excite,

Infoseek і інші хоча і виконали завдання, але достатком релевантних

посилань не вразили (можливо, просто через те, що їхньої бази даних не

настільки великі). Для пошуку англійською мовою на перших сторінках

виявилося 40-60% релевантних посилань (утім, не такий й поганий

результат).

 

Надмірне захоплення морфологічною обробкою слів може позбавити пошук

гнучкості. На мій погляд, саме цим грішать деякі російські пошукові

системи. Не можна не погодитися, що зручно ввести в поле запиту фразу

природною мовою й одержати список документів, що (на думку пошукової

машини) цьому запиту задовольняють. Такий пошук дає непоганий результат

у середньому. Однак будь-яке відхилення убік від затвердженої схеми може

різко знизити ефективність пошуку. Усі ці розуміння спочатку викликали

серйозні сумніви в застосовності методу на вітчизняних пошукових

серверах. Що ж вийшло в реальності?

 

У цілому побоювання підтвердилися. Для системи "Апорт!" обрана методика

виявилася цілком далека. Rambler представив гарні результати тільки

після того, як логіка запиту була змінена на чи. На першій сторінці всі

документи, як для російського, так і англійського пошуку, виявилися

цілком релевантними. На жаль, логіка АБО неминуче веде до утрати вагомої

-----> Page:

[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] 19 [20]

ЗАМОВИТИ ОРИГІНАЛЬНУ РОБОТУ