UkrReferat.com
найбільша колекція україномовних рефератів

Всього в базі: 75855
останнє поновлення: 2016-12-09
за 7 днів додано 17

Реферати на українській
Реферати на російській
Українські підручники

$ Робота на замовлення
Реклама на сайті
Зворотній зв'язок

 

ПОШУК:   

реферати, курсові, дипломні:

Українські рефератиРусские рефератыКниги
НазваПошук інформації в Інтернет (реферат)
Автор
РозділІнформатика, компютерні науки
ФорматWord Doc
Тип документуРеферат
Продивилось9657
Скачало813
Опис
ЗАКАЧКА
Замовити оригінальну роботу

сті, але можливі і виключення з цього правила, наприклад,

на AltaVista таке упорядкування не проводиться при використанні

розширеного пошуку тільки по логічному вираженню, без застосування слів

у першій частині запиту.

 

Друге. У Web може існувати кілька копій того самого документу, але або в

різних кодуваннях, або розміщених на різних серверах. Пошукова система

може вважати їхнім або різним документами (що є не досить коректно) або

копією одного документа і видавати, відповідно, або кілька лінків, або

один, із указівкою всіх кодувань і списку адрес. Пошуковий механізм

серверу Яndex, наприклад, при індексації документу підраховує визначене

число-ідентифікатор, що є запорукою унікальності і зберігається в

індексній базі. Якщо це число вже є в базі, вважається, що документ

ідентичний проіндексованому раніше, і замість нового документа в індекс

заноситься інформація про дублювання на веб-сторінці по іншій адресі і,

можливо в іншому кодуванні.[ ] Інформація про кодування сторінки

виходить з аналізу заголовку і вибіркового аналізу тексту, також можливе

використання даних тагу МЕТА HTTP-EQUIV="ContentType"

CONTENT="text/html; charset= windows-1251", де останній запис декларує

кодування сторінки; для кирилиці можливе використання чотирьох кодувань:

windows-1251, DOS-866, KOI-8r, ISO.

 

Визначення релевантності документа.

 

Третє. Вказання "міри релевантності". Це може бути кількість входжень

ключових слів у текст документу, чи ступінь відповідності сторінки в

процентному співвідношенні, Яndex, наприклад, кожному знайденому

документу ставить у відповідність число від 1 до 10. Можлива також

видача повної статистики запиту, що корисно при подальшому пошуку.

Зручним є генерування списку серверів, на яких розміщено найбільше

документів зі знайдених за запитом.

 

Четверте. Опис сторінки. Ним може бути або заголовок сторінки, або текст

із мета-тагу description, чи декілька перших рядків основного тексту

документу, але найбільш зручний для користувача варіант - вивід частини

тексту сторінки, у якому вживаються ключові слова з запиту.

 

П'яте. Використання повнотекстового індексування й обліку позиції

кожного слова в тексті документу дозволяє пошуковим системам Яndex і

Апорт! і МЕТА пропонувати додаткові можливості роботи з результатами

пошуку. Апорт! і МЕТА дозволяють одержати реконструкцію тексту знайдених

документів навіть у випадку їхнього зникнення з мережі (але, звичайно,

без форматування і без вбудованих зображень). А на сервері Яndex

пропонується просто унікальна можливість навігації в знайденому

документі між входженнями ключових слів у текст. Ця опція має назву

"розмітка документа".

 

Alta Vista HotBot Excite Rambler Апорт!

Яndex InfoRes МЕТА

 

Облік різних кодувань

 

н/д

 

 

 

 

 

Відстеження копій документів

 

н/д н/д

 

 

 

 

 

Облік дублікатів документів.

 

Стратегія пошуку, заснована на механізмі аналізу текстів

 

Ми знаємо, як система виділяє ключові слова. Скористаємося цим знанням,

щоб сформувати оптимальний запит. Насамперед обумовимо деякі вихідні

-----> Page:

[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] 17 [18] [19] [20]

ЗАМОВИТИ ОРИГІНАЛЬНУ РОБОТУ