UkrReferat.com
найбільша колекція україномовних рефератів

Всього в базі: 75834
останнє поновлення: 2016-11-29
за 7 днів додано 10

Реферати на українській
Реферати на російській
Українські підручники

$ Робота на замовлення
Реклама на сайті
Зворотній зв'язок

 

ПОШУК:   

реферати, курсові, дипломні:

Українські рефератиРусские рефератыКниги
НазваПошук інформації в Інтернет (реферат)
Автор
РозділІнформатика, компютерні науки
ФорматWord Doc
Тип документуРеферат
Продивилось9561
Скачало803
Опис
ЗАКАЧКА
Замовити оригінальну роботу

ілька полів,

невидимих при перегляді документа в браузері, але інформація про які

може бути важливою для користувача. Це коментарі автора до веб-сторінки

(comment), тексти лінків на інші файли (anchor) і власне самі лінки

(link), графіка (і alt-таги (коментарі) до вбудованих зображень),

програми на мовах Java, Javascript і VBScript. Лінки зі сторінки можуть

вказувати не тільки на іншу веб-сторінку чи графічний файл, а, власне

кажучи, на довільний об'єкт, в інформації яким користувач також може

бути зацікавлений. Крім того, мовою HTML передбачено використання

спеціальних полів у документі що створюються для кращої індексації

сторінки пошуковою системою, так званих МЕТА-тагів. Для опису характеру

і змісту розміщеної на сторінці інформації використовуються таги

Description (опис), наприклад: "Офіційна веб-сторінка Верховної Ради

України", і Keywords (ключові слова), наприклад: "Верховна рада,

Парламент, законодавство, закони, політика". В основному тексті

веб-сторінки рекомендується використання спеціальних тагів для виділення

заголовків (header), допускається використання заголовків шести рівнів.

Також важливою для користувача може виявитися інформація про дату

останнього відновлення сторінки, тощо. Ті частини й атрибути

гіпертекстового документа, що враховуються при складанні індексу,

назвемо областю індексації. Крім файлів веб-сторінок можливе

індексування текстових файлів (з розширенням, txt), на які є лінк зі

сторінки. Файли цього типу можуть безпосередньо переглядатися в браузері

і тому на них можливий безпосередній перехід зі сторінки результатів

запиту до пошукової системи.

 

При індексації сторінки спайдер може враховувати всі слова в області

індексації, за винятком так званих стоп-слів (слів, що найчастіше

вживаються: сполучників, прийменників, тощо) тоді така система

називається повнотекстовою (full-text), чи, заради зменшення обсягу

побудованого індексу, враховуються тільки слова, що видаються пошуковому

механізму більш важливими за інші, наприклад часто вживані, чи ті, котрі

стоять у реченні на ключовому місці, створюється начебто "екстракт"

сторінки. Системи другого типу можна назвати абстрактними (abstract).

Усі пошукові системи що розглядаються в даній статті є повнотекстовими і

підтримують стоп-слова.

 

Ще одна особливість побудови індексу зв'язана з великою кількістю

різноманітних кодувань, у яких може бути створений веб-документ. Якщо

символи латинського алфавіту в будь-якій кодовій таблиці стоять на тих

самих місцях, то для кирилиці існує п'ять (важливих для Internet)

кодувань, чотири кодових сторінки для PC і кодова сторінка систем

Macintosh. І тому результатами пошуку за запитом українською чи

російською мовами будуть тільки сторінки в тому кодуванні, у якому

ставився запит, сторінки в інших кодуваннях знайдені не будуть. При

пошуку за допомогою будь-якого західного пошукача, варто пам'ятати про

цю проблему і, при необхідності, робити кілька запитів у різних

кодуваннях. Пошукові системи Апорт!, Rambler, Яndex і Мета коректно

обробляють цю проблему, здійснюючи автоматичне перекодування запиту.

-----> Page:

[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] 10 [11] [12] [13] [14] [15] [16] [17] [18] [19] [20]

ЗАМОВИТИ ОРИГІНАЛЬНУ РОБОТУ