UkrReferat.com
найбільша колекція україномовних рефератів

Всього в базі: 75834
останнє поновлення: 2016-11-29
за 7 днів додано 10

Реферати на українській
Реферати на російській
Українські підручники

$ Робота на замовлення
Реклама на сайті
Зворотній зв'язок

 

ПОШУК:   

реферати, курсові, дипломні:

Українські рефератиРусские рефератыКниги
НазваПошук інформації в Інтернет (реферат)
Автор
РозділІнформатика, компютерні науки
ФорматWord Doc
Тип документуРеферат
Продивилось9559
Скачало803
Опис
ЗАКАЧКА
Замовити оригінальну роботу

ед обумовимо деякі вихідні

передумови. Допустимо, ми маємо деяке текст-джерело і хочемо знайти в

мережі Інтернет документи схожого змісту. Звідки візьметься таке

текст-джерело? Оскільки саме завдання пошуку не могло б виникнути з

нічого, десь неодмінно повинна існувати інформація, що збудила інтерес

до проблеми. Може бути, це журнальна стаття, книга, веб-сторінка і т.п.

Саме цю інформацію і потрібно упорядкувати і привести у форму, зручну

для аналізу. Якщо завдання існує тільки у вас у голові, спробуйте

написати невеликий твір, виклавши своє бачення проблеми, — воно і стане

текстом-джерелом. Якби нам удалося об’єднати джерело-текст-джерело так

само, як це робить пошукова машина, по ідеї, ми могли б одержати

результати з максимально високої релевантністю. Спробуємо. Візьмемо

текст-джерело і проаналізуємо його.

 

Послідовність дій така:

 

Підбираємо текст-джерело. Якщо чіткий опис проблеми в тексті-джерелі,

тим якісніше і точніше виявиться результат. Розмите і плутане

джерело-текст-джерело видасть з пошукової системи настільки ж безглузді

документи.

 

Видаляємо з тексту стоп-слова (їхній можна просто викреслювати).

 

Обчислюємо частоту входження кожного терміна. При чому робимо це без

обліку морфології слів. Так, слова ship і ships будуть різними

термінами. Не потрібно враховувати і реєстр, усі букви вважаємо

рядковими.

 

Виписуємо на окремий лист терміни в порядку зменшення їхньої частоти

входження (першими повинні йти ті, котрі зустрічаються частіше).

 

Вибираємо діапазон частот. Він повинний лежати де-небудь по середині. Не

потрібно брати занадто часто, чи занадто рідко терміни, що

зустрічаються. Вибір діапазону суб'єктивний. Вам належить орієнтуватися

на конкретний зміст тексту. Необхідність вибирати діапазон вручну не

повинний бентежити, адже тепер ви вибираєте терміни не з тексту, а з

побудованого по визначеному законі упорядкованого списку.

 

З обраного діапазону виписуємо терміни. У великому тексті в діапазоні

може виявитися досить багато слів. Усі їх застосувати навряд чи

вдасться. Досить узяти 10-20 термінів. Їх варто вибирати, керуючись, у

першу чергу, здоровим глуздом. Причому не варто обмежуватися тільки

характерними термінами, навіть якщо вони здаються найбільш вдалими. У

список повинні потрапити і загальні слова (їхній краще вибирати із

середньої частини діапазону).

 

Складаємо запит, розташовуючи відібрані слова в порядку їхнього

проходження в списку термінів. Запит повинний розумітися машиною як

слова, зв'язані логічним оператором АБО . Це дуже важлива вимога. Щоб

результат не спотворився, варто вивчити особливості синтаксису запитів

конкретної пошукової системи.

 

Відправляємо запит пошуковій системі.

 

У відповідь ви можете одержати кілька мільйонів посилань. Але не

лякайтеся. Якщо пошукова машина збирає результати (а це ще одна

необхідна умова), на перших сторінках виявляться практично стопроцентно

релевантні документи. Саме цікаве, що документ — джерело запиту (якщо

його аналог існує в Інтернету) зовсім не обов'язково буде очолювати

список.

-----> Page:

[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] 18 [19] [20]

ЗАМОВИТИ ОРИГІНАЛЬНУ РОБОТУ