.

Скільки інформації виробляється у світі? (реферат)

Язык: украинский
Формат: реферат
Тип документа: Word Doc
2 3531
Скачать документ

Реферат на тему:

Скільки інформації виробляється у світі?

Проект “Скільки інформації” (How Much Information) був виконаний
студентами та співробітниками Школи інформаційного менеджменту та
інформаційних систем (School of Informational Management and Systems)
Каліфорнійського університету в Берклі (University of California at
Berkeley) Пітером Ліманом (Peter Lyman) та Хелом Р. Веріаном (Hal R
Varian) за участі Джеймса Дана (James Dunn), Олексія Стригіна (Aleksey
Strygin) та Кірстен Сверінген (Kirsten Swearingen). Головною метою
проекту стало дослідження кількості інформації, яка щороку виробляється
в світі. Крім цього, було досліджено залежність кількості та темпів
росту інформації від типу носія, на якому вона зберігається.

 

Короткий зміст дослідження та його результати

Щороку в світі виробляється від одного до двох ексабайтів (1 ексабайт =
1млрд. гігабайт) унікальної інформації, тобто приблизно по 250 мегабайт
на кожну людину в світі (враховуючи і дітей). При цьому друкована
інформація складає лише 0.003% від цієї суми. Найбільша кількість
інформації припадає на магнітні носії, які до того ж мають найшвидші
темпи росту (загальна ємність жорстких дисків, проданих у світі, за рік
збільшується вдвічі). Схоже на те, що магнітні носії стають
універсальним засобом зберігання інформації.

 

Вступ

Вартість магнітних носіїв інформації швидко спадає; так, на осінь 2000
року 1 гігабайт носія коштував менше 10 доларів, і прогнозують, що до
2005 року ця вартість впаде до 1 долара. Здається, що незабаром кожна
пересічна людина зможе мати віртуальний доступ до всієї інформації, що
тільки є в світі. У зв’язку з цим виникає природнє питання: а скільки ж
інформації всього виробляється в світі? Оскільки ми збираємось зберігати
всю інформацію, скільки ж місця для цього нам потрібно?

 Для визначення відповіді на це питання авторами проекту було проведено
детальне дослідження. Зокрема, була зроблена оцінка оцінка кількості
оригінальної інформації та її копій на найбільш розповсюджених носіях
інформації, що виробляється за рік в США та світі. Крім того, було
оцінено кількість накопиченої в світі інформації у різних форматах. І
нарешті, було проведено спробу оцінити розміри комунікаційних потоків,
тобто інформації, яка циркулює у комунікаціях між людьми і не
зберігається на майбутнє, але, звичайно, могла б.

 

Інформація, що виробляється на носіях

Більшість інформації зберігається на чотирьох основних носіях: папері,
плівці, оптичних (CD та DVD) та магнітних носіях. Існують досить
достовірні дані про річне виробництво кожного типу носіїв у світі, а
також непогані оцінки того, скільки приблизно інформації продукується у
кожному з цих форматів.

Таблиця 1 відображає річне виробництво оригінальної інформації у світі
за даними на 1999 рік. Вища оцінка, подана в таблиці, є досить грубою і
базується на первісних, необроблених даних, у той час як у нижній оцінці
певним чином враховано те, що дані можуть дублюватися та архівуватися.
Припущення, на основі яких було зроблено ці оцінки, і особливості
їхнього обрахування будуть розглянуті дещо пізніше.

 

Таблиця 1: Світове виробництво оригінальної інформації, що зберігається
у цифровому вигляді, у терабайтах за даними 1999 року

 

Тип носія Вид носія Верхня оцінка, Тб/рік Нижня оцінка, Тб/рік Рівень
росту, %

ПАПІР Книги 8 1 2

Газети 25 2 -2

Періодичні видання 12 1 2

Офісні документи 195 19 2

Всього: 240 23 2

ПЛІВКА Фотографії 410 000 41 000 5

Кіноплівка 16 16 3

Рентгенівська плівка 17 200 17 200 2

Всього: 427 216 58 216 4

ОПТИЧНІ НОСІЇ Музичні CD 58 6 3

Комп’ютерні СD 3 3 2

DVD 22 22 100

Всього: 83 31 70

МАГНИТНІ НОСІЇ Касети для відеокамер 300 000 300 000 5

Жорсткі диски персональних комп’ютерів 766 000 7 660 100

Сервери відділів 460 000 161 000 100

Сервери корпорацій 167 000 108 550 100

Всього: 1 693 000 577 210 55

ВСЬОГО:   2 120 539 635 480 50

 

Із зроблених оцінок випливають приголомшуючі факти. По-перше, це
малочисельність друкованої інформації, яка, як виявляється, загалом
складає лише 0.003% кількості всієї інформації у світі. Це зовсім не
означає, що друковані носії віджили себе, як раз навпаки: це лише
означає, що друк – це надзвичайно ефективний засіб зберігання
інформації.

Другий, не менш значний факт – це так звана «демократизація даних».
Надзвичайно великі об’єми унікальної інформації створюються та
зберігаються окремими людьми. Звичайно, більшість вмісту жорстких дисків
персональних комп’ютерів користувачів не є унікальним, що досить сильно
вплинуло на розбіжність між верхньою та нижньою оцінкою кількості
інформації на цих носіях. Тим не менше, в процесі того, як все більше і
більше інформації потрапляє на жорсткі диски персональних користувачів,
кількість оригінальної інформації, що виробляється окремими особами,
значно зростає. Сама ця думка є вражаючою: якщо ще століття тому окрема
людина могла виробити лише незначну кількість інформації, то тепер люди
здатні за короткий проміжок часу виробити гігабайти інформації та при
бажанні представити її всьому світу через Інтернет.

І нарешті, третій цікавий результат – це домінування цифрової
інформації. На долю цифрових носіїв не тільки припадає найбільший обсяг
інформації, але, крім цього, вони мають найшвидші тенденції росту. В той
час, як кількість унікальної інформації, що виробляється на папері та
плівці, залишається на стабільному рівні, продаж оптичних та магнітних
носіїв інформації подвоюється кожного року. Вже сьогодні більшість
текстової інформації, навіть тієї, що потрапляє у друк, з’являється на
світ саме у цифровому вигляді, і цілком ймовірно, що за декілька років
така сама доля очікує і на графічні зображення. Цифрова інформація є
надзвичайно дешевою для копіювання і розповсюдженння, для неї легко
впроваджувати пошук і зручно редагувати. Таким чином, демократизація
данних, особливо у цифровому вигляді, буде зростати і далі.

 

Деякі особливості обрахованих оцінок

 

 Зрозуміло, що всі оцінки, наведені в таблиці 1, є дуже приблизними. Для
того, щоб іх отримати, розробники проекту були вимушені зробити цілу
низку припущень, а до того ж деякі джерела даних просто виявилися
недоступними. Нижче наведені головні методологічні принципи, на основі
яких і були отримані дані таблиці 1:

Дублювання

Відокремити оригінальну інформацію від її копій дуже важко. Наприклад,
газета може одночасно виходити у друкованому вигляді, розміщуватися в
Інтернеті та зберігатися в архівах на мікроплівці. Загалом, як показує
досвід, більшість друкованих матеріалів виробляється та/або архівується
у магнітному вигляді. крім того, дублювання спостерігається і всередині
одного й того ж носія інформації. Так, наприклад, у різних газетах
можуть зустрічатися одні й ті ж самі новини, оповідання або оголошення.
В ідеалі оцінка кількості інформації повинна була б відображати лише
унікальну, неповторну інформацію, але зрозуміло, що підрахувати цю
кількість практично неможливо. Найбільш серйозний вплив має дублювання
цифрової інформації. бо, як було зазначено раніше, лише незначна частка
того, що зберігається на жорстких дисках користувачів персональних
комп’ютерів, дійсно є унікальним. При побудові оцінок автори проекту
намагалися врахувати всі ці факти.

Стиснення даних

На відміну від паперу або плівки, чіткого способу підрахувати кількість
інформації, що міститься на цифрових носіях, поки що не існує.
Наприклад, сторінка тексту, сканована за роздільної здатності 600 точок
на дюйм, може бути легко стиснена до однієї сотої від її початкового
розміру. Розмір кінофільму на DVD може складати лише тисячну частину від
його початкового розміру у цифровому вигляді. Враховуючи всі факти,
автори проекту притримувалися припущення про “середній” ступень
стиснення існуючих даних (мається на увазі середній рівень стиснення між
звичайними нестисненими або слабко стисненими даними та даними, що
зазвичай зберігаються у високостисненому вигляді). Слід зауважити, що
можливість стиснення даних в залежності від вимог користувача надає
цифровим даним ще одну перевагу над аналоговими.

Архівація даних

Чи слід включати до загальної оцінки кількість інформації, що
зберігається у вигляді резервних копій? Це питання постає для оцінки
інформації, що зберігається на мікроплівці, CDROM’ах з можливістю
повторного запису і навіть для друкованих засобів, але найважче за усе
вирішити його для цифрової магнітної плівки. Збереження даних на
магнітній плівці – це найбільш поширений засіб резервування інформації,
що зберігається на жорстких дисках, отже цей процес не повинний
розглядатися як виробництво оригінальної інформації. Правило начебто
каже, що плівка містить в собі в десять разів більше заархівованої
інформації, ніж жорсткі диски. Проте останнім часом це відношення
постійно знижується через те, що все більше і більше даних резервуються
прямо на жорстких дисках, які є набагато зручнішими у використанні. Ось
чому більшість даних про кількість інформації, що зберігається на
магнітній плівці, до розгляду включено не було. Тим не менш, не слід
забувати про те, що велика кількість наукової інформації зберігається
саме у такому вигляді, отже дані про такі репозиторії було включено до
кількості інформації, що зберігається на магнітних носіях.

Виробництво у США та світове виробництво

У США виробляється близько 25 відсотків всієї текстової та близько 30
відсотків графічної інформації у світі, що є досить значним показником.
Відносно магнітних носіїв таких даних немає, але досить очевидно, що в
США виробляється щонайменше 50 відсотків світової продукції такого типу.
В більшості випадків у дослідженні наведені саме світові показники, але
в тих випадках, коли безпосередньо підрахувати світові дані було
неможливо, оцінки буле зроблені саме виходячи з показників виробництва
продукції того чи іншого типу в США. Дані про виробництво інформації у
странах третього світу залишилися практично недоступними.

Рівні росту

0

d

x

c

A

?

O

?

O

O

ae

±??

±??

±??

AВиробництво оригінальної інформації у книгах, на фотографіях та
компакт-дисках залишається практично на стабільному рівні. Вміст
DVD-дисків швидко зростає, але загалом відбувається це через те, що цей
носій інформації є ще досить новим, і на нього переноситься значна
частина вже існуючої в світі інформації. На відміну від цього, продаж
магнітних носіїв інформації дійсно подвоюється кожного року.

 

Телебачення і радіо

Оригінальна інформація, яка щороку виробляється на телебаченні,
зберігається на портативних магнітних відеокасетах, і тому в цьому
дослідженні розглянута

саме як інформація на магнітних носіях. На відміну від цього, більшість
інформації, що передається по радіо – це просто програвання звичайних
компакт-дисків, які вже враховано у відповідній статистиці. В таблиці 3
буде наведено дані про те, скільки місця необхідно для резервування всіх
радіо- та телепрограм, враховуючи деякі припущення про дублювання
інформації.

 

Цифрові комунікації

Дослідження, виконані в ході роботи над проектом, в основному були
пов’язані з інформацією, яка зберігається організаціями або окремими
особами. Але крім цього у світі циркулює велика кількість інформації,
яка використовується у спілкуванні без систематичного її зберігання.
Дещо з цього матеріалу з’являється на світ у цифрових джерелах, як,
наприклад, електронна пошта, Usenet або Web. Інша інформація, така як,
наприклад, телефонні дзвінки бабо звичайні листи, не є цифровою.

Досить ймовірно, що в майбутньому ця інформація підлягатиме
систематичному архівуванню, що, безперечно, буде вимагати носіїв
великого об’єму. В таблиці 2 наведено, скільки місця буде потрібно для
архівування інформації, що використовується основними засобами цифрової
комунікації.

 

Таблиця 2: Світові об’єми унікальної інформації у цифрових
комунікаційних потоках

 Засіб комунікації Терабайти

Email 11 285

Usenet 73

 

У 2000 році мережа World Wide Web містила в собі близько 21 терабайта
статичних html-сторінок і має тенденцію росту в 100 відсотків на рік.
Крім того, багато сторінок генеруються динамічно, з використанням
інформації з різноманітних баз даних, тому насправді ця цифра має бути
набагато більшою.

Хоча соціальний вплив “всесвітньої паутини” є дійсно феноменальним,
кількість інформації, що передається через електронну пошту, перевищує
попередню цифру в 500 разів. Кожного року через електронну пошту
проходить приблизно 610 млрд. листів, в той час як статичних
Web-сторінок нараховується десь всього біля 2.1 млрд. Лише годовий потік
новин в Usenet’і в три рази перевищує вміст інформації у World Wide Web.
Отже, як зазначає один із дослідників, “реальний вбивця – це
спілкування, а не зберігання”.

 

Нецифрові комунікації

В процесі роботи над проектом була також зроблена оцінка того, скільки
місця було б необхідно для того, щоб заархівувати всі нецифрові
комунікаційні потоки в США (на жаль, достовірних даних про світові
комунікації знайдено не було).

 

Таблиця 3. Світові об’єми унікальної інформації у нецифрових
комунікаційних потоках

 

Засіб комунікації Терабайти

Радіо 788

Телебачення 14 150

Телефон 576 000

Листування 150 000

 

Найбільш вражаюча цифра тут – це об’єми телефонних розмов, більшу
частину яких, звичайно ж, становить саме неповторна інформація. І
навпаки, радіо і телебачення в своїй більшості використовують інформацію
повторно.

 

Споживання інформації

Досить цікаво також подивитися на цифри, що відображають споживання
інформації її користувачами. В таблиці 4 наведені порівняльні дані за
1992 та 2000 роки про те, скільки годин на рік було витрачено
споживачами США на той чи інший носій інформації.

 

Таблиця 4. Кількість годин на рік, яку було затрачено споживачами США на
роботу з тим чи іншим носієм інформації та еквівалент кількості цієї
інформації в мегабайтах

Носій Годин у 1992 році Годин у 2000 році Мегабайт у 2000 році Зміна у
відсотках

Телебачення 1510 1571 3 142 000 4

Радіо 1150 1056 57 800 -8

Музичні записи 233 269 13 450 15

Газети 172 154 11 -10

Книжки 100 96 7 -4

Журнали 85 80 6 -6

Домашнє відео 42 55 110 000 30

Відеоігри 19 43 21 150 126

Інтернет 2 43 9 2 050

Всього 3 324 3 380 3 344 783 1.7

 

Найбільш цікаві особливості цієї таблиці:

1)      Кількість годин, витрачена на радіо та телебачення та
стабільність цих даних у часі

2)      Скорочення часу, витраченого на друковані носії інформації

3)      Різке зростання часу, що витрачається на відеоігри, домашнє
відео та Інтернет (в той же час, загальний обсяг цього часу порівняно
невеликий)

Крім того, слід зауважити. що загальна кількість часу, витрачена на
носії інформації, практично не змінилася. Порівнюючи це із швидким
зростанням кількості інформації, що виробляється кожного року, можна
зробити висновок про те, що все менша і менша частка тієї інформації, що
виробляється, дійсно споживається користувачами.

 

Індивідуальна та опублікована інформація

Як вже було сказано, технологічні досягнення призвели до демократизації
даних, тобто до того, що окремі особи можуть власноруч створювати
величезні об’єми інформації. В таблиці 5 наведені дані про річний обсяг
інформації, виготовленої окремими особами або тієї, що стосується
окремих осіб.

 

Таблиця 5. Річний обсяг індивідуальної інформації

Назва Кількість Терабайтів

Фотографії 80 млрд. знімків 410 000

Домашнє відео 1.4 млрд. відеокасет 300 000

Рентгенівські знімки 2 млрд. знімків 17 200

Жорсткі диски 200 млн. встановлених 13 760

Всього:   740 960

Обсяг індивідуальної інформації можна порівняти з обсягом
“опублікованої” інформації, дані про яку наведено в таблиці 6. Неважко
помітити, що об’єм індивідуальної інформації в 600 разів більший.

Не дивлячись на те, що Web, Usenet та електронна пошта містять величезні
обсяги індивідуальної інформації, вони не були включені до жодної з
таблиць, оскільки в даному випадку відокремити індивідуальну інформацію
від публічної дуже важко. Цілком ймовірно, що в майбутньому чіткий
розподіл інформації на індивідуальну та публічну знищиться взагалі.

 

Таблиця 6. Річний випуск опублікованої інформації

Назва Найменувань Терабайтів

Книжки 968 735 8

Газети 22 643 25

Наукові видання 40 000 2

Журнали 80 000 10

Інформаційні підбірки 40 000 2

Офісні документи 7 500 000 000 195

Кінофільми 4 000 16

Музичні CD 90 000 6

Комп’ютерні CD 1 000 3

DVD 5 000 22

Всього:   285

 

Висновок

Річний обсяг виробленої інформації складає по 250 мегабайтів на людину
(враховуючи і дітей). Складається враження, що люди просто тонуть в
океані інформації, тому основна задача людства – навчитися плавати в
цьому океані. Для цього насамперед необхідні краще розуміння інформації
та кращі засоби роботи з нею.

 

Додатки

Степені десяти

Деякі цікаві факти з приводу того, з чим можна порівняти байт, кілобайт
тощо.

Байт (8 біт)

0.1 байт: бінарне значення

1 байт: один символ

10 байт: одне слово

100 байт: телеграма АБО перфокарта

 

Кілобайт (1000 або 103 байт)

1 кілобайт: коротеньке оповідання

2 кілобайти: сторінка тексту, набраного шрифтом типу TrueType

10 кілобайт: сторінка енциклопедії АБО статична Web-сторінка

50 кілобайт: стиснена сторінка відсканованого тексту

100 кілобайт: фотографія з низькою роздільною здатністю

200 кілобайт: коробка перфокарт

500 кілобайт: дуже важка коробка перфокарт

 

Мегабайт (1 000 000 або 106 байт)

1 мегабайт: коротенький роман АБО 3,5-дюймова дискета

2 мегабайти: фотографія з високою роздільною здатністю

5 мегабайтів: всі твори Шекспіра АБО 30 секунд відео, знятого на
телекамеру

10 мегабайт: хвилина музичного запису високої якості АБО цифровий

рентгенівський знімок грудної клітини

20 мегабайт: коробка дискет

50 мегабайт: цифрова маммограма

100 мегабайт: полиця з книжками довжиною 1 м АБО двохтомний

енциклопедичний словник

200 мегабайт: картридж для IBM 3480

500 мегабайт: один CD-ROM АБО жорсткий диск

 

Гігабайт ( 1 000 000 000 або 109 байт)

1 гігабайт: вантажівка, повна паперу АБО музичний запис симфонії у
високій якості АБО один телефільм

2 гігабайти: 20 метрів книжкових полиць

20 гігабайт: музичні записи найвідоміших творів Бетховена АБО
відеокасета у форматі VHS, призначена для запису цифрових даних

50 гігабайт: цілий поверх книжкових полиць

100 гігабайт: цілий поверх наукових журналів АБО велика цифрова касета у
форматі ID-1

500 гігабайт: найбільший у світі FTP-сайт

 

Терабайт ( 1 000 000 000 000 або 1012 байт)

1 терабайт: всі рентгенівські знімки у великій лікарні із сучасним
обладнанням АБО книжки, на виготовлення паперу для яких пішло 50000
дерев

2 терабайти: наукова бібліотека

10 терабайт: бібліотека Конгресу в США

400 терабайт: база даних Національної адміністрації з океану та
атмосфери США (NOAA)

 

Петабайт ( 1 000 000 000 000 000 або 1015 байт)

 

2 петабайти: всі наукові бібліотеки США

8 петабайт: вся інформація, що міститься у Web

20 петабайт: річний випуск жорстких дисків у 1995 році

200 петабайт: весь друкований матеріал у світі АБО випуск цифрової
магнітної плівки у 1995 році

 

Ексабайт ( 1 000 000 000 000 000 000 або 1018 байт)

2 ексабайти: річний обсяг всієї інформації у світі

5 ексабайт: всі слова, коли небудь сказані людьми за всю історію людства

 

Зетабайт ( 1 000 000 000 000 000 000 000 або 1021 байт)

 

Йотабайт ( 1 000 000 000 000 000 000 000 000 або 1024 байт)

 

  

Проект “Скільки інформації” (How Much Information) виконаний студентами
та співробітниками Школи інформаційного менеджменту та інформаційних
систем (School of Informational Management and Systems) Каліфорнійського
університету в Берклі (University of California at Berkeley):

 

http://www.sims.berkeley.edu/how-much-info

e-mail: HYPERLINK “mailto:[email protected]
[email protected]

(2000 р.)

 

Нашли опечатку? Выделите и нажмите CTRL+Enter

Похожие документы
Обсуждение

Ответить

Курсовые, Дипломы, Рефераты на заказ в кратчайшие сроки
Заказать реферат!
UkrReferat.com. Всі права захищені. 2000-2020