Neseniai atliktų tyrimų duomenimis, WWW esančios informacijos kiekis perkopė paieškos serverių indeksuojamos informacijos ribas. Tai gali būti pagrindinė gerai žinomo interneto fenomeno, kad ne visi WWW tinklapiai yra lygiateisiai, priežastis.
Jau vasarį indeksuojamas WWW plotas sudarė 800 milijonų WWW puslapių 2,8 milijonuose WWW serverių - tai sudarė 6 trilijonus baitų tekstinės ir 3 trilijonus baitų grafinės informacijos. Taip teigia NEC analitikai Steve Lawrence ir C. Lee Giles ataskaitoje, publikuotoje antradienį, “Nature” žurnale.
Tai gera naujiena. O dabar blogoji (gal net ir ne naujiena): rasti internete reikalingą informaciją darosi vis sunkiau. Tyrimų duomenimis, net ir geriausi paieškos serveriai aprėpia tik 16% WWW tinklapių. 11 populiariausių WWW paieškos serverių drauge indeksuoja tik 42 % visos informacijos.
Praktinė visų šių duomenų išvada labai paprasta: diduma WWW tinklapių iš viso nėra indeksuoti jokiame paieškos serveryje. Gal todėl "pasaulinė visuomenė", ignoruodama paieškos sistemas elgiasi labai teisingai? O eiliniam WWW tinklapių kūrėjui darosi vis sunkiau "prasimušti" į generuojamus paieškos rezultatų tinklapius. Internetas savo esme lyg ir žada priėjimą prie bet kokios informacijos, tačiau dalis informacijos (netgi didžioji dalis) yra tarsi išmesta už borto.
Lawrence teigimu, kyla informacijos kontrolės klausimas. Nėra jokių įrodymų, kad paieškos sistemos piktnaudžiauja savo valdžia, tačiau jos turi visas sąlygas tai daryti. Pvz., net tinklapio registracija neduoda garantijų, kad tinklapis bus bent jau įtrauktas į duomenų bazę. Dauguma paieškos sistemų riboja indeksuojamų tinklapių iš vieno domeno kiekį. Tai dar viena priežastis (be informacijos paieškos greičio) atsisakyti nemokamų WWW tinklapių serviso paslaugų, nes, pvz., “GeoCities” jau turi 34 milijonus puslapių. Geriau jau įsigyti savo domeninį vardą arba ieškoti "mažesnių sambūrių". Galbūt todėl dauguma žmonių iš viso nesuka galvos ir neregistruoja savo tinklapių.
Be to, tyrimai rodo ir kitus "rasinio persekiojimo" požymius. Tarkime, neamerikietiški tinklapiai indeksuojami rečiau nei amerikietiški, akademinių įstaigų tinklapiai į duomenų bazes papuola rečiau nei komerciniai tinklapiai.
"Paieškos serverių darbe galima įžiūrėti ir dar vieną ryškią tendenciją," - teigia analitikai. "Tinklapiai, į kuriuos nuorodų yra nedaug, indeksuojami rečiau, nei tie, į kuriuos nukreipia daug nuorodų ". Taigi tinklapiai, neturintys nė vienos į juos nukreipiančios nuorodos, greičiausiai bus neindeksuoti. Tai gali sulėtinti ar iš viso sustabdyti aukštos kokybės informacijos plitimą, vien todėl, kad ji nauja ir nežinoma.
|