Бранислав Бубања, "PC"01.02.2001.Страни претраживачи су добри, али домаћи сегмент Интернета захтева додатне услуге. Зато смо испробали могућности сајтова концентрисаних на индексирање YU Wеb-а.
Претраживачи Интернета (или, како их многи зову, „машине за претраживање") су сајтови који индексирају садржај Wеb страна и омогућавају да, постављањем правог упита, добијемо тачну адресу, или чешће адресе, на којима ћемо пронаћи жељене податке. О њиховом значају говори и статистика посећености Интернет сајтова: већ дуже време најпосећенији сајт света је Yаhоо! (невероватних 60 милиона посета месечно). У првих педесет сајтова по посећености налази се још неколико машина за претраживање, као што су Altavista (са око 11 милиона посета) или Google (око пет милиона посета за месец дана).
И код нас је ситуација слична. Број домена је, наравно, много мањи, али сасвим довољан да је без претраживача врло тешко пронаћи неки податак. Конкретно, регистровано је око 7,400 домена са суфиксом YU, од чега је трећина неактивна. Нажалост, страни претраживачи се не сналазе добро са YU словима, па ће упити који их садрже остати без релевантних резултата. Зато у нашим условима велику улогу у претраживању Интернета могу да остваре домаћи претраживачи.
Како смо тестирали
Пронашли смо девет активних домаћих машина за претраживање Интернета и детаљно смо их тестирали. С обзиром на специфичне захтеве корисника (првенствено због слова која не постоје у другим језицима), направили смо посебан алгоритам за тестирање. Свакој од тестираних машина за претраживање поставили смо десет упита, обраћајући пажњу на низ параметара. Пре свега, као упит смо постављали речи за које смо сигурни да се појављују у великом броју домаћих страница. Затим смо постављали упите са речима које сматрамо релативно ретким, рецимо "котур" и "лопата". Циљ постављања ових упита је био да утврдимо начин индексирања сајтова на машинама за претраживање. Наиме, ако се индексирање врши помоћу кључних речи задатих у заглављу странице, онда ће се као кључна реч сигурно користити „Интернет", али тешко да ће неко ставити израз „котур". Ако је нека машина за претраживање пронашла и такве речи, она индексира комплетан садржаја странице, што је много боља варијанта.
Следећи низ упита обухватао је речи са YU словима. Пошто се ради о домаћим сајтовима, веома је битно да претраживач дозвољава постављање упита (и проналажење резултата) који у себи садрже наша слова. Чак је, чини нам се, много битније ако се пронађе мали број резултата (при упиту са нашим словима) него да се појави велики број резултата, а да претраживач не даје могућност тражења израза са нашим словима. У таквом случају нам домаћа машина за претраживање није ни потребна - тај посао ће много боље обавити Yаhоо! или Altavista. Нажалост, добар део претраживача пао је на овом тесту - само четири од девет претраживача успели су да пронађу сајтове на основу упита у којима су се појављивала наша слова.
Yugoslavia Infomap
Овај претраживач се може похвалити најкраћом Web адресом www.yu. Насловна страница није превише оптерећена и сасвим је прегледна. Сајт је реализован на енглеском језику, а од корисних информација ту се налазе текући датум и време (стандардно време и недавно установљено Интернет време). Од додатних садржаја могли бисмо да наведемо могућност слања електронских честитки, преглед Web камера, слање mail-а на/аx, Web е-mail...
Постављањем упита и преко броја добијених резултата закључили смо да овај претраживач индексира сајтове преко кључних речи. Није омогућено напредно претраживање. Поред сваког пронађеног линка дате су додатне информације о страници (да ли на њој има Јаvа аплета, фрејмова, формулара...). На основу упита који су садржали наша слова, www.yu је успео да пронађе само три сајта која садрже реч "рачунар". Зато се претраживач може користити пре свега за постављање упита који садрже честе термине, али није погодан ако вам затреба специфична реч.
Југословенска Интернет архива
На адреси www.map.co.yu налази се Југословенска Интернет архива. Сајт је на српском језику и на почетној страни има линкове издвојене по категоријама. Садржи и линкове ка страницама са важним информацијама као што су локације и телефони јавних комуналних предузећа, здравствених установа, хуманитарних организација, средстава информисања итд; издвојена је секција која се бави рачунарским новостима. Дизајн сајта је једноставан и корисници се лако сналазе, чак и када га први пут посете. Резултати претраживања се исписују у групама од по 20 линкова на страници.
Број пронађених страница на овом претраживачу је био врло мали, али је он успео да лоцира неколико сајтова на један упит који је у себи садржао наша слова. Овај претраживач такође користи индексирање страница само преко кључних речи, с тим што је број пронађених страница мањи него у случају Yugoslavia Infomap-a. Ни Југословенска Интернет архива не дозвољава напредно претраживање.
| интернет | секс | чекић | рачунар | котур | лопата | Yugoslavia Infomap | 224 | 36 | 0 | 3 | 0 | 0 | Југословенска Интернет Архива | 173 | 13 | 0 | 2 | 0 | 0 | Montenegro Search Engine | 199 | 23 | 0 | 5 | 0 | 0 | Шерлок | 10000* | 1158 | 0 | 0 | 43 | 74 | Yuhoo * | 2/339 | 0/34 | 0/0 | 0/1 | 0/0 | 0/0 | YU Search | 1419 | 6 | 0 | 0 | 4 | 0 | Yu Web Adresar | 303 | 7 | 0 | 0 | 0 | 0 | Интернет Навигатор | 276 | 8 | 0 | 0 | 0 | 1 | Интернет Крстарица ** | 18/246/500+ | 0/54/500+ | 0/0/18 | 0/96/500+ | 0/0/23 | 47 | |
* број пронађених категорија и страница
** број пронађених категорија, сајтова и страница
Montenegro Search Engine
Први црногорски сајт за претраживање Интернета налази се на адреси www.mse.cg.yu. Сајт је реализован на српском језику. Насловна страна се одликује једноставним дизајном и све опције се налазе надохват руке. И овај претраживач је заснован на принципу каталога: прикупљени сајтови су разврстани у осам категорија, којима се може приступити директно или задавањем упита.
Сајтови се индексирају по кључним речима, а број пронађених страница је негде између резултата које су постигла претходна два претраживача. Montenegro Search Engine се боље сналази са нашим словима, тако да је од четири упита у којима се она појављују пронашао резултате за два упита.
Шерлок
Један од најпознатијих домаћих претраживача заслужује да га детаљније опишемо. На www.pretrazivac.com наћи ћете мета-претраживач који на насловној страници нуди обиље садржаја и најновије вести. Ово је једини претраживач који омогућава да се по једном домену прикаже само један резултат (нисмо користили ту опцију, јер нам је циљ био да видимо колико страница може да пронађе). Додатне опције су могућност прегледа упита које су постављали други корисници, приказ најновијих додатих линкова, претраживач слика и места за забаву по градовима...
У каталогу претраживача налази се око 3600 линкова, а он приказује десет пронађених линкова по страници. Уз основне садржаје о сајту, виде се и информације о серверу на коме се налази пронађена страница, уз могућност прегледа сличних сајтова, приказа резултата само са текућег домена (или искључивање тог домена из приказа), као и информације Alexa сервиса за праћење промета на датом домену.
Приликом постављања упита, претраживач је дао највећи број резултата, мада треба нагласити да он индексира и странице које нису везане за Југославију, па зато нисмо могли да одредимо тачан број резултата који се односе само на нашу земљу. Индексирање се не врши само преко кључних речи - "робота" индексира читав садржај странице. На сајту постоје енглеско-српски и српско-енглески речник са 70,000 речи.
Шерлок омогућава напредно претраживање, али му озбиљно недостаје опција за претраживање речи са YU словима. Да нема тог проблема, Шерлок би без проблема могао да истакне своју кандидатуру за најбољи YU претраживач.
YU Directory Guide
У оквиру популарног сајта SerbianCafe (www.serbiancafe.com) постоји и претраживач који носи назив Yuhoo, што је очита асоцијација на Yahoo. Сервис је индексирао око 2,500 домаћих сајтова, а сам претраживач је на адреси www.serbiancafe.com/yuhoo. Насловна страница је веома једноставна и на њој се налази само формулар за постављање упита и категорије у којима су смештени индексирани сајтови.
Претраживач је прилично посећен, мада на нашем тесту није добио високу оцену. Yuhoo је преузео логику приказивања резултата коју користи Yahoo, тако да прво приказује категорије у којима се налазе пронађене речи, а након тога саме линкове. Овај начин рада је користан јер ће у највећем броју случајева на првој страници бити приказани линкови који садрже управо информације које тражите, наравно под условом да сте добро поставили упит. Yuhoo не омогућава напредно претраживање и није нашао ниједан резултат код упита који садрже наша слова.
YU Search
Најстарија машина за претраживање југословенског Интернета постоји од септембра 1996. године. Сајт је реализован двојезички, на адреси www.yusearch.com/start.html. Насловна страница је добро организована, са јасно издвојеним целинама. Ово је једини домаћи претраживач који дозвољава и претрагу е-mail адреса.
Сајтови су разврстани по категоријама, дата је ранг-листа најпосећенијих сајтова до којих се стигло преко ове машине за претраживање, омогућено је постављање сајта на YUSearch сервер... На основу броја пронађених резултата закључили смо да претраживач индексира како кључне речи теко и остатак садржаја странице. Највећи недостатак му је што не проналази резултате ако се у упиту појаве наша слова.
YU Web Adresar
YU Web Adresar се налази на страници www.beocity.com. Сајт је реализован на српском језику, а почетна страница је помало претрпана садржајем. Зато се читава страница релативно споро учитава. Претраживач комбинује два основна система рада: преглед категорија и индексирање по кључним речима. Број пронађених резултата креће се у нивоу осталих претраживача који користе систем индексирања преко кључних речи, а највећи недостатак је што ни он не проналази резултате са нашим словима.
Интернет Навигатор
Интернет Навигатор је једноставан и прегледан претраживач који се налази на адреси www.navigator.co.yu. Реализован је на енглеском језику и, попут осталих претраживача, поседује категорије у којима су подељени линкови. Сајтови су сортирани у 14 категорија, а са почетне странице се може приступити најпосећенијим југословенским сајтовима.
По броју и структури пронађених резултата и овде закључујемо да се врши претрага линкова који се налазе у категоријама, али да се странице комплетно индексирају (ово је један од само три претраживача који су пронашли реч "лопата"). Нажалост, ни он се не сналази ако у упиту постоје YU слова.
Интернет Крстарица
Интернет Крстарица је прави југословенски Web портал (место одакле можете започети своје свакодневне активности на Интернету) па заслужује да га детаљније опишемо. Прошлу годину Крстарица је завршила са 1.8 милиона приступа месечно, што значи да је код корисника Интернета већ веома популарна.
На насловној страни (www.krstarica.com) приказани су разноразни садржаји, али су они добро и прегледно организовани. Крстарица може да се прегледа на српском или енглеском језику, а посебна посластица је ћирилична верзија. Из садржаја овог сајта можемо издвојити линкове ка вестима, ТВ програм, временску прогнозу, хороскоп, библиотеку софтвера, магазин (са десетинама тема које се свакодневно ажурирају), речник...
Претрага података је направљена у Yahoo! стилу. Крстарица поседује каталог сајтова по категоријама (око 5,000 домена). Машина за претраживање има и јединствен приказ резултата који се одвија на три нивоа: најпре се претражују категорије, затим сајтови и на крају појединачне странице. Тако се, ако је веровати искуствима претраживача Yahoo!, постижу најбољи резултати.
Приликом постављања упита корисник може да бира између претраге домаћег Интернета, страница које се налазе ван YU домена, слика и MP3 фајлова. Ово је једини претраживач који је пронашао резултате за све упите које смо поставили. Чак се није збунио ни са речима "чекић" и "Ђурдевдан" које су за остале претраживаче биле фаталне.
Без обзира на то да ли сте поставили упит на ћирилици или латиници, Крстарица ће извршити конверзију текста и приказаће резултате који не зависе од писма коришћеног на сајту. Крстарица прави још једну интерну конверзију: ако као упит унесете реч "цацак", Крстарица ће као резултат приказати сајтове које у себи имају како ту реч, тако и реч „Цачак". На Крстарици би ускоро требало да заживи потпуно нови алгоритам претраживања који ће дозвољавати унос упита у облику фраза и коришћење Булових израза, чиме ће претраживање YU Интернета бити додатно олакшано.
Закључак
Пошто смо тестирали све тренутно активне машине за претраживање домаћег Интернета, покушали смо да на неки начин извршимо и њихово рангирање. При томе смо водили рачуна о неколико приоритета. Сматрамо да је најбитније да за сваки постављени упит добијемо корисне резултате.
Неприкосновени победник теста је Интернет Крстарица - једина је успела да пронађе резултате за све постављене упите, једина проверава ћириличне сајтове и једина резултате приказује у виду пронађених категорија, сајтова и страница. На другом месту је Monte-negro Search Engine који се додуше не може похвалити великим бројем пронађених страница, али је од 12 упита пронашао резултате за њих осам, од чега су два са нашим словима. Треће место заслужио је Yugoslavia Infomap, који је имао нешто више пронађених сајтова за сваки резултат, али је приказао резултате само за седам упита.
Шерлок (односно Претраживач) је пронашао највећи број резултата за сваки од упита где је уопште приказао резултат (осам од 12), али није успео да пронађе ниједан резултат са нашим словима. Одмах иза њега у овој групи је Yu Search са завидним бројем резултата али са седам пронађених упита. Седам упита је пронашао и Интернет Навигатор, док су на зачељу остали Yuhoo и Yu Web Adresar, са по шест пронађених упита.