- Класификация на видовете интернет търсачки
- 1- Йерархични търсачи (паяк)
- За да се плъзне
- индексирани
- Изчислете уместността
- Извлечете резултата
- 2- Директории
- 3- Хибридни търсачки
- 4- Двигатели на Metasearch
- Препратки
В класирането на интернет търсачките могат да бъдат разделени в йерархични търсачки, директории, хибридни търсачки и мета търсачки.
Търсачките са софтуерна система, предназначена да намира информация в световната мрежа. Те използват ключови думи, за да търсят документи, свързани с тези думи, и след това класират резултатите в съответствие с темата, която се търси.
Интернет търсачките се стремят да извлекат информация, която потребителят им изисква; това е възможно поради голяма база данни, налична в интернет.
Те са се превърнали в инструмент за ежедневна употреба за намиране на информация. Благодарение на това, в момента е много лесно да намерите информация с търсачки като Google, AOL, Yahoo и Bing.
В интернет има хиляди различни търсачки; всеки от тях има своите различни способности и характеристики.
Първата разработена търсачка се нарича Archie и тя се използва за търсене на FTP файлове; първата текстова търсачка се нарича Вероника.
Потребителите имат достъп до търсачката чрез браузъра на компютър, смартфон, таблет или друго електронно оборудване.
Класификация на видовете интернет търсачки
1- Йерархични търсачи (паяк)
Този тип търсачка използва 'паяк' за търсене на уебсайтове в Интернет. Този паяк влиза в отделни уеб страници, изважда ключови думи и след това добавя страниците в базата данни на интернет търсачката.
Предимствата на този тип търсачки са, че съдържат голям брой страници и че те са лесни за използване. Поради тази причина е много обичайно потребителят да създаде познание с него и да го използва многократно.
От друга страна, недостатъците включват, че тъй като те извличат толкова много данни, е напълно възможно да има твърде много информация.
Повечето от популярните търсачки в Интернет са йерархични като Google, Bing, Yahoo, Baidu и Yandex.
Всички йерархични интернет търсачки използват бот (паяк), за да намерят и индексират ново съдържание в базата данни за търсене.
Има четири основни стъпки, които следва всяка йерархична търсачка, преди да се покаже която и да е уеб страница в резултатите от търсенето:
За да се плъзне
Търсачките обхождат целия Интернет, за да намерят достъпни уеб страници. Това се прави от софтуер, наречен паяк; честотата между свлачищата може да отнеме дни.
индексирани
Процесът на идентифициране на думите и изразите най-добре описва уеб страницата. Идентифицираните думи се наричат ключови думи и страницата се присвоява на идентифицираните думи.
Изчислете уместността
Търсачката сравнява търсения низ в низ за изискване с индексираните страници на базата данни.
Тъй като е по-вероятно повече от една страница да съдържа низ за търсене, търсачката започва да изчислява релевантността на всяка от страниците в своя индекс с низа за търсене.
Има няколко алгоритми за изчисляване на релевантността. Всеки от тези алгоритми има различни относителни тегла за общи фактори, като ключова дума или плътност на връзките.
Ето защо всяка от търсачките дава различни страници с резултати за един и същ низ за търсене.
От време на време търсачките променят своите алгоритми.
Извлечете резултата
По принцип това е просто показване на резултатите в браузъра; безкрайните страници с резултати от търсенето, които са подредени от най-уместни до най-малко важни.
2- Директории
Директориите са търсачки, които зависят от човешките дейности за техните списъци: уеб страница се изпраща в директорията и нейното включване трябва да бъде одобрено от редакционния екип.
Този процес протича по следния начин:
1-Собственикът на уебсайта представя кратко описание на своя сайт в директорията заедно с категорията, в която той трябва да бъде посочен.
2-Подаденият сайт се преглежда ръчно. След това той може да бъде добавен към съответната категория или може да бъде отхвърлен от списъка. По-вероятно е да се добави сайт с добро съдържание, отколкото уеб страница с лошо съдържание.
3-Ключовите думи, въведени в полето за търсене, ще бъдат съпоставени с описанието на уеб страницата. Това означава, че промените, направени в съдържанието на сайта, не се вземат предвид, тъй като има значение само описанието на сайта.
Предимството е, че всяка страница се преглежда за уместност и съдържание, преди да бъде включена. Често пъти с по-малко резултати означава, че това, което трябва, може да бъде намерено по-бързо.
Като се има предвид, форматът и оформлението не са приятелски настроени за повечето хора и те могат да се борят с по-редки търсения. Друг недостатък е, че има забавяне в създаването на уеб страницата и нейното включване в директорията
Някои известни директории включват проекта Open Dictionary, Internet Public Library и наскоро затворения DMOZ.
3- Хибридни търсачки
Тези търсачки използват както йерархични търсачки, така и директории за изброяване на уеб страници в резултатите от търсенето.
Повечето паяк търсачки, като Google, използват основно йерархични търсачки като основен механизъм и ръчен мониторинг като вторичен механизъм.
Понякога на потребителя се дава възможност да търси в мрежата или в директория. В други моменти, потребителят може да получава както резултати, курирани от човека, така и йерархични резултати при едно и също търсене; когато това е така, човешките резултати обикновено са изброени първо.
Google и Yahoo са две от основните търсачки, които попадат в тази категория, въпреки че все повече търсачки мигрират към тази система.
4- Двигатели на Metasearch
Тези интернет търсачки са тези, които търсят едновременно други търсачки и след това комбинират резултатите в един списък.
Предимството е, че се получават повече резултати, но тяхната релевантност и качество могат да страдат значително.
Примери за мета търсачки включват Dogpile, Metacrawler и Clusty.
Препратки
- Какви са различните видове търсачки (2016). Възстановена от webnotes.com
- Търсене в Интернет: видове търсачки. Възстановено от libguides.astate.edu
- Видове търсачки (2008). Възстановена от zeald.com
- Търсачките и нейните видове (2015). Възстановена от слайдшоу.com
- Търсачка (2017). Възстановени от computerhope.com