Ինտերնետում պահվող տեղեկատվության քանակն ահռելի է: Այս տվյալների մեջ անհնար է ձեռքով ինչ-որ բան գտնել: Որոնիչներին կոչ է արվում ավտոմատացնել գործընթացը: Դրանք հաշվողական համակարգեր են, որոնք կազմակերպում են տվյալները և որոնում են հարցումների միջոցով:
Հրահանգներ
Քայլ 1
Որոնիչների սերվերներում անընդհատ գործում են բոտեր կոչվող ծրագրեր: Bot- ը կարճ է ռոբոտի համար: Նրանք իրենց պահվածքով իսկապես հիշեցնում են ռոբոտներ: Պարբերաբար այցելելով յուրաքանչյուր կայք սերվերում պահվող ցուցակից, նրանք բերում են բոլոր տեքստերի տեղական օրինակները համահունչ նույն էջերի նույն տեքստերի ընթացիկ տարբերակներին: Բոտերը հետևում են իրենց հանդիպած բոլոր հղումներին, և եթե գտնում են նորաստեղծ էջ, այն ավելացնում են ցուցակում և ստեղծում նաև տեղական օրինակ: Պատճենները չեն տեղադրվում ինտերնետում. Դրանք միայն կայքերի ցուցակ ստանալու գործընթացի բաղկացուցիչ մասն են: Սա նշանակում է, որ հեղինակային իրավունքի խախտում տեղի չի ունենում:
Քայլ 2
Փորձեք միևնույն արտահայտությունը մի քանի անգամ մուտքագրել նույն որոնիչի մեջ: Դուք կտեսնեք, որ արդյունքներն ամեն անգամ շարվում են նույն հերթականությամբ: Այն հազվադեպ է փոխվում, ոչ ավելի հաճախ, քան օրը մեկ անգամ: Սրա պատճառը պարզ է. Որոնման արդյունքների կարգը որոշվում է բավականին բարդ ալգորիթմով: Հաշվարկը հաշվի է առնում էջերում որոշակի բառերի օգտագործման հաճախականությունը, այլ կայքերում տեղակայված այս էջի հղումների քանակը, ինչպես նաև մի շարք այլ գործոններ:
Քայլ 3
Վեբ կայքերի սեփականատերերը, ձգտելով իրենց ռեսուրսները բերել այս ցուցակի վերևում, օպտիմալացնում են դրանց վրա տեղադրված տեքստերը: Այս օպտիմալացումը կարող է լինել «սպիտակ» - ուղղակիորեն թույլատրվում է «որոնիչների» կանոններով, «մոխրագույն» - չի թույլատրվում, բայց չի արգելվում, ինչպես նաև «սև» ՝ ուղղակիորեն արգելվում է: Վերջին դեպքում կայքը շուտով կարող է ընդմիշտ անհետանալ ցուցակից: Օպտիմալացման ալգորիթմները հաճախ ավելի բարդ են, քան որոնման արդյունքների տեսակավորման ալգորիթմները:
Քայլ 4
Հիմնաբառը կամ արտահայտությունը մուտքագրելուց հետո սերվերի ծրագիրը որոնում է համապատասխանություններ տեքստերի բոլոր տեղական օրինակներում: Դրանից հետո արդյունքները տեսակավորվում են ՝ օգտագործելով վերը նշված բարդ ալգորիթմը: Դրանից հետո բովանդակության կառավարման համակարգը ավտոմատ կերպով առաջացնում է էջ, որը փոխանցվում է զննարկչին: Օգտատիրոջ խնդրանքով կարող են առաջադրվել ցուցակի հետևյալ էջերը. Երկրորդ, երրորդ և այլն: