რა არის ვებსაიტის ინდექსირება? როგორ ხდება ეს? ამ და სხვა კითხვებზე პასუხები შეგიძლიათ იპოვოთ სტატიაში. ვებ ინდექსირება (საძიებო სისტემებში ინდექსირება) არის საძიებო სისტემის რობოტის მიერ საიტის შესახებ ინფორმაციის მონაცემთა ბაზაში დამატების პროცესი, რომელიც შემდგომში გამოიყენება ვებ პროექტების შესახებ ინფორმაციის მოსაძიებლად, რომლებმაც გაიარეს ასეთი პროცედურა..
მონაცემები ვებ რესურსების შესახებ ყველაზე ხშირად შეიცავს საკვანძო სიტყვებს, სტატიებს, ბმულებს, დოკუმენტებს. აუდიო, სურათები და ა.შ. ასევე შეიძლება ინდექსირებული იყოს. ცნობილია, რომ საკვანძო სიტყვების აღმოჩენის ალგორითმი დამოკიდებულია საძიებო სისტემაზე.
არსებობს გარკვეული შეზღუდვა ინდექსირებული ინფორმაციის ტიპებზე (flash ფაილები, Javascript).
ინიციაციის მართვა
საიტის ინდექსირება რთული პროცესია. მის სამართავად (მაგალითად, კონკრეტული გვერდის მიმაგრების აკრძალვის მიზნით), თქვენ უნდა გამოიყენოთ robots.txt ფაილი და ისეთი ინსტრუქციები, როგორიცაა Allow, Disallow, Crawl-delay, User-agent და სხვა.
ასევე, ტეგები და რეკვიზიტები გამოიყენება ინდექსაციისთვის, რესურსის შინაარსის დამალვა Google-ისა და Yandex-ის რობოტებისგან (Yahoo იყენებს ტეგს).
Goglle საძიებო სისტემაში ახალი საიტები ინდექსირებულია რამდენიმე დღიდან ერთ კვირამდე, ხოლო Yandex-ში - ერთიდან ოთხ კვირამდე.
გსურთ თქვენი საიტი გამოჩნდეს საძიებო სისტემის შედეგების შეკითხვებში? შემდეგ ის უნდა დამუშავდეს Rambler, Yandex, Google, Yahoo და ა.შ. თქვენ უნდა აცნობოთ საძიებო სისტემებს (ობობებს, სისტემებს) თქვენი ვებსაიტის არსებობის შესახებ და შემდეგ ისინი მთლიანად ან ნაწილობრივ გადაამოწმებენ მას.
ბევრი საიტი არ არის ინდექსირებული წლების განმავლობაში. ინფორმაცია, რომელიც მათზეა, არავის უნახავს მათი მფლობელების გარდა.
დამუშავების მეთოდები
საიტის ინდექსირება შესაძლებელია რამდენიმე გზით:
- პირველი ვარიანტი არის ხელით დამატება. თქვენ უნდა შეიყვანოთ თქვენი საიტის მონაცემები საძიებო სისტემების მიერ შემოთავაზებული სპეციალური ფორმების მეშვეობით.
- მეორე შემთხვევაში, საძიებო სისტემის რობოტი თავად პოულობს თქვენს ვებსაიტს ბმულებით და ახდენს მას ინდექსირებას. მას შეუძლია თქვენი საიტის პოვნა სხვა რესურსების ბმულებით, რომლებიც თქვენს პროექტამდე მიგვიყვანს. ეს მეთოდი ყველაზე ეფექტურია. თუ საძიებო სისტემა ამ გზით პოულობს საიტს, ის მას მნიშვნელოვანად მიიჩნევს.
დროი
საიტის ინდექსირება არც ისე სწრაფია. ვადები ცვალებადია, 1-2 კვირა. ავტორიტეტული რესურსებიდან ბმულები (ჩინებული PR-ით და Titz-ით) საგრძნობლად აჩქარებს საიტის განთავსებას საძიებო სისტემის მონაცემთა ბაზაში. დღეს Google ითვლება ყველაზე ნელა, თუმცა 2012 წლამდე მას შეეძლო ამ საქმის გაკეთება ერთ კვირაში. რომსამწუხაროდ, ყველაფერი ძალიან სწრაფად იცვლება. ცნობილია, რომ Mail.ru დაახლოებით ექვსი თვეა მუშაობს ამ სფეროში არსებულ ვებგვერდებთან.
საიტის ინდექსირება საძიებო სისტემებში ყველა სპეციალისტისთვის შეუძლებელია. საძიებო სისტემების მიერ უკვე დამუშავებული საიტის მონაცემთა ბაზაში ახალი გვერდების დამატების დროზე გავლენას ახდენს მისი შინაარსის განახლების სიხშირე. თუ ახალი ინფორმაცია მუდმივად ჩნდება რესურსზე, სისტემა მიიჩნევს, რომ ის ხშირად განახლებულია და სასარგებლოა ხალხისთვის. ამ შემთხვევაში მისი მუშაობა დაჩქარებულია.
შეგიძლიათ თვალი ადევნოთ ვებსაიტის ინდექსირების პროგრესს ვებმასტერებისთვის სპეციალურ განყოფილებებში ან საძიებო სისტემებში.
ცვლილებები
ასე რომ, ჩვენ უკვე გავარკვიეთ, როგორ ხდება საიტის ინდექსირება. უნდა აღინიშნოს, რომ საძიებო სისტემების მონაცემთა ბაზები ხშირად განახლდება. ამიტომ, მათში დამატებული თქვენი პროექტის გვერდების რაოდენობა შეიძლება შეიცვალოს (შემცირდეს და გაიზარდოს) შემდეგი მიზეზების გამო:
- საძიებო სისტემის სანქციები ვებსაიტის წინააღმდეგ;
- შეცდომების არსებობა საიტზე;
- საძიებო სისტემის ალგორითმის შეცვლა;
- ამაზრზენი ჰოსტინგი (სერვერის მიუწვდომლობა, სადაც პროექტი მდებარეობს) და ასე შემდეგ.
Yandex პასუხები საერთო კითხვებზე
"Yandex" არის საძიებო სისტემა, რომელსაც მრავალი მომხმარებელი იყენებს. იგი მეხუთე ადგილზეა მსოფლიოს საძიებო სისტემებს შორის დამუშავებული კვლევის მოთხოვნების რაოდენობით. თუ თქვენ დაამატეთ საიტი მას, შეიძლება ძალიან დიდი დრო დასჭირდეს მონაცემთა ბაზაში დამატებას.
URL-ის დამატება არ იძლევა გარანტიას მის ინდექსირებაზე. ეს მხოლოდ ერთ-ერთი მეთოდია, რომლითაც სისტემის რობოტს ეუბნებიანახალი რესურსის შესახებ. თუ საიტის ბმული ცოტაა ან საერთოდ არ არის სხვა ვებსაიტებიდან, მისი დამატება დაგეხმარებათ მის უფრო სწრაფად პოვნაში.
თუ ინდექსირება არ მოხდა, თქვენ უნდა შეამოწმოთ, იყო თუ არა სერვერზე რაიმე წარუმატებლობა Yandex რობოტიდან მისთვის აპლიკაციის შექმნის დროს. თუ სერვერი შეატყობინებს შეცდომის შესახებ, რობოტი შეწყვეტს მუშაობას და შეეცდება დაასრულოს ის ორმხრივი მოგზაურობის მიხედვით. Yandex-ის თანამშრომლებს არ შეუძლიათ საძიებო სისტემის მონაცემთა ბაზაში გვერდების დამატების სიჩქარე.
საიტის ინდექსირება Yandex-ში საკმაოდ რთული ამოცანაა. არ იცით როგორ დაამატოთ რესურსი საძიებო სისტემაში? თუ არსებობს მასზე ბმულები სხვა ვებსაიტებიდან, მაშინ არ გჭირდებათ სპეციალური საიტის დამატება - რობოტი ავტომატურად იპოვის მას და ინდექსებს. თუ არ გაქვთ ასეთი ბმულები, შეგიძლიათ გამოიყენოთ "URL-ის დამატება", რათა საძიებო სისტემას უთხრათ საიტის არსებობის შესახებ.
გაითვალისწინეთ, რომ URL-ის დამატება არ იძლევა გარანტიას, რომ თქვენი შექმნა იქნება ინდექსირებული (ან ინდექსირებული).
ბევრს აინტერესებს, რამდენი ხანი სჭირდება საიტის ინდექსირებას Yandex-ში. ამ კომპანიის თანამშრომლები არ იძლევიან გარანტიებს და არ იწინასწარმეტყველებენ პირობებს. როგორც წესი, მას შემდეგ რაც რობოტმა შეიტყო საიტის შესახებ, მისი გვერდები ძიებაში ჩნდება ორ დღეში, ზოგჯერ რამდენიმე კვირაში.
პროცესი
"Yandex" არის საძიებო სისტემა, რომელიც მოითხოვს სიზუსტეს და ყურადღებას. საიტის ინდექსირება შედგება სამი ნაწილისგან:
- მოძებნის რობოტი ათვალიერებს რესურსების გვერდებს.
- კონტენტისაიტის (შინაარსი) ჩაწერილია საძიებო სისტემის მონაცემთა ბაზაში (ინდექსი).
- 2-4 კვირაში, მონაცემთა ბაზის განახლების შემდეგ, შეგიძლიათ ნახოთ შედეგები. თქვენი საიტი გამოჩნდება (ან არა) ძიების შედეგებში.
ინდექსირების შემოწმება
როგორ შევამოწმოთ ვებსაიტის ინდექსირება? ამის გაკეთების სამი გზა არსებობს:
- შეიყვანეთ თქვენი ბიზნესის სახელი საძიებო ზოლში (მაგალითად, "Yandex") და შეამოწმეთ ყველა ბმული პირველ და მეორე გვერდებზე. თუ იქ იპოვით თქვენი გონების URL-ს, მაშინ რობოტმა დაასრულა თავისი დავალება.
- შეგიძლიათ შეიყვანოთ თქვენი ვებსაიტის URL საძიებო ზოლში. თქვენ შეძლებთ ნახოთ, რამდენი ინტერნეტ ფურცელია ნაჩვენები, ანუ ინდექსირებული.
- დარეგისტრირდით ვებმასტერების გვერდებზე Mail.ru, Google, Yandex. მას შემდეგ რაც გაივლით საიტის დადასტურებას, თქვენ შეძლებთ იხილოთ ინდექსირების შედეგები და სხვა საძიებო სისტემები, რომლებიც შექმნილია თქვენი რესურსის მუშაობის გასაუმჯობესებლად.
რატომ იშლება Yandex?
Google-ში საიტის ინდექსირება ხდება შემდეგნაირად: რობოტი მონაცემთა ბაზაში შეაქვს საიტის ყველა გვერდს, უხარისხო და მაღალი ხარისხის, შერჩევის გარეშე. მაგრამ მხოლოდ სასარგებლო დოკუმენტები შედის რეიტინგში. და "Yandex" დაუყოვნებლივ გამორიცხავს ყველა ვებ ნაგავს. მას შეუძლია ნებისმიერი გვერდის ინდექსირება, მაგრამ საძიებო სისტემა საბოლოოდ აღმოფხვრის ყველა ნაგავს.
ორივე სისტემას აქვს დამატებითი ინდექსი. ორივე დაბალი ხარისხის გვერდი გავლენას ახდენს მთლიანად ვებსაიტის რეიტინგზე. აქ მარტივი ფილოსოფია მუშაობს. კონკრეტულის საყვარელი რესურსებიმომხმარებელი დაიკავებს უფრო მაღალ პოზიციებს მის გაცემაში. მაგრამ იმავე ინდივიდს გაუჭირდება ისეთი საიტის პოვნა, რომელიც არ მოეწონა ბოლო დროს.
ამიტომ, უპირველეს ყოვლისა, აუცილებელია ვებ დოკუმენტების ასლების ინდექსაციისგან დაფარვა, ცარიელი გვერდების შემოწმება და დაბალი ხარისხის შინაარსის ინდექსაციის თავიდან აცილება.
გააჩქარეთ Yandex
როგორ შემიძლია დავაჩქარო საიტის ინდექსირება Yandex-ში? მიჰყევით ამ ნაბიჯებს:
- დააინსტალირეთ Yandex ბრაუზერი თქვენს კომპიუტერში და გამოიყენეთ იგი საიტის გვერდების დასათვალიერებლად.
- დაადასტურეთ რესურსის მართვის უფლებები Yandex. Webmaster-ში.
- დააქვეყნეთ სტატიის ბმული Twitter-ზე. ცნობილია, რომ Yandex ამ კომპანიასთან 2012 წლიდან თანამშრომლობს.
- დაამატეთ ძებნა Yandex-იდან საიტისთვის. "ინდექსირების" განყოფილებაში შეგიძლიათ შეიყვანოთ თქვენი საკუთარი URL.
- შეიყვანეთ "Yandex. Metrica" კოდი მონიშვნის გარეშე "ინდექსაციისთვის გვერდების გაგზავნა აკრძალულია".
- შექმენით საიტის რუკა, რომელიც არსებობს მხოლოდ რობოტისთვის და არ ჩანს აუდიტორიისთვის. შემოწმება დაიწყება მასთან. საიტის რუკის მისამართი შეყვანილია robots.txt-ში ან შესაბამისი ფორმით "Webmaster" - "Indexing Settings" - "Sitmap Files".
შუალედური მოქმედებები
რა უნდა გაკეთდეს მანამ, სანამ ვებ გვერდი არ იქნება ინდექსირებული Yandex-ის მიერ? შიდა საძიებო სისტემამ უნდა განიხილოს საიტი, როგორც პირველადი წყარო. ამიტომ სტატიის გამოქვეყნებამდეც აუცილებელია მისი შინაარსის „კონკრეტული ტექსტების“ფორმაში დამატება. წინააღმდეგ შემთხვევაშიპლაგიატისტები დააკოპირებენ ჩანაწერს თავიანთ რესურსზე და პირველები იქნებიან მონაცემთა ბაზაში. შედეგად, ისინი აღიარებულნი იქნებიან ავტორებად.
Google მონაცემთა ბაზა
Google-ისთვის, იგივე რეკომენდაციები, რაც ზემოთ აღვწერეთ, შესაფერისია, მხოლოდ სერვისები იქნება განსხვავებული:
- Google+ (შეცვალა Twitter);
- Google Chrome;
- Google Tools for Programmers - "Scan" - "Look like Googlebot" - ვარიანტი "Scan" - ვარიანტი "Index";
- ძიება Google-ის რესურსში;
- Google Analytics (Yandex. Metrics-ის ნაცვლად).
აკრძალვა
რა არის საიტის ინდექსირების აკრძალვა? თქვენ შეგიძლიათ გადაფაროთ იგი როგორც მთელ გვერდზე, ასევე მის ცალკეულ ნაწილზე (ბმული ან ტექსტის ნაწილი). სინამდვილეში, არსებობს როგორც გლობალური ინდექსირების აკრძალვა, ასევე ადგილობრივი. როგორ ხორციელდება?
მოდით განვიხილოთ Robots.txt-ში საძიებო სისტემის მონაცემთა ბაზაში ვებსაიტის დამატების აკრძალვა. robots.txt ფაილის გამოყენებით, შეგიძლიათ გამორიცხოთ ერთი გვერდის ან მთელი რესურსის სათაურის ინდექსირება, როგორიცაა:
- მომხმარებლის აგენტი:
- აკრძალვა: /kolobok.html
- აკრძალვა: /foto/
პირველი პუნქტი ამბობს, რომ ინსტრუქციები განსაზღვრულია ყველა PS-სთვის, მეორე მიუთითებს იმაზე, რომ kolobok.html ფაილის ინდექსირება აკრძალულია, ხოლო მესამე არ იძლევა საშუალებას დაამატოთ ფოტო საქაღალდის მთლიანი შიგთავსი. მონაცემთა ბაზა. თუ თქვენ გჭირდებათ რამდენიმე გვერდის ან საქაღალდის გამორიცხვა, გთხოვთ, მიუთითოთ ისინი Robots-ში.
კონკრეტული ინტერნეტ ფურცლის ინდექსაციის თავიდან ასაცილებლად, შეგიძლიათ გამოიყენოთ რობოტების მეტათეგი. ის განსხვავდება robots.txt-ისგანის ფაქტი, რომ ის ინსტრუქციებს აძლევს ყველა PS-ს ერთდროულად. ეს მეტა ტეგი მიჰყვება html ფორმატის ზოგად პრინციპებს. ის უნდა განთავსდეს გვერდის სათაურში ტეგებს შორის. აკრძალვის ჩანაწერი, მაგალითად, შეიძლება დაიწეროს ასე:.
Ajax
როგორ ახდენს Yandex-ის ინდექსირებას Ajax საიტები? დღეს Ajax ტექნოლოგიას იყენებს მრავალი ვებ დეველოპერი. რა თქმა უნდა, მას დიდი პოტენციალი აქვს. მასთან ერთად შეგიძლიათ შექმნათ სწრაფი და პროდუქტიული ინტერაქტიული ვებ გვერდები.
თუმცა, საძიებო სისტემის რობოტი "ხედავს" ვებ სიას განსხვავებულად, ვიდრე მომხმარებელი და ბრაუზერი. მაგალითად, ადამიანი უყურებს კომფორტულ ინტერფეისს მოძრავად დატვირთული ინტერნეტ ფურცლებით. მცოცავისთვის, იმავე გვერდის შინაარსი შეიძლება იყოს ცარიელი ან წარმოდგენილი იყოს როგორც დანარჩენი სტატიკური HTML შინაარსი, რომლისთვისაც სკრიპტები არ მუშაობს.
შეგიძლიათ გამოიყენოთ URL -ით Ajax საიტების შესაქმნელად, მაგრამ საძიებო სისტემა არ იყენებს მას. ჩვეულებრივ, URL-ის ნაწილი -ის შემდეგ გამოყოფილია. ეს უნდა იყოს გათვალისწინებული. ამიტომ, URL-ის ნაცვლად, როგორიცაა https://site.ru/example, ის აკეთებს აპლიკაციას https://site.ru-ზე მდებარე რესურსის მთავარ გვერდზე. ეს ნიშნავს, რომ ინტერნეტ ფურცლის შინაარსი შეიძლება არ მოხვდეს მონაცემთა ბაზაში. შედეგად, ის არ გამოჩნდება ძიების შედეგებში.
აიაქსის საიტების ინდექსირების გასაუმჯობესებლად, Yandex-მა მხარი დაუჭირა ცვლილებებს საძიებო რობოტში და ასეთი ვებსაიტების URL-ების დამუშავების წესებს. დღეს ვებმასტერებს შეუძლიათ Yandex-ის საძიებო სისტემას მიუთითონ ინდექსირების აუცილებლობა რესურსის სტრუქტურაში შესაბამისი სქემის შექმნით. ამისთვის გჭირდებათ:
- შეცვალეთ სიმბოლოგვერდების URL-შიზე !. ახლა რობოტი მიხვდება, რომ მას შეუძლია მიმართოს ამ ინტერნეტ ფურცლის შინაარსის HTML ვერსიას.
- ასეთი გვერდის შინაარსის HTML ვერსია უნდა განთავსდეს URL-ზე, სადაც ! შეცვალა ?_escaped_fragment_=.