Kā bloķēt meklētājprogrammas (ar attēliem)

Satura rādītājs:

Kā bloķēt meklētājprogrammas (ar attēliem)
Kā bloķēt meklētājprogrammas (ar attēliem)

Video: Kā bloķēt meklētājprogrammas (ar attēliem)

Video: Kā bloķēt meklētājprogrammas (ar attēliem)
Video: How to Open ODS File OpenDocument in Excel 2021 2024, Maijs
Anonim

Meklētājprogrammas ir aprīkotas ar robotiem, kas pazīstami arī kā zirnekļi vai roboti, kas pārmeklē un indeksē tīmekļa lapas. Ja jūsu vietne vai lapa tiek izstrādāta vai tajā ir sensitīvs saturs, iespējams, vēlēsities bloķēt robotu pārmeklēšanu un vietnes indeksēšanu. Uzziniet, kā bloķēt visas vietnes, lapas un saites, izmantojot robots.txt failus, un bloķēt noteiktas lapas un saites ar html tagiem. Lasiet tālāk, lai uzzinātu, kā bloķēt konkrētu robotu piekļuvi jūsu saturam.

Soļi

1. metode no 2: meklētājprogrammu bloķēšana ar failiem robots.txt

576315 1
576315 1

1. darbība. Izprotiet robots.txt failus

Fails robots.txt ir vienkāršs vai ASCII teksta fails, kas informē meklētājprogrammu zirnekļus, kam viņiem ir atļauts piekļūt jūsu vietnē. Failus un mapes, kas norādītas failā robots.txt, meklētājprogrammu zirnekļi nedrīkst pārmeklēt un indeksēt. Jums var būt nepieciešams fails robots.txt, ja:

  • Jūs vēlaties bloķēt konkrētu saturu no meklētājprogrammu zirnekļiem.
  • Jūs izstrādājat vietni, kas darbojas tiešsaistē, un neesat gatavs meklētājprogrammu zirnekļiem, lai tie pārmeklētu un indeksētu vietni
  • Jūs vēlaties ierobežot piekļuvi cienījamiem robotiem.
576315 2
576315 2

2. darbība. Izveidojiet un saglabājiet failu robots.txt

Lai izveidotu failu, palaidiet vienkārša teksta redaktoru vai koda redaktoru. Saglabājiet failu kā: robots.txt. Faila nosaukumam jābūt maziem.

  • Neaizmirstiet “s”.
  • Saglabājot failu, izvēlieties paplašinājumu “'.txt”'. Ja izmantojat Word, atlasiet opciju “Vienkāršs teksts”.
576315 3 1
576315 3 1

3. solis. Uzrakstiet robots.txt failu, kas ir pilnībā neatļauts

Ir iespējams neļaut ikvienam cienījamam meklētājprogrammas zirneklim pārmeklēt un indeksēt jūsu vietni, izmantojot failu “pilnībā neatļaut” robots.txt. Teksta failā ierakstiet šādas rindas:

    User-agent: * Neatļaut: /

  • Nav ieteicams pilnībā izmantot robots.txt failu. Kad robots, piemēram, Bingbot, lasa šo failu, tas neindeksēs jūsu vietni un meklētājprogramma nerādīs jūsu vietni.
  • Lietotāju aģenti: šis ir vēl viens termins meklētājprogrammu zirnekļiem vai robotiem
  • *: zvaigznīte nozīmē, ka kods attiecas uz visiem lietotāju aģentiem
  • Neatļaut: /: slīpsvītra uz priekšu norāda, ka visa vietne nav atļauta robotiem
576315 4 1
576315 4 1

4. solis. Uzrakstiet nosacītās atļaujas failu robots.txt

Tā vietā, lai bloķētu visus robotus, apsveriet iespēju bloķēt konkrētus zirnekļus no noteiktiem vietnes apgabaliem. Parastās nosacītās atļaušanas komandas ietver:

  • Bloķēt konkrētu robotu: nomainiet zvaigznītes blakus Lietotāja aģents ar googlebot, googlebot-ziņas, googlebot attēls, bingbot, vai teoma.
  • Bloķējiet direktoriju un tā saturu:

    User-agent: * Neatļaut: /sample-directory /

  • Tīmekļa lapas bloķēšana:

    User-agent: * Neatļaut: /private_file.html

  • Attēla bloķēšana:

    User-agent: googlebot-image Neatļaut: /images_mypicture.jpg

  • Bloķēt visus attēlus:

    User-agent: googlebot-image Neatļaut: /

  • Bloķēt noteiktu faila formātu:

    User-agent: * Neatļaut: /p*.gif$

576315 5
576315 5

5. solis. Mudiniet robotus indeksēt un pārmeklēt jūsu vietni

Daudzi cilvēki vēlas sveikt meklētājprogrammu zirnekļus, nevis bloķēt tos, jo vēlas, lai visa viņu vietne tiktu indeksēta. Lai to paveiktu, jums ir trīs iespējas. Pirmkārt, varat atteikties no faila robots.txt izveides-ja robots neatrod failu robots.txt, tas turpinās pārmeklēt un rādīt visu jūsu vietni. Otrkārt, varat izveidot tukšu failu robots.txt-robots atradīs failu robots.txt, atpazīs, ka tas ir tukšs, un turpinās pārmeklēt un indeksēt jūsu vietni. Visbeidzot, varat uzrakstīt failu robots.txt ar pilnu atļauju. Izmantojiet kodu:

    User-agent: * Neatļaut:

  • Kad robots, piemēram, googlebot, lasa šo failu, tas var brīvi apmeklēt visu jūsu vietni.
  • Lietotāju aģenti: šis ir vēl viens termins meklētājprogrammu zirnekļiem vai robotiem
  • *: zvaigznīte nozīmē, ka kods attiecas uz visiem lietotāju aģentiem
  • Neatļaut: tukšā disallow komanda norāda, ka ir pieejami visi faili un mapes
576315 6
576315 6

6. darbība. Saglabājiet txt failu sava domēna saknē

Kad esat uzrakstījis failu robots.txt, saglabājiet izmaiņas. Augšupielādējiet failu savas vietnes saknes direktorijā. Piemēram, ja jūsu domēns ir www.jūsudomēns.com, ievietojiet failu robots.txt vietnē www.jūsudomēns.com/robots.txt.

2. metode no 2: meklētājprogrammu bloķēšana, izmantojot metatagus

576315 7
576315 7

1. solis. Izprotiet HTML robotu metatagus

Robotu metatags ļauj programmētājiem iestatīt parametrus robotiem vai meklētājprogrammu zirnekļiem. Šie tagi tiek izmantoti, lai bloķētu robotu indeksēšanu un pārmeklēšanu visā vietnē vai tikai atsevišķās vietnes daļās. Varat arī izmantot šos tagus, lai bloķētu konkrēta meklētājprogrammas zirnekļa satura indeksēšanu. Šie tagi parādās jūsu HTML faila galvgalī.

Šo metodi parasti izmanto programmētāji, kuriem nav piekļuves vietnes saknes direktorijam

576315 8
576315 8

2. darbība. Bloķējiet robotprogrammatūras no vienas lapas

Ir iespējams bloķēt visus robotus, lai tie indeksētu lapu un nesekotu lapas saitēm. Šo tagu parasti izmanto, kad tiek izstrādāta aktīva vietne. Kad vietne ir pabeigta, ir ļoti ieteicams noņemt šo tagu. Ja nenoņemsiet atzīmi, jūsu lapa netiks indeksēta vai meklēta, izmantojot meklētājprogrammas.

  • Jūs varat bloķēt robotprogrammatūru, lai tā indeksētu lapu un nesekotu nevienai no saitēm:
  • Varat bloķēt visu robotu lapas indeksēšanu:
  • Jūs varat bloķēt visus robotus, sekojot lapas saitēm:
576315 9
576315 9

3. solis. Ļaujiet robotprogrammatūrām indeksēt lapu, bet neievērojiet tās saites

Ja ļausit robotprogrammatūrai indeksēt lapu, lapa tiks indeksēta; ja neļausit zirnekļiem sekot saitēm, saites ceļš no šīs lapas uz citām lapām tiks pārtraukts. Ievietojiet galvenē šādu koda rindu:

576315 10
576315 10

Solis 4. Ļaujiet meklētājprogrammu zirnekļiem sekot saitēm, bet ne indeksēt lapu

Ja ļausit robotprogrammatūrām sekot saitēm, saites ceļš no šīs konkrētās lapas uz citām lapām paliks nepamanīts; ja jūs viņiem ierobežojat lapas indeksēšanu, jūsu tīmekļa lapa netiks parādīta rādītājā. Ievietojiet galvenē šādu koda rindu:

576315 11
576315 11

5. darbība. Bloķējiet vienu izejošo saiti

Lai lapā paslēptu vienu saiti, ieguliet a rel tagu saites tagā. Iespējams, vēlēsities izmantot šo tagu, lai bloķētu saites citās lapās, kas novirza uz konkrēto lapu, kuru vēlaties bloķēt.

    Ievietot saiti uz bloķēto lapu

576315 12
576315 12

6. darbība. Bloķējiet konkrētu meklētājprogrammas zirnekli

Tā vietā, lai bloķētu visus tīmekļa lapas robotus, iespējams, vēlēsities neļaut vienam robotam pārmeklēt un indeksēt lapu. Lai to paveiktu, metatagā “robots” jāaizstāj ar konkrēta robota nosaukumu. Piemēri: googlebot, googlebot-ziņas, googlebot attēls, bingbot, un teoma.

576315 13
576315 13

7. solis. Mudiniet robotus pārmeklēt un indeksēt jūsu lapu

Ja vēlaties nodrošināt, ka jūsu lapa tiks indeksēta un tiks sekotas tās saitēm, varat ievietot sekošanas atļauju meta "robots" atzīmējiet galvenē. Izmantojiet šādu kodu:

Ieteicams: