Hakukoneiden työ

Monet aloittelevat verkkovastaavat ja vain internetin surffaajien fanit koskevat kysymystä: miten hakukoneet toimivat? Hakukoneiden perusperiaatteet tänään harkitsee neuvostoa.
Nykyaikainen hakukone on kokonaisuus, joka koostuu monimutkaisimmista ohjelmista ja algoritmeista, jotka toimivat hämmästyttävän nopeasti. Kuvittele, uusi hakualgoritmia Googlen kofeiini pystyy käsittelemään 3 km: n A4-arkkia vastaavia tietoja vain 1 sekunnissa!
Kaikissa hakukoneissa ohjelmistokomponentit voidaan jakaa viiteen pääryhmään:
- "Spiders"
- "Matkalla hämähäkit"
- indeksoijia
- tietokanta
- tulosjärjestelmät
ohjelmat hämähäkki - hämähäkit (hämähäkit) - työnsä algoritmilla muistuttavat selaimia, mutta niillä ei ole näkyviä komponentteja. Hämähäkki lataa sivun html-koodin käyttäen http-protokollia.
Robottipyyntö palvelimelle sisältää komennon"Hae / polku / asiakirja" ja jotkut muut http-pyyntökomennot. Tähän pyyntöön hämähäkki vastaanottaa palvelimelta vastauksen tekstivirraksi, joka sisältää palvelutietoja asiakirjasta ja itse asiakirjasta. Hämähäkki on osa hakukoneiden indeksointimoduulia.
"Matkustaminen Spider" - indeksointi - on toinen komponenttiindeksointimoduuli. Crawler siirtyy automaattisesti kaikkiin hämähäkkiin löydettyihin hyperlinkkeihin ja etsii näin asiakirjoja, joita hakija ei vielä tunne.
Robot indeksointitoiminnon (indeksoija) toimii suoraan hämähäkinrobottien lataamien sivujen sisällön kanssa. Indeksoija suorittaa sivujen morfologisen, leikkauksellisen analyysin ja jakaa ne erillisiin osiin.
tietokannat (tietokanta) ovat erityinen ohjelmisto, joka on suunniteltu kerättämän ja indeksoidun indeksoidun asiakirjan tallentamiseen.
Hakukoneen tulossyöttö - tulosten myöntämisjärjestelmä on yksi tärkeimmistähakukoneen osia. Loppukäyttäjän on käsiteltävä tulostusjärjestelmää, joka syöttää kyselyn hakulogiin. Tulosten tuotosjärjestelmä yli kaksisataa eri kriteeriä käyttäen tekee valinnan tuloksiin, jotka täyttävät parhaiten hakutavoitteet.
Tällaisen valinnan algoritmia kutsutaan yleensä algoritmiksi tai ranking mekanismi. Sivuston ylläpitäjien petosten välttämiseksi voidakseen vaikuttaa liikkeeseenlaskujen tuloksiin, tarkka algoritmien hakukoneet pidetään tiukimpana salaisuutena.
On kuitenkin olemassa useita tunnettuja kriteerit, otetaan huomioon, kun hakukoneen avulla optimoidaan että ylläpitäjä voi "laillisesti" vaikuttaa hakutulokset. Esimerkiksi, Hakukoneessa sivun analyysissä otetaan huomioon:
- onko sivun nimessä avainsana (otsikko)
- Onko avainsana näkyvissä sivun URL-osoitteessa?
- onko otsikoissa H1-H6 avainsana, tunnisteet STRONG, B, EM, I
- mikä on sivun avainsanojen tiheys (tiheys)
- Sisältyykö avainsana metatietokuvissa: avainsanat, kuvaus
- Onko sivulla sisäisiä ja ulkoisia linkkejä?
Käyttäjä toimii vuorovaikutuksessa hakukoneen kanssa hakupalvelimen kanssa. Vastaanotettu hakukysely käyttäjältäPalvelin käsittelee ja välittää sijoittamismoduulin syötteeksi parametriin. Moduulissa puolestaan suoritetaan asiakirjojen käsittely, jonka tiedot tallennetaan hakupalvelimen tietokantaan ja tekee käyttäjäsovelluksesta vastaavat sivut.
Seuraavaksi järjestelmä tuottaa koodinpätkän tekstitietoja, jotka näytetään käyttäjälle SERP (Hakukoneen tulossivun) muodossa - hakutulossivuilla.
Niinpä jopa lyhyt kuvaus tärkeimmistäPeriaatteet hakukoneita osoittaa, kuinka tiiviisti sidoksissa toisiinsa kaikki ohjelmistot järjestelmän osista ja kuinka hyvin ja debugged on toimittava hakukoneen jotta nopeasti ja luotettavasti antaa käyttäjälle tietoa hänen etsiä.














