2020-ban lesz 30 éves az első internetes keresőszolgáltatás

A Google másodpercenként több mint 60 ezer kérést szolgál ki, akár emberi hang alapján, gépi tanulással javítva az eredményeket.

Az út 1990-ben kezdődött, akkor jelent meg az interneten az első kereső, az Archie Query Form. A világháló történetét bemutató sorozatunkban megemlékeztünk már a két távoli számítógép közötti első összeköttetésről, az első emailről, vírusról, spamről és domainről. Ezúttal a keresők történetét vesszük górcső alá, ugyanis jó néhány versenyző próbálkozott ezen a pályán a Google előtt.

A színes, böngészhető, kereszthivatkozásokkal ellátott weboldalak megjelenése előtt még más típusú tartalmak, szolgáltatások uralták az internetet. Ilyen volt például a fájlmegosztás őse, az FTP archívumok világa. Az Archie név éppen az „archive” kifejezés lerövidítésével jött létre.

Archie, a prototípus

A kereső ötlete akkor született meg, amikor 1987-ben a McGill University School of Computer Science számítógépes hálózata rácsatlakozott az internetre. Ekkor készítette el Alan Emtage, az egyetem egyik diákja az Archie első változatát, ami havonta felvette a kapcsolatot a publikus FTP archívumokkal, majd lekérte és eltárolta az elérhető fájlok listáját. A listában az egyetemi rendszeren belül egy parancs kiadásával lehetett keresni. A cél az volt, hogy az egyetemi kutatók könnyebben megtalálják és elérjék az interneten halmozódó tudást, a munkájukhoz szükséges tartalmakat.

Ezután Peter Deutsch, az egyetem rendszergazdája, és Bill Heelan a Concordia University hallgatója is beszállt a fejlesztésbe. Következő lépésben a programozók lehetővé tették, hogy érdeklődők Telnet protokoll segítségével bejelentkezhessenek az archie.mcgill.ca címen elérhető gépre, és keressenek az egyre terebélyesedő adatbázisukban. Később a rendszer hatékonyabb backendet és frontendet kapott, majd helyi eszközből hálózati szolgáltatássá vált, és a kereséseket már több, különböző helyeken működő szerver szolgálta ki. Végül pedig Archie a World Wide Weben is elérhető lett.  Aranykorában Montreal internetes forgalmának felét ez a szolgáltatás generálta. A keresőt egyfajta mementóként ma is fenntartja egy lengyel egyetem.

 

Archie internetes debütálásakor 1990-et írtunk. Vagyis az első kereső abban az évben született, amikor:

  • Februárban Nelson Mandelát 11 év után kiengedték a börtönből
  • Áprilisban munkagépekkel elkezdték a berlini fal lebontását, és októberben újraegyesült Németország
  • Szintén áprilisban földkörüli pályára állt a Hubble Space Telescope
  • Ugyanabben a hónapban debütált az ABC-TV csatornán a Twin Peaks.
  • Tavasszal a balti országok kiváltak a Szovjetunióból
  • Elindult az emberi DNS feltérképezését célzó Human Genome Project
  • Szeptemberben elvégezték az első génterápiás kezelést
  • Novemberben 11 év után véget ért Margaret Thatcher miniszterelnöksége
  • Lezárult az internet elődjének számító ARPANET projekt
  • Magyarországon lezajlott a harmadik magyar köztársaság első parlamenti és önkormányzati választása

Az ezt követő években gombamódra szaporodtak a keresőszolgáltatások, amelyek eltérő megoldásokat használtak: például a webszervereket listázták, fájlneveket és weboldalak fejlécéből nyerhető információt tároltak. A legtöbb esetben a címszöveg betű szerinti ismerete nélkül lehetetlen volt bármit is megtalálni. 1993-ban már az URL-ek tárolása is megjelent, de a megtalálás sorrendjében, mindenféle rangsor nélkül.

Az 1994-ben debütált Infoseek volt az első szolgáltatás, amelynek adatbázisába maguk a rendszergazdák vihették fel a weboldaluk adatait. Ugyanebben az évben indult útjára a Yahoo! Search, amely kézzel épített linkgyűjteményként indult, majd kereshető adatbázissá nőtte ki magát.

A WebCrawler volt az első kereső, ami teljes weboldalakat indexelt, és annyira népszerű lett, hogy napközben szinte lehetetlen volt használni.

 

A mai keresőmotorok szoftveres robotjai módszeresen böngészik a webet, és a megtalált oldalakat címek, fejlécek, tartalom és más specifikus elemek alapját indexelik, és ezeket az információkat saját adatbázisukban tárolják. Amikor egy felhasználó keresőszavakat küld ebbe az adatbázisba, akkor a rendszer válaszként egy rangsorolt találati listát küld vissza, amelynél a sorrendet számos tényező határozza meg – például megbízhatóság, relevancia vagy éppen az adott oldal technikai megfelelősége.

A szintén 1994-ben bevezetett Lycos 54 ezer dokumentumot katalogizált, ami még az indulás évében 394 ezerre, 1995-re 1,5 millióra, 1996-ra pedig 60 millióra nőtt. Ráadásul a keresett kifejezéseket előtaggal kiegészítve, illetve szóhasonlóság alapján is megtalálta, és az eredményeket relevancia alapján rangsorolva tudta kiadni. Az 1995-ben elérhetővé vált LookSmartnál azt is meg lehetett adni, hogy mely kifejezések ne forduljanak elő a találatok között.

Az 1995-ös év nagy nevei közé tartott még az Excite és az AltaVista. Ez utóbbi számos forradalmi újítást vezetett be, például korlátlan sávszélességgel fogadta a keresőket, és természetes szövegeket, vagyis akár kerek mondatokat is lehetett keresőszövegként használni. Eközben a WebCrawlert felvásárolta az AOL, a Netscape webböngészőben pedig az Infoseek lett az alapértelmezett kereső.

1998-ben debütált a neten a Google és az MSN Search – ez utóbbit 2009-ben nevezték át Bingre.

Ma már a keresések több mint 90%-át a Google bonyolítja le. A SearchEngineLand adatai szerint egy átlagember napi 3-4 keresést indít a keresőóriásnál, ami 3,8 millió keresés percenként, 228 millió óránként, 5,47 milliárd naponta és közel 2 trillió keresés évente. A Google mintegy 200 szempontot vesz figyelembe, mielőtt egy adott keresésre kiadja a legjobbnak ítélt találati listát.

 

Kapcsolódó

A világ legmenőbb szerverparkjai
Miközben teljesen természetesnek vesszük, hogy az adatainkat és a legkülönfélébb szolgáltatásokat bármikor és bárhonnan elérhetjük a felhő segítségével, nem feltétlenül gondolunk bele, milyen grandiózus technikai megoldásokra van szükség a háttérben ahhoz, hogy mindez zökkenőmentesen működjön 4 milliárd internetfelhasználó számára.

 

CÍMKÉK: Internet, hálózat