Monday, April 9, 2012

საძიებო ძრავები და დირექტორიები


საძიებო სისტემა არის კომპიუტერული სისტემის,კერძოდ ინტერნეტი,  განვითარებული ინსტრუმენტები, რათა იპოვო მოთხოვნილი სიტყვები ან ფრაზები რომლებსაც შეიცავს დოკუმენტი. ესენი მისი ფუნქციაა მოძებნონ მთლიანი ტექსტიანი დოკუმენტები განსაზღვრული სიტყვით ან ფრაზით. მათ შეიძლება მოგვცენ ან არ მოგვცენ ისეთივე  დამაკმაყფილებელი შედეგი, როგორი სხვა საძიებო ხელსაწყოებმა, მაგრამ მომხმარებლები ხშირად არიან კმაყოფილები, რადგანაც ისინი პოულობენ რაღაცას,  რაც დაკავშირებულია იმასთან, რასაც ეძებდნენ და მიაჩნიათ უფრო სწრაფი. მაგრამ მომხმარებლების უმრავლესობამ არ იცი, რომ რასაც ისინი პოულობენ არის ავთენტური, ავტორიტეტული, ან  ყველაზე კარგი, რაც არის ხელმისაწვდომი ამ თემაზე.  ცნობილი საკითხების ან კონკრეტული სახელების ძებნა ზოგჯერ ნაკლებად დამაკმაყოფილებელია, ვიდრე აქტუალური ინფორმაციის ძებნა.
საძიებო სისტემა გახდა უფრო დახვეწილი, მაგრამ მას კიდევ აქვს ხარვეზები, როგორიცაა არანაირი განსხვავება ომონიმებსა და არანაირი კავშირი სინონიმებს შორის. გუგლი არის ერთერთი ყველაზე დახვეწილი ორივეში, როგორც ძებნის დახმარების მოცემაში (მაგ. გეკითხება „შენ ნამდვილად იგულისხმე რომ მოძებნო.......? ცუდად დაწერილი  სიტყვის შემთხვევაში ) და პასუხის ჩვენებაში.
ზოგი საძიებო სისტემა მოიძიებს კონკრეტულ რესურს, როგორიცაა ორგანიზაციების ვებ-საიტები. სხვა საძიებო სისტემები მთელ ინტერნეტში. პროგრამის გამოყენებას ქვია  spider ი, თითოეული სამძებრო სისტემა ავტომატურად აგროვებს ინფორმაციას სხვადასხვა ვებ რესურსიდან და ათავსებს მათ ჩანაწერბის მონაცემთა ბაზაში ან ფორმაში. Spider ი, როგორც წესი დაპროგრამებულია, რომ მიიღოს და გადმოწეროს კონკრეტული სამიზნეების ასლები და ყველაფერი რაც მათ უკაშირდებათ. მასიური კოლექტიური მაჩვენებელი - რომელიც შექმნილია  spider ის  მონაცემთა ბაზით- არის ის ტერმინები, რასაც მომხმარებელი  საძიებო ყუთში  შეიყვანს.
ცხადია, ინტერნეტის ყველა ვებგვერდი არაა ინდექსირებული.ზოგი რესურსი შეიძლება ინდექსირებული გახდეს მხოლოდ ცოტა საძიებო სისტემებით-  
მხოლოდ რამდენიმე წლის წინ გახდა შესაძლებელი რესურსების მოძებნა PDF ისა და PowerPoint-ის ფორმატით ინტერნეტში.ზოგ შემთხვევაში,რესურსები შეიძლება იყოს პაროლით დაცული,და ამის გამო შეიძლება ისინი არ იყოს ინდექსირებული საძიებო სისტემებში, რადგანაც ისინი არ არიან ხელმისაწვდომი მძებნელებისათვის. სხვა შემთხვევებში  რესურსები შეიძლება იყოს ინდექსირებული და აკრძალვის მაგივრად შეიძლება დაუბრუნდნენ ძებნის შედეგს.
ძებნის შედეგების გამოჩნა, ჩვეულებისამებრ, აქტუალურობის მიხედვითაა დაწყობილი, რომელიც შეიძლება სხვადასხვა გზით გამოითვალოს. საძიებო სისტემამ აქტუალურობა შეიძლება გამოითვალოს სხვადასხვა ფაქტორების შეწონვის პრინციპით, როგორიცაა, რამდენი საძიებო ტერმინი ან ფაილი არის ნაპოვნი ვებგვერდზე; რამდენად ხშირად არის ნაპოვნი თითოეული ტერმინი ან ფაილი გვერდზე; არის თუ არა ტერმინები ახლოს ან გაბნეული; არის ტერმინები დოკუმენტების თავში თუ არის ტექსტის ბოლოში და როგორ არის საერთო ან ერთადერთი საძიებო ტერმინი. საძიებო ტერმინები განაგრძობენ სწრაფვას აქტუალობის გამოთვლის უფრო დახვეწილი მეთოდების და შედეგების ჩვენებისაკენ. მაგალითად, გუგლი იყენებს არამარტო ისეთ ფაქტორებს, როგორიცაა სიტყვების განლაგება და სიხშირე, აგრეთვე ვებ საიტების პოპულარობასაც. გუგლი და სხვა საძიებო სისტემები განუწყვეტლივ ახლდებიან, იხვეწებიან და ამოწმებენ თავიანთ ალგორითმებს და ფორმულებს, რათა გააუმჯობესონ ინტერნეტით ძებნის გამოცდილება. მეტამონაცემების განვითარებასთან ერთად,საძიებო სისტემებს აქვთ პირობა უფრო დახვეწილი ინფორმაციული საძიებო სისტემის განვითარების.
საძიებო სისტემის ალტერნატივები შეიცავენ კატალოგებს და საგნის კვანძებს. yahoo მაგალითად ასაქმებს ადამიანებს ინდექსატორს ცნობარის შექმნაში.
ზოგი ინტერნეტ ცნობარი არის ორგანიზებული ტრადიციული საბიბლიოთეკო კლასიფიკაციის მიხედვით, მაგრამ უმრავლესობა არის შექმნილი თავიდან იმ ადამიანების მიერ რომლებიც გეგმავენ ცნობარს. კატეგორიების შედარებისათვის სხვადასხვა ცნობარი აჩვენებს, რომ იერარქია შეიძლება იყოს სრულიად განსხვავებული ცნობარიდან ცნობარამდე.
სათაურის კვანძი ცნობარის მსგავსია,ორივე მათგანი ფოკუსირებულია კონკრეტულ საგანზე. ისინი ხშირად არიან აგებულები აკადემიური ბიბლიოთეკებისაგან, ზოგჯერ კი ჯგუფური მუშაობით.ამის მაგალითია GEM  და  DHHS.


ინტერნეტი


ინტერნეტი არის ბილიოთეკის მსგავსი, სადაც ყველა წიგნი არის ერთად დაყრილი და არ არის კატალოგი. ბევრი წლის განამავლობში დიდი ძალისხმევა დასჭირდა, რომ ეპოვათ გზა ინტერნეტის მეტად გასაკონტროლებლად. თუმცა ჯერ კიდევ ვერ ვიტყვით, რომ ის ორგანიზებულია. ის იმდენად სწრაფად იცვლება, რომ ჩვენმა ძალისხმევამ აზრი  შეიძლება რამდენიმე თვეში დაკარგოს. 
ინტერნეტის ორგანიზების სხვადასხვა მიდგომები არსებობს. ორგანიზების თავდაპირველი მცდელობა ტრადიციული საბიბლიოთეკო სისტემა იყო. ბიბლიოთეკარები ადგენდნენ ბიბლიოგრაფიებს ვებ გვერდებისათვის. ზოგიერთმა ამ ბიბლიოგრაფიებიდან მიიღეს პორტალები დაკარიბჭეებიინტერნეტში (INFOMINE.com) -არის მაგალითი რამდენიმე ბიბლიოთეკის თანამშრომლობით შექმნილი პორტალის. ეს არის ინტერნეტ რესურსების ვირტუალური ბიბლიოთეკა. სისტემა სრულდება იმ ბიბლიოთეკარების მიერ, რომლებაც შექმნეს მეტამონაცემები. სისტემას ასევე აქვს ავტომატური და ნახევრად-ავტომატური მეტამონაცემების ჩანაწერის ამოღება ვებ-მხოხავებიდან J.
ბიბლიოთეკარებს უპირისპირდებოდნენ იმ ადამიანების ნაწილი, რომლებიც მუშაობდნენ მეტამონაცემების სტანდარტზე სახელად Dublin core , 15 ელემენტისგან შედგენილი ვებ რესურსები აღსაწერად. 1990 -დან  OCLC- შექმნა გზა ბიბლიოთეკარებისთვის ონლაინ რესურსების ერთობლივი კატალოგისათვის და გაამზადა ხელმისაწვდომი მონაცემთა ბაზა მნიშვნელოვანი ვებ რესურსების აღსაწერად. ეს სისტემა ხელმისაწვდომია OCLC- ინტერფეისტან კავშირით. დაკავშირებისას შეგიძლიათ აირჩიოთ ან ტრადიციული MARC/AACR2 ან Dublin core ფორმატი. კავშირის (Connexion) მნიშვნელოვანი ბუნება, ინტერნეტში ორგანიზებასთან დაკავშირებითგარკვეული საგნების მიგნების განვითარების დებულება.
გაცილებით მეტი სამუშაო ინტერნეტში ძიებისა და ორგანიზებისათვის ჩაატარეს სხვა პირებმა ვიდრე ბიბლიოთეკარებმა. მაგ, საძიებო ძრავები განავითარეს კომპიუტერის მეცნიერებმა და პროგრამისტებმა. ადამიანების უმრავლესობა აფასებს საძიებო ძრავებს, იმის მიუხედავად, რომ შესაძლოა იმედგაცრუებული დარჩნენ, რადგან ძრავში არ არის მეტი შერჩევა და სიზუსტე. პროგრამების დაობობებისუმრავლესობა იგზავნება საიტების საპოვნელად რომ დაემატოს ინდექსებში მხოლოდ ტექსტი. გრაფიკები და ფოტოები შეიძლება ასეთად აღიარებულია, მაგრამ არ შეიძლება იყოს  ინტერპრეტირებული თუ ახლავთ ტექსტი ან ეტიკეტი. გარდა ამისა ამ პროგრამებს არ შეუძლიათ გაანალიზება საიტის მიზნის, ისტორიის, პოლიტიკის და .. სიტუაციის გასაუმჯობესებლად მუშაობს სხვადასხვა სახის მეტამონაცემები ინტ. რესურსებისათვის, შესაბამისი ინფორმაცია შეიძლება აიკრიფოს რობოტისგან საწყისი მეტამონაცემებიდან რომ დაემატოს საიტს მისივე ავტორისგან ან ვინმემ სცადოს აღწერა და გაანალიზება რესურსის. მიუხედავად იმისა, რომ ამ დროისათვის მეტამონაცემების გამოყენებამ შეინარჩუნა მისი გამოყენების ყველაზე საწყისი. სწორად გამოყენებული მეტამონაცემები შეიძლება მოიცავდეს ინფორმაციას საიტის არატექსტური ნაწილის შესახებ, მისი ისტორიის და კონტენტის და .
არსებობს პროგრამული უზრუნველყოფა, რომელიც ავტომატურად უკეთებს კლასიფიცირებას და ინდექსაციას ელ დოკუმენტებს. მაგრამ ავტომატური ხელსაწყოები კლასიფიკაციას ადამიანისაგან განსხვავებულად ახდენს. ინფორმაციის ბევრ ინსტიტუტებს აქვთ ინტერესი ამ ტიპის პროგრამებისადმი. მაგრამ მათი შედეგი ჯერ დიდი ვერაა. სანამ ამ სისტემების გაუმჯობესება მნიშვნელოვანია, ისინი არ იქნება უფრო მეტად გამოყენებადი, ვიდრე ადამიანები ინდექსაციისა და კატალოგირებისათვის. Yahoo რესურსების კატეგორიებს ალაგებს და ინდექსაციას ახდენს ფართო სფეროების ადამიანების გამოყენებით. Google -მა დაიწყო ინტერნეტში ძიების დომინირება, დირექტორია საიტებს ალაგებს პოპულარობის მიხედვით. თუმცა კატალოგირება და კლასიფიკაცია მოითხოვს ინტელექტუალურ ძალისხმევასაუცილებელია, რომ სულ მცირე რამდენიმე სამუშაო უნდა იყოს ავტომატური, რადგან მუდმივად იზრდება ონლაინ ინფორმაცია
 OCLC ავითარებს პროდუქტებს და ასპონსორებს კვლევის პროექტებს რომლის შედეგებითაც შესაძლებელი იქნება საბიბლიოთეკო კლასიფიკაციის სქემების გაუმჯობესება, კატალოგირების პროდუქტიული ხელსაწყოების და ახალი წინადადებები მეტამონაცემების შექმნისა და შენარჩუნებისათვის.  INFOMINE-ის მკვლევარებმა განავითარეს სისტემა, რომელიც ავტომატურად ავალებს ნოტაციებისა და სასაქონლო სათაურის კლასიფიკაციას.
ზოგს სწამს, რომ ინტერნეტში ინფორმაციის ორგანიზება შეუძლებელია, ნაწილი, რომელიც მნიშვნელოვანია ძიებისათვის და შთამომავლობისათვის, იქნება მიყვანილი ორგანიზაციული კონტროლის ქვეშ.  იმ პრინციპების სწავლა თუ როგორ ხდებოდა საუკუნეების განმავლობაში ბეჭდური ინფორმაციის ორგანიზება, შეიძლება გამოყენებულ იქნას ელექტრონული რესურსების ავტომატური დამუშავებისათვის. ახლა ძალისხმევა მიმართულია, რომ შეიქმნას სემანტიკური ვებგვერდი  სადაც მონაცემები განისაზღვრება შინაარსობრივად დაკავშირებული ინფორმაციის უფრო ეფექტური აღმოჩენისათვის. ეს ძალისხმევა კიდევ ერთი ნათელი დადასტურებაა ადამიანის მიერ ინფრომაციის ორგანიზების სურვილისა.