Sunday, May 22, 2011

The Dublin Core / MODS


ზოგადი და ბიბლიოგრაფიული მონაცემთა სქემები
ბიბლიოთეკის სფეროს შიდა სტანდარტები დიდი ხნით ადრე განვითარდა, ვიდრე დეკოდირების სტანდარტები და აგრძელებს არსებობას , როგორც ცალკეული ინსტრუმენტი. ამ შიდა სტანდარტის მაგალითები, რომლებიც განხილულია აქ,  არის ASBD და AACR2. სხვა მონაცემთა ბაზების საჭიროებისათვის, განსაკუთრებით კი ელექტრონული რესურსების გამოყენებისთვის, 1990–იან წლებში შეიქმნა ძირითადი სქემა  Dublin Core, უფრო მოგვიანებით კი განვითარდა ზოგადი გამოყენების სქემა MODS-ი.
The Dublin Core (DC)
DC  ( Dublin Core Metadata Element Set -  დუბლინის ძირითადი მეტამონაცემები)  ასე ეწოდა რადგან, პირველი ვორქშოპი მის შესახებ ჩატარდა დუბლინში, ოჰაიოში 1995 წელს.  DC შეიქმნა იმისათვის, რომ ყოფილიყო საერთაშრისო სტანდარტი მონაცემთა ბაზების შესაქმნელად, რაც იძლეოდა საშუალებას, რომ პროექტი შეევსო ნებისმიერ ადამიანს, ვინც ამ საკითხზე მუშაობდა. კონფერენციების და ვორქშოპების მონაწილეები, სადაც განიხილებოდა DC არიან  სხვადასხვა მიმართულების ექსპერტები. (მაგ. გამომცემლები, ბიბლიოთეკის სპეციალისტები, კომპიუტერული მეცნიერებების ეხსპერტები და სხვ.) ამგვარად, ეს არის ჯვარედინი სფეროების სტანდარტი და შესაძლებელია იყოს ნებისმიერი სახის მონაცემების საფუძველი ნებისმიერ სფეროში. მან მიიღო ISO 15836 სტანდარტი და ANSI/NISO Z39.85 სტანდარტი 2007 წელს.  ის გამოიყენება საერთაშორისო დონეზე, პროფაილების გარკვეულმა რაოდენობამ განავითარა სპეციალური დომენი რომელიც იყენებს DC–ს, როგორც დამწყებ მინიშნებას.
DCMI (Dublin Core Metadata Initiative - დუბლინის საერთაშორისო მეტამონაცემთა ინიციატივა) ზედამხედველობას უწევს სტანდარტის განვითარების შესრულებას. DC განვითარდა, რადგან ის იყენებდა HTML –ს რამოდენიმე წელი. შაბლონები ისეა გაკეთებული, რომ ნებისმიერს შეუძლია გამოიყენოს DC–ს ელემენტების შესავსებად. ასეთი შაბლონები შეიძლება შეივსოს და წინასწარ დათვალიერებულ იქნას, შემდეგ კი HTML–ად დაფორმატებული მონაცემი დაუბრუნდება მომხმარებელს ეკრანზე რომ შესაძლებელი იყოს მისი დაკოპირება და ჩასმა დოკუმენტის სათაურში.  უფრო მოგვიანებით კი DC–მ დაიწყო  XML გამოყენება. დოკუმენტები, რომლებიც მოიცავს გაიდლაინებს DC –ს გამოყენებას XML –ში, შესაძლებელია ნანახი იქნეს DCMI–ს ვებ–გვერდზე. ასევე განიხილება რეკომენდაციები, რომ DC–ს მონაცემები გამოისახოს RDF–ს საშუალებით.
DC მონაცემთა ბაზა მოიცავს 15 ელემენტს, რომელიც სამ ჯგუფად იყოფა :
ელემენტები რომლებიც დაკავშირებული რესურსების შინაარსზე
·         სათაური – ინფორმაციული რესურსის სახელი
·         ობიექტი – რესურსის შინაარსის თემა, რეკომენდირებულია კონტროლირებადი ლექსიკონის გამოყენება და ფორმალური კლასიფიკაციის სქემები.
·         აღწერა –რესურსის შინაარსის ტექსტური ფორმულირება, შეიძლება იყოს აბსტრაქტი, შინაარსის ცხრილი ან უბრალოდ ტექსტური ანგარიში.
·         წყარო – ონფორმაცია დამატებით რესურსებზე რომლის გამოყენებითაც პირველადი წყაროა მიღებული. საუკეთესო პრაქტიკული რეკომენდაციაა, რომ გამოიყენოთ ფორმალური საიდენტიფიკაციო სისტემის ციფრები, იმისათვის რომ მოხდეს დამაკავშირებელი რესურსის ამოცნობა.
·         ენა –  რესურსის ინტელექტუალური შინაარსის ენის იდენტიფიცირება, რეკომენდირებულია რომ გამოიყენოთ ენის ტეგები, რომლებიც განსაზღვრულია RFC 4646–ში.
·         დაკავშირება – მეორადი წყაროს მიმართების დადგენა პირველად რესურსთან, როგორც სამუშაო, რომელიც არწერილი რესურსის ერთ–ერთი ვერსიაა, დაფუძნებულია მასზე ან დაკავშირებულია მასთან. საუკეთესო პრაქტიკული რეკომენდაციაა, რომ გამოიყენოთ ფორმალური საიდენტიფიკაციო სისტემის ციფრები, იმისათვის რომ მოხდეს დამაკავშირებელი რესურსის ამოცნობა.
·         მოქმედების ზონა – განსაკუთრებული ადგილმდებარეობის განსაზღვრა, (მაგ. რაიმე რეგიონი), დროებითი პერიოდი (ყურადღება მიაქციეთ, რომ ეს ელემენტი არის რესურსის ობიექტის დროით პერიოდზე, მაშინ როცა თარიღის ელემენტი გამოიყენება რესურსის შექმნის თარიღის აღსაწერად), ან იურისდიქცია (მაგ. ადმინისტრაციული ერთეული). სივრცული და დროებითი მახასიათებლები უნდა იქნეს აღებული კონტროლირებადი სიიდან როგორიც არის TGN (Thesaurus of Geographic Names- გეოგრაფიული სახელების საგანძური) ხოლო თარიღი უნდა იყოს სტანდარტული წელი/თვე/დღე.
რესურსთან დაკავშირებული ელემენტები, როდესაც საქმე გვაქვს ინტელექტუალურ საკუთრებასთან.
·         შემქმნელი –ადამიანის ან ორგანიზაციის სახელი, რომელიც პასუხისმგებელია რესურსის ინტელექტუაუალურ საკუთრებაზე. (მაგ. ავტორი, მსახიობი, კომპოზიტორი)
·         გამომცემელი – იმ პირის ან ორგანიზქაციის სახელი, ვინც რესურსი ხელმისაწვდომი გახადა. (მაგ. გამომცემელი, საგამომცემლო სახლი, უნივერსიტეტი ან მისი რომელიმე დეპარტამენტი.)
·         „ხელშემწყობი“ – პირის ან ორგანიზაციის სახელი, რომელმაც რესურსის ინტელექტუალური საკუტრება გახადა მნიშვნელოვანი, მაგრამ ეს ადამიანი არ არის მისი შემქმნელი. (მაგ. რედაქტორი, ილუსტრატორი)
·         უფლებები – ფორმულირება, ლინკი, ან რაიმე იდენტიფიკატორი რომელიც გვაძლევს ინფორმაციას უფლებების შესახებ. (მაგ. საკუთრების უფლების ფორმულირება, რომელიც მოიცავს ინტელექტუალური საკუთრების უფლებასაც)
ელემენტები, რომლებიც დაკავშირებული ძირითადად რესურსის გამოცემასთან
·         თარიღი – რესურსის სასიცოცხლო ციკლში არსებული თარიღი (მაგ. შექმნის, ხელმისაწვდომად ქცევის ან გადასინჯვის თარიღი.) რეკომენდირებულია რომ გამოვიყენოთ ISO 8601 სტანდარტის W3CDTF პროფილი. (თარიღისა და დროის ფორმატი). განსაკუტრებით კი თარიღის ფორმა წელი/თვე/დღე.
·         ტიპი – რესურსის შინაარსის ჟანრის ან ხასიათის აღნიშვნა. (მაგ. პოემა, ლექსიკონი, ტექნიკური რეპორტი.) რეკომენდირებულია რომ ჟანრის განსაზღვრა მოხდეს DCMI –ს მეშვეობით. (ტიპების კონტროლირებადი ლექსიკონი)
·         ფორმატი – რესურსის ფიზიკური სიდიდის აღნიშვნა, ფაილის ფორმატი ან რესურსის ისეთი  ზომები, როგორიცაა ზომა და ხანგრძლივობა. რეკომენდირებულია რომ ფიზიკური მახასიათებლის განსაზღვრა მოხდეს MIMY Media TYPE სისტემით.
·         იდენტიფიკატორი –ციფრები რომლებიც ახდენენ რესურსის უნიფიცირებას. (მაგ. ISBN, URI, URL.) რეკომენდირებულია, რომ შეეფარდოს ოფიციალურ საიდენტიფიკაციო სისტემას.
ზემოთ მოყვანილი ელემენტებიდან, შემქმნელი, „ხელშემწყობი“ და ობიექტი არის ძირითადი ელემენტები, რომელზედაც საუბარი გვექნება 8, 10 და 11 თავებში.
DC –ს საერთო პრინციპები, როდესაც ის დაარსდა იყო : (1) ელემენტები შეიძლება დაემატოს და შეივსოს გარკვეული საჭიროების შემთხვევაში, (2) ყველა ელემენტი არის ნებაყოფლობითი, არასავალდებული, (3) ყველა ელემენტი არის განმეორებადი, (4) ყველა ელემენტი შეიძლება შეიცვალოს განმსაზღვრელის მიერ. ელემენტების შინაარსის ფორმა არ არის მკაცრად განსაზღვრული. იხილეთ 7.4 სქემა, როგორც DC –ს ჩანაწერის მაგალითი.
დიდი ხნის განმავლობაში, DCMI–ს გარშემო იყო ორი ბანაკი, თითოეულს ყავდა საკმაოდ ძლიერი დამცველები. მინიმალისტების ბანაკი მოითხოვდა რომ ყოფილიყო მხოლოდ 15 ელემენტი და არ ყოფილიყო დამატებითი განმსაზღვრელები, ხოლო განმსაზღვრელების ბანაკი მიიჩნევდა რომ სუბელემენტები ისეთივე მნიშვნელოვანი და გამოსადეგია, როგორც ელემენტები. საბოლოოდ ორივემ გაიმარჯვა. შეიმუშავეს სტანდარტი NISO, რომელიც მოიცავს, როგორც ელემენტებს ასევე მის განმსაზღვრელებს.  განმსაზღვრელების ორი ძირითადი კლასი გამოიყენება : ელემენტის რაფინირება – ავიწროვებს ან აღრმავებს ელემენტის შინაარს, დეკოდირების სქემა – ახდენს იმ სქემების იდენტიფიცირებას, რომელიც დაკავშირებულია ელემენიტის ჟანრთან. 7.1 სქემაზე მოცემულია DC–ს ელემეტები, რომლებიც მოიცავს როგორც პირველ ასევე მეორე კლასს.რეკომენდირებულია რომ ეს წესები გამოვიყენოთ.
DC გამოიყენება მსოფლიოს მაშტაბით. მისი საშუალებით მონაცემებს აჯგუფებენ და ახარსხებენ მარტივი ელექტრონული კატალოგებისთვის, რომელსაც ვებ საიტები იყენებენ, ასევე მას იყენებენ მეტამონაცემების დასახარისხებლად სახელმწიფო სტრუქტურებშიც კი, მაგ. ავსტრალიაში. როგორც უკვე ავღნიშნეთ , მათ შორის არის OCLC სისტემა, რომელიც გამოიყენება WorldCat-ში. კატალოგისტები, რომლებიც იყენებენ ამ სისტემას შეუძლიათ ნახონ ან ჩამოტვირთონ ჩანაწერები MARC-ის, HTML–ის,  XML–ის დეკოდირების საშუალებით. ჯერ კიდევ არსებობს გარკვეული რაოდენობა პროფაილების, რომლებიც დაფუძნებულია DC–ზე. ამის მაგალითია Library Application Profile. (საბიბლიოტეკო მოხმარების პროფილი) ის მოიცავ DC–ს 15 ელემენტს და დამატებული აქვს სამი ელემენტი : მომხმარებელი, ადგილმდებარეობა და გამოცემა.
Metadata Object Description Schema MODS - მეტამონაცემების ობიექტის აღწერის სქემა
მეხუთე თავში MODS განხილული იყო, როგორც დეკოდირების სტანდარტი. ეს არის ჰიბრიდული მეტამონაცემების სქემა , რომელიც აერთიანებს დეკოდირების წესებსა და ელემენტების სტრუქტურას. იგი შეიქმნა კონგრესის ბიბლიოთეკის ქსელის განვითარების სამსახურისა და მარკ-ის სპეციალისტების თანამშრომლობით, ასევე სხვა ექსპერტების მონაწილეობით. MODS-სი აწარმოებს ალტერნატიულ მარტივ მეტამონაცემთა ფორმატს ძალიან ცოტა ველებით და ასევე მეორე სახის სისტემასაც, რომელიც მოიცავს მეტამონაცემთა გაცილებით დიდ ინფორმაციას, როგორიცაა მარკ-21.  იგი მდიდარია  DC - სთან შედარებით, მაგრამ მარკ-ის ფორმატთან შედარებით მარტივია. ის დაფუძნებულია XML- სტანდარტზე, რაც გულისხმობს იმას რომ მისი გამოყენება შეუძლია ნებისმიერ ადამიანს ვინც ინგლისურ ენაზე საუბრობს, თუმცა ეს პრობლემას უქმნის იმათ ვინც ინგლისურ ენაზე ვერ კითხულობს.
როდესაც MODS ვითარდებოდა, გადაწყდა რომ მარკ-ის რამოდენიმე ელემენტი გაერთიანდებოდა და ზოგიერთი მარკ-ის ველი საერთოდ ამოვარდებოდა. თუმცა ზოგი მარკ-ის ველი განმეორდა და ზოგ შემთხვევაში ერთი ელემენტი რამოდენიმედაც კი დაიყო. მაგ. სახელი, იდენტიფიკატორი და სათაურის შესახებ ინფორმაცია  შეიძლებოდა გამოგვეყენებინა როგორც ცალცალკე ელემენტად, ასევე აგვეღო ერთი ძირითადი და დანარჩენები ყოფილიყო მისი დაქვემდებარებული. სახელი, მაგ. შეიძლებოდა ყოფილიყო რესურსის სახელი ან ის შეიძლებოდა ყოფილიყო დამაკავშირებელი ინფორმაციის სახელი.
MODS-ის ყველაზე მეტად გამოყენებადი ელემენტებია :
სათაურის შესახებ ინფორმაცია, სახელი, რესურსის ტიპი, ჟანრი, ინფორმაცია წარმოშობის შესახებ, ენა, ფიზიკური მახასიათებელი, შინაარსი, შინაარსის ცხრილი, სამიზნე აუდიტორია, ჩანაწერი, ობიექტი, კლასიფიკაცია, დამაკავშირებელი საგანი, იდენტიფიკატორი, ადგილმდებარეობა, ნაწილი და ინფორმაცია ჩანაწერის შესახებ.
სუბ-ელემენტების მაგალითი, რაც მოყვება ინფორმაციას წარმოშობის შესახებ არის:
ადგილი, გამომცემელი, მონაცემთა ჟანრი,თარიღის ვალიდურობა, კოპირების თარიღი,სხვა დაკავშირებული თარიღი.
MODS-ი გამოყენებადი გახდა 2002 წლის ივნისში, და ექსპერიმენტები მასზე ტარდება ამ დროიდან. 2008 წლის იანვარში, მისი 3.3 ვერსია გამოვიდა,მას შემდეგ  MODS-მა დაარეგისტრირა უამრავი კომპანია რომელიც მისი მომხმარებელია. მაგ. ავსტრალიის  ეროვნული მეტამონაცემთა ბაზა აგროვებს მონაცემთა ჩანაწერებს Open Archives Initiative Protocol for Metadata Harvesting. (OAI_PMH). MODS-ი მუშაობს იმაზე, რომ Dublin Core-ის ჩანაწერები აქციოს მარკ-ის ჩანაწერებად.

 წყარო : The Organization of Information / Arlene G. Taylor

1 comment:

  1. 7.1 და 7.4 ცხრილები აქ ვერ ავტვირთე, ამიტომ ლექციაზე მოვიტან და პრეზენტაციისას განახებთ. :)))

    ReplyDelete