Latest News

MARC 21 বা মেটাডাটা স্ট্যান্ডার্ড টেকনিক্যাল 📚 চ্যাপ্টার পাবলিকেশন


চ্যাপ্টার: MARC 21 বা মেটাডাটা স্ট্যান্ডার্ড  টেকনিক্যাল 

MARC 21 (Machine-Readable Cataloging) হলো লাইব্রেরি অটোমেশনের জন্য সবচেয়ে গুরুত্বপূর্ণ এবং বহুল ব্যবহৃত একটি মেটাডাটা স্ট্যান্ডার্ড। এটি মূলত বই বা যেকোনো রিসোর্সের তথ্যকে এমনভাবে সাজায় যা কম্পিউটার সহজে বুঝতে এবং প্রসেস করতে পারে। নিচে MARC 21-এর টেকনিক্যাল গঠন এবং এর প্রধান দিকগুলো আলোচনা করা হলো:

📚 MARC 21-এর কাঠামো (Structure)

একটি MARC রেকর্ড মূলত তিনটি প্রধান অংশ নিয়ে গঠিত:

🌐 Leader (লিডার): এটি রেকর্ডের একদম শুরুতে থাকে (০-২৩ ক্যারেক্টার)। এটি কম্পিউটারকে জানায় রেকর্ডের দৈর্ঘ্য কত, এটি কী ধরণের রেকর্ড (বই নাকি ম্যাপ), এবং এর এনকোডিং লেভেল কী।

🌐 Directory (ডিরেক্টরি): এটি একটি ইনডেক্সের মতো কাজ করে। লিডারের পরেই এটি শুরু হয় এবং কম্পিউটারকে বলে দেয় যে কোন ট্যাগ (Tag) কত নম্বর পজিশন থেকে শুরু হয়েছে এবং তার দৈর্ঘ্য কত।

🌐 Variable Fields (ভেরিয়েবল ফিল্ডস): এখানে মূল তথ্যগুলো থাকে। একে দুই ভাগে ভাগ করা যায়:

  🌐 Control Fields (00X): এতে কোনো ইন্ডিকেটর বা সাবফিল্ড থাকে না (যেমন: 001, 008)।

  🌐 Data Fields (01X-8XX): এখানে মূল ক্যাটালগিং তথ্য থাকে।

📚 প্রধান কন্টেন্ট ডিজাইনators (Tags)

MARC 21-এ তথ্যগুলোকে নির্দিষ্ট সংখ্যার মাধ্যমে প্রকাশ করা হয়, যাকে Tag বলে। প্রধান কিছু ট্যাগ হলো:

✨ 020 | ISBN | আন্তর্জাতিক মান বই নম্বর। 

✨ 100 | Main Entry | প্রধান লেখক বা ব্যক্তির নাম। 

✨ 245 | Title Statement | বইয়ের শিরোনাম এবং দায়িত্বের বিবৃতি।

✨ 250 | Edition | সংস্করণ (যেমন: ৩য় সংস্করণ)। 

✨ 260/264 | Publication | প্রকাশকের নাম, স্থান এবং সাল। 

✨300 | Physical Description | পৃষ্ঠাসংখ্যা, আকার এবং অলঙ্করণ। 

✨ 650 | Subject Heading | বইটির মূল বিষয়বস্তু বা টপিক।

📚 ইন্ডিকেটর এবং সাবফিল্ড (Indicators & Subfields)

MARC 21-এর ডাটা ফিল্ডগুলোতে আরও সুনির্দিষ্ট তথ্যের জন্য দুটি গুরুত্বপূর্ণ এলিমেন্ট থাকে:

🌐 Indicators (ইন্ডিকেটর): প্রতিটি ডাটা ফিল্ডের সাথে দুটি ডিজিটাল পজিশন থাকে (০-৯ পর্যন্ত)। এগুলো কম্পিউটারকে নির্দেশ দেয় কীভাবে তথ্যটি ডিসপ্লে বা প্রসেস করতে হবে। (যেমন: ২৪৫ ফিল্ডের প্রথম ইন্ডিকেটর ঠিক করে টাইটেলটি মেইন এন্ট্রি হবে কি না)।

🌐 Subfield Codes (সাবফিল্ড কোড): তথ্যের ক্ষুদ্র অংশকে আলাদা করতে ডিক্লেয়ার করা হয়। এটি একটি চিহ্ন (যেমন: $, | বা ‡) এবং একটি অক্ষর দিয়ে প্রকাশ করা হয়।

  🌐 উদাহরণ: 245 $a শিরোনাম $b উপ-শিরোনাম $c লেখকের নাম।

📚 মেটাডাটা স্ট্যান্ডার্ড হিসেবে গুরুত্ব

🌐 Interoperability: এটি Z39.50 বা OAI-PMH প্রোটোকলের মাধ্যমে এক লাইব্রেরি থেকে অন্য লাইব্রেরিতে ডাটা আদান-প্রদান সহজ করে।

🌐 Automation: Koha, Evergreen-এর মতো আধুনিক লাইব্রেরি ম্যানেজমেন্ট সফটওয়্যারগুলো MARC 21 ছাড়া অসম্পূর্ণ।

🌐 Standardization: এটি বিশ্বজুড়ে ক্যাটালগিংয়ে অভিন্নতা বজায় রাখে।

✨ MARCXML-এর টেকনিক্যাল গঠন এবং এর ব্যবহারের সুবিধাগুলো বিস্তারিতভাবে জানাতে পারি। MARCXML হলো মূলত MARC 21 রেকর্ডের একটি XML (Extensible Markup Language) রিপ্রেজেন্টেশন, যা আধুনিক ওয়েব এবং ডিজিটাল লাইব্রেরি ইকোসিস্টেমে ডাটা আদান-প্রদান সহজ করে। নিচে এর টেকনিক্যাল ডিটেইলস আলোচনা করা হলো:

🌐 MARCXML-এর মূল কাঠামো (Architecture)

MARCXML মূলত একটি নির্দিষ্ট XML Schema (XSD) অনুসরণ করে। এর প্রধান এলিমেন্টগুলো হলো:

✍ <record>: এটি একটি একক MARC রেকর্ডের রুট এলিমেন্ট।

✍ <leader>: এটি MARC 21-এর লিডার (২৪ ক্যারেক্টার) ধারণ করে।

✍ <controlfield>: ট্যাগ নম্বর 001 থেকে 008 পর্যন্ত তথ্য এখানে থাকে। এর কোনো সাবফিল্ড বা ইন্ডিকেটর থাকে না।

  ✍ উদাহরণ: <controlfield tag="001">12345</controlfield>

✍ <datafield>: ট্যাগ নম্বর 01X থেকে 8XX পর্যন্ত তথ্য এখানে থাকে। এতে ind1 এবং ind2 (ইন্ডিকেটর) থাকে।

✍ <subfield>: ডাটাফিল্ডের ভেতরে নির্দিষ্ট তথ্যের অংশগুলো এখানে থাকে, যা একটি code এট্রিবিউট বহন করে।

📚 টেকনিক্যাল উদাহরন (Code Snippet)

একটি বইয়ের শিরোনাম (২৪৫ ফিল্ড) MARCXML-এ দেখতে কেমন হয়, তা নিচে দেওয়া হলো:

<datafield tag="245" ind1="1" ind2="0">

  <subfield code="a">The Catcher in the Rye /</subfield>

  <subfield code="c">J.D. Salinger.</subfield>

</datafield>


📚 কেন MARCXML গুরুত্বপূর্ণ? (Technical Advantages)

লাইব্রেরি অটোমেশন এবং ডিজিটাল আর্কাইভের ক্ষেত্রে এটি বেশ কিছু সুবিধা প্রদান করে:

🌐 Interoperability: এটি OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) প্রোটোকলের মাধ্যমে সহজে মেটাডাটা হারভেস্ট করতে সাহায্য করে।

🌐 Flexibility: প্রথাগত বাইনারি MARC রেকর্ড পড়া কঠিন, কিন্তু XML ফাইল যেকোনো ব্রাউজার বা সাধারণ টেক্সট এডিটরে পড়া ও প্রসেস করা যায়।

🌐 Easy Conversion: MARCXML থেকে সহজে Dublin Core, MODS, বা HTML-এ রূপান্তর করা সম্ভব (XSLT ব্যবহার করে)।

🌐 Web Integration: আধুনিক লাইব্রেরি সফটওয়্যার (যেমন: Koha, DSpace) মেটাডাটা ইমপোর্ট-এক্সপোর্টের জন্য ডিফল্ট হিসেবে MARCXML ব্যবহার করে।

📚 MARC 21 বনাম MARCXML

👉 ফরম্যাট | ISO 2709 (অস্পষ্ট বাইনারি) | XML (মানুষ ও মেশিনের পাঠযোগ্য)

👉 স্টোরেজ | কম জায়গা লাগে | বেশি জায়গা লাগে

👉 ব্যবহার | ডাটাবেস লেভেলে স্টোরেজ | ডাটা আদান-প্রদান ও ওয়েব পাবলিশিং 

👉 টুলস | MarcEdit-এর মতো স্পেশাল টুলস লাগে | যেকোনো XML লাইব্রেরি/টুলস দিয়ে চলে

কোনো MARC রেকর্ডকে XML-এ কনভার্ট করার জন্য  MarcEdit বা পাইথনের pymarc লাইব্রেরি ব্যবহার করা যায়। মেটাডাটা ম্যাপিং বা এক স্ট্যান্ডার্ড থেকে অন্য স্ট্যান্ডার্ডে তথ্য রূপান্তর (Crosswalk) করা লাইব্রেরি অটোমেশনের একটি অত্যন্ত গুরুত্বপূর্ণ প্রযুক্তিগত ধাপ। বিশেষ করে যখন আপনি MARC 21 (যা অত্যন্ত বিস্তারিত) থেকে Dublin Core (যা তুলনামূলক সহজ ও সংক্ষিপ্ত)-এ তথ্য স্থানান্তর করেন, তখন কিছু নির্দিষ্ট নিয়ম মেনে চলতে হয়।

📚 নিচে MARC থেকে Dublin Core (DC)-এর ম্যাপিং এবং কনভার্সন পদ্ধতির একটি কারিগরি রূপরেখা দেওয়া হলো:

✨মেটাডাটা ম্যাপিং টেবিল (MARC to Dublin Core)

সব MARC ফিল্ডকে Dublin Core-এর ১৫টি এলিমেন্টের মধ্যে জায়গা দিতে হয়। প্রধান ম্যাপিংগুলো নিচে দেওয়া হলো:

👉 100, 110, 111 | dc:creator | প্রধান লেখক বা কর্পোরেট বডি। 

👉245 $a, $b | dc:title | বই বা রিসোর্সের মূল শিরোনাম। 

👉 260 $c / 264 $c | dc:date | প্রকাশের তারিখ বা সাল।

👉 260 $b / 264 $b | dc:publisher | প্রকাশকের নাম।

👉 650, 651 | dc:subject | বিষয়ভিত্তিক কীওয়ার্ড বা ইনডেক্স টার্ম।

👉 020 $a | dc:identifier | ISBN বা অন্য কোনো স্বতন্ত্র নম্বর।

👉 500, 520 | dc:description | সাধারণ নোট বা সারসংক্ষেপ।

👉 300 $a | dc:format | পৃষ্ঠাসংখ্যা বা রিসোর্সের ধরন।

👉 546 $a | dc:language | ভাষা (যেমন: Bengali, English)। |

📚 কনভার্সন বা রূপান্তর পদ্ধতি (Technical Methods)

মেটাডাটা কনভার্সন সাধারণত তিনটি উপায়ে করা হয়:

ক. XSLT (Extensible Stylesheet Language Transformations)

এটি সবচেয়ে জনপ্রিয় পদ্ধতি। যদি আপনার কাছে MARCXML ফাইল থাকে, তবে একটি XSLT স্টাইলশিট ব্যবহার করে মুহূর্তেই সেটিকে Dublin Core XML-এ রূপান্তর করা যায়।

✍ লাইব্রেরি অব কংগ্রেস (Library of Congress)-এর তৈরি করা স্ট্যান্ডার্ড XSLT ফাইল পাওয়া যায় যা এই রূপান্তর নিখুঁতভাবে করে।

খ. MarcEdit সফটওয়্যার ব্যবহার

এটি লাইব্রেরিয়ানদের জন্য সবচেয়ে সহজ টুল। এর Export Metadata ফিচার ব্যবহার করে আপনি .mrc ফাইলকে সরাসরি Dublin Core ফরম্যাটে (XML বা Tab Delimited) নিয়ে আসতে পারেন।

গ. প্রোগ্রামিং (Python/pymarc)

যদি আপনি অটোমেশন বা স্ক্রিপ্ট ব্যবহার করতে চান, তবে পাইথনের pymarc লাইব্রেরি দিয়ে নির্দিষ্ট ফিল্ডগুলো তুলে এনে Dublin Core ফরম্যাটে সাজানো যায়।

🐯 ম্যাপিংয়ের চ্যালেঞ্জসমূহ

🧭 Granularity Loss: MARC-এ অনেক সূক্ষ্ম তথ্য থাকে (যেমন: প্রকাশকের শহর, নাম, ও সাল আলাদা সাবফিল্ডে থাকে), কিন্তু Dublin Core-এ সেগুলো সব একসাথে dc:publisher বা dc:date-এ চলে আসে। ফলে তথ্যের গভীরতা কিছুটা কমে যায়।

🧭 Repeatable Fields: MARC-এ একাধিক সাবজেক্ট ফিল্ড থাকতে পারে, যা Dublin Core-এ একাধিক <dc:subject> ট্যাগ হিসেবে যুক্ত করতে হয়।

🐯 ব্যবহারিক প্রয়োগ

আপনি যদি Koha থেকে ডাটা এক্সপোর্ট করে DSpace (Institutional Repository)-এ আপলোড করতে চান, তবে এই ম্যাপিং এবং কনভার্সনটি করা জরুরি। কারণ DSpace মূলত Dublin Core স্ট্যান্ডার্ড ব্যবহার করে। Koha (LMS) এবং DSpace (IR)-এর মধ্যে মেটাডাটা সিঙ্ক্রোনাইজেশন বা ইমপ্লিমেন্টেশন একটি অত্যন্ত উন্নত টেকনিক্যাল কাজ। তবে নিচের গাইডলাইনটি অত্যন্ত গুরুত্বপূর্ণ :

🐒 Koha-তে MARC 21 ম্যাপিং (Data Entry level)

Koha মূলত MARC 21 ফ্রেমওয়ার্ক ব্যবহার করে। এখানে নতুন কোনো ফিল্ড যোগ করতে বা ম্যাপিং করতে হলে:

🐒 Koha Administration > MARC Bibliographic Framework-এ যেতে হয়।

🐒 এখানে আপনার প্রয়োজনীয় Framework (যেমন: Books বা Serial) সিলেক্ট করে MARC Structure-এ গিয়ে নির্দিষ্ট ট্যাগ (যেমন: 020, 100, 245) এডিট করা যায়।

🐒 আপনি যদি চান কোনো নির্দিষ্ট ফিল্ড আপনার OPAC-এ দেখা যাবে কি না, তবে সেটি 'Subfield Structure'-এর 'Visibility' ট্যাব থেকে নিয়ন্ত্রণ করতে পারেন।

📚 Koha থেকে DSpace-এ ডাটা ট্রান্সফার (Harvesting)

যদি আপনি চান Koha-র রেকর্ডগুলো অটোমেটিক DSpace-এ চলে আসুক, তবে OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) প্রোটোকল ব্যবহার করতে হবে।

📗 ধাপ ১: Koha-তে OAI-PMH সার্ভার এনাবেল করুন (Koha Admin > Global System Preferences > OAI-PMH).

📗 ধাপ ২: DSpace-এ গিয়ে Collection Management থেকে OAI Harvesting অপশনটি সেটআপ করুন।

📗 ম্যাপিং: এই প্রক্রিয়ায় Koha-র MARC ডাটা স্বয়ংক্রিয়ভাবে DSpace-এর Dublin Core ফরম্যাটে ম্যাপ হয়ে যায়।

✨ DSpace-এ Dublin Core কাস্টমাইজেশন

DSpace-এ ডিফল্টভাবে ১৫টি Dublin Core এলিমেন্ট থাকে। তবে আপনি যদি আরও বিস্তারিত তথ্য দিতে চান:

✍ dspace.cfg ফাইলে গিয়ে মেটাডাটা স্কিমা (Metadata Schema) এডিট করা যায়।

 যেমন: আপনি যদি কোনো গবেষণাপত্রের জন্য বিশেষ কোনো ফিল্ড (যেমন: dc.description.abstract) যোগ করতে চান, তবে তা মেটাডাটা রেজিস্ট্রি থেকে করা সম্ভব।

টেকনিক্যাল টিপস (Data Librarian হিসেবে আপনার জন্য):

📗MarcEdit টুল: আপনি যদি একসাথে অনেকগুলো রেকর্ড (Bulk Upload) Koha বা DSpace-এ দিতে চান, তবে MarcEdit সফটওয়্যারটি ব্যবহার করে প্রথমে ডাটা ক্লিন এবং ম্যাপিং করে নেওয়া সবচেয়ে নিরাপদ।

📗 Excel to MARC: আপনি যদি এক্সেল শিটে ডাটা এন্ট্রি করেন, তবে সেটিকে .mrc বা MARCXML ফরম্যাটে কনভার্ট করে Koha-তে ইমপোর্ট করা অনেক সহজ।

লাইব্রেরি সায়েন্স এবং ডিজিটাল ডাটা ম্যানেজমেন্টের ক্ষেত্রে Koha, DSpace, এবং MarcEdit-এর মতো সফটওয়্যারগুলোর প্রপার কনফিগারেশন খুবই গুরুত্বপূর্ণ। আপনি যদি আপনার প্রফেশনাল ব্লগ বা একাডেমিক কাজের জন্য এগুলো ব্যবহার করতে চান, তবে আমি আপনাকে নিচের টেকনিক্যাল গাইডলাইনগুলো দিয়ে সাহায্য করতে পারি:

🦁 Koha Installation & Configuration (LMS)

Koha মূলত লিনাক্স (বিশেষ করে Ubuntu) এনভায়রনমেন্টে সবচেয়ে ভালো কাজ করে। এর প্রধান কনফিগারেশন ধাপগুলো হলো:

🐯 Installation: উবুন্টু টার্মিনালে koha-common প্যাকেজ এবং MariaDB ডাটাবেস সেটআপ করা।

🐯 Z39.50 Server Setup: অন্য লাইব্রেরি (যেমন: Library of Congress) থেকে সরাসরি ক্যাটালগ ডাটা কপি করার জন্য এটি কনফিগার করা।

🐯 SMTP Configuration: ইউজারদের অটোমেটিক ইমেইল নোটিফিকেশন পাঠানোর জন্য জিমেইল বা অন্য মেইল সার্ভারের সাথে কানেক্ট করা।

📚 DSpace Configuration (Institutional Repository)

ডিজিটাল আর্কাইভ তৈরির জন্য DSpace-এর সেটআপ কিছুটা জটিল কারণ এটি Java (JDK), Apache Tomcat, এবং PostgreSQL-এর উপর ভিত্তি করে চলে।

📗 Metadata Registry: ডিফল্ট Dublin Core ছাড়াও যদি আপনার কাস্টম মেটাডাটা ফিল্ড লাগে, তবে সেটি কনফিগার করা।

📗 OAI-PMH Harvesting: অন্য সার্ভার থেকে মেটাডাটা অটোমেটিক সংগ্রহ করার জন্য প্রোটোকল সেটআপ করা।

📗 Search Engine (Solr): আপনার রিপোজিটরিতে দ্রুত সার্চ করার জন্য Solr কনফিগার করা।

📚 MarcEdit (Data Manipulation Tool)

এটি মূলত উইন্ডোজ বা ম্যাক-এ চলে এবং ক্যাটালগ ডাটা ক্লিনিংয়ের জন্য অপরিহার্য।

📗 Excel to MARC Conversion: আপনার কাছে যদি এক্সেল শিটে অনেক বইয়ের তথ্য থাকে, তবে সেটিকে .mrc ফাইলে রূপান্তর করার টেকনিক্যাল ধাপ।

📗 Batch Editing: হাজার হাজার রেকর্ডের কোনো নির্দিষ্ট ফিল্ড (যেমন: ৫০০ নম্বর নোট ফিল্ড) এক ক্লিকে পরিবর্তন বা ডিলিট করা।

আপনার জন্য একটি বিশেষ টেকনিক্যাল টিপ:

আপনি যদি Koha 24.05 বা তার পরবর্তী ভার্সন ব্যবহার করেন, তবে সেখানে REST API-এর সুবিধা রয়েছে। এটি ব্যবহার করে আপনি আপনার ব্লগে সরাসরি লাইব্রেরির রিয়েল-টাইম ডাটা বা ক্যাটালগ ডিসপ্লে করতে পারেন।


No comments:

Featured Post

কম্পিউটার সিস্টেম সেটআপ : আলোচনা

কম্পিউটার সিস্টেম ছবিটি একটি আধুনিক কম্পিউটার সিস্টেমের বিভিন্ন অংশ (Parts of a Computer System) নিয়ে একটি চমৎকার তথ্যচিত্র। একট...

Writer Profile

Writer Profile
Writing Books _ Click Photo