MARC 21 বা মেটাডাটা স্ট্যান্ডার্ড টেকনিক্যাল 📚 চ্যাপ্টার পাবলিকেশন

চ্যাপ্টার: MARC 21 বা মেটাডাটা স্ট্যান্ডার্ড টেকনিক্যাল

MARC 21 (Machine-Readable Cataloging) হলো লাইব্রেরি অটোমেশনের জন্য সবচেয়ে গুরুত্বপূর্ণ এবং বহুল ব্যবহৃত একটি মেটাডাটা স্ট্যান্ডার্ড। এটি মূলত বই বা যেকোনো রিসোর্সের তথ্যকে এমনভাবে সাজায় যা কম্পিউটার সহজে বুঝতে এবং প্রসেস করতে পারে। নিচে MARC 21-এর টেকনিক্যাল গঠন এবং এর প্রধান দিকগুলো আলোচনা করা হলো:

📚 MARC 21-এর কাঠামো (Structure)

একটি MARC রেকর্ড মূলত তিনটি প্রধান অংশ নিয়ে গঠিত:

🌐 Leader (লিডার): এটি রেকর্ডের একদম শুরুতে থাকে (০-২৩ ক্যারেক্টার)। এটি কম্পিউটারকে জানায় রেকর্ডের দৈর্ঘ্য কত, এটি কী ধরণের রেকর্ড (বই নাকি ম্যাপ), এবং এর এনকোডিং লেভেল কী।

🌐 Directory (ডিরেক্টরি): এটি একটি ইনডেক্সের মতো কাজ করে। লিডারের পরেই এটি শুরু হয় এবং কম্পিউটারকে বলে দেয় যে কোন ট্যাগ (Tag) কত নম্বর পজিশন থেকে শুরু হয়েছে এবং তার দৈর্ঘ্য কত।

🌐 Variable Fields (ভেরিয়েবল ফিল্ডস): এখানে মূল তথ্যগুলো থাকে। একে দুই ভাগে ভাগ করা যায়:

🌐 Control Fields (00X): এতে কোনো ইন্ডিকেটর বা সাবফিল্ড থাকে না (যেমন: 001, 008)।

🌐 Data Fields (01X-8XX): এখানে মূল ক্যাটালগিং তথ্য থাকে।

📚 প্রধান কন্টেন্ট ডিজাইনators (Tags)

MARC 21-এ তথ্যগুলোকে নির্দিষ্ট সংখ্যার মাধ্যমে প্রকাশ করা হয়, যাকে Tag বলে। প্রধান কিছু ট্যাগ হলো:

✨ 020 | ISBN | আন্তর্জাতিক মান বই নম্বর।

✨ 100 | Main Entry | প্রধান লেখক বা ব্যক্তির নাম।

✨ 245 | Title Statement | বইয়ের শিরোনাম এবং দায়িত্বের বিবৃতি।

✨ 250 | Edition | সংস্করণ (যেমন: ৩য় সংস্করণ)।

✨ 260/264 | Publication | প্রকাশকের নাম, স্থান এবং সাল।

✨300 | Physical Description | পৃষ্ঠাসংখ্যা, আকার এবং অলঙ্করণ।

✨ 650 | Subject Heading | বইটির মূল বিষয়বস্তু বা টপিক।

📚 ইন্ডিকেটর এবং সাবফিল্ড (Indicators & Subfields)

MARC 21-এর ডাটা ফিল্ডগুলোতে আরও সুনির্দিষ্ট তথ্যের জন্য দুটি গুরুত্বপূর্ণ এলিমেন্ট থাকে:

🌐 Indicators (ইন্ডিকেটর): প্রতিটি ডাটা ফিল্ডের সাথে দুটি ডিজিটাল পজিশন থাকে (০-৯ পর্যন্ত)। এগুলো কম্পিউটারকে নির্দেশ দেয় কীভাবে তথ্যটি ডিসপ্লে বা প্রসেস করতে হবে। (যেমন: ২৪৫ ফিল্ডের প্রথম ইন্ডিকেটর ঠিক করে টাইটেলটি মেইন এন্ট্রি হবে কি না)।

🌐 Subfield Codes (সাবফিল্ড কোড): তথ্যের ক্ষুদ্র অংশকে আলাদা করতে ডিক্লেয়ার করা হয়। এটি একটি চিহ্ন (যেমন: $, | বা ‡) এবং একটি অক্ষর দিয়ে প্রকাশ করা হয়।

🌐 উদাহরণ: 245 $a শিরোনাম $b উপ-শিরোনাম $c লেখকের নাম।

📚 মেটাডাটা স্ট্যান্ডার্ড হিসেবে গুরুত্ব

🌐 Interoperability: এটি Z39.50 বা OAI-PMH প্রোটোকলের মাধ্যমে এক লাইব্রেরি থেকে অন্য লাইব্রেরিতে ডাটা আদান-প্রদান সহজ করে।

🌐 Automation: Koha, Evergreen-এর মতো আধুনিক লাইব্রেরি ম্যানেজমেন্ট সফটওয়্যারগুলো MARC 21 ছাড়া অসম্পূর্ণ।

🌐 Standardization: এটি বিশ্বজুড়ে ক্যাটালগিংয়ে অভিন্নতা বজায় রাখে।

✨ MARCXML-এর টেকনিক্যাল গঠন এবং এর ব্যবহারের সুবিধাগুলো বিস্তারিতভাবে জানাতে পারি। MARCXML হলো মূলত MARC 21 রেকর্ডের একটি XML (Extensible Markup Language) রিপ্রেজেন্টেশন, যা আধুনিক ওয়েব এবং ডিজিটাল লাইব্রেরি ইকোসিস্টেমে ডাটা আদান-প্রদান সহজ করে। নিচে এর টেকনিক্যাল ডিটেইলস আলোচনা করা হলো:

🌐 MARCXML-এর মূল কাঠামো (Architecture)

MARCXML মূলত একটি নির্দিষ্ট XML Schema (XSD) অনুসরণ করে। এর প্রধান এলিমেন্টগুলো হলো:

✍ <record>: এটি একটি একক MARC রেকর্ডের রুট এলিমেন্ট।

✍ <leader>: এটি MARC 21-এর লিডার (২৪ ক্যারেক্টার) ধারণ করে।

✍ <controlfield>: ট্যাগ নম্বর 001 থেকে 008 পর্যন্ত তথ্য এখানে থাকে। এর কোনো সাবফিল্ড বা ইন্ডিকেটর থাকে না।

✍ উদাহরণ: <controlfield tag="001">12345</controlfield>

✍ <datafield>: ট্যাগ নম্বর 01X থেকে 8XX পর্যন্ত তথ্য এখানে থাকে। এতে ind1 এবং ind2 (ইন্ডিকেটর) থাকে।

✍ <subfield>: ডাটাফিল্ডের ভেতরে নির্দিষ্ট তথ্যের অংশগুলো এখানে থাকে, যা একটি code এট্রিবিউট বহন করে।

📚 টেকনিক্যাল উদাহরন (Code Snippet)

একটি বইয়ের শিরোনাম (২৪৫ ফিল্ড) MARCXML-এ দেখতে কেমন হয়, তা নিচে দেওয়া হলো:

<subfield code="a">The Catcher in the Rye /</subfield>

<subfield code="c">J.D. Salinger.</subfield>

</datafield>

📚 কেন MARCXML গুরুত্বপূর্ণ? (Technical Advantages)

লাইব্রেরি অটোমেশন এবং ডিজিটাল আর্কাইভের ক্ষেত্রে এটি বেশ কিছু সুবিধা প্রদান করে:

🌐 Interoperability: এটি OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) প্রোটোকলের মাধ্যমে সহজে মেটাডাটা হারভেস্ট করতে সাহায্য করে।

🌐 Flexibility: প্রথাগত বাইনারি MARC রেকর্ড পড়া কঠিন, কিন্তু XML ফাইল যেকোনো ব্রাউজার বা সাধারণ টেক্সট এডিটরে পড়া ও প্রসেস করা যায়।

🌐 Easy Conversion: MARCXML থেকে সহজে Dublin Core, MODS, বা HTML-এ রূপান্তর করা সম্ভব (XSLT ব্যবহার করে)।

🌐 Web Integration: আধুনিক লাইব্রেরি সফটওয়্যার (যেমন: Koha, DSpace) মেটাডাটা ইমপোর্ট-এক্সপোর্টের জন্য ডিফল্ট হিসেবে MARCXML ব্যবহার করে।

📚 MARC 21 বনাম MARCXML

👉 ফরম্যাট | ISO 2709 (অস্পষ্ট বাইনারি) | XML (মানুষ ও মেশিনের পাঠযোগ্য)

👉 স্টোরেজ | কম জায়গা লাগে | বেশি জায়গা লাগে

👉 ব্যবহার | ডাটাবেস লেভেলে স্টোরেজ | ডাটা আদান-প্রদান ও ওয়েব পাবলিশিং

👉 টুলস | MarcEdit-এর মতো স্পেশাল টুলস লাগে | যেকোনো XML লাইব্রেরি/টুলস দিয়ে চলে

কোনো MARC রেকর্ডকে XML-এ কনভার্ট করার জন্য MarcEdit বা পাইথনের pymarc লাইব্রেরি ব্যবহার করা যায়। মেটাডাটা ম্যাপিং বা এক স্ট্যান্ডার্ড থেকে অন্য স্ট্যান্ডার্ডে তথ্য রূপান্তর (Crosswalk) করা লাইব্রেরি অটোমেশনের একটি অত্যন্ত গুরুত্বপূর্ণ প্রযুক্তিগত ধাপ। বিশেষ করে যখন আপনি MARC 21 (যা অত্যন্ত বিস্তারিত) থেকে Dublin Core (যা তুলনামূলক সহজ ও সংক্ষিপ্ত)-এ তথ্য স্থানান্তর করেন, তখন কিছু নির্দিষ্ট নিয়ম মেনে চলতে হয়।

📚 নিচে MARC থেকে Dublin Core (DC)-এর ম্যাপিং এবং কনভার্সন পদ্ধতির একটি কারিগরি রূপরেখা দেওয়া হলো:

✨মেটাডাটা ম্যাপিং টেবিল (MARC to Dublin Core)

সব MARC ফিল্ডকে Dublin Core-এর ১৫টি এলিমেন্টের মধ্যে জায়গা দিতে হয়। প্রধান ম্যাপিংগুলো নিচে দেওয়া হলো:

👉 100, 110, 111 | dc:creator | প্রধান লেখক বা কর্পোরেট বডি।

👉245 $a, $b | dc:title | বই বা রিসোর্সের মূল শিরোনাম।

👉 260 $c / 264 $c | dc:date | প্রকাশের তারিখ বা সাল।

👉 260 $b / 264 $b | dc:publisher | প্রকাশকের নাম।

👉 650, 651 | dc:subject | বিষয়ভিত্তিক কীওয়ার্ড বা ইনডেক্স টার্ম।

👉 020 $a | dc:identifier | ISBN বা অন্য কোনো স্বতন্ত্র নম্বর।

👉 500, 520 | dc:description | সাধারণ নোট বা সারসংক্ষেপ।

👉 300 $a | dc:format | পৃষ্ঠাসংখ্যা বা রিসোর্সের ধরন।

👉 546 $a | dc:language | ভাষা (যেমন: Bengali, English)। |

📚 কনভার্সন বা রূপান্তর পদ্ধতি (Technical Methods)

মেটাডাটা কনভার্সন সাধারণত তিনটি উপায়ে করা হয়:

ক. XSLT (Extensible Stylesheet Language Transformations)

এটি সবচেয়ে জনপ্রিয় পদ্ধতি। যদি আপনার কাছে MARCXML ফাইল থাকে, তবে একটি XSLT স্টাইলশিট ব্যবহার করে মুহূর্তেই সেটিকে Dublin Core XML-এ রূপান্তর করা যায়।

✍ লাইব্রেরি অব কংগ্রেস (Library of Congress)-এর তৈরি করা স্ট্যান্ডার্ড XSLT ফাইল পাওয়া যায় যা এই রূপান্তর নিখুঁতভাবে করে।

খ. MarcEdit সফটওয়্যার ব্যবহার

এটি লাইব্রেরিয়ানদের জন্য সবচেয়ে সহজ টুল। এর Export Metadata ফিচার ব্যবহার করে আপনি .mrc ফাইলকে সরাসরি Dublin Core ফরম্যাটে (XML বা Tab Delimited) নিয়ে আসতে পারেন।

গ. প্রোগ্রামিং (Python/pymarc)

যদি আপনি অটোমেশন বা স্ক্রিপ্ট ব্যবহার করতে চান, তবে পাইথনের pymarc লাইব্রেরি দিয়ে নির্দিষ্ট ফিল্ডগুলো তুলে এনে Dublin Core ফরম্যাটে সাজানো যায়।

🐯 ম্যাপিংয়ের চ্যালেঞ্জসমূহ

🧭 Granularity Loss: MARC-এ অনেক সূক্ষ্ম তথ্য থাকে (যেমন: প্রকাশকের শহর, নাম, ও সাল আলাদা সাবফিল্ডে থাকে), কিন্তু Dublin Core-এ সেগুলো সব একসাথে dc:publisher বা dc:date-এ চলে আসে। ফলে তথ্যের গভীরতা কিছুটা কমে যায়।

🧭 Repeatable Fields: MARC-এ একাধিক সাবজেক্ট ফিল্ড থাকতে পারে, যা Dublin Core-এ একাধিক <dc:subject> ট্যাগ হিসেবে যুক্ত করতে হয়।

🐯 ব্যবহারিক প্রয়োগ

আপনি যদি Koha থেকে ডাটা এক্সপোর্ট করে DSpace (Institutional Repository)-এ আপলোড করতে চান, তবে এই ম্যাপিং এবং কনভার্সনটি করা জরুরি। কারণ DSpace মূলত Dublin Core স্ট্যান্ডার্ড ব্যবহার করে। Koha (LMS) এবং DSpace (IR)-এর মধ্যে মেটাডাটা সিঙ্ক্রোনাইজেশন বা ইমপ্লিমেন্টেশন একটি অত্যন্ত উন্নত টেকনিক্যাল কাজ। তবে নিচের গাইডলাইনটি অত্যন্ত গুরুত্বপূর্ণ :

🐒 Koha-তে MARC 21 ম্যাপিং (Data Entry level)

Koha মূলত MARC 21 ফ্রেমওয়ার্ক ব্যবহার করে। এখানে নতুন কোনো ফিল্ড যোগ করতে বা ম্যাপিং করতে হলে:

🐒 Koha Administration > MARC Bibliographic Framework-এ যেতে হয়।

🐒 এখানে আপনার প্রয়োজনীয় Framework (যেমন: Books বা Serial) সিলেক্ট করে MARC Structure-এ গিয়ে নির্দিষ্ট ট্যাগ (যেমন: 020, 100, 245) এডিট করা যায়।

🐒 আপনি যদি চান কোনো নির্দিষ্ট ফিল্ড আপনার OPAC-এ দেখা যাবে কি না, তবে সেটি 'Subfield Structure'-এর 'Visibility' ট্যাব থেকে নিয়ন্ত্রণ করতে পারেন।

📚 Koha থেকে DSpace-এ ডাটা ট্রান্সফার (Harvesting)

যদি আপনি চান Koha-র রেকর্ডগুলো অটোমেটিক DSpace-এ চলে আসুক, তবে OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) প্রোটোকল ব্যবহার করতে হবে।

📗 ধাপ ১: Koha-তে OAI-PMH সার্ভার এনাবেল করুন (Koha Admin > Global System Preferences > OAI-PMH).

📗 ধাপ ২: DSpace-এ গিয়ে Collection Management থেকে OAI Harvesting অপশনটি সেটআপ করুন।

📗 ম্যাপিং: এই প্রক্রিয়ায় Koha-র MARC ডাটা স্বয়ংক্রিয়ভাবে DSpace-এর Dublin Core ফরম্যাটে ম্যাপ হয়ে যায়।

✨ DSpace-এ Dublin Core কাস্টমাইজেশন

DSpace-এ ডিফল্টভাবে ১৫টি Dublin Core এলিমেন্ট থাকে। তবে আপনি যদি আরও বিস্তারিত তথ্য দিতে চান:

✍ dspace.cfg ফাইলে গিয়ে মেটাডাটা স্কিমা (Metadata Schema) এডিট করা যায়।

যেমন: আপনি যদি কোনো গবেষণাপত্রের জন্য বিশেষ কোনো ফিল্ড (যেমন: dc.description.abstract) যোগ করতে চান, তবে তা মেটাডাটা রেজিস্ট্রি থেকে করা সম্ভব।

টেকনিক্যাল টিপস (Data Librarian হিসেবে আপনার জন্য):

📗MarcEdit টুল: আপনি যদি একসাথে অনেকগুলো রেকর্ড (Bulk Upload) Koha বা DSpace-এ দিতে চান, তবে MarcEdit সফটওয়্যারটি ব্যবহার করে প্রথমে ডাটা ক্লিন এবং ম্যাপিং করে নেওয়া সবচেয়ে নিরাপদ।

📗 Excel to MARC: আপনি যদি এক্সেল শিটে ডাটা এন্ট্রি করেন, তবে সেটিকে .mrc বা MARCXML ফরম্যাটে কনভার্ট করে Koha-তে ইমপোর্ট করা অনেক সহজ।

লাইব্রেরি সায়েন্স এবং ডিজিটাল ডাটা ম্যানেজমেন্টের ক্ষেত্রে Koha, DSpace, এবং MarcEdit-এর মতো সফটওয়্যারগুলোর প্রপার কনফিগারেশন খুবই গুরুত্বপূর্ণ। আপনি যদি আপনার প্রফেশনাল ব্লগ বা একাডেমিক কাজের জন্য এগুলো ব্যবহার করতে চান, তবে আমি আপনাকে নিচের টেকনিক্যাল গাইডলাইনগুলো দিয়ে সাহায্য করতে পারি:

🦁 Koha Installation & Configuration (LMS)

Koha মূলত লিনাক্স (বিশেষ করে Ubuntu) এনভায়রনমেন্টে সবচেয়ে ভালো কাজ করে। এর প্রধান কনফিগারেশন ধাপগুলো হলো:

🐯 Installation: উবুন্টু টার্মিনালে koha-common প্যাকেজ এবং MariaDB ডাটাবেস সেটআপ করা।

🐯 Z39.50 Server Setup: অন্য লাইব্রেরি (যেমন: Library of Congress) থেকে সরাসরি ক্যাটালগ ডাটা কপি করার জন্য এটি কনফিগার করা।

🐯 SMTP Configuration: ইউজারদের অটোমেটিক ইমেইল নোটিফিকেশন পাঠানোর জন্য জিমেইল বা অন্য মেইল সার্ভারের সাথে কানেক্ট করা।

📚 DSpace Configuration (Institutional Repository)

ডিজিটাল আর্কাইভ তৈরির জন্য DSpace-এর সেটআপ কিছুটা জটিল কারণ এটি Java (JDK), Apache Tomcat, এবং PostgreSQL-এর উপর ভিত্তি করে চলে।

📗 Metadata Registry: ডিফল্ট Dublin Core ছাড়াও যদি আপনার কাস্টম মেটাডাটা ফিল্ড লাগে, তবে সেটি কনফিগার করা।

📗 OAI-PMH Harvesting: অন্য সার্ভার থেকে মেটাডাটা অটোমেটিক সংগ্রহ করার জন্য প্রোটোকল সেটআপ করা।

📗 Search Engine (Solr): আপনার রিপোজিটরিতে দ্রুত সার্চ করার জন্য Solr কনফিগার করা।

📚 MarcEdit (Data Manipulation Tool)

এটি মূলত উইন্ডোজ বা ম্যাক-এ চলে এবং ক্যাটালগ ডাটা ক্লিনিংয়ের জন্য অপরিহার্য।

📗 Excel to MARC Conversion: আপনার কাছে যদি এক্সেল শিটে অনেক বইয়ের তথ্য থাকে, তবে সেটিকে .mrc ফাইলে রূপান্তর করার টেকনিক্যাল ধাপ।

📗 Batch Editing: হাজার হাজার রেকর্ডের কোনো নির্দিষ্ট ফিল্ড (যেমন: ৫০০ নম্বর নোট ফিল্ড) এক ক্লিকে পরিবর্তন বা ডিলিট করা।

আপনার জন্য একটি বিশেষ টেকনিক্যাল টিপ:

আপনি যদি Koha 24.05 বা তার পরবর্তী ভার্সন ব্যবহার করেন, তবে সেখানে REST API-এর সুবিধা রয়েছে। এটি ব্যবহার করে আপনি আপনার ব্লগে সরাসরি লাইব্রেরির রিয়েল-টাইম ডাটা বা ক্যাটালগ ডিসপ্লে করতে পারেন।

Latest News

MARC 21 বা মেটাডাটা স্ট্যান্ডার্ড টেকনিক্যাল 📚 চ্যাপ্টার পাবলিকেশন

No comments:

Total Page views

Popular Posts

Search This Blog

Subscribe My Website

Get new posts by email:

My Blog List

Featured Post

কম্পিউটার সিস্টেম সেটআপ : আলোচনা

Writer Profile

Latest News

MARC 21 বা মেটাডাটা স্ট্যান্ডার্ড টেকনিক্যাল 📚 চ্যাপ্টার পাবলিকেশন

Related Post

No comments:

Total Page views

Popular Posts

Search This Blog

Subscribe My Website

Get new posts by email:

My Blog List

Featured Post

কম্পিউটার সিস্টেম সেটআপ : আলোচনা

Writer Profile