. भूमंडलीकरण में आईटी का योगदान है यूनिकोड - बालेन्दु शर्मा दाधीच सूचना प्रौद्योगिकी के क्षेत्र में विकास और सुधार की निरंतर प्...
.
भूमंडलीकरण में आईटी का योगदान है यूनिकोड
- बालेन्दु शर्मा दाधीच
सूचना प्रौद्योगिकी के क्षेत्र में विकास और सुधार की निरंतर प्रक्रिया चलती रहती है और इसी संदर्भ में पिछले कुछ वर्षों से सूचनाओं के भंडारण की एक आधुनिकतम पद्धति लोकप्रिय हो रही है जिसे यूनिकोड कहते हैं। यूनिकोड के माध्यम से पहली बार सूचना प्रौद्योगिकी पर अंग्रेजी की अनिवार्य निर्भरता से मुक्ति की संभावनाएं दिख रही हैं क्योंकि यह पद्धति एक आम कम्प्यूटर को विश्व की सभी भाषाओं में काम करने में सक्षम बना सकती है। जाहिर है, आईटी के क्षेत्र में भारतीय भाषाओं को विकसित होते देखने की आकांक्षा रखने वाले लोग यूनिकोड में छिपी संभावनाओं को देखकर उत्साहित हैं क्योंकि कई दशकों के बाद अब हम बिना अंग्रेजी जाने कंप्यूटर की क्षमताओं का प्रयोग करने की स्थिति में आ रहे हैं। मीडिया में कम्प्यूटर टेक्नॉलॉजी की असंदिग्ध रूप से महत्वपूर्ण भूमिका को देखते हुए कहा जा सकता है कि वह भी आने वाले कुछ वर्षों में इस काल-विभाजक परिघटना से प्रभावित हुए बिना नहीं रह सकता।
हालांकि यूनिकोड है तो सिर्फ डेटा के स्टोरेज संबंधी एनकोडिंग मानक, लेकिन इसके प्रयोग से कंप्यूटरों की कार्यप्रणाली और उनके इस्तेमाल के तौर-तरीकों में क्रांतिकारी बदलाव आ सकता है क्योंकि डेटा ही कंप्यूटरों के संचालन का केंद्र बिन्दु है। भले ही हम कंप्यूटर का किसी भी काम के लिए प्रयोग करें, मसलन लेखन कार्य के लिए, ध्वनि रिकॉर्डिंग के लिए या फिर वीडियो प्रोसेसिंग के लिए, हमें इसके लिए कंप्यूटर को या तो कुछ सूचनाएं प्रदान करनी पड़ती हैं (जैसे टाइपिंग के माध्यम से या रिकॉर्डिंग के जरिए) या फिर हम कुछ सूचनाएं कंप्यूटर से ग्रहण करते हैं (मसलन पहले से रिकार्डेड वीडियो को देखना या पहले से मौजूद फाइलों को खोलना)। इन्हें क्रमश: इनपुट और आउटपुट के रूप में जाना जाता है। इन दोनों प्रक्रियाओं में जिन सूचनाओं (डेटा) का प्रयोग होता है उसे कंप्यूटर पर अंकों के रूप में स्टोर किया जाता है क्योंकि वह सिर्फ अंकों की भाषा जानता है, और वह भी सिर्फ दो अंकों- 'शून्य' तथा 'एक' की भाषा। इन दो अंकों का भिन्न-भिन्न ढंग से पारस्परिक बाइनरी संयोजन कर अलग-अलग डेटा को कंप्यूटर पर रखा जा सकता है। मिसाल के तौर पर 01000001 का अर्थ है अंग्रेजी का कैपिटल ए अक्षर और 00110001 से तात्पर्य है 1 का अंक।
अक्षरों या पाठ्य सामग्री और कंप्यूटर पर स्टोर किए जाने वाले बाइनरी डिजिट्स के बीच तालमेल बिठाने वाली प्रणाली को एनकोडिंग कहते हैं। एनकोडिंग टेबल के माध्यम से कंप्यूटर यह तय करता है कि फलां बाइनरी कोड को फलां अक्षर या अंक के रूप में स्क्रीन पर प्रदर्शित किया जाए। किस एनकोडिंग में कितने बाइनरी अंक प्रयुक्त होते हैं, इसी पर उसकी क्षमता और नामकरण निर्भर होते हैं। उदाहरण के तौर पर अब तक लोकप्रिय एस्की एनकोडिंग को 7 बिट एनकोडिंग कहा जाता है क्योंकि इसमें हर संकेत या सूचना के भंडारण के लिए ऐसे सात बाइनरी डिजिट्स का प्रयोग होता है। एस्की एनकोडिंग के तहत इस तरह के 128 अलग-अलग संयोजन संभव हैं यानी इस एनकोडिंग का प्रयोग करने वाला कम्प्यूटर 128 अलग-अलग अक्षरों या संकेतों को समझ सकता है। अब तक कंप्यूटर इसी सीमा में बंधे हुए थे और इसीलिए भाषाओं के प्रयोग के लिए उन भाषाओं के फ़ॉन्ट पर सीमित थे जो इन संकेतों को कंप्यूटर स्क्रीन पर अलग-अलग ढंग से प्रदर्शित करते हैं। यदि अंग्रेजी का फ़ॉन्ट इस्तेमाल करें तो 01000001 संकेत को ए अक्षर के रूप में दिखाया जाएगा। लेकिन यदि हिंदी फ़ॉन्ट का प्रयोग करें तो यही संकेत ग, च या किसी और अक्षर के रूप में प्रदर्शित किया जाएगा।
यूनिकोड एक 16 बिट की एनकोडिंग व्यवस्था है, यानी इसमें हर संकेत को संग्रह और अभिव्यक्त करने के लिए सोलह बाइनरी डिजिट्स का इस्तेमाल होता है। इसीलिए इसमें 65536 अद्वितीय संयोजन संभव हैं। इसी वजह से यूनिकोड हमारे कंप्यूटर में सहेजे गए डेटा को फ़ॉन्ट की सीमाओं से बाहर निकाल देता है। इस एनकोडिंग में किसी भी अक्षर, अंक या संकेत को सोलह अंकों के अद्वितीय संयोजन के रूप में सहेज कर रखा जा सकता है। चूंकि किसी एक भाषा में इतने सारे अद्वितीय अक्षर मौजूद नहीं हैं इसलिए इस स्टैंडर्ड (मानक) में विश्व की लगभग सारी भाषाओं को शामिल कर लिया गया है। हर भाषा को इन 65536 संयोजनों में से उसकी वर्णमाला संबंधी आवश्यकताओं के अनुसार स्थान दिया गया है। इस व्यवस्था में सभी भाषाएं समान दर्जा रखती हैं और सहजीवी हैं। यानी यूनिकोड आधारित कम्प्यूटर पहले से ही विश्व की हर भाषा से परिचित है (बशर्ते ऑपरेटिंग सिस्टम में इसकी क्षमता हो)। भले ही वह हिंदी हो या पंजाबी, या फिर उड़िया। इतना ही नहीं, वह उन प्राचीन भाषाओं से भी परिचित है जो अब बोलचाल में इस्तेमाल नहीं होतीं, जैसे कि पालि या प्राकृत। और उन भाषाओं से भी जो संकेतों के रूप में प्रयुक्त होती हैं, जैसे कि गणितीय या वैज्ञानिक संकेत।
यूनिकोड के प्रयोग से सबसे बड़ा लाभ यह हुआ है कि एक कंप्यूटर पर दर्ज किया गया पाठ (टेक्स्ट) विश्व के किसी भी अन्य यूनिकोड आधारित कम्प्यूटर पर खोला जा सकता है। इसके लिए अलग से उस भाषा के फ़ॉन्ट का इस्तेमाल करने की अनिवार्यता नहीं है क्योंकि यूनिकोड केंद्रित हर फ़ॉन्ट में सिध्दांतत: विश्व की हर भाषा के अक्षर मौजूद हैं। कंप्यूटर में पहले से मौजूद इस क्षमता को सिर्फ एक्टीवेट (सक्रिय) करने की जरूरत है जो विंडोज एक्सपी, विंडोज 2000, विंडोज 2003, विंडोज विस्ता, मैक एक्स 10, रेड हैट लिनक्स, उबन्तु लिनक्स आदि ऑपरेटिंग सिस्टम्स के जरिए की जाती है। विश्व भाषाओं की यह उपलब्धता सिर्फ देखने या पढ़ने तक ही सीमित नहीं है। हिंदी जानने वाला व्यक्ति यूनिकोड आधारित किसी भी कम्प्यूटर में टाइप कर सकता है, भले ही वह विश्व के किसी भी कोने में क्यों न हो। सिर्फ हिंदी ही क्यों, एक ही फाइल में, एक ही फ़ॉन्ट का इस्तेमाल करते हुए आप विश्व की किसी भी भाषा में लिख सकते हैं। इस प्रक्रिया में अंग्रेजी कहीं भी आड़े नहीं आती। विश्व भर में चल रही भूमंडलीकरण की प्रक्रिया में सूचना प्रौद्योगिकी का यह अपना अलग ढंग का योगदान है।
.
.
यूनिकोड आधारित कम्प्यूटरों में हर काम किसी भी भारतीय भाषा में किया जा सकता है, बशर्ते ऑपरेटिंग सिस्टम या कंप्यूटर पर इन्स्टॉल किए गए सॉफ्टवेयर यूनिकोड व्यवस्था का पालन करें। मिसाल के तौर पर माइक्रोसॉफ्ट के ऑफिस संस्करण, सन माइक्रोसिस्टम्स के स्टार ऑफिस या फिर ओपनसोर्स पर आधारित ओपनऑफिस.ऑर्ग जैसे सॉफ्टवेयरों में आप शब्द संसाधक (वर्ड प्रोसेसर), तालिका आधारित सॉफ्टवेयर (स्प्रैडशीट), प्रस्तुति संबंधी सॉफ्टवेयर (पावर-प्वाइंट आदि) तक में हिंदी और अन्य भाषाओं का बिल्कुल उसी तरह प्रयोग कर सकते हैं जैसे कि अब तक अंग्रेजी में किया करते थे। यानी न सिर्फ टाइपिंग बल्कि शॉर्टिंग, इन्डेक्सिंग, सर्च, मेल मर्ज, हेडर-फुटर, फुटनोट्स, टिप्पणियां (कमेंट) आदि सब कुछ। कंप्यूटर पर फाइलों के नाम लिखने के लिए भी अब अंग्रेजी की जरूरत नहीं रह गई है। यदि आप अपनी फाइल का नाम हिंदी में 'मेरीफाइल.डॉक' भी रखना चाहें तो इसमें कोई अड़चन नहीं है। इंटरनेट पर भी अब यूनिकोड का मानक खूब लोकप्रिय हो रहा है और धीरे-धीरे लोग पुरानी एनकोडिंग व्यवस्था की सीमाओं से निकल कर यूनिकोड अपनाने की दिशा में बढ़ रहे हैं। गूगल, विकीपीडिया, एमएसएन आदि इसके उदाहरण हैं जिनमें हिंदी में काम करना उसी तरह संभव है जैसे कि अंग्रेजी में। यूनिकोड आधारित भारतीय भाषाओं की वेबसाइटों की विषय वस्तु (कॉन्टेंट) सर्च इंजनों द्वारा भी सहेजा जाता है यानी विश्व स्तर पर उनकी उपस्थिति और दायरा बढ़ता है। फिलहाल सर्च इंजनों पर हिंदी और अन्य भारतीय भाषाओं की वेबसाइटों की स्थिति दयनीय है क्योंकि हर वेबसाइट में अलग-अलग फ़ॉन्ट का इस्तेमाल होने के कारण सर्च इंजनों के लिए उनकी विषय वस्तु को समझना संभव नहीं है। यूनिकोड के प्रयोग से यही काम उनके लिए बहुत आसान हो जाता है।
यूनिकोड आधारित वेबसाइटों या पोर्टलों को देखने के लिए पाठक के पास संबंधित फ़ॉन्ट होने की अनिवार्यता भी नहीं है। अगर कोई वेबसाइट यूनिकोड में है तो उसे विश्व में किसी भी स्थान पर फ़ॉन्ट डाउनलोड किए बिना न सिर्फ देखा जा सकता है बल्कि उसके लेखों को अपने कंप्यूटर पर सहेजा भी जा सकता है। डाइनेमिक फ़ॉन्ट नामक टेक्नॉलॉजी के जरिए यह सुविधा सीमित अर्थों में पहले भी मौजूद थी लेकिन कंप्यूटर पर सहेजे गए लेख तभी पढ़े जा सकते थे यदि कंप्यूटर में संबंधित फ़ॉन्ट मौजूद हो। अब यह सीमा नहीं रही।
कंप्यूटर अब अंग्रेजी का मोहताज नहीं रहा और इसीलिए यूनिकोड ने उसकी सम्पूर्ण कार्यप्रणाली भी बदल दी है। डेटा के भंडारण के साथ-साथ उसकी प्रोसेसिंग और प्रस्तुति के तरीके भी बदल गए हैं। चूंकि यूनिकोड सोलह बिट की एनकोडिंग व्यवस्था है और विश्व के अधिकांश सॉफ्टवेयर पुरानी एनकोडिंग व्यवस्था को ध्यान में रखते हुए विकसित किए गए थे इसलिए ऐसे सॉफ्टवेयर यूनिकोड टेक्स्ट को समझ नहीं पाते। नतीजतन विश्व भर में सॉफ्टवेयरों को यूनिकोड समर्थन युक्त बनाने की प्रक्रिया चल रही है। किसी कंप्यूटर पर यूनिकोड का पूरा लाभ लेने के लिए न्यूनतम आवश्यकता है ताजातरीन विन्डोज, लिनक्स या मैक ऑपरेटिंग सिस्टम का प्रयोग। चूंकि इन ऑपरेटिंग सिस्टम्स के संसाधनों की अपनी जरूरतें हैं इसलिए इस बात की काफी संभावना है कि संबंधित कम्प्यूटर कम से कम पी-4, 2 गीगाहर्त्ज श्रेणी का हो और कम से कम 40 जीबी हार्ड डिस्क और 256 एमबी रैम (रैंडम एक्सेस मेमरी) से युक्त हो। इन्हीं कारणों से यूनिकोड की ओर प्रस्थान करने में कुछ आर्थिक बिंदुओं पर विचार करने की आवश्यकता पड़ सकती है।
(बालेंदु शर्मा दाधीच, प्रभासाक्षी.कॉम से सम्बद्ध हैं)
COMMENTS