पिछले अंक से जारी… हिंदी कंप्यूटरी सूचना प्रौद्योगिकी के लोकतांत्रिक सरोकार वेद प्रकाश अध्याय 3 हिंदी कोड व्यव...
हिंदी कंप्यूटरी
सूचना प्रौद्योगिकी के
लोकतांत्रिक सरोकार
वेद प्रकाश
अध्याय 3
हिंदी कोड व्यवस्था का इतिहास – एक झलक
कंप्यूटर पर हिंदी का इतिहास कमोबेश उतना ही पुराना है जितना कि भारत में कंप्यूटर का इतिहास। सबसे पहले 1970-73 के बीच श्री आर.एम.के. सिन्हा और श्री एच.एन.महाबाला ने देवनागरी ऑपटिकल कैरेक्टर रिकग्निशन पर और श्री पी.वी.एच.एल. नरसिम्ह्न, श्री वी. राजारमन और श्री बी. प्रसाद ने की-बोर्ड और कोडिंग स्कीम विकसित करने पर काम किया। लेकिन उस समय कंप्यूटरों की भारी कीमतों के चलते यह मात्र अकादमिक प्रक्रिया तक ही सीमित रहा। आठवें दशक के मध्य में माइक्रोप्रोसेसरों के विकास के साथ कंप्यूटरों की कीमतों में कमी आई, तब इनमें से कुछ विचार स्टैंड-एलोन इंडियन लैंग्वेज़ टर्मिनल डिज़ाइन में फलीभूत हो पाए (श्री आर.एम.के. सिन्हा व श्री अर्जुन रमन)।
1978 में भारतीय प्रौद्योगिकी संस्थान, कानपुर (श्री आर.एम.के. सिन्हा) के निमंत्रण पर इलेक्ट्रॉनिकी विभाग (डॉ. ओम विकास), भारत सरकार ने ‘कंप्यूटर आधारित सूचना सिस्टमों में भाषाई निहितार्थ’ पर एक राष्ट्रीय परिसंवाद आयोजित किया। इसने इस बारे में देश में गर्मागर्म बहस छेड़ दी। लेकिन असली शुरूआत तब हुई जब भारतीय प्रौद्योगिकी संस्थान, कानपुर (श्री आर.एम.के. सिन्हा और श्री एस.के. मलिक) ने ‘एकीकृत देवनागरी कंप्यूटर’ के डिज़ाइन और विकास’ के प्रोजेक्ट को प्रायोजित किया। ‘एकीकृत देवनागरी कंप्यूटर’ अपने 8 महीने के रिकार्ड समय में तैयार हो गया तथा दिल्ली में आयोजित तीसरे विश्व हिंदी सम्मेलन में इसका प्रदर्शन किया गया। इसे मल्टीटास्किंग फर्मवेयर के साथ इंटेल 8086 प्रोसेसर का उपयोग करके विकसित किया गया था। इस प्रौद्योगिकी के अनुकूलन के लिए इस प्रोजेक्ट को 32 बिट के मोटरोला नं. 68000 के प्रोसेसर पर विस्तार दिया गया, जिसका परिणाम थी—जिस्ट प्रौद्योगिकी। जिस्ट प्रौद्योगिकी मोहन तांबे के अथक प्रयासों का परिणाम थी. जिस्ट का मतलब—ग्राफिक्स एंड इंटैलीजेंस बेस्ड स्क्रिप्ट टैक्नोलॉजी)। इस प्रौद्योगिकी को कई कंपनियों ने खरीदा। जब इस प्रोजेक्ट पर कार्य करने वाले शोध इंजीनियर मोहन तांबे सेंटर फॉर डेवलपमेंट ऑफ एडवांस्ड कंप्यूटिंग (सी-डेक) गया तो सी-डेक ने जिस्ट प्रौद्योगिकी को अपना लिया। जिस्ट प्रौद्योगिकी ने भारतीय भाषाओं की मशीन-भाषाई इंटरफेस की जटिल समस्या को सुलझा लिया।
इसी के आधार पर जुलाई, 1983 में इलेक्ट्रॉनिकी विभाग ने सूचना संसाधन के लिए भारतीय लिपियों और उनके कोड के मानकीकरण पर उप समिति की रिपोर्ट (Report of the sub-committee on Stanardization of Indian Scripts and their Code for Information Processing) प्रकाशित की। जिसमें उन्होंने इस्की कोड-83 की घोषणा की। 1988 में इसे और कांपेक्ट करने के लिए इसका संशोधन किया गया जिसे अगस्त 1988 में सूचना अंतरविनिमय के लिए भारतीय लिपि संहिता के मानकीकरण पर उप समिति की रिपोर्ट (Report of the sub-committee on Stanardization of Indian Scripts Code for Information Interchange) में इलैक्ट्रानिकी विभाग ने प्रकाशित कराया। इसके बाद 1991 में इसे संशोधित कर इसमें कई वैदिक अक्षर जोड़े गए। भारतीय मानक ब्यूरो ने इस संशोधित संस्करण को ही अंगीकृत और मानकीकृत कर अपने आईएस 13194-1991 दस्तावेज में भारतीय मानक-सूचना अंतरविनिमय के लिए भारतीय लिपि संहिता- यूडीसी- 681-3 शीर्षक के अंतर्गत प्रकाशित किया। तभी से यह सभी इलैक्ट्रानिकी उपकरणों के लिए भारतीय भाषाओं का राष्ट्रीय मानक है। इस्की दस्तावेज हासिल करने के लिए www.cdac.in/html/gist/down/iscii_d.asp पर जाएँ।
भारतीय मानक
सूचना अंतरविनिमय के लिए भारतीय लिपि संहिता (ISCII-91)
इस कोड की कई विशेषताएँ हैं---
· यह ब्राह्मी लिपि पर आधारित होने से ब्राह्मी लिपि से उत्पन्न सभी लिपियों के लिए एक समान है, यानी कि न केवल भारतीय लिपियों जैसे असमिया, उड़िया, तमिल, तेलुगू, देवनागरी, के लिए बल्कि तिब्बती, थाई और सिंहली भाषाओं के लिए भी यह कोड समान है।
· सभी ब्राह्मी आधारित लिपियों का समान कोड होने का लाभ यह है कि इन लिपियों का आपस में सटीक लिप्यंतरण किया जा सकता है। जाहिर है इससे मात्र लिपि के कारण पैदा होने वाली अजनबियत को दूर करने में मदद मिलेगी।
· इस्की कोड में अक्षरों को उनके उच्चारण के क्रम में ही रखा गया है, चाहे उनका लिखने का तरीका अलग ही क्यों न हो। इससे हम चाहें किसी भी लिपि में टाइप क्यों न कर रहे हों, उन अक्षरों के लिखने के तरीकों में चाहे कितना ही अंतर क्यों न हो, उन्हें टाइप करने का तरीका एक ही रहेगा।
· इसका दूसरा फायदा यह है कि इससे उनके अकारादिक्रम में सीधी छँटाई में कोई दिक्कत पेश नहीं आती। मूल अक्षरों को टाइपिंग का आधार बनाने के कारण उन्हें टाइप करने का एक ही तरीका हो सकता है। यदि क्ष, त्र, ज्ञ जैसे संयुक्ताक्षरों के लिए अलग कोड दिया जाएगा तो यह संभव नहीं हो सकेगा।
· इस्की कोड में एस्की कोड को यथावत रखा गया है जिससे अंग्रेज़ी और भारतीय भाषाओं के सह-अस्तित्व में कोई कठिनाई नहीं आएगी। इससे अंग्रेज़ी में विकसित सभी सॉफ्टवेयरों में इसके इस्तेमाल में कोई कठिनाई नहीं आएगी।
आप सोच रहे होंगे कि जब हिंदी में इतना सुविचारित और सुचिंतित कोड था जो न केवल हिंदी को वैज्ञानिक आधार पर संयोजित करता था बल्कि सभी भारतीय लिपियों की आधारभूत एकता की भित्ति पर भी खड़ा था। और जिसके कारण सभी भारतीय भाषाओं की एकता भी एक नया तकनीकी आयाम ग्रहण करने जा रही थी। फिर क्या हुआ कि इसके बावजूद हिंदी में बेहद अराजकता की स्थिति दिखाई पड़ती है।
इस कोड के इतना बेहतरीन और उपयोगी होने के बावजूद अधिकतर सॉफ्टवेयर निर्माताओं ने इसका अनुपालन नहीं किया। इस बात को ज़रा ठंडे दिमाग से समझिए। यानी कि, मान लीजिए, 184 के स्थान पर, जिसे इस्की कोड में ‘क’ के लिए नियत किया हुआ है, यदि एक सॉफ्टवेयर निर्माता ने ‘ग’ रख दे और दूसरा सॉफ्टवेयर निर्माता ने इसी स्थान पर ‘च’ रख दे तो क्या होगा। पहले निर्माता के सॉफ्टवेयर में तैयार दस्तावेज़ में जहाँ-जहाँ ‘ग’ टाइप किया हुआ है, दूसरे सॉफ्टवेयर में खोलने पर वहीं-वहीं ‘च’ दिखाई पड़ेगा। और मानक इस्की कोड का इस्तेमाल करने वाले सॉफ्टवेयर में वहाँ ‘क’ दिखाई देगा; यानी बेतरतीब, अर्थहीन, अक्षरों का समूह स्क्रीन पर दृष्टिगोचर होगा। और मित्रो, यही हुआ भी है। आज हिंदी में कंप्यूटर पर आने वाली महत्वपूर्ण कठिनाइयों का यही कारण है। इंटरनेट, ई-मेल, ई-वाणिज्य और ई-शासन के बढ़ते घोड़े की लगाम हिंदी सॉफ्टवेयर निर्माताओं ने इसी तरह थामी है। इनके कोड व्यवस्था में नित नए प्रयोगों ने भारतीय भाषाओं के उपयोक्ताओं को बेहद परेशान किया है।
सवाल यह है कि इन सॉफ्टवेयर निर्माताओं ने इस्की कोड का इस्तेमाल क्यों नहीं किया? क्या इसके पीछे इस्की कोड की कुछ खामियाँ थीं या वे इसे और बेहतर बनाना चाहते थे? नहीं।
इसके पीछे एक तरफ ऑपरेटिंग सिस्टम निर्माताओं का हिंदी और दूसरी भारतीय भाषाओं के प्रति उपेक्षा भाव था तो दूसरी तरफ इनके बाज़ारों को न समझ पाने की क्षमता का अभाव था। इसीलिए उन्होंने इस्की को समर्थन नहीं दिया। एक और बात, इस्की अपने आप सीधे विंडोज़ जैसे ऑपरेटिंग सिस्टम पर इस्तेमाल नहीं किया जा सकता, इसके लिए एक फोंट कोड चाहिए जिसमें हिंदी के लिए कम से कम 188 कोड स्थान चाहिए। (इस्की के 128 स्थानों की तुलना में)। विंडोज़ जैसे ऑपरेटिंग सिस्टमों के लिए इस्की कोड तब तक अपर्याप्त था जब तक कि ऑपरेटिंग सिस्टम निर्माता अंदर से इसे समर्थन न दें।
चूँकि इस्की इस समस्या के हल के लिए अपर्याप्त था इसलिए जरूरी था कि हिंदी सॉफ्टवेयर निर्माता आपस में बैठ कर एक मानक निर्धारित करते और उसे अपनाते। ऐसा नहीं हुआ। हालाँकि सी-डेक ने इस समस्या के हल के लिए इस्फॉक फोंट कोड विकसित किया और इसे मानक बनाने की कोशिश की। यदि हमने इसे मानक निर्धारित कर अपनाया होता तो दूसरे देशों की तरह हमारी भाषाओं की कंप्यूटरी का जबर्दस्त विकास हुआ होता। दुर्भाग्य से सी-डेक इस प्रयास में सफल नहीं हो पाया।
मानकीकरण न किए जाने और उसे न अपनाने के पीछे हिंदी सॉफ्टवेयर निर्माताओं की थोड़ी स्वार्थलिप्सा भी थी। अलग फोंट कोड के कारण यदि कोई संगठन या कंपनी एक बार उनके सॉफ्टवेयर को खरीद ले तो हमेशा उनके ही सॉफ्टवेयर खरीदने को मजबूर था, नहीं तो वह संगठन या कंपनी अपने विभिन्न कंप्यूटरों में तैयार हिंदी दस्तावेज़ों का आदान-प्रदान नहीं कर पाएगी। यही नहीं, न केवल उन्होंने अपने कोड दूसरे फोंट निर्माताओं से अलग रखे बल्कि अपने ही विभिन्न उत्पादों के लिए भी विभिन्न कोड बनाए ताकि उनके एक उत्पाद का ग्राहक दूसरे उत्पाद के फोंट इस्तेमाल न कर पाए।
इनकी इस स्वार्थलिप्सा के शिकार हुए सरकारी कार्यालय जिनमें राजभाषा नीति के चलते हिंदी का प्रयोग करना था तो दूसरी तरफ डेस्क टॉप पब्लिशर, जिन्हें भारतीय भाषाओं के मुद्रण को गला-काट प्रतियोगिता भरी दुनिया में टिके रहना था, नित नए फोंटों को अपनाते हुए।
इस अन्यायपूर्ण लूट में कोई फोंट निर्माता पीछे नहीं था।
इस मामले में भारत सरकार भी अपनी जिम्मेवारी से नहीं बच सकती। दूसरे देशों की सरकारों की तरह भारत सरकार का यह कर्तव्य था कि वह इस फोंट कोड के मानकीकरण में केंद्रीय भूमिका निभाती और इस दिशा में हो रहे निजी प्रयासों की कड़ी निगरानी करती, जैसाकि दूसरे देशों की सरकारों ने किया, तो फोंट कोड के कारण उत्पन्न समस्या पैदा ही नहीं होती.
शायद यह स्थिति अनंत काल तक चलती रहती यदि इंटरनेट के प्रसार ने सूचनाओं का आदान-प्रदान करने और आपस में वितरित करने के लिए मजबूर न किया होता, जिसके कारण एक नया फोंट मानक उभर कर आया—यूनिकोड।
अध्याय 4
यूनिकोड: समस्याएँ अनेक समाधान एक
कंप्यूटर जगत की एक प्रतिष्ठित पत्रिका ‘पीसी क्वेस्ट’ में 1998 में एक दिलचस्प वाकया छपा। कोरिया की एक छात्रा उच्च स्तरीय अध्ययन के लिए अमरीका गई। वह कोरिया में कोरियाई भाषा में कंप्यूटर और इंटरनेट के इस्तेमाल में निपुण थी। यहाँ तक कि उसकी बूढ़ी दादी भी कंप्यूटर और इंटरनेट का इस्तेमाल कर लेती थी। छात्रा को तो अंग्रेज़ी आती थी, परंतु उसकी दादी को नहीं। दुनिया के अनेक देशों की तरह कोरिया में किसी भी सॉफ्टवेयर के बिकने की बुनियादी शर्त होती है कि उसमें कोरियाई भाषा का इंटरफेस हो। ज़ाहिर है कि उसकी दादी कोरियाई इंटरफेस के माध्यम से कंप्यूटर और इंटरनेट का उपयोग करती थी। जब कोरियाई छात्रा ने अमरीका से अपनी दादी को ई-मेल भेजना चाहा तो वैकल्पिक भाषा में कोरियाई भाषा के बदले अरबी भाषा की मैपिंग देख कर उसका हाथ रुक गया। और उसकी दादी का भेजा ई-मेल अरबी जंक कैरेक्टरों में बदल चुका था।
यहाँ जेम्स बांड शृंखला की फिल्म ‘टूमारो नेवर डाइज़’ का वह दृश्य याद करें जब जेम्स बांड अपनी कोरियाई साथी के साथ बचता-बचाता उसके घर पहुँचता है। जो बाहर से तो किसी स्लम जैसा दीखता है पर अंदर से किसी जासूसी संस्था का अत्यानुधिक नियंत्रण कक्ष। जेम्स बांड जैसे ही उसका कंप्यूटर इस्तेमाल करना चाहता है, की-बोर्ड पर केवल कोरियाई अक्षर देख कर उसका हाथ रुक जाता है।
इस परिस्थिति ने सॉफ्टवेयर निर्माताओं को सोचने पर मज़बूर किया कि वे विभिन्न भाषाओं को एक ही विस्तृत कोड में समाहित करने का उपाय खोजें। ताकि इंटरनेट पर फैलते ई-बाज़ार का तेज़ी से फैलाव हो सके। इंटरनेट की दुनिया बहुभाषी बने इसमें बहुत से लोगों की अपने-अपने कारणों से दिलचस्पी थी।
इसी का परिणाम है- यूनिकोड कन्सोरटियम। इसमें सभी देशों की सरकारों के प्रतिनिधि शामिल हैं। भारत का सूचना प्रौद्योगिकी विभाग इसका सदस्य है। इस कन्सोरटियम ने सभी सदस्य देशों की भाषाओं के मानक कोडों को शामिल किया गया है। इसमें 8 बिट के बजाय 16 बिट की स्टोरिंग व्यवस्था है इसलिए इसमें कुल 65,536 कैरेक्टर स्टोर किए जा सकते हैं। इसके पहले 128 कैरेक्टर तो अंग्रेज़ी के आस्की कोड के लिए नियत हैं। यह विश्व की सभी—नई व पुरानी— लिखित भाषाओं के सभी कैरेक्टरों को स्थान मुहय्या कराता है। इसके अतिरिक्त इसमें तकनीकी चिह्न, विराम चिह्न और कई अन्य कैरेक्टर भी दिए गए है। यूनिकोड मानक सभी तरह के उपयोक्ताओं—कारोबार से हों या शिक्षा व्यवसाय से, मुख्य धारा की लिपियों का इस्तेमाल करने वाले हों या अल्पसंख्यक लिपियों का—सभी की जरूरतों को समर्थन देने का प्रयत्न करता है।
विश्व के सभी देशों के लोग, सॉफ्टवेयर व हार्डवेयर निर्माता कंपनियाँ, इंटरनेट सेवा प्रदाता इलेक्ट्रॉनिकी से जुड़े कारोबारी लोग सभी पूरी दुनिया में यूनिकोड को समर्थन दे रहे हैं। प्रतिदिन कंपनियाँ नए-नए यूनिकोड समर्थित उत्पाद लेकर बाज़ार में आ रही हैं। इस मामले में ओपन सोर्स (मुक्त संसाधन) समुदाय भी पीछे नहीं है।
यूनिकोड में हिंदी और दूसरी भारतीय भाषाओं को भी स्थान मिला है। इसके लिए इस्की-89 को आधार बनाया गया है। जिससे यूनिकोड में थोड़ी बहुत समस्या भी है, अगर इस्की 91 को आधार बनाया गया होता तो ये मामूली दिक्कतें भी नहीं होतीं. ख़ैर, देर आयद दुरस्त आयद।
चूँकि यूनिकोड में देवनागरी लिपि भी शामिल है इसलिए सारे यूनिकोड समर्थित सॉफ्टेवयर खुद-ब-खुद हिंदी समर्थक हो गए हैं, बशर्ते कि आपने उनमें यूनिकोड बेस्ड हिंदी फोंट को सक्रिय किया हुआ हो। आप किसी सॉफ्टवेयर का नाम लीजिए, आप पाएँगे कि न केवल उसमें हिंदी में काम करने की सुविधा मौजूद है बल्कि उसका इंटरफेस भी हिंदी में आ चुका है। जो अभी नहीं आए हैं, वे भी इस राजमार्ग पर बढ़ रहे हैं। यही नए अंतरराष्ट्रीय समुदाय के ज्ञान-सूचना-जानकारी के आदान-प्रदान का आधार है। यूनिकोड के देवनागरी कोड के विषय में अधिक जानकारी हासिल करने के लिए www.unicode.org/cahrts/pdf/u0900.pdf को देखें।
विश्व के साथ-साथ भारत में सबसे ज्यादा प्रचलित ऑपरेटिंग सिस्टम माइक्रोसॉफ्ट कंपनी का विंडोज़ एक्सपी है, यह हिंदी में टाइप करने के उपकरण तो उपलब्ध कराता ही है, इसका हिंदी इंटरफेस भी, यानी सारी कमांडे, रूप आदि भी हिंदी में उपलब्ध हैं। इसका इस्तेमाल करके फाइल का नाम आदि भी हिंदी में दे सकते हैं। तथा विंडोज़ के सर्च इंजन से हिंदी के किसी शब्द के आधार पर खोज भी कर सकते हैं। इसका इस्तेमाल करने से अंग्रेज़ी विंडोज़ एक्सपी पर चल रहे कंप्यूटरों से कनेक्टिविटी की किंचिन्मात्र भी समस्या नहीं है।
इसके बाद सर्वाधिक लोकप्रिय है माइक्रोसॉफ्ट ऑफिस एक्सपी, इसका हिंदी इंटरफेस (जिसे ‘ऑफिस’ हिंदी नाम दिया गया है) भी उपलब्ध है, जिसमें वर्ड, एक्सेल, पावरप्वाइंट, आऊटलुक और एक्सेस हिंदी में कमांडों के साथ उपलब्ध हैं. इसकी हिंदी बहुत आसान और सहज है। इसके वर्ड में हिंदी का वर्तनी जाँचक, हिंदी थिसारस, हिंदी शब्दावली की सुविधा भी मौजूद है। इसके एक्सेल में अकारादिक्रम से डेटा की छँटाई करने और सूचीबद्ध करने और खोजने की सुविधा उपलब्ध है।
मुक्त सॉफ्टवेयरों में ऑपरेटिंग सिस्टम लिनक्स और ऑफिस सूट में ऑपनऑफिस पूरी तरह हिंदी इंटरफेस के साथ बिल्कुल मुफ्त में उपलब्ध हैं। यह सब है यूनिकोड का चमत्कार कि उसने हिंदी को हर जगह पहुँचा दिया है, बस जरूरत मात्र हिंदी को सक्रिय करने की है।
अब एक बानगी विशेष कार्यों के लिए बने सॉफ्टवेयरों में हिंदी की सुविधा व समर्थन की। नीचे हम उन उन्नत कंप्यूटरी के उत्पादों एक सूची दे रहे हैं जो अपने खास कामों के लिए पूरी दुनिया में छाए हैं और साथ ही यूनिकोड के रास्ते हिंदी को अपना पूर्ण समर्थन प्रदान करते हैं:--
ऑपरेटिंग सिस्टम- कंप्यूटर पर कोई भी कार्य करने से पहले उस पर ऑपरेटिंग सिस्टम होना बहुत ज़रूरी होता है। ऑपरेटिंग सिस्टम हमारी भाषा और कंप्यूटर की भाषा के बीच पुल का काम करते हैं। यदि हमारा ऑपरेटिंग सिस्टम यूनिकोड समर्थक हो और हमने उसमें हिंदी को सक्रिय किया हुआ हो तो उस पर चल रहे किसी भी सॉफ्टवेयर के यूनिकोड समर्थक होते ही उसमें हिंदी समर्थन स्वतः ही आ जाता है। इसके लिए हमें किसी थर्ड पार्टी फोंटों की आवश्यकता नहीं होती। नीचे कुछ यूनिकोडसेवी ऑपरेटिंग सिस्टम दिए गए हैं---
· माइक्रोसॉफ्ट के विंडोज़ सीई, विंडोज़ 2000, विंडोज़ एनटी और विंडोज़ एक्सपी
· लिनक्स-जीएनयू ग्लिबसी 2.2.2 और नवीनतम के साथ /केडीई भी हिंदी में
· एससीओ यूनिक्सवेअर 7.1.0
· सन सोलेरिस
· एपल के मैक ओएस 9.2, मैक ओएस 10.1, मैक ओएस एक्स सर्वर, एटीएसयूआई
· बेल लैब्स प्लान 9
· कॉम्पैक्स ट्रू64 यूनिक्स, ओपन वीएमएस
· आईबीएम एआईएक्स, एएस/400, ओएस/2
· वीटा न्यूओवा का इन्फर्नो
· नया जावा प्लेटफार्म
· सिम्बिअन प्लेटफार्म
फोंट और प्रिंटिंग सॉफ्टवेयर- ये विभिन्न ऑपरेटिंग सिस्टमों में खूबसूरत फोंट और अक्षर लेखन की विभिन्न रूप उपलब्ध कराते हैं—
· माइक्रोसॉफ्ट का एरियल यूनिकोड एमएस
· माइक्रोसॉफ्ट का लूसिडा सेंस यूनिकोड
· सीडेक का मंगल, सुरेख, योगेश, जनहिंदी आदि फोंट
· सीडेक के ओपन फोंटों की शृंखला- जिस्टओटी फोंट
डेटाबेस और सहायक सुविधाएँ- कंप्यूटर का मुख्य कार्य आँकड़ों को ग्रहण, विश्लेषित और स्टोर करना है। यह कार्य डेटाबेस सॉफ्टवेअरों में तैयार अनुप्रयोगों से किया जाता है। इसके कुछ उपयोग जैसे बैंकिंग व्यवस्था, रेल व्यवस्था, बीमा सॉफ्टवेयर आदि हैं। इनमें से निम्नलिखित में यूनिकोड को समर्थन प्राप्त है। यानी यदि आप ऊपर उल्लेखित ऑपरेटिंग सिस्टमों में से किसी पर निम्नलिखित में से कोई डेटाबेस चलाएँगे तो आप अपना सारा कार्य हिंदी में उसी सटीकता, शुद्धता और पूर्णता से कर पाएँगे, जैसे आप हिंदी में करते हैं। ये डेटाबेस हैं—
· माइक्रोसॉफ्ट एक्सेस 2000/ एक्सपी
· माइक्रोसॉफ्ट एसक्यूएल सर्वर
· ऑरेकल ऑरेकल 8
· यूनिसिस यू रैप
· एडाबेस संस्करण 7
· फ्रंटबेस वी 2.19
· पोस्टग्री एसक्यूएल 7.1 –(विश्व का सर्वाधिक विकसित ओपन सोर्स डेटाबेस)
· साइबेस एडप्टिव सर्वर एंटरप्राइज़
प्रोग्रामिंग लैंग्वेजिज़- किसी अनुप्रयोग को तैयार करने के लिए किसी न किसी प्रोग्रामिंग भाषा का इस्तेमाल किया जाता है। इन भाषाओं के यूनिकोडसेवी होने के कारण अब हिंदी में सॉफ्टवेयर लिखना कोई मुश्किल काम नहीं रहा है. नीचे कुछ यूनिकोड समर्थित प्रोग्रामिंग भाषाओं को दिया गया है—
· जावा प्रोग्रामिंग भाषा
· एक्सचेंज़र एक्सएमएस एडीटर संस्करण 1.2
· माइक्रोसॉफ्ट वीजे++, विज़ुअल स्टुडियो 7.0, विज़ुअल बेसिक
· जावा स्क्रिप्ट (ईएसएमए स्क्रिप्ट)
· आईबीएम एपीएल 2
· लैड सी++ क्लास लाइब्रेरी
· पाइथॉन- ऑबजेक्ट ओरिएन्टिड ओपन सोर्स लैंग्वेज़
· साइबेस
· टीसीएल 8.1+
· एक्सएमएल ब्लूप्रिंट एक्सएमएल एडीटर संस्करण 2.2
· यूनिएडिट डीएलएल
सर्च इंजन- नेट पर सूचना को खोजने के लिए सर्च इंजनों का प्रयोग किया जाता है। निम्नलिखित सर्च इंजन ये सुविधा हिंदी में उपलब्ध कराते हैं—
· गूगल
· फास्ट सर्च
· अल्टावीज़ा
इंटरनेशनल लाइब्रेरीज़- इन लाइब्रेरीज़ का अनुप्रयोग विकसित करने और बैकग्राऊंड सपोर्ट प्रदान करने के लिए इस्तेमाल किया जाता है। निम्नलिखित इंटरनेशनल लाइब्रेरीज़ यूनिकोड को समर्थन प्रदान करती है—
· एलिस बैटम
· बेसिक टैक्नॉलजी यूक्लिड
· डेल्फी फंडामेंटल्स कोड लाइब्रेरी
· डीआई कनवर्टर्स 1.9.1
· सेलिओज़ वर्ज़न 1.3
· जेनेसिस 11
· आईबीएम आईसीयू ओपन सोर्स लाइब्रेरी
· आईबीएम आईसीयू4जे जावा लाइब्रेरी
· लेक्सटैक लैंग्वेज़ आइडेंटीफायर
· लिबिकॉन्व
· एसडीएल इंटरनेशनल
· ट्रोलटैक क्यूटी संस्करण 2.0 और अधिक
· बोरलैंड डेल्फी वर्ज़न 2.0
· सिमुल्ट्रांस
· वर्ल्डप्वाइंट
· लायनब्रिज
अन्य सॉफ्टवेयर- इसके अतिरिक्त निम्नलिखित सॉफ्टवेयर भी यूनिकोड को समर्थन प्रदान करते हैं। ये सॉफ्टवेयर खास कामों के लिए विकसित किए गए अनुप्रयोग हैं। आइए, एक बानगी देखें—
· आर्चीवारिअस 3000
· 123बिल्डइट
· जिस्टइनटाइम
· एल्टाविजा
· बीएंडई सॉफ्टवेयर
· बेसिस टैक्नॉलजी सी2सी
· बेसिस टैक्नॉलजी मोर्फोलोजिकल एनेलाइज़र
· बिग फेसलेस पीडीएफ लाइब्रेरी
· ब्रॉयस सॉफ्टवेयर
· चाइनीज़ स्टार 3.0
· ई-लर्निंग इंजिन 1.2
· एरिक्सन ए, आर और टी सीरीज़ के मोबाइल फोन
· इवेंट रिपोर्टर वर्जन 5.1
· इंटरनेशनल कंपोनेंट फॉर यूनिकोड
· ग्लिफगेट
· जावा इंटरनेशनलाइज़ेशन एंड लोकलाइज़ेशन आर्टिकल
· लिनक्स उत्पाद- यूडिट, केडीई 1.89 और जीटीके+
· लोटस डोमिनो और लोटस नोट्स
· लिनक्स एक्सटर्म
· मातृभाषा 1.0
· माइक्रोसॉफ्ट ऑफिस 2000/एक्सपी
· एमएसएन मैसेंजर
· मल्टीलिंग्वुअल डोमेन नेम सिस्टम
· मल्टीट्रांस 1.01.3
· नेटिवनेम्स
· नेटस्केप नेविगेटर
· एनजे स्टार क्यूनिकेटर 2.2
· नेटवेयर डायरेक्टरी सिस्टम
· एनस्क्रिप्ट
· ओपन मार्केट ट्रांज़ेक्ट
· पीपलसॉफ्ट
· पीडीएफ लिब 5.0
· सोफ्टलिंक लाइब्रेरी ग्लोबल 5.45
· सोलेरिस डेवलपर्स कनेक्शन साइट
· टैक्सपाइप प्रो 6.8
· ट्रांज़िट/टर्मस्टार एक्सवी
· यूनिकोड सिन्टेक्स एडिट
· यूनिगीज़ 1.3
· यूनिटाइप ग्लोबल राइटर 8
· यूनिटूल बॉक्स
· वाचक
· वैब टर्म 5.0
यह सूची सिर्फ इशारा भर है। स्थान के अभाव के कारण कुछ अधिक लोकप्रिय नाम ही दिए गए हैं। यह सूची प्रतिदिन बढ़ती ही जा रही है। ऐसा नहीं है कि उपरोक्त सभी सॉफ्टवेयरों में पूरा हिंदी समर्थन है। परंतु अधिकतर सॉफ्टवेयर हिंदी में काम करने की सुविधा प्रदान करने के साथ ही हिंदी के अन्य संबंधित उपकरण भी उपलब्ध कराते हैं। इन सॉफ्टवेयरों में जो सुविधाएँ शुरू में नहीं थीं, वे उन्हें अपने अगले संस्करणों में जोड़ते जा रहे हैं।
लेकिन इन सुविधाओं का द्वार आपके लिए तभी खुलता है जब आप यूनिकोड अपनाते हैं। नहीं तो हिंदी कंप्यूटरी की दुनिया की अराजकता जस की तस विराजमान है।
हिंदी सॉफ्टवेयर निर्माता अब अपने सॉफ्टवेयरों में अपने फोंटों से यूनिकोड में कनवर्ज़न की सुविधा, और अन्य सॉफ्टवेयरों से कन्वर्ज़न की सुविधा का बड़े ज़ोर शोर से उल्लेख करते हैं। इन्होंने पहले तो अपने सॉफ्टवेयरों में किसी मानक का अनुपालन न करके हिंदी कंप्यूटरी के विकास में रुकावटें पहुँचाईं और अब खुद को मसीहा के तौर पर पेश कर रहे हैं। और इसके लिए एक बार फिर इन समस्याओं से अनजान हिंदी विभागों से मोटी कमाई कर रहे हैं।
लेकिन क्या सारा कसूर इन्हीं का है? भारत सरकार को अन्य देशों की तरह सभी सॉफ्टवेयर निर्माताओं को स्पष्ट निर्देश दे देने चाहिए थे कि यदि भारत में कारोबार करना है तो हिंदी में समर्थन देना ही पड़ेगा। अगर ऐसा हुआ होता तो हिंदी कंप्यूटरी 10 साल पिछड़ न गई होती, अंग्रेज़ी के साथ कदम मिला कर नित नए अनुप्रयोग विकसित कर भारत के लिए और ज्यादा विदेशी मुद्रा ला रही होती। साथ ही यहाँ के विकास कार्यों, परियोजनाओं को बढ़ाने और सूचना प्रौद्योगिकी के लाभ जन साधारण तक पहुँचाने में बहुत आगे निकल गई होती।
फिर भी इन सॉफ्टवेयर निर्माताओं का यह योगदान तो है ही कि इन्होंने प्रतिकूल परिस्थितियों के बावजूद हर नए अंग्रेज़ी अनुप्रयोग में हिंदी समर्थन देने के लिए तुरंत थर्ड पार्टी टूल विकसित किए। यदि हिंदी का प्रबुद्ध वर्ग कंप्यूटर पर हिंदी में अपना रोज़मर्रा का काम करता तो ये सभी टूल और भी जल्दी विकसित हो गए होते। दुर्भाग्यपूर्ण तो यह है कि हिंदी समाज सारी सुविधाएँ होने के बावजूद अपना सारा काम अंग्रेज़ी में कर के उसका बाज़ार बढ़ाता है और हिंदी की राह में रोड़े अटकाता है।
हिंदी कंप्यूटरी में मानक स्थापित करने ही होंगे। हमें हर हाल में यूनिकोड को अपना लेना चाहिए। यह हिंदी कंप्यूटरी की दुनिया में एक नए युग की शुरुआत है। अब हिंदी कंप्यूटर पर केवल पत्र टाइप करने वाली भाषा बन कर नहीं रह सकती। इसे नई प्रौद्योगिकी के हर चरण में अपनी ताकत दिखानी है। यदि हिंदी समाज प्रण कर ले कि वह यूनिकोड व अन्य तय मानकों का ही प्रयोग करेगा तो फिर सूरज निकला ही समझो।
अध्याय 5
ये हिंदी फोंट क्या है?
पिछले अध्याय में हमने हिंदी कोड पर विस्तृत चर्चा की है। कोड कंप्यूटर में सूचना, जानकारी या आँकड़ों के इनपुट, प्रोसेस, स्टोरेज और आऊटपुट का आधार होता है। परंतु एक उपयोक्ता के लिए कोडिंग सिस्टम से कोई फर्क नहीं पड़ता जब तक कि वह अपने दस्तावेजों, फाइलों आदि को इलेक्ट्रॉनिक रूप में विनिमय न करना चाहे। एक उपयोक्ता को फर्क पड़ता है, फोंटो से। हालाँकि यूनिकोड और ऑपनटाइप फोन्टों को अपनाने से इन सभी समस्याओं से निजात मिल जाती है। फिर भी जिन समस्याओं ने हिंदी और भारतीय भाषाई कंप्यूटरी को एक दशक तक साँसत में रखा, उन पर एक नज़र डालना, अनुपयुक्त न होगा।
‘विंडोज़’ के युग में प्रवेश करने के साथ ही इस समस्या की शुरुआत होती है। उसके पहले ‘डॉस’ में कैरेक्टर कोडिंग व्यवस्था से एकीकृत होने के कारण समस्या नहीं थी। लेकिन विंडोज़ वातावरण ने कंप्यूटरी में सौंदर्य बोध जोड़ा। इसने प्रकाशन व्यवसाय की ज़रूरतों के मद्देनज़र नए-नए रूप वाले फोन्ट जोड़े। अंग्रेज़ी में प्रत्येक अक्षर की कोडिंग और उसके प्रदर्शित रूप में एकरूपता है इसलिए भी दिक्कत नहीं थी। लेकिन हिंदी में अक्षरों के प्रदर्शित रूपों में कई तरह की भिन्नताएँ हैं—जैसे मात्रा लगने या अर्द्धाक्षर लगने या संयुक्त अक्षर होने पर उनका रूप बदल जाता है.
इससे पहले कि हम फोंटों की व्यवस्था पर बात करें, आइए थोड़ा फोंट के बारे में जानें। फोंट कंप्यूटर स्क्रीन, डिस्पले बोर्ड या स्क्रीन, प्रिंटर द्वारा छपा किसी अक्षर का प्रदर्शित रूप होता है। एक ही अक्षर को मोटे, तिरछे या रेखांकित रूप में भी प्रदर्शित किया जाता है और उनके लिखने के लिए विभिन्न शैलियाँ अपनाई जाती हैं। इन विभिन्न शैलियों या रूपों में एक ग्लिफ (रूपाकार) होता है जो उस कैरेक्टर के लिए नियत कोड प्वाइंट के साथ अंतस्संबंधित होता है। हिंदी और भारतीय भाषाओं में (क) संयुक्ताक्षरों के ग्लिफ, (ख) मात्राओं के विभिन्न रूपों और चंद्रबिंदु, अनुस्वार और नुक्ते के लिए ग्लिफ और (ग) अंकों और विराम चिह्नों के लिए अलग ग्लिफ इस्तेमाल किए जाते हैं। इन ग्लिफों को निर्धारित करते समय न केवल उनके टंकित रूपों का ध्यान रखा जाता है अपितु उनके वर्तमान और परंपरागत लिखित रूपों का भी ध्यान रखा जाता है। फोंट में दी गई उक्त ‘क’ और ‘ख’ की विषयवस्तु को फोंट में ग्लिफ प्रतिस्थापन तालिका (सबस्टीट्यूशन टेबल) का प्रावधान करके उपयोग किया जा सकता है। ऐसी तालिका भारतीय लिपियों के लिए अपरिहार्य है। ऐसी लिपियों में ग्लिफ पोज़िशनिंग तालिका न्यूनतम अपेक्षित चिह्नित स्थिति को हासिल करने के लिए भी दी जाती है। कुछ फोंटों के लिए ये तालिकाएँ कमोबेश समान होती हैं, पर हमेशा ऐसा नहीं होता। और यहीं से समस्या पैदा होती है।
मान लीजिए हमें हिंदी में ‘च’ लिखना है। इसे कई तरह के संयोजनों से लिखा जा सकता है
1. च,
2. च् + ा
या ओ लिखना है तो इसे निम्नलिखित कई तरह से लिखा जा सकता है
1. ओ,
2. अ + ा + े,
3. अ + ो
फोंट पोजिशनिंग तालिका में एक फोंट के लिए कोई एक तरीका तय किया जाता है। कंप्यूटर के कुंजीपटल पर उस अक्षर के लिए नियत कुंजी दबाते ही, कंप्यूटर की मेमोरी में संचित विभिन्न ग्लिफ जुड़ कर डिस्पले स्क्रीन पर उस अक्षर को दर्शाते हैं। यह पूरी प्रक्रिया कंप्यूटर की कृत्रिम बुद्धिमता के ज़रिए बड़ी तेजी से की जाती है।
यदि अलग-अलग फोंट निर्माता एक समान कोड होने पर भी यदि अलग-अलग फोंट पोजिशनिंग तालिकाएँ इस्तेमाल करते हैं तो एक सॉफ्टवेयर में तैयार दस्तावेज़ को पढ़ना असंभव हो जाएगा।
हिंदी और भारतीय भाषाओं में विभिन्न सॉफ्टवेयर निर्माताओं ने यही किया भी। नतीजा हम सबके सामने है। इस विषय में भारत सरकार को कोई मानक नहीं है। हालाँकि सी-डेक इस्फॉक फोंट तालिका को मानक बनवाना चाहता था। पर ऐसा नहीं हो पाया। नतीजा सामने है।
लेकिन फोंटों में एक समस्या और भी है। विभिन्न सॉफ्टवेयर निर्माताओं ने अपने अलग-अलग फोंट समूहों के लिए अलग-अलग फोंटकोड तैयार किए। जबकि कम से कम उन्हें अपने सभी फोंटों के लिए तो एक ही फोंटकोड व्यवस्था अपनानी चाहिए थी। एक ही फोंट निर्माता ने अनेक फोंट तालिकाओं का इस्तेमाल क्यों किया?
जब विंडोज़ वातावरण ने हिंदी फोंट को अपने ऑपरेटिंग सिस्टम का हिस्सा नहीं बनाया तो हिंदी प्रेमियों के लिए कंप्यूटर के बढ़ते प्रयोग का मतलब था, हिंदी का प्रयोग से बाहर हो जाना। हिंदी प्रेमी सॉफ्टवेयर निर्माता इस स्थिति को स्वीकार करने को तैयार नहीं थे। उन्होंने एक्सटेंडिड आस्की कोड (परिवर्धित एस्की कोड) में दिए गए ग्राफिक कैरेक्टरों के स्थानों पर ओवरलैपिंग करके हिंदी अक्षरों के डिस्प्ले को संभव बनाया। शुरू में उनकी प्राथमिकता थी कि किसी तरह कंप्यूटर स्क्रीन पर हिंदी अक्षर चमकने लगें। वैसे भी हिंदी कंप्यूटरी का बाज़ार सबसे पहले डीटीपी ने बनाया। डीटीपी ने मुद्रण के पुराने तरीके में आमूलचूल बदलाव ला दिया था। मुद्रण की गति और गुणवत्ता बहुत अच्छी हो गई थी। इसलिए सबसे पहले मुद्रण सॉफ्टवेयरों के लिए हिंदी फोंट विकसित किए गए। इन्हें स्थापित और इस्तेमाल करने के लिए कंप्यूटर में एडोब टाइप मैनेजर स्थापित करना ज़रूरी था। इन फोंटों को पोस्ट स्क्रिप्ट फोंट (संक्षेप में पीएस फोंट) कहते हैं।
धीरे धीरे सरकारी दफ्तरों में कुछ हिंदी प्रेमी उत्साही कर्मचारियों ने माइक्रोसॉफ्ट वर्ड में हिंदी फोंटों की माँग की तो इसने ट्रू-टाइप फोंटों का मार्ग प्रशस्त किया। ट्रू-टाइप फोंट विंडोज़ में जैसा दिखते थे वैसा ही प्रिंट में भी दिखाई देते थे। लेकिन सरकारी वातावरण द्विभाषिक था। हिंदी विभाग भी केवल हिंदी में काम नहीं कर सकते थे। एक ही दस्तावेज में हिंदी और अंग्रेज़ी दोनों टाइप करनी हो तो हर बार भाषा बदलते समय टोगल कुंजी दबाने के साथ साथ फोंट भी सिलेक्ट करना पड़ता था। इससे बचने के लिए माइक्रोसॉफ्ट वर्ड में मेक्रो लिखे गए जिससे टोगल कुंजी दबाते ही स्क्रीन पर स्वतः ही हिंदी या अंग्रेज़ी फोंट आ जाता। लेकिन यह हल स्थायी नहीं था। उस सॉफ्टवेयर का नया संस्करण आने पर वह मेक्रो बेकार हो जाता। तब इतने सारे ग्राहकों के कंप्यूटर पर जाकर नए मेक्रो लिखना हिंदी सॉफ्टवेयर निर्माताओं के लिए बड़ा महँगा सौदा था।
हिंदी फोंटों के साथ एक समस्या यह भी थी कि अपने जटिल स्वरूप के कारण वे छोटे दिखते थे। स्क्रीन पर दोनों भाषाओं का टैक्स्ट एक ही आकार में दिखाने के लिए ज़रूरी था कि हम अग्रेजी के फोंट का आकार यदि 12 चुनें तो हिंदी के फोंट का आकार हमें कम से कम 16 और बेहतर होगा कि 18 चुनना पड़ेगा। कंप्यूटर के फोंट फोरमेट को याद रखने का एक दुष्परिणाम यह भी था कि वह हिंदी टाइप करते हुए उसके फोंट के आकार को छोटा कर अंग्रेज़ी फोंट के आकार में ले जाता था या अंग्रेज़ी टाइप करते समय उसके फोंट को बढ़ाकर हिंदी के आकार में ले जाता था। ऐसे में सिवाय इसके कोई चारा न था कि सामग्री को सिलेक्ट कर उपयुक्त फोंट-आकार में किया जाए।
इस फोंट के आकार वाली समस्या के निदान के लिए हिंदी सॉफ्टवेयर निर्माताओं को हिंदी फोंटों के समान आकार और रूप वाले अंग्रेज़ी फोंट बनाने पड़े। ये फोंट सी-डेक के उत्पादों में एक्सटेंशन 1 के साथ दिखाई पड़ते हैं। इन्होंने नौसिखिए हिंदी कर्मचारियों को खूब छकाया। वे इनका नाम देख कर इनके हिंदी फोंट होने का धोखा खा जाते और सामग्री टाइप करना शुरू कर देते। स्क्रीन पर उभरते जंक कैरेक्टर देख कर वे संभलते। फिर टंकित सामग्री को सिलेक्ट कर ढूँढ कर हिंदी फोंट देते तब कहीं जा कर हिंदी में दस्तावेज अपने सही रूप में दिखाई देता।
इसमें एक दिक्कत यह भी थी कि दुबारा दस्तावेज खोलने पर या तो पूरा दस्तावेज अंग्रेज़ी फोंट में बदल हो जाता और हिंदी अक्षर जंक कैरेक्टरों के रूप में दिखने लगते या पूरा दस्तावेज हिंदी फोंट में बदल जाता और अंग्रेज़ी अक्षर जंक कैरेक्टरों के रूप में दिखने लगते। इससे काम में खासी देरी होती। सॉफ्टवेयर सामान्यतः फोंट को स्वतः पहचान लेते। इससे अंग्रेज़ी में जहाँ काम काफी आसान होता, वहीं हिंदी में कष्ट और बढ़ जाता क्योंकि कभी हिंदी टाइप करते समय कंप्यूटर स्वतः अंग्रेज़ी फोंट देने लगता और जंक कैरेक्टर दिखने शुरू हो जाते या अंग्रेज़ी टाइप करते समय हिंदी फोंट दर्शाने लगता और जंक कैरेक्टर दिखने शुरू हो जाते। दस्तावेज को वाँछित स्थिति में लाने के लिए जगह-जगह सामग्री सिलेक्ट कर उपयुक्त फोंट देना पड़ता।
इस बीच माइक्रोसॉफ्ट एक्सेल में तालिका बनाने और डेटाबेस प्रोग्रामों में हिंदी में डेटा भरने में यह कठिनाई भी थी कि उनमें एक खाने (सेल) या फील्ड में एक से अधिक फोंट देने का विकल्प नहीं था। और सरकारी विभागों में यह कार्य केवल हिंदी में किया नहीं जा सकता था। वैसे भी हिंदी में सोर्टिंग, इंडेक्सिंग और सर्चिंग की सुविधा मौजूद नहीं थी। इसलिए डेटा प्रोसेस करने के लिए अंग्रेज़ी में डेटा देना आवश्यक था। उक्त सभी समस्याओं के हल के लिए द्विभाषिक (बाइलिंग्वुअल) फोंट विकसित किए गए। यानी कि एक ही फोंट तालिका में हिंदी और अंग्रेज़ी दोनों के ग्लिफ शामिल किए गए।
अब टोगल कुंजी दबाने पर फोंट बदलने की आवश्यकता नहीं थी। फोंट का आकार बदलने की आवश्यकता नहीं थी। बस सीधे टाइप करने की ज़रूरत थी। हाँ, यदि कभी पूरी सामग्री अंग्रेज़ी जंक के रूप में दीखे भी तो सारी सामग्री को एक साथ सिलेक्ट कर द्विभाषिक फोंट चुनने से समस्या खत्म हो जाती। लेकिन एकभाषीय (मोनोलिंगुवल) फोंट में टंकित सामग्री के साथ यह सुविधा नहीं थी। इन द्विभाषिक फोंटों ने हिंदी जगत की लंबे समय तक भरपूर सेवा की। आम कर्मचारी को हिंदी में काम करने पर सामान्य तौर पर कोई दिक्कत नहीं आती थी।
इस स्थिति में परिवर्तन तभी आया जब इलेक्ट्रॉनिक रूप में यानी फ्लॉपी द्वारा की डेटा विनिमय ज़रूरत पैदा हुई। यह स्थिति और विकराल तब बनी जब इंटरनेट और ई-मेल की दुनिया ने दस्तक दी। यदि आपका दस्तावेज़ पाने वाले कंप्यूटर में वही फोंट नहीं है तो वह आपका दस्तावेज नहीं पड़ सकता। इसका हल यह निकाला कि ई-मेल में फाइल को चित्र (बीएमपी फाइल) के रूप में भेजा जाए। इसका परिणाम था फाइल का आकार बढ़ जाना यानी ई-मेल के आदान-प्रदान में अधिक समय ज़ाया होना। इंटरनेट पर समय की कीमत थी। इसलिए यह विकल्प छोटे दस्तावेजों और अपरिहार्य परिस्थितियों में ही इस्तेमाल किया गया। इसमें एक दिक्कत यह भी थी कि दस्तावेज की सामग्री तो छोड़िए उसके फोरमेट में भी परिवर्तन करना संभव नहीं था।
इसके हल के रूप में उपयोक्ता को सुझाया गया कि वह फोंट फाइल भी साथ ही भेज दे। इसका मतलब यह हुआ कि हिंदी के उपयोक्ता को सामान्य कंप्यूटर उपयोक्ता से अधिक बुद्धिमान होना चाहिए। ताकि वह विंडोज़ की फोंट डायरेक्टरी से सही फोंट पहचान कर कॉपी कर सके। और फोंट प्राप्त होने पर उसे फोंट डायरेक्टरी में स्थापित कर सके। इससे यह लाभ तो ज़रूर हुआ कि सामग्री की फोरमेटिंग में बदलाव संभव हो गया, परंतु बिना वह सॉफ्टवेयर हुए सामग्री में बदलाव या कुछ जोड़ना संभव नहीं था, चाहें वह एक शब्द ही क्यों न हो। वैसे यदि वह शब्द संपूर्ण रूप में उसी दस्तावेज में कहीं पहले ही टाइप किया हुआ हो तो उसे वहाँ से कॉपी ज़रूर किया जा सकता था। सोचिए, इस तरह से एक एक शब्द को ढूँढ कर वाक्य लिखना कितनी मेहनत का काम था।
इंटरनेट पर आपकी व्यवसायिक साइट को देखने के लिए भला सर्फर इतना जहमत क्यों उठाए। वह चुपके से अगली साइट पर चला जाएगा। इसके निराकरण के लिए डायनेमिक फोंट विकसित किए गए। डायनेमिक फोंट वे फोंट थे जो आपके कंप्यूटर के वैबसाइट से कनेक्ट होते ही तेज़ी से आपके कंप्यूटर की कैश मेमोरी में लोड हो जाते थे। जिससे जितनी देर में वैबसाइट लोड होती थी उतनी ही देर में फोंट लोड हो जाते थे। आपके सामने सारी सामग्री हिंदी में दिखाई देती। आपको फोंट लोड करने के कष्ट से छुटकारा। पर यह प्रक्रिया देखने में जितनी सरल थी, वास्तव में उतनी ही जटिल। इसमें आपकी वैबसाइट के कनेक्ट होते ही, एक कनेक्शन उस फोंट निर्माता के सर्वर से होता था जहाँ से फोंट आपके कंप्यूटर पर लोड होता है। यानी कि वैबसाइट निर्माता को डायनेमिक फोंट के लिए ये कमांड लाइन अपनी साइट पर देनी होंगी। कहने का मतलब इतना ही है कि यह कोई संतोषजनक समाधान नहीं है। क्योंकि यह इंटरनेट के लिए तो ठीक था पर सामग्रियों के अन्यथा आदान-प्रदान में यह सहायक नहीं था।
एक नई समस्या यह आई कि आपके कंप्यूटर पर तो सामग्री ठीक दिखाई देती थी परंतु वैब पर लोड करते ही इसके कुछ अक्षर टूट जाते थे और सामग्री विकृत हो जाती थी। और यह सब उस फोंट के आपकी मशीन में होने के बावजूद होता था। इसका कारण था कि जिस ऑपरेटिंग सिस्टम या उसके जिस संस्करण पर आपने सामग्री तैयार की थी उस पर तो वह ठीक दिखाई देती पर दूसरे ऑपरेटिंग सिस्टमों या उसी ऑपरेटिंग सिस्टम के उन्नत संस्करणों में यह समस्या उत्पन्न हो जाती। इसने सॉफ्टवेयर निर्माताओं को प्लेटफार्म-स्वतंत्र फोंट विकसित करने को प्रेरित किया। इसका परिणाम रहे वैब-फोंट। इनके इस्तेमाल से वैबसाइट निर्माता हिंदी में ऐसी वैबसाइटें निर्मित कर सकते थे जिनमें फोंट टूटते या विकृत नहीं होते थे। और हिंदी में तैयार सामग्री के अवलोकन में कोई परेशानी नहीं आती थी। लेकिन इन फोंटों के इस्तेमाल के लिए भी आपको फोंट तो लोड करने ही पड़ते थे।
आप देख रहे हैं कि किस तरह हिंदी के फोंट निर्माता ऑपरेटिंग सिस्टम या सॉफ्टेवयर का नया संस्करण आने पर लाचार हो जाते और नए समाधान खोजने को मजबूर होते। इसकी वजह थी कि हिंदी फोंट ऑपरेटिंग सिस्टम का हिस्सा नहीं थे। उन्हें एक कामचलाऊ व्यवस्था के द्वारा ऑपरेटिंग सिस्टम में डिस्पले करने लायक बनाया जाता था जिसके लिए ऑपरेटिंग सिस्टम निर्माता द्वारा खाली छोड़े गए स्थानों का प्रयोग किया जाता था। यदि ऑपरेटिंग सिस्टम निर्माता अपने अगले संस्करण में उस खाली स्थान का उपयोग किसी और काम के लिए इस्तेमाल कर लेगा तो उस स्थान पर दिए गए कैरेक्टर का डिसप्ले विकृत हो जाएगा।
उदाहरण के लिए यदि ‘न’ के स्थान का उपयोग किसी और काम के लिए कर लिया जाता है तो कुछ ऐसी स्थिति हो जाएगी कि पूरे दस्तावेज में जहाँ जहाँ ‘न’ है वहाँ वहाँ एक ग्रे पैच दिखाई देने लगे या एक वर्ग या प्रश्न वाचक चिह्न दिखाई देने लगे, चाहे आपके पास हिंदी का वही सॉफ्टवेयर है, वही फोंट है, परंतु अंग्रेज़ी के ऑपरेटिंग सिस्टम के नए संस्करण के आने से आपकी सारी सामग्री अपठनीय। ऐसी हालत में कितनी झुँझलाहट होती है अपनी बेबसी पर।
फिर इन फोंटों में फाइल का नाम, सर्च, फाइंड एंड रिप्लेस आदि नहीं दे सकते थे. इन्हें सोर्ट नहीं कर सकते थे। स्पैलचेक, थिसारस आदि की सुविधाएँ न होना एक अलग बात थी। इसका यह मतलब नहीं है कि ये सुविधाएँ थीं ही नहीं। हिंदी सॉफ्टवेयर निर्माताओं ने ये सुविधाएँ विकसित तो की थीं, पर वे चलतीं थर्ड पार्टी एरेंजमेंट के तहत ही थीं। इसका मतलब यही कि जब भी आप अपने हार्डवेयर या सॉफ्टवेयर को अपग्रेड करेंगे, तो ज़रूरी नहीं है कि ये सुविधाएँ उसी सहजता से चल पाएँ।
कितना दुख और आश्चर्य होता है यह देख कर कि विंडोज़ 98 में थाईलैंड और कोरिया जैसे छोटे देशों की भाषाएँ भी थीं, और बेहद जटिल लिपि वाली चीनी और जापानी भाषाएँ भी थीं, लेकिन वैज्ञानिक वर्णमाला वाली देवनागरी आदि भारतीय लिपियाँ नहीं थीं। ईरान इराक के कारण अरबी लिपि तो थी परंतु उर्दू की ज़रूरतों के हिसाब से वह परिवर्धित नहीं थी। इसके लिए हमारी सरकार और हमारा अभिजात्य वर्ग, जो अपना सारा काम काज अंग्रेज़ी के माध्यम से करता है, जिम्मेवार नहीं है तो और कौन है। लेकिन विश्वविद्यालयों के हिंदी प्राध्यापकों और हिंदी भाषी जनता का क्या कोई उत्तरदायित्व नहीं था कि वे हिंदी का उपयोग कर माँग पैदा करते ताकि विदेशी सॉफ्टवेयर निर्माता अपने सॉफ्टवेयरों को हमारी भाषाओं में देने को बाध्य हो जाते। जो थोड़ा बहुत बाज़ार विकसित हुआ, उसे सरकारी हिंदी विभागों और डीटीपी का काम करने वालों ने ही पैदा किया।
यह स्थिति शायद और चलती रहती यदि भारत का उपभोक्ता सामानों के बड़े बाज़ार के रूप में विकास न हुआ होता। जिसने उपभोक्ता कंपनियों को अपने विज्ञापन और प्रचार के लिए हिंदी चुनने को मजबूर किया। फिर शुरू हुआ एटीएम और ऑन-लाइन लेन-देन का दौर। इनके आम जनता तक पैठ के लिए हिंदी चाहिए थी. फिल्मों, टीवी सीरियलों और कंप्यूटर पर खेलों ने हिंदी शीर्षकों और नामावलियों की जरूरत पैदा की। धीरे-धीरे हमारे व्यापार, वाणिज्य, मनोरंजन, बैंकिंग आदि सभी कुछ का डिज़िटलीकरण होने लगा। इंटरनेट ने डिज़िटलीय जानकारियों के अथाह और अबाध प्रवाह तथा इन्टर-एक्टिव कार्यक्रमों को खूब फैलाया। आज सभी सरकारी मंत्रालय और विभाग अपनी सारी योजनाओं, जानकारियों, निविदाओं आदि को नेट पर जारी करने लगे हैं। शिक्षा संस्थान न केवल अपने परीक्षा परिणामों को नेट पर जारी करते हैं, बल्कि कुछ शिक्षा संस्थान तो ऑन लाइन परीक्षा लेने तथा प्रशिक्षण देने भी लग गए हैं।
क्या यह सब कुछ हमारे देश में हिंदी के बिना हो सकता है? क्या इसकी पहुँच आम जनता तक हो सकती है? क्या अंग्रेज़ी के माध्यम से इंटरनेटी दुकानें अपना माल विज्ञापित कर सकती है? क्या वे अपने माल को अंग्रेज़ी से ऑन-लाइन बेच सकती हैं? इन सब सवालों का एक ही जवाब होगा कि नहीं, नहीं, नहीं। यदि भारत में सूचना प्रौद्योगिकी को अपनी कमाई बढ़ानी है, यदि भारत की उपभोक्ता व सेवा कंपनियों को अपना इंटरनेटी बाज़ार तेज़ी से फैलाना है, यदि इन्टरनेट को अपनी पैठ दूर दराज तक करनी है तो उसे हिंदी और भारतीय भाषाओं को अपनाना ही होगा।
इन सब कारणों ने ओपनटाइप फोंट बनाने का मार्ग प्रशस्त किया। ओपन टाइप फोंट डिज़िटल फोंट हैं जो ओपनटाइप विशिष्टताओं से युक्त हैं। ये फोंट ब्राह्मी और सेमेटिक लिपियों जैसी जटिल लिपियों के लिए अपेक्षित उन्नत टाइपोग्राफी विशेषताएँ उपलब्ध कराते हैं। साथ ही ये फोंट लिगेचर्स, रूपों, विकल्पों और अन्य प्रतिस्थापनों को समर्थन प्रदान करते हैं। ये फोंट दो आयामी ग्लिफ पोज़िशन और ग्लिफ अटैचमेंट को भी समर्थन प्रदान करते हैं। ये स्क्रिप्ट प्रोसेसिंग लाइब्रेरी और ओपन टाइप लाइब्रेरी सेवा (ओटीएलएस) के साथ मिलकर काम करते हैं। ओटीएलएस टैक्स्ट प्रोसेसिंग सहायक कार्यों का सेट है। विंडोज़ ऑपरेटिंग सिस्टम में यूनिस्क्राइब और ओटीएलएस ऑपरेटिंग सिस्टम लाइब्रेरी का अंग हैं।
ओपन टाइप फोंटों का उद्देश्य भारतीय भाषाओं में वैब-विषयवस्तु तैयार करना, डेस्कटॉप अनुप्रयोगों में भारतीय भाषाओं को समर्थन प्रदान करना, यूनिकोड आधारित भारतीय भाषाओं में सर्च इंजन विकसित करना और विभिन्न भाषाओं के लिए भारतीय भाषा निधि विकसित करना है।
किस्सा मुख़्तसर, ओपन फोंट सब रोगों की दवा हैं, ये यूनिकोड आधारित सभी अनुप्रयोगों को समर्थन देते हैं।
चूँकि ये विंडोज़ 2000, विंडोज़ एक्सपी, लिनक्स, यूनिक्स, मेक ओएस आदि लगभग सभी ऑपरेटिंग सिस्टमों का हिस्सा हैं इसलिए ये प्रयोक्ता को वही स्वतंत्रता मुहैय्या कराते हैं, जो अंग्रेज़ी के फोंटों के इस्तेमाल में देखने में आती है। इनका उपयोग करने पर आप अपने फोल्डर या किसी फाइल का नाम हिंदी में दे सकते हैं, हिंदी में फाइल ढूँढ सकते हैं। किसी दस्तावेज में कोई शब्द ढूँढ कर बदल सकते हैं। किसी दस्तावेज या तालिका (स्प्रैडशीट) या डेटाबेस में हिंदी अकारादिक्रम के अनुसार शब्दों को संयोजित, सूचीबद्ध और सोर्ट कर सकते हैं।
यदि आप माइक्रोसॉफ्ट के ऑफिस हिंदी का इस्तेमाल करते हैं तो हिंदी में स्पैलचैक, थिसारस, अंग्रेज़ी हिंदी शब्द कोश आदि की सुविधाएँ भी आपको हासिल होती हैं। इंटरनेट पर गूगल, मोज़िला या सिफी जैसे किसी ब्राऊज़र में आप हिंदी में इंटरनेटी सामग्री को खोज सकते हैं। यदि आप किसी दस्तावेज या स्प्रैडशीट में ओपनटाइप फोंट ‘जिस्टओटी-योगेश’ में कोई सामग्री टाइप करते हैं और जिस मशीन पर आपने सामग्री फ्लॉपी या ई-मेल द्वारा भेजी है, उस पर यह फोंट नहीं है तो घबराने या परेशान होने की कोई ज़रूरत नहीं है, यह स्वतः ही उस कंप्यूटर के डिफाल्ट ओपनटाइप फोंट (जो विंडोज़ एक्सपी में ‘मंगल’ है) में बदल कर सामग्री को प्रदर्शित कर देगा। बशर्ते कि वह कंप्यूटर यूनिकोड समर्थित होना चाहिए। किसी भी यूनिकोड समर्थित सिस्टम में हिंदी को सक्रिय करके आप हिंदी में प्राप्त सामग्री को संपादित कर सकते हैं।
इसके अलावा यूनिकोड समर्थित कंप्यूटर में यदि आप चाहें तो समय और दिनांक के हिंदी फोरमेट चुन सकते हैं, भारतीय मुद्रा, भारतीय अंकों, उनके शब्द रूपों आदि को तो चुन ही सकते हैं। स्प्रैडशीट में आप अपनी कस्टम सूची भी हिंदी में बना सकते हैं। एमएस वर्ड में आप ऑटोटैक्स्ट में मनचाहे शब्द भर सकते हैं।
सुविधाओं की यह सूची अंतहीन है। कहने का अभिप्राय इतना ही है कि यूनिकोड और ओपनटाइप फोंट इस्तेमाल करने से हिंदी के रास्ते की सारी समस्याएँ दूर हो जाती हैं। यदि आपके विंडोज़ एक्सपी में फोंट लिस्ट में मंगल फोंट दिखाई नहीं दे रहा है, या स्टेटस बार के दाहिने कोने पर ईएन/एचआई दिखाई नहीं दे रहा है तो इसका मतलब इतना ही है कि आपके सिस्टम में हिंदी को सक्रिय नहीं किया हुआ है। हिंदी को सक्रिय करने की विधि के लिए परिशिष्ट देखें। एक बार हिंदी को सक्रिय कर लेंगे तो उपरोक्त सुविधाएँ स्वतः ही आपको हासिल हो जाएँगी। यदि आप अधिक फोंट चाहते हैं तो इस पते www.ildc.in पर टीडीआईएल की वैबसाइट को देखें। यहाँ आपको और भी बहुत सारी सुविधाएँ मुफ्त में डाऊनलोड करने के लिए उपलब्ध हैं। इन पर ‘हिंदी सॉफ्टवेयर टूल’ नामक अध्याय में विस्तार से विचार किया गया है।
क्रमश : अगले अंकों में जारी…
tag: hindi computing, computing in hindi, hindi computing - problems and solutions, hindi enabled software and hardware, software programming in hindi, ved prakash
मेरा मन तो हो रहा है कि इस पुस्तक को टिडलीविकी प्रयोग करके केवल एक एच टीएमेल फ़ाइल के रूप में भी प्रस्तुत किया जाय। हो न हो कोई इसके दो कदम और आगे जाकर, कुछ और करके, इसे और उपयोगी बना दे?
जवाब देंहटाएंइसी तरह के अनेकानेक प्रयास होंगे तो ही हम कह सकेंगे कि हिन्दी को आधुनिक सूचना प्रौद्योगिकी का लाभ मिल रहा है और तभी हिन्दी जनता भी लाभान्वित होगी।
जी, हाँ, अनुनाद जी, अवश्य.
जवाब देंहटाएंइसकी संपूर्ण किश्तें प्रकाशित होने के उपरांत इसकी पीडीएफ़ ईबुक भी प्रकाशित करने की योजना है. इस हेतु वेद प्रकाश जी ने विशेष अनुमति प्रदान की है. हम उनके दिल से आभारी हैं कि उन्होंने इतनी महत्वपूर्ण जानकारी युक्त पूरी पुस्तक को प्रकाशित करने की अनुमति प्रदान की है.
बेहद पठनीय.
जवाब देंहटाएंक्या किसी भी किताब को यूँ, किस्तों में छापा जा सकता है? मन में सवाल उठा इसलिए पुछ रहा हूँ...अपना तो फायदा ही है :)
संजय जी,
जवाब देंहटाएंजी हाँ, इसके लिए विशेष अनुमति वेद प्रकाश जी ने दी है. रचनाकार में पहले भी कई किताबें किश्तों में छप चुकी हैं. जरा कहानी संग्रह और उपन्यास कड़ी पर क्लिक कर देखें तो सही.