Business

Technology

हिंदी और यूनीकोड

कंप्यूटर पर हिंदी यूनीकोड क्या है?
यूनीकोड अंग्रेजी के दो शब्दों यूनीवर्सल (जागतिक) एवं कोड (कूट संख्या) से गठित एक नया शब्द है। अतः यूनीकोड का मतलब एक ‘विशेष कूट संख्या’ से है। यूनीकोड शब्द कंप्यूटर विज्ञान एवं प्रौद्योगिकी के क्षेत्र में प्रचलित है। इसे यूनीवर्सल कोड भी कहते हैं। कम्प्यूटर कार्यक्रम के अंतर्गत यूनीकोड प्रत्येक वर्ण के लिए एक विशेष अंक प्रदान करता है। चाहे कोई भी प्लेटफार्म हो अथवा कोई भी भाषा हो। यूनीकोड को व्यापक रूप से विश्वव्यापी सूचना आदान-प्रदान के मानक के रूप में स्वीकार किया जा चुका है।
यूनीकोड तकनीकी परिचय
यह 16 बिट (2 बाइट) का कोड है। इसे ही यूनीकोड मानक माना गया है। यूनीकोड 16  बिट एनकोडिंग का प्रयोग करता है जोकि 65536 कोड-प्वाइंट (वर्ण) उपलब्ध कराता है। 16 बिट यूनीकोड में 65536 वर्णों कैरेक्टरों की उपलब्धता होने के कारण यह कोड विश्व की लगभग सभी लेखनीय भाषाओं के लिए, सभी कैरेक्टरों को इनकोड करने की क्षमता रखता है। कम्प्यूटर उपयोक्ताओं के लिए जो बहुभाषी टेक्स्ट पर काम करते है जैसे कि व्यापारियों, भाषाविदों, अनुसंधानकर्त्ताओं वैज्ञानिकों, गणितज्ञों और तकनीशियनों के लिए यूनीकोड मानक बहुत लाभप्रद है। यूनीकोड मानक प्रत्येक कैरेक्टर को एक विलक्षण संख्यात्मक मान और नाम देता है। यह अंतरराष्ट्रीय मानक है। इससे हिंदी तथा अन्य भारतीय भाषाओं में कंप्यूटर पर अंग्रेजी की तरह ही सरलता से और शतप्रतिशत शुद्धता से कार्य किया जा सकता है। आंतरिक तौर पर कंप्यूटर केवल बाइनरी कूट अंकों 0 और 1 को ही समझता है। इसलिए हम जो भी वर्ण टाइप करते हैं, वह अंततः 0 और 1 में ही परिवर्तित किए जाते हैं, तभी कंप्यूटर उन्हें समझ पाता है। किस भाषा के किस शब्द के लिए कौन-सा अंक प्रयुक्त होगा इसका निर्धारण करने के नियम विभिन्न संकेत-लिपि प्रणाली( इनकोडिंग सिस्टम) द्वारा निर्धारित होते हैं। ये प्रत्येक वर्ण के लिए एक अंक निर्धारित करके वर्ण संग्रहीत करते हैं। यूनीकोड का आविष्कार होने से पहले ऐसे अंक देने के लिए सैकड़ों संकेत-लिपि प्रणालियां थीं। किसी एक संकेत लिपि में पर्याप्त वर्ण नहीं है। उदाहरण के लिए यूरोपीय संघ को अकेले ही अपनी सभी भाषाओं के वर्णों को संग्रहीत करने के लिए विभिन्न संकेत लिपियों की आवश्यकता होती है। यहां तक कि अंग्रेजी जैसी भाषा के लिए भी सभी वर्णों, विरामचिह्नों और सामान्य प्रयोग के तकनीकी प्रतीकों हेतु एक ही संकेत लिपि पर्याप्त नहीं थी। इन संकेत लिपियों में आपस में तालमेल भी नहीं है। इसलिए, दो संकेत-लिपियां, दो विभिन्न वर्णों के लिए एक ही अंक प्रयोग कर सकती हैं अथवा समान वर्ण के लिए विभिन्न अंकों का प्रयोग कर सकती हैं। किसी भी कंप्यूटर को विभिन्न संकेत लिपियों की आवश्यकता होती है। फिर भी जब दो विभिन्न संकेत लिपियों अथवा प्लेट्फार्मों के बीच डाटा भेजा जाता है तो उस डाटा के हमेशा खराब होने का जोखिम रहता है।
यूनीकोड के प्रयोग से लाभ
एकरूपता आती है, विभिन्न तरह के फांट्स से छुटकारा मिलता है।
हिंदी में ई-मेल, एसएमएस, चैट आदि आसानी से कर सकते हैं।
कार्यालयों के सभी कार्य कंप्यूटर पर हिंदी में आसानी से होते हैं।
हिंदी में बनी फइलों का आसानी से आदान-प्रदान कर सकते हैं।
हिंदी की-वर्ड को गूगल या किसी अन्य सर्च इंजन में सर्च कर सकते हैं।
कंप्यूटर पर यूनीकोड में हिंदी देवनागरी के  टाइपिंग हेतु कुछ विधियां ः कंप्यूटर पर यूनीकोड आधारित हिंदी टाइपिंग करने के लिए सामान्यतः एक हिंदी टूल की जरूरत होती है जिसे आइएमई टूल कहते हैं। यूनीकोड अस्की फांट (क्रुतिदेव- 8 बिट कोड फांट) की तरह व्यवहार नही करता। जैसे कि हम एमएस वर्ड में जाकर कृतिदेव फांट चुन कर हिंदी टाइपिंग करने लगते हैं। यूनीकोड का प्रचलित फांट- मंगल 16 बिट कोड फांट है। एमएस वर्ड में हम मंगल को कृतिदेव की तरह चुन कर हिंदी टाइपिंग नहीं कर सकते हैं। यूनीकोड आधारित हिंदी देवनागरी टूल, प्रखर देवनागरी लिपिक प्रलेख देवनागरी लिपिक आदि जैसे उपकरणों की सहायता से टाइप की जा सकती है।
वर्तमान में कंप्यूटर पर यूनीकोड आधारित हिंदी टाइपिंग हेतु मुख्यतः तीन विधियां बहु-प्रचलित हैं ः
रेमिंग्टन टंकण शैली
इन-स्क्रिप्ट टंकण शैली
फोनेटिक इंग्लिश आधारित टंकण शैली।
इन तीनों प्रकार की टंकण शैली की अपनी-अपनी टंकण करने की एक विधा है और प्रत्येक के लिए अपना-अपना एक की बोर्ड लेआउट भी है। हिंदी टंकण के लिए निम्नलिखित तीन की-बोर्ड लेआउट बहु-प्रचलित हैं जो इस प्रकार से हैं-
1: टाइप-राइटर लेआउट - इसे प्रायः रेमिंग्टन टाइप-राइटर के नाम से भी जाना जाता है। इसका लेआउट हिंदी टाइप-राइटर पर आधारित है। यह काफी पुराना और बहु-प्रचलित लेआउट है। यह लेआउट उन लोगों के लिए उपयोगी है जो कंप्यूटर पर आने से पूर्व ही इस लेआउट पर टाइपिंग सीखे हुए हैं या पहले से ही इस पर टाइपिंग करने के आदी हैं।
2: रेमिंग्टन टंकण शैली – रेमिंग्टन एक टच टाइपिंग प्रणाली है। टच टाइपिंग एक टंकण विधि है, जिसमें की-बोर्ड को बिना देखे केवल हाथों से छू-कर टाइप किया जाता है। यह हिंदी टाइपिंग की सबसे पुरानी विधि है। यह उन प्रयोगकर्ताओं के लिए एकदम सही और उपयोगी है जिन्होंने पहले से हिंदी टाइपराइटर पर हिंदी टाइपिंग सीखी है तथा इसके अभ्यस्त हैं। रेमिंग्टन टंकण शैली के तहत हिंदी टाइपिंग करने के लिए टंकणकर्ता को अंग्रेजी भाषा की जानकारी का होना कतई आवश्यक नहीं है। अंग्रेजी का बिलकुल ज्ञान न रखने वाले भी इस शैली से बखूबी टंकण कार्य कर सकते हैं।
डी.ओ.इ. फ ोनेटिक- इसे इन-स्क्रिप्ट लेआउट कहते हैं। इस लेआउट का मानकीकरण भारत सरकार के इलेक्ट्रॉनिक्स विभाग द्वारा किया गया तथा ‘ब्यूरो ऑफ इंडियन स्टैंडर्ड्स’ द्वारा इसे राष्ट्रीय मानक घोषित किया गया। इस लेआउट की सबसे बड़ी खूबी यह है कि यह सभी भारतीय भाषाओं के वर्णों के लिए प्रयुक्त कुंजियों में समरूपता रखता है।
इन-स्क्रिप्ट टंकण शैली-   यह भी एक टच टाइपिंग प्रणाली है। इसके ध्वन्यात्मक ; गुण के कारण एक व्यक्ति जो कि किसी एक लिपि में इन-स्क्रिप्ट टाइपिंग जानता हो वह सभी भारतीय लिपियों में, बिना उस लिपि के ज्ञान के भी श्रुतलेखन द्वारा टाइप कर सकता है। इन-स्क्रिप्ट टंकण शैली के तहत हिंदी टाइपिंग करने के लिए टंकणकर्ता को अंग्रेजी भाषा की जानकारी का होना कतई आवश्यक नहीं है। अंग्रेजी का बिलकुल ज्ञान न रखने वाले भी इस शैली से बखूबी टंकण कार्य कर सकते हैं। परंतु टंकणकर्ता को हिंदी पढ़ना आना जरूरी है, क्योंकि यहां जो शब्द टाइप किया जाएगा वह उस शब्द के उच्चारण के वर्ण क्रम में ही कुंजियाँ प्रयोग कर टाइप कर सकेगा। यह सभी प्रमुख प्रचालन तंत्रों (ओएस)अंतर्निर्मित आता है इसलिए किसी अलग टाइपिंग औजार को इंस्टाल करने की आवश्यकता नहीं। वह सभी नवीन उपयोगकर्ता, जो कंप्यूटर पर पहले से हिंदी के लिए किसी भी प्रकार की टाइपिंग नहीं जानते उन्हें इन-स्क्रिप्ट ही सीखना चाहिए। इन-स्क्रिप्ट का कुंजीपटल विन्यास विशेष शोध द्वारा विशिष्ट क्रम में बनाया गया है, जिससे इसे याद करना अत्यंत सरल है। मात्र एक हफ्ते के अभ्यास से ही इन-स्क्रिप्ट में लिखना शुरू किया जा सकता है। इन-स्क्रिप्ट में आमतौर पर एक वर्ण के लिए एक कुंजी होने से टाइपिंग की अशुद्धियां कम होती हैं। इन-स्क्रिप्ट लेआउट में भारतीय लिपियों के सभी यूनीकोड मानकीकृत चिह्नों को शामिल किया गया है। टच स्क्त्रीन डिवाइसों यथा टैबलेट तथा मोबाइल फोन आदि के लिए भी इनस्क्रिप्ट की-बोर्ड पूर्णतया उपयुक्त है।
फोनेटिक इंग्लिश- इसे रोमनाइज्ड लेआउट कहते हैं। इसका ध्वन्यात्मक लिप्यंतरण आधारित की-बोर्ड लेआउट कम्प्यूटर का वास्तविक की-बोर्ड लेआउट ही है। ध्वन्यात्मक लिप्यंतरण (फोनेटिक ट्रांसलिट्रेशन) मशीनी लिप्यंतरण की एक विधि है। यह एक ऐसी लिप्यंतरण विधि है, जिससे कि हिंदी आदि भारतीय लिपियों को आपस में तथा रोमन में बदला जाता है। इसकी कोई मानक लिप्यंतरण स्कीम नहीं होती। अलग-अलग टूल में अलग.अलग स्कीम प्रयोग होती है।
फोनेटिक इंग्लिश (रोमनाइज्ड ) आधारित टंकण शैली- इस टंकण शैली में प्रयोक्ता हिंदी टेक्स्ट को रोमन लिपि में टाइप करता है तथा यह रियल टाइम में समकक्ष देवनागरी अथवा इंडिक लिपिद्ध में ध्वन्यात्मक रूप से परिवर्तित हो जाता है। इस प्रकार का स्वचालित परिवर्तन ध्वन्यात्मक टेक्स्ट एडिटर, वर्ड प्रोसेसर तथा सॉफ्टवेयर प्लगइन के द्वारा किया जाता है। परंतु सर्वश्रेष्ठ तरीका फोनेटिक आइएमइ का प्रयोग है, जिसकी सहायता से टेक्स्ट किसी भी एप्लिकेशन में सीधे ही लिखा जा सकता है।


जगदीप सिंह दांगी एसोसिएट प्रोफेसर, भाषा विद्यापीठ महात्मा गांधी अंतरराष्ट्रीय हिंदी विश्वविद्यालय, वर्धा
हिंदी और यूनीकोड हिंदी और यूनीकोड Reviewed by naresh on Sunday, June 08, 2014 Rating: 5

No comments:

blogger.com