tag:blogger.com,1999:blog-10323440.post-25403621324204977342007-12-06T19:17:00.000+05:302007-12-07T08:57:59.919+05:30अपने लिये फाण्ट परिवर्तक प्रोग्राम स्वयं लिखें<span style="font-size:130%;"><br />यूनिकोड के फायदे अब सब स्वीकारते हैं, सब जानते हैं। ऐतिहासिक रूप से कम्प्यूटर पर हिन्दी (और अन्य गैर-रोमन लिपीय भाषायें) बड़े टेढ़े-मेढ़े रास्ते तय करते हुए आयी। इसमें 'लिगेसी' फाण्ट का प्रयोग भी एक मुकाम था। शुशा, कृतिदेव, संस्कृत९९ और न जाने कितने फाण्ट प्रयोग होते थे। जितने लोग, उतने फाण्ट।<br /><br /><br />अच्छी बात ये है कि इन फाण्टों में ही बहुत सारी हिन्दी की उपयोगी सामग्री (कन्टेन्ट) सम्हालकर रखा हुआ है। जिनको यूनिकोड में बदकर अमर किया जा सकता है।<br /><br /><br /><br />किसी भी हिन्दी फाण्ट परिवर्तक के मुख्यत: तीन भाग होते हैं -<br /><br />१) पुराने (लिगेसी) संकेतों को संगत हिन्दी यूनिकोड संकेतों से प्रतिस्थापित करना<br /><br />२) छोटी इ की मात्रा का स्थान बदलना<br /><br />३) आधा र (अक्षरों के उपर लगने वाला र) का स्थान बदलना<br /><br />कहने की जरूरत नहीं कि जो भी प्रोग्राम लिखा जायेगा, उसे इन तीनों कार्य करने पड़ेंगे।<br /><br /><br /><br /><span style="font-size:180%;">पुराने संकेतों को यूनिकोड संकेतों से बदलना</span>:<br /><br />हर लिगेसी फाण्ट में हिन्दी के स्वरों, मात्राओं एवं ब्यंजनों के लिये कुछ कोड प्रयोग किया जाता है, जो अन्तत: एक संकेत के रूप में दिखता है। विभिन्न लिगेसी फाण्टों में ये संकेत कुछ समान होते हैं और ज्यादातर भिन्न। उदाहरण के लिये संस्कृत९९ मे लिगेसी फाण्ट के कुछ संकेत और यूनिकोड के संगत संकेत नीचे दिये गये हैं:<br /><br /><span style="color: rgb(255, 102, 102);">"k", "K", "Š", "o", "O", "g", "G", "¸"</span><br /><span style="color: rgb(255, 102, 102);">"</span><span style="color: rgb(255, 102, 102);">क</span><span style="color: rgb(255, 102, 102);">", "</span><span style="color: rgb(255, 102, 102);">क्</span><span style="color: rgb(255, 102, 102);">", "</span><span style="color: rgb(255, 102, 102);">क्</span><span style="color: rgb(255, 102, 102);">", "</span><span style="color: rgb(255, 102, 102);">ख</span><span style="color: rgb(255, 102, 102);">", "</span><span style="color: rgb(255, 102, 102);">ख्</span><span style="color: rgb(255, 102, 102);">", "</span><span style="color: rgb(255, 102, 102);">ग</span><span style="color: rgb(255, 102, 102);">", "</span><span style="color: rgb(255, 102, 102);">ग्</span><span style="color: rgb(255, 102, 102);">", "</span><span style="color: rgb(255, 102, 102);">घ</span><span style="color: rgb(255, 102, 102);">"</span><br /><br /><br /><br /><span style="font-size:180%;">छोटी इ की मात्रा की समस्या :</span><br /><br />लिगेसी फान्टों में अधिकतर छोटी इ की मात्रा को निम्नलिखित उदाहरण से समझा जा सकता है:<br /><br /><span style="color: rgb(255, 102, 102);">दिन</span> के लिये संस्कृत९९ में <span style="color: rgb(255, 102, 102);">idn </span> लिखा गया होगा.<br /><br /><span style="color: rgb(255, 102, 102);">क्लिष्ट</span> को <span style="color: rgb(255, 102, 102);">ikl;q</span> लिखा गया होगा।<br /><br />ध्यान दें कि छोटी इ की मात्रा के लिये <span style="color: rgb(255, 102, 102);">i</span> </span><span style="font-size:130%;">का <span></span></span><span style="font-size:130%;"><span></span> प्रयोग किया जा रहा है और यह जिस वर्ण पर लगनी है उसके ठीक पहले या उसके एक स्थान और पहले (दूसरे उदाहरण में) हो सकती है। जबकि यूनिकोड में छोटी इ की मात्रा के लिये आने वाला कोड , उस व्यंजन के कोड के बाद आता है।<br /><br />दिन = द का कोड + <span></span></span><span style="font-size:130%;">छोटी</span><span style="font-size:130%;"><span></span> इ की मात्रा का कोड + न का कोड<br /><br />स्थिति = स का कोड + हलन्त का कोड (स को आधा करने के लिये) + थ का कोड + छोटी इ की मात्रा का कोड + त का कोड + छोटी इ की मात्रा का कोड<br /><br /><br /><br /><span style="font-size:180%;">आधे र की समस्या :</span><br />आधे र की समस्या, छोटी इ की समस्या के तरह ही, किन्तु इसके </span><span style="font-size:130%;">ठीक</span><span style="font-size:130%;"> उल्टा है।<br /><br />उदाहरण :<br /><span style="color: rgb(255, 102, 102);">तर्क</span> का संस्कृत ९९ मे कोड <span style="color: rgb(255, 102, 102);">tkR</span> है;<br /><span style="color: rgb(255, 102, 102);">कर्ता</span> का संकेत <span style="color: rgb(255, 102, 102);">ktaR</span> है।<br /><br />स्पष्ट है कि लिखने में जिस ब्यंजन के उपर आधा र लगाया जाता है, उसके बाद, या उस पर लगी मात्राओं के बाद आधे र का संकेत आता है।<br /><br />किन्तु यूनिकोड में आधे र की स्थिति अलग है। उच्चारण की दृष्टि से आधा र, उस ब्यंजन के पहले आता है, जिसके उपर इसे लगाया जाता है। इसी लिये यूनिकोड में आधे र का कोड भी उस ब्यंजन के पहले आता है।<br /><br />उदाहरण :<br /><br /><span style="color: rgb(255, 102, 102);">तर्क</span> = त का यूनिकोड + आधे र का यूनिकोड + क का यूनिकोड<br /><br /><span style="color: rgb(255, 102, 102);">कर्ता</span> = क का यूनिकोड + आधे र का यूनिकोड + त का यूनिकोड + आ की मात्रा का यूनिकोड<br /><br /><br />संस्कृत९९ को यूनिकोड में बदलने का प्रोग्राम का सोर्स कोड <a href="http://technical-hindi.googlegroups.com/web/sanskrit99%20to%20unicode%20converter13.htm?gda=bMu8VlYAAAB5zxHOSbEKAP8cNeX2R8xaku-_7IT5Ci4CHhEaAf8ps2G1qiJ7UbTIup-M2XPURDT54eRQL6h_r_EYXAppjEm_4DTwGKTe1bw6qyuAMO5NYJyoK-ZSYxsZ1B_iBQ7epEk">इस फाइल</a> को वर्डपैड में खोलकर या किसी अन्य तरीके से देखा जा सकता है।<br /><br /><br />और भी कई मुद्दे हैं जैसे - लिगेसी में किस अक्षर के लिये कौन सा संकेत प्रयुक्त हुआ है, कैसे जानें ; एच टी एम एल और जावास्क्रिप्ट के किन कमाण्डों का प्रयोग किस काम के लिये करें; प्रोग्राम का फ्लोचार्ट कैसा होगा .. आदि मुद्दे अगली पोस्टों में विचारे जायेंगे।<br /><br /><br /><br /><br /></span><div class="blogger-post-footer"><img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/10323440-2540362132420497734?l=pratibhaas.blogspot.com'/></div>अनुनाद सिंहhttp://www.blogger.com/profile/05634421007709892634noreply@blogger.com6