भारत को और संस्कृत भाषा को संसार के सब से पहले दार्शनिक ग्रंथ वेदों का रचयिता होने का गौरव प्राप्त हुआ। आरंभ में वेद मौखिक थे। वेदों के एक एक शब्द का सही उच्चारण और हर शब्द का सही अर्थ पीढ़ी दर पीढ़ी सुरक्षित रखने के लिए एक नितांत अनोखी प्रणाली विकसित की गई - समाज का एक पूरा वर्ग इस महा उद्यम के लिए मनोनीत कर दिया गया! इस वर्ग को सूचना प्रौद्योगिकी की पहली जैव मशीन और स्मृति चिप कहना अनुचित न होगा।
तभी से शब्दों के संकलन और कोश निर्माण की आवश्यकता का महत्व सर्वमान्य हो गया था। संसार के पहले कोश निघंटु की रचना वैदिक काल में ही हुई। इस थिसारस में अठारह सौ वैदिक शब्दों को विषय क्रम से संकलित किया गया था। इस की रचना का श्रेय प्रजापति कश्यप को दिया जाता है। महर्षि यास्क ने निरुक्त में निघंटु के तथा अन्य वैदिक शब्दों की विशद व्याख्या की। यह संसार का पहला शब्दार्थ कोश और तत्कालीन समाज का विश्वकोश यानी ऐनसाइक्लोपीडिया है।
लिपि काल में बने कोशों में शिरोमणि ग्रंथ के तौर पर आया - अमरसिंह कृत नामलिंगानुशासन या त्रिकांड। अपनी विलक्षणता के कारण आरंभ से ही यह थिसारस अपने रचेता के नाम परअमरकोश ही कहा जाता है, ठीक वैसे ही जैसे आजकल अँगरेजी का थिसारस अपने तमाम संस्करणोँ और प्रकारांतरों के बावजूद रोजेट्स थिसारस ही कहा जाता है। उस काल में हस्तलिखित प्रतिलिपियां आसानी से नहीं मिलती थीं। इसलिए सभी छात्रों को ग्रंथ कंठस्थ करने होते थे। स्मरण में सुविधा के लिए ऐसे सभी कोश छंदबद्ध होते थे। किसी श्लोक का एक पद या शब्द याद आते ही तत्संबंधी पूरा प्रकरण ज़बान पर आ जाता था। इस तरह याददाश्त ही अनुक्रम खंड का काम करती थी।
अमरकोश में 8000 (आठ हज़ार) शब्दों को 1502 (एक हज़ार पांच सौ दो) श्लोकोँ में पद्यबद्ध किया गया है। ये श्लोक तीन कांडोँ में विभाजित हैँ, जिन में कुल मिला कर 25 वर्ग हैँ। इन में से चार वर्ग मानव समाज से संबंधित हैं और उन का क्रम ब्राह्मण, क्षत्रिय, वैश्य और शूद्र वर्णों के क्रम से रखा गया है। हर विषय अपने से संबद्ध या विपरीत विषय की ओर ले जाता है।
अमरकोश की शैली से प्रभावित हो कर ही अमीर खुसरो ने फ़ारसी में द्विभाषी कोश (फ़ारसी-हिंदी) ख़ालिक़बारी की रचना की। यह संसार का पहला द्विभाषी थिसारस है। इस में हिंदी के साथ साथ अरबी फ़ारसी के शब्द समूह विषय क्रम से आते थे। हाथ से बनी प्रतिलिपियों में अशुद्धियां रह जाती थीं। हस्तलिखित होने के कारण वे बड़ी संख्या में उपलब्ध नहीं हो सकती थीं, और बहुत महँगी भी होती थीं।
लिपि के अन्वेषण के बाद सब से बड़ी क्रांति हुई जर्मनी में जोहानिस गुटेनबर्ग द्वारा 1450 में मुद्रण तकनीक का आरंभ। तब और आजकल भी कई छापेख़ानों में छपने वाली सामग्री नीचे एक सपाट धरातल पर रखी जाती थी, उस पर स्याही लगा कर ऊपर काग़ज़ रखा जाता था। एक सपाट फलक को ऊपर से नीचे ला कर काग़ज़ पर छाप डाली जाती थी। यह काम दाब या प्रैस से होता था, इसलिए इस का नाम प्रिंटिग ‘प्रैस’ पड़ा। हिंदी में भी छाप डालने के कारण यह छापाख़ाना कहलाता है।
अब किताबें आसानी से मिलने लगीं और जानकारी का संप्रेषण एक साथ कई क़दम आगे बढ़ गया। तब से अब छापेख़ाने में होने वाले सुधारों के साथ विविध विषयों पर तरह तरह की किताबें आम आदमी तक पहुँचना और भी आसान होता गया। पहली पहली किताबें धार्मिक थीं, जैसे बाइबिल। बाद में कुछ दंतकथाएँ और रहस्य कथाएँ छपनी शुरू हुईं। साहित्य का नंबर बाद में आया। धीरे धीरे कोश छपने लगे। इंग्लैंड में सन 1755 में सैमुअल जानसन का पहला इंग्लिश कोश ए डिक्शनरी आफ़ द इंग्लिश लैंग्वेज छपा। सन 1828 में इस से कहीं आगे बढ़ कर और बड़ा नोहा वैब्स्टर का ऐन अमेरीकन डिक्शनरी आफ़ द इंग्लिश लैंग्वेज छपा।
अमेरिकी नेता बेंजमिन फ़्रैंकलिन के प्रैस में एक मशीन
भारत में भी आरंभ में छपी पुस्तकें बाइबिल के अनुवाद थे। बात न तो यहाँ रुक सकती थी, न रुक पाई। भारतीय अस्मिता ने शीघ्र ही अपनी संस्कृति को छापेख़ाने तक लाना शुरू कर दिया। भारतीय साहित्य लोगों तक पहुँचाया जाने लगा। मैं बात कोशों तक ही सीमित रखूँगा। कुछ बहुत महत्वपूर्ण मुद्रित भारतीय (संस्कृत तथा हिंदी और इंग्लिश) कोश इस प्रकार हैं:
अब मैं अपने कोशों की बात करता हूँ – ये आधुनिक भारत के पहले थिसारस हैं।
कोश और थिसारस के क्षेत्र अलग अलग हैं। कोश शब्द को अर्थ देता है, थिसारस अर्थ को, विचार को, एक नहीँ अनेक शब्द देता है। कोश में हर शब्द अकारादि क्रम से छपा होता, जैसे:कक्ष, कक्षा, कगार।
थिसारस में शब्दों का संकलन अकारादि क्रम से न हो कर कोटि क्रम से होता है, जैसे इंद्रिय के बाद ज्ञानेंद्रिय, कर्मेंद्रिय या फिर कड़वा स्वाद के बाद कसैला स्वाद, खट्टा स्वाद, चरपरा स्वाद, नमकीन स्वाद और मीठा स्वाद। यह शब्दों के अर्थ तो नहीं देता, लेकिन किसी एक शब्द के अनेक पर्यायवाचियों से शब्द का अर्थ समझ में आ जाता है,
समांतर कोश बनाने की प्रेरणा मुझे रोजेट के थिसारस से मिली थी। तो 1973 में प्राथमिक अभ्यास या रिहर्सल के तौर पर मैं ने उसी के क्रम को अपनाने का फ़ैसला किया। सौभाग्य से अच्छी बात यह हुई कि मैं ने शब्दों के पर्याय याददाश्त के आधार पर न लिख कर, ज्ञानमंडल के बृहत् हिंदी कोश के पहले से अंतिम पन्ने तक एक एक शब्द पढ़ कर रोजेट की आर्थी कोटियों में फ़िट करने की नीति बनाई। इस दो कारण थे – 1) मैं भी अपनी याददाश्त मात्र के भरोसे नहीं रहना चाहता था। 2) मैं अपने थिसारस को पूरी तरह प्रामाणिक बनाना चाहता था। मैं ने इस कोश के अतिरिक्त कई विषयों के कोशों और पुस्तकों को भी अपने शब्दों के स्रोत के तौर पर इस्तेमाल किया।
जल्दी ही पता चल गया कि रोजेट का माडल मेरे काम का नहीं है। हिंदी की बहुत सारी कोटियोँ के लिए उस में जगह ही नहीँ थी। अब हमें अपना कोटि क्रम या संदर्भ क्रम बनाना था। करते करते सीखने के अलावा हमारे पास कोई उपाय नहीँ था। कम से कम पाँच बार हमें नए रास्ते अपनाने पड़े। 1973 से 1992 तक पूरे बीस साल बीतते बीतते, हमें लगा हम किसी कामचलाऊ क्रम तक पहुँच रहे हैँ। तब तक साठ हज़ार कार्डों पर हम लगभग दो लाख साठ हज़ार शब्द या अभिव्यक्तियां या रिकार्ड दर्ज़ कर चुके थे। एक शब्द या अभिव्यक्तियां या रिकार्ड का मतलब एक शब्द नहीँ एक पूरा वाक्यांश या मुहाविरा भी है।
इस तरह से काम करते करते कई समस्याएं खड़ी हो जाती थीं। पहली थी कि कई बार हम पहले किया काम फिर से दोहराने लगते थे – क्योंकि सारा काम याद रख पाना आसान नहीं था। पहले भी यह काम कर चुके हैं, यह जाँचने का कोई तरीक़ा नहीं था।
इस से भी बड़ी समस्या छपाई की थी जो मेरे सामने हर दिन सुरसा की तरह मुँह बाए खड़ी रहती। मैं छापेख़ाने में काम कर चुका था। छापेख़ाने में जो समस्याएँ आती हैं, उन का ध्यान आते ही मेरे रोंगटे खड़े हो जाते।
पहले हमारे कार्ड टाइपिस्टोँ को दिए जाएंगे। उन से कई कार्ड खो भी सकते हैं, और उन का क्रम भी बिगड़ सकता है। टाइपिस्ट बीच बीच में से कई शब्द ग़लत टाइप कर जाते हैं, कई शब्द और पंक्तियाँ टाइप करना भूल जाते हैं और कई पंक्तियां दोबारा टाइप कर जाते हैं। मैं टाइप किए दो लाख साठ हज़ार शब्दों को पढ़ूँगा, उन की ग़लतियां ठीक कराऊंगा। कई पेज कई बार टाइप कराने पड़ सकते हैं। हर बार नई ग़लतियां होने की संभावना रहेगी। फिर टाइप शीट छापेख़ाने में कंपोज़िंग के लिए जाएंगी। वहाँ बार बार उन की प्रूफ़ रीडिंग करानी होगी। सैकड़ों पेजों का कंपोज़्ड मैटर प्रैस वाला रखेगा कहाँ। उन दिनों छपाई के लिए मशीन पर जाने से पहले कई बार पेज टूट जाते थे। तब क्या होगा। वे पेज फिर से कंपोज़ करवाने और प्रूफ़ पढ़ने होँगे। हर शीर्षक और उपशीर्षक की एकोत्तर संख्या मैनुअली लिखते समय सही क्रम का अनुपालन हो पाएगा या नहीँ - यह समस्या भी रहेगी।
अनुक्रम बनाने की समस्या तो और भी जटिल थी। पूरा संदर्भ खंड छप जाने के बाद उस के एक एक शब्द को अकारादि क्रम से लिखने और उन की शीर्षक तथा उपशीर्षक संख्या लिखना - तौबा! यह मेरे बस का काम नहीं था। दूसरों से बनवाएं, तो उन्हें देने का पैसा कहाँ से आएगा, और वे सब संख्याएं सही लिखेंगे भी या नहीं, फिर प्रैस में कंपोज़िंग में कितनी ज़्यादा ग़लतियां होंगी – यह कौन जाँचेगा। यही सब सोच सोच कर मुझे दिन रात बुख़ार सा चढ़ा रहता था।
1992 में मेरे बेटे डाक्टर सुमीत कुमार ने कहा -
“इन सभी समस्याओं का एकमात्र हल है कंप्यूटर–यानी सूचना प्रौद्योगिकी।”
बात यहाँ समाप्त नहीं हो गई। अब हम अपने डाटा को द्विभाषी बनाने में जुट गए। अकेली हिंदी के लिए लिखी गई फ़ाक्स-प्रो ऐप्लीकेशन में इंग्लिश शब्द जोड़ने के लिए मूल प्रविधि में 1997 में परिवर्तन किया गया। आधार बना हमारा हिंदी वाला डाटाबेस। जिस तरह हिंदी थिसारस बनाने के लिए रोजेट में अनेक शब्दकोटियां नहीं थीं, उसी तरह हमारे डाटा में अनेक इंग्लिश शब्दकोटियां नहीं थीं। वे किस प्रकार कहां जोड़ी जाएं, इस के लिए भी काफ़ी सोचविचार किया गया। इंग्लिश शब्दों के स्रोत के लिए आक्सफ़र्ड यूनिवर्सिटी और वैब्सटर के कोश चुने गए। उन का एक एक शब्द परख कर हमारे पुराने डाटा में उपयुक्त जगह शामिल करने के लिए प्रावधान किया गया। 2007 में यह काम पूरा हुआ। उसी साल पेंगुइन इंडिया की ओर से द पेंगुइन इंग्लिश-हिंदी/हिंदी-इंग्लिश थिसारस ऐंड डिक्शनरी नाम से तीन विशाल खंडोँ में प्रकाशित हुई।
इस बीच हमारे दो और हिंदी कोश आ चुके थे—1) अरविंद सहज समांतर कोश – अकारादि क्रम से संयोजित थिसारस, और 2) शब्देश्वरी – भारतीय पौराणिक नामों का थिसारस।और अभी सितंबर 2013 में आया है समांतर कोश का परिवर्धित और परिष्कृत संस्करण बृहत् समांतर कोश (प्रकाशक वही नेशनल बुक ट्रस्ट इंडिया। यह कोश हमारी कंपनी से भी मंगाया जा सकता है)।
सफ़र की पांचवीं मंज़िल की ओर हमारा प्रयाण था - इंटरनेट पर अरविंद लैक्सिकन पहुँचाने की तैयारी। 2008 में सुमीत ने तय कि डाटा को फ़ाक्स-प्रो से निकाल कर विज़ुअल बेसिक की सहायता से माइक्रोसाफ़्ट नैट प्लैटफ़ार्म में लाना चाहिए। अतः डाटाबेस को ऐमऐस ऐक्सैस (MS Access) में इस तरह परिवर्तित किया गया कि वह ऐसक्यू लाइट (SQLite) में ढाला जा सके। यह डाटा ऐमऐस विंडोज़ और लाइनक्स (Linux) ही नहीँ हर प्लेटफ़ार्म पर चलता है।
जून 2011 में राष्ट्रीय राजधानी क्षेत्र की हिंदी अकादेमी ने मुझे शलाका सम्मान प्रदान किया। उसी दिन सुमीत ने अरविंद लैक्सिकन www।arvindlexicon।com लिंक पर लांच कर दिया।
तो बहुत थोड़े शब्दों में यह थी भाषा के उद्भव से सूचना प्रौद्योगिकी की सहायता से हिंदी कोश निर्माण की दास्तान।
áउच्चारण पर आधारित हिंदी का फ़ोनेटिक कीबोर्ड - इस में आ इ ई उ ऊ ए ऐ ओ औ आदि और उन की मात्राओं के लिए स्वतंत्र कुंजी है. मतलब कि ये मात्र ग्राफ़िक नहीं हैं, बल्कि स्वतंत्र उच्चारण है. टाइप राइटर में आ, ओ और औ तथा अन्य सभी मात्राएं व्यंजनों के बाएँ, दाएँ या ऊपर और नीचे टंकित की जाती थीं. कंप्यूटर में इन में से हर एक को अलग से टंकित करना होता है.
á प्रसंस्कृत डाटा - डाटा मैनिपुलेशन - डाटा प्रस्तुति – डाटा प्रदर्शन
áऐमऐस ऐक्सैस में डाटा – आप देख रहे हैं सफलता विषयक डाटा. इस में भिन्न रंग चयनक विधि दिखाते हैं
áऐमऐस ऐक्सैस में डाटा – आप देख रहे हैं सफलता विषयक डाटा. इस में भिन्न रंग चयनक विधि दिखाते हैं
áसफलता का अकारादि क्रम से हिंदी-इंग्लिश कोश के लिए आउटपुट
áसफलता का संदर्भ क्रम से आउटपुट – यह बृहत् समांतर कोश का एक पेज है
इंटरनेट पर सफलता का आउटपुट
स्त्रोत-
अंतिम बार संशोधित : 2/21/2020
इस पृष्ठ में अक्सर पूछे जाने वाले प्रश्न - नि:शुल्...
इस पृष्ठ में अक्सर पूछे जाने वाले प्रश्न - मौलाना ...
इस भाग में नोबेल शांति पुरस्कार(2014) प्राप्त शख्...
इसमें अनुसूचित जनजातियों हेतु राष्ट्रीय प्रवासी छा...