ജി 20 ഡിജിറ്റൽ ഇക്കണോമി വർക്കിംഗ് ഗ്രൂപ്പ് മന്ത്രിമാരുടെ യോഗത്തിൽ പ്രധാനമന്ത്രി നരേന്ദ്ര മോദി "ഭാഷിണി" അനാവരണം ചെയ്തു. ഈ എഐ-പവർ ഭാഷാ വിവർത്തന പ്ലാറ്റ്ഫോം ഇന്ത്യയുടെ ഭാഷാ വൈവിധ്യത്തെ ആഘോഷിക്കുന്നു.
ഭാഷിണി ഡിജിറ്റൽ വിഭജനം നികത്താനും ഓരോ ഇന്ത്യക്കാരനും ബന്ധമുണ്ടെന്ന് ഉറപ്പാക്കാനും ലക്ഷ്യമിടുന്നു. അതിവിപുലമായ ഭാഷകളും ഭാഷാഭേദങ്ങളും കൊണ്ട് ഇന്ത്യ അത്തരം നവീകരണത്തിനുള്ള ക്യാൻവാസായി മാറിയിരിക്കുന്നു. ഇന്ത്യയിലെ എണ്ണമറ്റ ഭാഷകളിലുടനീളം ഡിജിറ്റൽ ഉൾപ്പെടുത്തലിനെ പ്ലാറ്റ്ഫോം പിന്തുണയ്ക്കുന്നു.
പലർക്കും, ഇത് അവരുടെ മാതൃഭാഷയിൽ ആദ്യമായി ഉള്ളടക്കം ആക്സസ് ചെയ്യുക എന്നാണ്. അതുകൊണ്ട്, ഭാഷിണി എന്താണെന്ന് ആഴത്തിൽ നോക്കാം.
ഭാഷിണിയുടെ ആവശ്യം
ഡിജിറ്റൽ ലോകം ഇംഗ്ലീഷിലേക്ക് ചായുന്നു, ഇത് ഇംഗ്ലീഷ് ഇതര സംസാരിക്കുന്ന പലരെയും ഒഴിവാക്കി. ഓൺലൈനിൽ വിവരങ്ങൾ കണ്ടെത്താൻ ശ്രമിക്കുന്നത് സങ്കൽപ്പിക്കുക, പക്ഷേ അത് നിങ്ങളുടെ ഭാഷയിലല്ല. ഇത് നിരാശാജനകവും പരിമിതപ്പെടുത്തുന്നതുമാണ്.
തങ്ങളുടെ മാതൃഭാഷയിൽ ഉള്ളടക്കം ആക്സസ് ചെയ്യാൻ പാടുപെടുന്നതിനാൽ നിരവധി ഇന്ത്യക്കാർ ദിവസവും ഈ പ്രശ്നം അഭിമുഖീകരിക്കുന്നു. ഇവിടെയാണ് ഭാഷിണിയുടെ ആവശ്യം വരുന്നത്. ഈ വിടവ് നികത്താനും എല്ലാ ഇന്ത്യൻ ഭാഷകൾക്കും ഡിജിറ്റൽ സ്പെയ്സിൽ ന്യായമായ അവസരം ലഭിക്കുന്നുണ്ടെന്ന് ഉറപ്പാക്കാൻ ഒരു പ്ലാറ്റ്ഫോം നൽകാനും ഇത് ലക്ഷ്യമിടുന്നു. ഭാഷ കാരണം ആരും പിന്നോക്കം പോകരുത്.
ഭാഷിണി മാതൃക മനസ്സിലാക്കുന്നു

ഡിജിറ്റൽ-ആദ്യ കാലഘട്ടത്തിൽ ഭാഷ ഉൾക്കൊള്ളാനുള്ള ഒരു പ്രതീക്ഷയായി ഭാഷിണി നിലകൊള്ളുന്നു. ഇത് എങ്ങനെ പ്രവർത്തിക്കുന്നുവെന്നും അതിന്റെ അടിസ്ഥാന തത്വങ്ങളെക്കുറിച്ചും നമുക്ക് നോക്കാം.
ഭാഷകളുടെ പ്രവർത്തനവും പ്രമോഷനും
പ്രാദേശിക ഭാഷകളെ സജീവമായി പ്രോത്സാഹിപ്പിക്കുന്ന പ്രസ്ഥാനമാണ് ഭാഷിണി. അതിന്റെ സാങ്കേതിക നേട്ടങ്ങളിലൂടെയും സഹകരണത്തിലൂടെയും ഇത് ചെയ്യുന്നു. കമ്പനികളുമായും പ്ലാറ്റ്ഫോമുകളുമായും ഇടപഴകുമ്പോൾ ഭാഷിണി അതിന്റെ ഓഫറുകൾ സമന്വയിപ്പിക്കുന്നു. ഇത് വിവിധ ഡിജിറ്റൽ പ്ലാറ്റ്ഫോമുകളിൽ തടസ്സമില്ലാത്ത ഉപയോക്തൃ അനുഭവം ഉറപ്പാക്കുന്നു.
ഭാഷിണിയുടെ ബിൽഡിംഗ് ബ്ലോക്കുകൾ
സാങ്കേതികവിദ്യ
ASR
സംസാരിക്കുന്ന വാക്കുകൾ മനസ്സിലാക്കാൻ ഓട്ടോമാറ്റിക് സ്പീച്ച് റെക്കഗ്നിഷൻ സഹായിക്കുന്നു.
ഓസിആര്ചിത്രം
ഒപ്റ്റിക്കൽ ക്യാരക്ടർ റെക്കഗ്നിഷൻ ചിത്രങ്ങളിൽ നിന്നുള്ള വാചകം വായിക്കുന്നു.
എൻ.എൽ.യു
സ്വാഭാവിക ഭാഷാ ധാരണ സന്ദർഭം മനസ്സിലാക്കുന്നത് ഉറപ്പാക്കുന്നു.
MT
മെഷീൻ ട്രാൻസ്ലേഷൻ തത്സമയ വിവർത്തനങ്ങൾ വാഗ്ദാനം ചെയ്യുന്നു.
ടി.ടി.എസ്
ടെക്സ്റ്റ്-ടു-സ്പീച്ച് എഴുതിയ ഉള്ളടക്കത്തിന് ശബ്ദം നൽകുന്നു.
ഉല്പന്നങ്ങൾ
- തത്സമയ സംഭാഷണം-പ്രസംഗം മെഷീൻ തൽക്ഷണ വിവർത്തനങ്ങൾക്കായി.
- പോലുള്ള വിവർത്തന ഉപകരണങ്ങൾ സ്പീച്ച് ടു സ്പീച്ച് (S2S) സർക്കാർ അസിസ്റ്റന്റ്.
- ഇന്ത്യൻ ഭാഷാ വോയ്സ് ഇന്റർനെറ്റ് നേറ്റീവ് ബ്രൗസിംഗ് അനുഭവങ്ങൾക്കായി.
- ഉള്ളടക്ക പ്രാദേശികവൽക്കരണം പ്രാദേശിക പ്രേക്ഷകരുമായി പ്രതിധ്വനിക്കുന്ന ഉള്ളടക്കം സൃഷ്ടിക്കാൻ സഹായിക്കുന്നു.
- പ്രവേശനക്ഷമത ആരെയും ഒഴിവാക്കുന്നില്ലെന്ന് ഉറപ്പുവരുത്തുന്ന ടൂളുകൾ എല്ലാവരെയും ഉൾക്കൊള്ളുന്നു.
- വിവർത്തക ലെൻസ് ഒരു ദൃശ്യ വിവർത്തന സഹായം വാഗ്ദാനം ചെയ്യുന്നു.
അടിത്തറ
- ഡാറ്റ കോർപ്പസ്: ഭാഷാ വിവരങ്ങളുടെ സമ്പന്നമായ ശേഖരം ഭാഷിണിയെ ഇന്ധനമാക്കുന്നു.
- ഹൈ കമ്പ്യൂട്ട് ഇൻഫ്രാസ്ട്രക്ചർ (HCI): ഇത് സുഗമവും കാര്യക്ഷമവുമായ പ്രവർത്തനങ്ങൾ ഉറപ്പാക്കുന്നു.
ഭാഷിണി, സാരാംശത്തിൽ, ഇന്ത്യയുടെ വിശാലമായ ഭാഷാ ലോകത്തെ പ്രതിഫലിപ്പിക്കുന്നു. ഡിജിറ്റൽ യുഗത്തിൽ നാനാത്വത്തിൽ ഏകത്വം എന്നത് യഥാർത്ഥത്തിൽ എന്താണ് അർത്ഥമാക്കുന്നത് എന്നതിന്റെ തെളിവായി ഇത് നിലകൊള്ളുന്നു.
ഭാഷിണിയുടെ ഗുണങ്ങൾ
ഭാഷിണി ഒരു വിവർത്തന വേദി മാത്രമല്ല; അത് മാറ്റത്തിനുള്ള ഒരു ഉത്തേജകമാണ്. നമുക്ക് അതിന്റെ ഗുണങ്ങൾ പര്യവേക്ഷണം ചെയ്യാം:
പ്രാദേശിക ഭാഷാ ഉള്ളടക്കത്തിന്റെ പ്രമോഷൻ
ഇന്ത്യയാണ് സ്വദേശം 21 പ്രത്യേക ഔദ്യോഗിക ഭാഷകൾ, ആകെ 121 ഭാഷകളും 271 മാതൃഭാഷകളും. ഓരോ പ്രദേശത്തിനും അതിന്റേതായ ഭാഷാ ചാരുതയുണ്ട്, ഭാഷിണി ഇത് തിരിച്ചറിയുന്നു. പ്രാദേശിക ഭാഷകളിലെ ഉള്ളടക്കത്തിനായി ഇത് സജീവമായി പ്രേരിപ്പിക്കുന്നു. ഇത് വൈവിധ്യമാർന്ന സംസ്കാരങ്ങൾക്ക് ഓൺലൈനിൽ പ്രാതിനിധ്യം ഉറപ്പാക്കുന്നു.
എല്ലാ ഇന്ത്യക്കാർക്കും ഡിജിറ്റൽ ഇൻക്ലൂസിവിറ്റി
നിരവധി ഇന്ത്യക്കാർ അഭിമുഖീകരിക്കുന്ന ഡിജിറ്റൽ വിഭജനത്തെ ബന്ധിപ്പിക്കുന്ന പാലമാണ് ഭാഷിണി. ഭാഷിണി ഉപയോഗിച്ച്, ഒരാളുടെ മാതൃഭാഷയിൽ ഉള്ളടക്കം ആക്സസ് ചെയ്യാൻ കഴിയും. ഓരോ ഇന്ത്യക്കാരനും അവരുടെ ഭാഷ പരിഗണിക്കാതെ തന്നെ ഉൾപ്പെടുന്നുവെന്ന് ഇത് ഉറപ്പാക്കുന്നു.
പ്രാദേശിക ഉള്ളടക്ക സ്രഷ്ടാക്കൾക്കുള്ള സാമ്പത്തിക അവസരങ്ങൾ
പ്രാദേശിക സ്രഷ്ടാക്കൾക്ക് വഴിയൊരുക്കുന്നതിനാൽ ഭാഷിണി ഒരു സാമ്പത്തിക ഉത്തേജനം കൂടിയാണ്. അവർക്ക് ഇപ്പോൾ പ്രാദേശിക ഭാഷകളിൽ ഉള്ളടക്കം നിർമ്മിക്കാൻ കഴിയും. പ്രാദേശിക കലാകാരന്മാർക്കും എഴുത്തുകാർക്കും മുൻകാലങ്ങളിൽ ഭാഷാ തടസ്സങ്ങൾ പ്രശ്നകരമാണെന്ന് കണ്ടെത്തിയ സ്രഷ്ടാക്കൾക്കും ഓൺലൈനിൽ ഒരു പ്ലാറ്റ്ഫോം കണ്ടെത്തുന്നതിന് ഇത് പുതിയ വഴികൾ തുറക്കുന്നു. അവർക്ക് അവരുടെ കഴിവുകൾ പ്രകടിപ്പിക്കാനും അതിൽ നിന്ന് സമ്പാദിക്കാനും കഴിയും, കാരണം അവർക്ക് ഇപ്പോൾ പ്രേക്ഷകരുണ്ടാകും.
പ്രാദേശിക ഭാഷാ വെബ്സൈറ്റുകൾ
കേരളത്തിൽ നിന്നുള്ള ഒരു വിനോദസഞ്ചാരിയെ പരിഗണിക്കുക. അവർക്ക് രാജസ്ഥാന്റെ സംസ്കാരത്തെക്കുറിച്ച് അറിയണം. ഭാഷിണി ഉപയോഗിച്ച് വെബ്സൈറ്റുകൾക്ക് മലയാളത്തിൽ ഉള്ളടക്കം നൽകാൻ കഴിയും. ഇത് വിനോദസഞ്ചാരികൾക്ക് വിവരങ്ങൾ എളുപ്പത്തിൽ ദഹിക്കുന്നു.
ഇന്ത്യൻ ഭാഷകളിലെ ഡിജിറ്റൽ ടൂളുകളും പ്ലാറ്റ്ഫോമുകളും
പഞ്ചാബിലെ ഒരു കർഷകനെ സങ്കൽപ്പിക്കുക. അവർ ഒരു കാലാവസ്ഥാ പ്രവചന ആപ്പ് ഉപയോഗിക്കാൻ ആഗ്രഹിക്കുന്നു. ആപ്പ് പഞ്ചാബിയിൽ ലഭ്യമാണെന്ന് ഭാഷിനി ഉറപ്പാക്കുന്നു. നിർണായകമായ കാലാവസ്ഥാ അപ്ഡേറ്റുകൾ മനസ്സിലാക്കാൻ ഇത് കർഷകനെ സഹായിക്കുന്നു.
സർക്കാർ സേവനങ്ങൾ വിശാലമായ പ്രേക്ഷകരിലേക്ക് എത്തുന്നു
ഒഡീഷയിലെ ഒരു മുതിർന്ന പൗരനെക്കുറിച്ച് ചിന്തിക്കുക. അവർക്ക് സർക്കാർ പെൻഷൻ പോർട്ടൽ ആക്സസ് ചെയ്യണം. ഒഡിയയിൽ (ഒറിയ) പോർട്ടലിനെ ഭാഷിണി പ്രാപ്തമാക്കുന്നു. മുതിർന്ന പൗരന്മാർക്ക് ഇപ്പോൾ നാവിഗേറ്റ് ചെയ്യാനും സേവനങ്ങൾ അനായാസം ഉപയോഗിക്കാനും കഴിയും സംഭാഷണ AI പ്രാദേശിക ഭാഷകളിൽ.
ഭാഷിണിയിലേക്ക് ഷായ്പിന്റെ സംഭാവന: ബഹുഭാഷാ വിവര ശേഖരണത്തിലൂടെ ഡിജിറ്റൽ ഉൾപ്പെടുത്തൽ
മദ്രാസിലെ ഇന്ത്യൻ ഇൻസ്റ്റിറ്റ്യൂട്ട് ഓഫ് ടെക്നോളജിയുമായി സഹകരിച്ച്, വൈവിധ്യമാർന്ന ഇന്ത്യൻ ഭാഷാ ഡാറ്റാസെറ്റുകൾ ശേഖരിക്കുക, തരംതിരിക്കുക, ട്രാൻസ്ക്രൈബ് ചെയ്യുക എന്നീ ബൃഹത്തായ ദൗത്യം ഷായിപ് ഏറ്റെടുത്തു.
ശക്തമായ ബഹുഭാഷാ സംഭാഷണ മാതൃകകൾ നിർമ്മിക്കുക എന്നതായിരുന്നു ലക്ഷ്യം, മുന്നോട്ടുള്ള പാതയ്ക്ക് ഒരുപാട് വെല്ലുവിളികൾ ഉണ്ട്.
സങ്കീർണ്ണത പരിഗണിക്കുക: 3000 ഭാഷകളിലായി 8 മണിക്കൂർ വ്യത്യസ്ത ഓഡിയോ ഡാറ്റ നേടുന്നു, ഓരോന്നിനും 4 തനതായ ഭാഷാഭേദങ്ങൾ. ഈ ഡാറ്റയ്ക്ക് സൂക്ഷ്മമായ വിഭജനവും ട്രാൻസ്ക്രിപ്ഷനും ആവശ്യമാണ്.
എന്നിട്ടും ഷൈപ്പ് വിജയിച്ചു. അവരുടെ സമഗ്രമായ സമീപനം ഒന്നിലധികം വശങ്ങൾ ഉൾക്കൊള്ളുന്നു:
- ഡാറ്റ ശേഖരണം: പ്രായം, ലിംഗഭേദം, വിദ്യാഭ്യാസം, ഭാഷാഭേദം എന്നിവയിലുടനീളമുള്ള ശബ്ദങ്ങളെക്കുറിച്ചുള്ള വൈവിധ്യമാർന്ന ഡാറ്റ ശൈപ്പ് ശേഖരിച്ചു.
- ഡാറ്റ വിഭജനം: ഓഡിയോ ഡാറ്റ കർശനമായ വിഭജനത്തിന് വിധേയമായി. കൃത്യത ഉറപ്പാക്കാൻ ഞങ്ങൾ ഓരോ സെഗ്മെന്റും സൂക്ഷ്മമായി ടാഗ് ചെയ്തു.
- ഗുണമേന്മ: എല്ലാ റെക്കോർഡിംഗും കർശനമായ ഗുണനിലവാര പരിശോധനകളിലൂടെ കടന്നുപോയി. ഏറ്റവും മികച്ചത് മാത്രമാണ് കട്ട് ചെയ്തത്.
- ഡാറ്റ ട്രാൻസ്ക്രിപ്ഷൻ: കുറ്റമറ്റ കൃത്യതയോടെ ഞങ്ങൾക്ക് ഗുണനിലവാരമുള്ള ജോലി ആവശ്യമാണ്. അതിനാൽ, ഓരോ വാക്കും, മടിയും, സൂക്ഷ്മതയും ഞങ്ങൾ കൃത്യതയോടെ പിടിച്ചെടുത്തു.
അതിന്റെ ഫലമായി എട്ട് ഇന്ത്യൻ ഭാഷകളിലുടനീളം കുറ്റമറ്റ സ്പീച്ച് റെക്കഗ്നിഷൻ മോഡലുകൾ തയ്യാറാക്കാൻ ഐഐടി മദ്രാസിനെ പ്രാപ്തരാക്കുന്ന ഉയർന്ന നിലവാരമുള്ള ഓഡിയോ ഡാറ്റാസെറ്റ് ഞങ്ങൾ സൃഷ്ടിച്ചു. ഈ സഹകരണത്തിന്റെ അലയൊലികൾ ഡിജിറ്റൽ ലോകത്തുടനീളം പ്രതിധ്വനിക്കും. യഥാർത്ഥത്തിൽ ഉൾക്കൊള്ളുന്ന ഡിജിറ്റൽ ഇന്ത്യ സൃഷ്ടിക്കാൻ ഇത് ഭാഷാപരമായ തടസ്സങ്ങളെ മറികടക്കും.