നിര്വചനം
ചിത്രങ്ങളിലെയോ സ്കാൻ ചെയ്ത പ്രമാണങ്ങളിലെയോ വാചക പ്രതീകങ്ങളെ തിരിച്ചറിയുന്നതിനെയാണ് വാചക തിരിച്ചറിയൽ എന്ന് പറയുന്നത്. ഇതിൽ അച്ചടിച്ചതും കൈയെഴുത്തുപ്രതിയുള്ളതുമായ തിരിച്ചറിയൽ ഉൾപ്പെടുന്നു.
ഉദ്ദേശ്യം
വിഷ്വൽ ഫോർമാറ്റുകളിലെ വാചകം ആക്സസ് ചെയ്യാവുന്നതും തിരയാൻ കഴിയുന്നതുമാക്കുക എന്നതാണ് ഇതിന്റെ ഉദ്ദേശ്യം.
പ്രാധാന്യം
- ആർക്കൈവുകളുടെ ഡിജിറ്റൈസേഷൻ പ്രാപ്തമാക്കുന്നു.
- പ്രവേശനക്ഷമതയ്ക്കും ഓട്ടോമേഷനും നിർണായകമാണ്.
- ചിത്രത്തിന്റെ ഗുണനിലവാരത്തെ ആശ്രയിച്ചിരിക്കും കൃത്യത.
- OCR സാങ്കേതികവിദ്യകളുമായി ബന്ധപ്പെട്ടത്.
ഇത് എങ്ങനെ പ്രവർത്തിക്കുന്നു
- സ്കാൻ ചെയ്തതോ ഫോട്ടോ എടുത്തതോ ആയ രേഖകൾ എടുക്കുക.
- വ്യക്തത മെച്ചപ്പെടുത്തുന്നതിന് ചിത്രങ്ങൾ മുൻകൂട്ടി പ്രോസസ്സ് ചെയ്യുക.
- ടെക്സ്റ്റ് മേഖലകൾ കണ്ടെത്തുക.
- തിരിച്ചറിയൽ മോഡലുകൾ പ്രയോഗിക്കുക.
- മെഷീൻ വായിക്കാവുന്ന വാചകം ഔട്ട്പുട്ട് ചെയ്യുക.
ഉദാഹരണങ്ങൾ (യഥാർത്ഥ ലോകം)
- ഗൂഗിൾ ലെൻസ്: ഫോട്ടോകളിലെ വാചകം തിരിച്ചറിയുന്നു.
- ABBYY FineReader: സ്കാൻ ചെയ്ത പ്രമാണങ്ങൾ ഡിജിറ്റൈസ് ചെയ്യുന്നു.
- ടെസ്സറാക്റ്റ് OCR: ഓപ്പൺ സോഴ്സ് ടെക്സ്റ്റ് റെക്കഗ്നിഷൻ എഞ്ചിൻ.
റഫറൻസുകൾ / കൂടുതൽ വായന
- സ്മിത്ത്, ആർ. “ടെസ്സറാക്റ്റ് OCR എഞ്ചിന്റെ ഒരു അവലോകനം.” ICDAR.
- ISO/IEC 15938-4 സ്റ്റാൻഡേർഡ്.
- പാറ്റേൺ അനാലിസിസിലും മെഷീൻ ഇന്റലിജൻസിലും IEEE ഇടപാടുകൾ.