നിര്വചനം
ആളുകൾ, സ്ഥാപനങ്ങൾ, സ്ഥലങ്ങൾ, തീയതികൾ അല്ലെങ്കിൽ ഉൽപ്പന്നങ്ങൾ പോലുള്ള വാചകത്തിലെ എന്റിറ്റികളെ തിരിച്ചറിയുകയും തരംതിരിക്കുകയും ചെയ്യുന്ന ഒരു NLP ടാസ്കാണ് നെയിംഡ് എന്റിറ്റി റെക്കഗ്നിഷൻ (NER).
ഉദ്ദേശ്യം
പ്രധാന എന്റിറ്റികളെ വേർതിരിച്ചെടുത്ത് ഘടനാരഹിതമായ വാചകം ഘടനാപരമാക്കുക എന്നതാണ് ഇതിന്റെ ഉദ്ദേശ്യം. ഇത് തിരയൽ, വിവരങ്ങൾ വേർതിരിച്ചെടുക്കൽ, വിജ്ഞാന ഗ്രാഫ് നിർമ്മാണം എന്നിവയെ പിന്തുണയ്ക്കുന്നു.
പ്രാധാന്യം
- വിവരങ്ങൾ വീണ്ടെടുക്കുന്നതിനും NLP പൈപ്പ്ലൈനുകൾക്കുമുള്ള അടിസ്ഥാനം.
- ഡൗൺസ്ട്രീം ആപ്ലിക്കേഷനുകളിലേക്ക് പിശകുകൾ വ്യാപിക്കുന്നു.
- ഡൊമെയ്ൻ-നിർദ്ദിഷ്ട NER (ഉദാ: മെഡിക്കൽ, നിയമപരമായ)-ന് ഇഷ്ടാനുസൃത ഡാറ്റാസെറ്റുകൾ ആവശ്യമാണ്.
- എന്റിറ്റി ലിങ്കിംഗ്, റിലേഷൻ എക്സ്ട്രാക്ഷൻ പോലുള്ള ജോലികളുമായി ബന്ധപ്പെട്ടത്.
ഇത് എങ്ങനെ പ്രവർത്തിക്കുന്നു
- വാചകം ശേഖരിച്ച് പ്രീപ്രോസസ്സ് ചെയ്യുക.
- എന്റിറ്റി വിഭാഗങ്ങൾ ഉപയോഗിച്ച് ഡാറ്റാസെറ്റുകൾ വ്യാഖ്യാനിക്കുക.
- ലേബൽ ചെയ്ത ഉദാഹരണങ്ങളിൽ (CRF-കൾ, ട്രാൻസ്ഫോർമറുകൾ) മോഡലുകൾ പരിശീലിപ്പിക്കുക.
- കാണാത്ത വാചകത്തിലെ എന്റിറ്റികൾ പ്രവചിക്കുക.
- ടെസ്റ്റ് ഡാറ്റ ഉപയോഗിച്ച് കൃത്യത സ്ഥിരീകരിക്കുക.
ഉദാഹരണങ്ങൾ (യഥാർത്ഥ ലോകം)
- spaCy: ബിൽറ്റ്-ഇൻ NER ഉള്ള ഓപ്പൺ സോഴ്സ് NLP ലൈബ്രറി.
- സ്റ്റാൻഫോർഡ് കോർഎൻഎൽപി: നാമകരണം ചെയ്ത എന്റിറ്റി തിരിച്ചറിയൽ ഉപകരണങ്ങൾ നൽകുന്നു.
- ഫിനാൻഷ്യൽ എൻഎൽപി: റിപ്പോർട്ടുകളിൽ നിന്ന് കമ്പനി പേരുകൾ വേർതിരിച്ചെടുക്കുന്നു.
റഫറൻസുകൾ / കൂടുതൽ വായന
- ജുറാഫ്സ്കിയും മാർട്ടിനും. സ്പീച്ച് ആൻഡ് ലാംഗ്വേജ് പ്രോസസ്സിംഗ്. സ്റ്റാൻഫോർഡ്.
- ലാംപിൾ തുടങ്ങിയവർ. “നെയിംഡ് എന്റിറ്റി റെക്കഗ്നിഷനുള്ള ന്യൂറൽ ആർക്കിടെക്ചറുകൾ.” ACL.
- ഹഗ്ഗിംഗ് ഫെയ്സ് ട്രാൻസ്ഫോർമറുകൾ NER മോഡലുകൾ.
- എന്റിറ്റി റെക്കഗ്നിഷൻ (NER) എന്ന് വിളിക്കുന്നത് എന്താണ്?