അറബിക് & തായ് & വിയറ്റ്നാമീസ് & ഹിന്ദി & ഇംഗ്ലീഷ് & ചൈനീസ് ഭാഷാ ഡാറ്റാസെറ്റ്

കേസ് ഉപയോഗിക്കുക: ഓസിആര്ചിത്രം
ഫോർമാറ്റ്: ചിത്രം
എണ്ണം: 150k
വ്യാഖ്യാനം: അതെ
വിവരണം: അറബിക് & തായ് & വിയറ്റ്നാമീസ് & ഹിന്ദി & ഇംഗ്ലീഷ് & ചൈനീസ് ഭാഷാ ഡാറ്റാസെറ്റ്
അറബിക് ടെക്സ്റ്റ് ഡാറ്റാസെറ്റ്

കേസ് ഉപയോഗിക്കുക: ഓസിആര്ചിത്രം
ഫോർമാറ്റ്: ചിത്രം
എണ്ണം: 1k
വ്യാഖ്യാനം: അതെ
വിവരണം: അറബിക് ടെക്സ്റ്റ് ഡാറ്റാസെറ്റിൽ അറബിയിൽ എഴുതിയ ടെക്സ്റ്റ് സാമ്പിളുകളുടെ ഒരു ശേഖരം അടങ്ങിയിരിക്കുന്നു. വാർത്താ ലേഖനങ്ങൾ, സോഷ്യൽ മീഡിയ പോസ്റ്റുകൾ, സാഹിത്യം, സംഭാഷണം എന്നിങ്ങനെ വിവിധ വിഷയങ്ങളിലും എഴുത്ത് ശൈലികളിലും വ്യാപിച്ചുകിടക്കുന്ന ഉള്ളടക്കത്തിൻ്റെ വിവിധ രൂപങ്ങൾ ഇതിൽ ഉൾപ്പെടുന്നു. ഈ ഡാറ്റാസെറ്റ് നാച്ചുറൽ ലാംഗ്വേജ് പ്രോസസ്സിംഗ് (NLP), ടെക്സ്റ്റ് ക്ലാസിഫിക്കേഷൻ, സെൻ്റിമെൻ്റ് അനാലിസിസ്, അറബിക് ഭാഷാ ആപ്ലിക്കേഷനുകളിലെ മെഷീൻ ട്രാൻസ്ലേഷൻ തുടങ്ങിയ ജോലികൾക്കായി ഉപയോഗിക്കുന്നു.
ചൈനീസ് & ഇംഗ്ലീഷ് & ടിബറ്റൻ & ഉയ്ഗൂർ ഭാഷാ ഡാറ്റാസെറ്റ്

കേസ് ഉപയോഗിക്കുക: ഓസിആര്ചിത്രം
ഫോർമാറ്റ്: ചിത്രം
എണ്ണം: 38k
വ്യാഖ്യാനം: അതെ
വിവരണം: ചൈനീസ് & ഇംഗ്ലീഷ് & ടിബറ്റൻ & ഉയ്ഗൂർ ഭാഷാ ഡാറ്റാസെറ്റ്
ചൈനീസ്, ഇംഗ്ലീഷ് മെനു ഡാറ്റാസെറ്റ്
കേസ് ഉപയോഗിക്കുക: ഓസിആര്ചിത്രം
ഫോർമാറ്റ്: ചിത്രം
എണ്ണം: 60k
വ്യാഖ്യാനം: അതെ
വിവരണം: ചൈനീസ്, ഇംഗ്ലീഷ് മെനു ഡാറ്റാസെറ്റിൽ ചൈനീസ്, ഇംഗ്ലീഷ് ഭാഷകൾ ഫീച്ചർ ചെയ്യുന്ന റെസ്റ്റോറൻ്റ് മെനുകളുടെ ചിത്രങ്ങളോ ടെക്സ്റ്റ് സാമ്പിളുകളോ അടങ്ങിയിരിക്കുന്നു. ദ്വിഭാഷാ വിഭവങ്ങളുടെ പേരുകൾ, വിവരണങ്ങൾ, വിലകൾ എന്നിവ അവതരിപ്പിക്കുന്ന വിവിധ ഫോണ്ടുകൾ, ലേഔട്ടുകൾ, മെനു ഘടനകൾ എന്നിവ ഇതിൽ ഉൾപ്പെടുന്നു. ഒപ്റ്റിക്കൽ ക്യാരക്ടർ റെക്കഗ്നിഷൻ (OCR), മെഷീൻ വിവർത്തനം, ബഹുഭാഷാ ക്രമീകരണങ്ങളിലെ മെനു ഡിജിറ്റൈസേഷൻ തുടങ്ങിയ ജോലികൾക്ക് ഈ ഡാറ്റാസെറ്റ് ഉപയോഗപ്രദമാണ്.
ചൈനീസ് കൈയെഴുത്ത് രചന ഡാറ്റാസെറ്റ്

കേസ് ഉപയോഗിക്കുക: ഓസിആര്ചിത്രം
ഫോർമാറ്റ്: ചിത്രം
എണ്ണം: 3k
വ്യാഖ്യാനം: അതെ
വിവരണം: ചൈനീസ് ഹാൻഡ്റൈറ്റൻ കോമ്പോസിഷൻ ഡാറ്റാസെറ്റിൽ കോമ്പോസിഷനുകൾ, ഉപന്യാസങ്ങൾ, മറ്റ് ദൈർഘ്യമേറിയ വാചകങ്ങൾ എന്നിവയുൾപ്പെടെ കൈയ്യക്ഷര ചൈനീസ് പാഠത്തിൻ്റെ സാമ്പിളുകൾ അടങ്ങിയിരിക്കുന്നു. ഇത് വിവിധ കൈയക്ഷര ശൈലികളും സങ്കീർണ്ണതയുടെ തലങ്ങളും അവതരിപ്പിക്കുന്നു, കൂടാതെ കൈയക്ഷരം തിരിച്ചറിയൽ, ടെക്സ്റ്റ് വിശകലനം, മെഷീൻ ലേണിംഗ് മോഡൽ പരിശീലനം തുടങ്ങിയ ജോലികൾക്കായി ഇത് ഉപയോഗിക്കുന്നു.
ചൈനീസ് വൈഫൈ പ്രോംപ്റ്റ് ഡാറ്റാസെറ്റ്

കേസ് ഉപയോഗിക്കുക: ഓസിആര്ചിത്രം
ഫോർമാറ്റ്: ചിത്രം
എണ്ണം: 1k
വ്യാഖ്യാനം: അതെ
വിവരണം: ചൈനീസ് വൈഫൈ പ്രോംപ്റ്റ് ഡാറ്റാസെറ്റിൽ വൈഫൈ പ്രോംപ്റ്റുകളിലും ചൈനീസ് ഭാഷയിൽ എഴുതിയ ലോഗിൻ സ്ക്രീനുകളിലും കാണപ്പെടുന്ന ടെക്സ്റ്റ് സാമ്പിളുകൾ അടങ്ങിയിരിക്കുന്നു. WIFI നെറ്റ്വർക്കുകളിലേക്ക് കണക്റ്റുചെയ്യുന്നതിനോ നിയന്ത്രിക്കുന്നതിനോ ബന്ധപ്പെട്ട വിവിധ നിർദ്ദേശങ്ങൾ, പിശക് സന്ദേശങ്ങൾ എന്നിവ ഇതിൽ സാധാരണയായി ഉൾപ്പെടുന്നു. ടെക്സ്റ്റ് തിരിച്ചറിയൽ, സ്വാഭാവിക ഭാഷാ പ്രോസസ്സിംഗ്, നെറ്റ്വർക്ക് കണക്റ്റിവിറ്റിക്കായി ഉപയോക്തൃ ഇൻ്റർഫേസുകൾ മെച്ചപ്പെടുത്തൽ തുടങ്ങിയ ജോലികൾക്കായി ഈ ഡാറ്റാസെറ്റ് ഉപയോഗിക്കുന്നു.
ഇംഗ്ലീഷ്, ചൈനീസ് കൈയക്ഷര ഡാറ്റാസെറ്റ്

കേസ് ഉപയോഗിക്കുക: ഓസിആര്ചിത്രം
ഫോർമാറ്റ്: ചിത്രം
എണ്ണം: 12k
വ്യാഖ്യാനം: അതെ
വിവരണം: ഇംഗ്ലീഷ്, ചൈനീസ് കൈയക്ഷര ഡാറ്റാസെറ്റിൽ ഇംഗ്ലീഷിലും ചൈനീസ് ഭാഷയിലും കൈയെഴുത്ത് സാമ്പിളുകൾ അടങ്ങിയിരിക്കുന്നു, വിവിധ എഴുത്ത് ശൈലികളും സ്വഭാവ സങ്കീർണ്ണതകളും പ്രദർശിപ്പിക്കുന്നു. കൈയക്ഷര തിരിച്ചറിയൽ മോഡലുകൾ പരിശീലിപ്പിക്കുന്നതിനും വിലയിരുത്തുന്നതിനും, ബഹുഭാഷാ വാചക വിശകലനത്തെ പിന്തുണയ്ക്കുന്നതിനും മറ്റ് അനുബന്ധ ഗവേഷണങ്ങൾക്കും ഇത് സാധാരണയായി ഉപയോഗിക്കുന്നു. ഡാറ്റാസെറ്റിൽ രണ്ട് ഭാഷകളിലെയും പ്രതീകങ്ങൾ, അക്കങ്ങൾ, വാക്കുകൾ, വാക്യങ്ങൾ എന്നിവയുടെ വൈവിധ്യമാർന്ന ശ്രേണി ഉൾപ്പെടുന്നു.
ഇംഗ്ലീഷ് & ചൈനീസ് ഷോപ്പ് സൈൻ ഡാറ്റാസെറ്റ്

കേസ് ഉപയോഗിക്കുക: ഓസിആര്ചിത്രം
ഫോർമാറ്റ്: ചിത്രം
എണ്ണം: 30k
വ്യാഖ്യാനം: അതെ
വിവരണം: ഇംഗ്ലീഷ് & ചൈനീസ് ഷോപ്പ് സൈൻ ഡാറ്റാസെറ്റിൽ ഇംഗ്ലീഷും ചൈനീസ് വാചകവും ഫീച്ചർ ചെയ്യുന്ന ഷോപ്പ് ചിഹ്നങ്ങളുടെ ചിത്രങ്ങൾ ഉൾപ്പെടുന്നു. സ്റ്റോർ പേരുകൾ, പരസ്യങ്ങൾ, പ്രമോഷനുകൾ, ദിശകൾ എന്നിവ പോലുള്ള വിവിധ സൂചനാ ഘടകങ്ങൾ ഇത് ക്യാപ്ചർ ചെയ്യുന്നു, വൈവിധ്യമാർന്ന ഫോണ്ടുകളിലും ശൈലികളിലും ഫോർമാറ്റുകളിലും പ്രദർശിപ്പിച്ചിരിക്കുന്നു. ടെക്സ്റ്റ് കണ്ടെത്തലും തിരിച്ചറിയലും, ബഹുഭാഷാ രംഗം മനസ്സിലാക്കൽ, ദ്വിഭാഷാ അടയാളങ്ങൾ വ്യാഖ്യാനിക്കുന്നതിനുള്ള കമ്പ്യൂട്ടർ വിഷൻ മോഡലുകൾ മെച്ചപ്പെടുത്തൽ തുടങ്ങിയ ജോലികൾക്കായി ഈ ഡാറ്റാസെറ്റ് ഉപയോഗിക്കുന്നു.
ഇംഗ്ലീഷ് & ചൈനീസ് പ്രത്യേക ആംഗിൾ ടെക്സ്റ്റ് ഡാറ്റാസെറ്റ്

കേസ് ഉപയോഗിക്കുക: ഓസിആര്ചിത്രം
ഫോർമാറ്റ്: ചിത്രം
എണ്ണം: 50k
വ്യാഖ്യാനം: അതെ
വിവരണം: ഇംഗ്ലീഷ്, ചൈനീസ് സ്പെഷ്യൽ ആംഗിൾ ടെക്സ്റ്റ് ഡാറ്റാസെറ്റിൽ ഇംഗ്ലീഷിലും ചൈനീസിലും വിവിധ കോണുകളിലും ഓറിയൻ്റേഷനുകളിലും പ്രദർശിപ്പിക്കുന്ന വാചകത്തിൻ്റെ ചിത്രങ്ങൾ അടങ്ങിയിരിക്കുന്നു. സ്റ്റാൻഡേർഡ് ഹോറിസോണ്ടൽ ഫോർമാറ്റുകളിൽ അവതരിപ്പിക്കാത്ത അടയാളങ്ങൾ, പരസ്യങ്ങൾ, പ്രമാണങ്ങൾ എന്നിവ പോലുള്ള ഉറവിടങ്ങളിൽ നിന്നുള്ള വാചകം ഇതിൽ ഉൾപ്പെടുന്നു. ടെക്സ്റ്റ് ഡിറ്റക്ഷൻ, റെക്കഗ്നിഷൻ മോഡലുകൾ, പ്രത്യേകിച്ച് പാരമ്പര്യേതര ഓറിയൻ്റേഷനുകളിലും കാഴ്ചപ്പാടുകളിലും ടെക്സ്റ്റ് കൈകാര്യം ചെയ്യാൻ കഴിവുള്ളവയെ പരിശീലിപ്പിക്കുന്നതിനും വിലയിരുത്തുന്നതിനും ഈ ഡാറ്റാസെറ്റ് ഉപയോഗിക്കുന്നു.
ഇംഗ്ലീഷ് മെനു ഡാറ്റാസെറ്റ്

കേസ് ഉപയോഗിക്കുക: ഓസിആര്ചിത്രം
ഫോർമാറ്റ്: ചിത്രം
എണ്ണം: 20k
വ്യാഖ്യാനം: അതെ
വിവരണം: ഇംഗ്ലീഷ് മെനു ഡാറ്റാസെറ്റിൽ ഇംഗ്ലീഷിൽ എഴുതിയ റെസ്റ്റോറൻ്റ് മെനുകളുടെ ചിത്രങ്ങളോ ടെക്സ്റ്റ് സാമ്പിളുകളോ ഉൾപ്പെടുന്നു. വിഭവത്തിൻ്റെ പേരുകൾ മുതൽ വിവരണങ്ങളും വിലകളും വരെയുള്ള ഉള്ളടക്കങ്ങളുള്ള വിവിധ ഫോണ്ടുകൾ, ലേഔട്ടുകൾ, ഫോർമാറ്റിംഗ് ശൈലികൾ എന്നിവ ഇതിൽ ഫീച്ചർ ചെയ്യുന്നു. ഒപ്റ്റിക്കൽ ക്യാരക്ടർ റെക്കഗ്നിഷൻ (OCR), ടെക്സ്റ്റ് എക്സ്ട്രാക്ഷൻ, ഭക്ഷണവുമായി ബന്ധപ്പെട്ട ആപ്ലിക്കേഷനുകളിൽ മെനു ഡിജിറ്റൈസേഷൻ തുടങ്ങിയ ജോലികൾക്കായി ഈ ഡാറ്റാസെറ്റ് ഉപയോഗിക്കാറുണ്ട്.
ഇംഗ്ലീഷ് സീൻസ് ടെക്സ്റ്റ് ഡാറ്റാസെറ്റ്

കേസ് ഉപയോഗിക്കുക: ഓസിആര്ചിത്രം
ഫോർമാറ്റ്: ചിത്രം
എണ്ണം: 33k
വ്യാഖ്യാനം: അതെ
വിവരണം: ഇംഗ്ലീഷ് സീൻസ് ടെക്സ്റ്റ് ഡാറ്റാസെറ്റിൽ ഉൾച്ചേർത്ത ഇംഗ്ലീഷ് ടെക്സ്റ്റുള്ള സ്വാഭാവിക ദൃശ്യങ്ങൾ അടങ്ങിയ ചിത്രങ്ങൾ അടങ്ങിയിരിക്കുന്നു. അടയാളങ്ങൾ, ബിൽബോർഡുകൾ, പോസ്റ്ററുകൾ എന്നിങ്ങനെ വിവിധ രൂപങ്ങളിൽ, പലപ്പോഴും വൈവിധ്യമാർന്ന ഫോണ്ടുകളിലും വലുപ്പങ്ങളിലും ഓറിയൻ്റേഷനുകളിലും ഈ വാചകം ദൃശ്യമാകുന്നു. ഈ ഡാറ്റാസെറ്റ് സാധാരണയായി ടെക്സ്റ്റ് ഡിറ്റക്ഷൻ, റെക്കഗ്നിഷൻ, സീൻ അണ്ടർസ്റ്റിംഗ് ടാസ്ക്കുകൾ എന്നിവയിൽ മോഡലുകളെ പരിശീലിപ്പിക്കുന്നതിനും പരിശോധിക്കുന്നതിനും ഉപയോഗിക്കുന്നു.
കൈയെഴുത്ത് ടെക്സ്റ്റ് ഡാറ്റാസെറ്റ്

കേസ് ഉപയോഗിക്കുക: ഡോക്യുമെന്റ് AI
ഫോർമാറ്റ്: HEIC (ചിത്രങ്ങൾ) & .mov (വീഡിയോകൾ)
എണ്ണം: 94053
വ്യാഖ്യാനം: ഇല്ല
വിവരണം: ജാപ്പനീസ്, കൊറിയൻ, റഷ്യൻ ഭാഷകൾക്കായി കൈയെഴുത്ത് വാചകത്തോടുകൂടിയ തത്സമയ ഫോട്ടോകൾ
റെക്കോർഡിംഗ് ഉപകരണം: iPhone & iPad ക്യാമറ
റെക്കോർഡിംഗ് അവസ്ഥ: - അഗ്രസീവ് ലൈറ്റിംഗ്/ഗ്ലെയർ - ക്യാമറ ഫ്ലാഷ് ഓൺ - കളർ ലൈറ്റ് - ലോ ലൈറ്റ്, ക്യാമറ ഫ്ലാഷ് ഇല്ല - സാധാരണ
ജാപ്പനീസ്, കൊറിയൻ ഭാഷാ ഡാറ്റാസെറ്റ്

കേസ് ഉപയോഗിക്കുക: ഓസിആര്ചിത്രം
ഫോർമാറ്റ്: ചിത്രം
എണ്ണം: 40k
വ്യാഖ്യാനം: അതെ
വിവരണം: ജാപ്പനീസ്, കൊറിയൻ ഭാഷാ ഡാറ്റാസെറ്റിൽ ജാപ്പനീസ്, കൊറിയൻ ഭാഷകളിലെ ടെക്സ്റ്റ് സാമ്പിളുകൾ ഉൾപ്പെടുന്നു. വിവിധ സന്ദർഭങ്ങളും ശൈലികളും ഉൾക്കൊള്ളുന്ന, വാക്യങ്ങൾ, ശൈലികൾ, വാക്കുകൾ എന്നിങ്ങനെയുള്ള ഉള്ളടക്കത്തിൻ്റെ ഒരു ശ്രേണി ഇത് അവതരിപ്പിക്കുന്നു. നാച്ചുറൽ ലാംഗ്വേജ് പ്രോസസ്സിംഗ് (NLP), മെഷീൻ വിവർത്തനം, ബഹുഭാഷാ ആപ്ലിക്കേഷനുകളിലെ ടെക്സ്റ്റ് വിശകലനം തുടങ്ങിയ ജോലികൾക്കായി ഈ ഡാറ്റാസെറ്റ് ഉപയോഗിക്കുന്നു.
അച്ചടിച്ച റെഗുലർ/കഴ്സീവ് ടെക്സ്റ്റ് ഡാറ്റാസെറ്റ് (പ്രമാണം AI)

കേസ് ഉപയോഗിക്കുക: ഡോക്യുമെന്റ് AI
ഫോർമാറ്റ്: HEIC (ചിത്രങ്ങൾ) & .mov (വീഡിയോകൾ)
എണ്ണം: 23930
വ്യാഖ്യാനം: ഇല്ല
വിവരണം: ജാപ്പനീസ്, കൊറിയൻ, റഷ്യൻ ഭാഷകൾക്കായി കൈയെഴുത്ത് വാചകത്തോടുകൂടിയ തത്സമയ ഫോട്ടോകൾ
റെക്കോർഡിംഗ് ഉപകരണം: iPhone & iPad ക്യാമറ
റെക്കോർഡിംഗ് അവസ്ഥ: - അഗ്രസീവ് ലൈറ്റിംഗ്/ഗ്ലെയർ - ക്യാമറ ഫ്ലാഷ് ഓൺ - കളർ ലൈറ്റ് - ലോ ലൈറ്റ്, ക്യാമറ ഫ്ലാഷ് ഇല്ല - സാധാരണ
ടെക്സ്റ്റ് + ഓഡിയോ-വിഷ്വൽ (ബഹുഭാഷാ/OCR/NLP) – പുസ്തകങ്ങൾ, ജേണലുകൾ, ഓഡിയോ+ടെക്സ്റ്റ്
കേസ് ഉപയോഗിക്കുക: ടെക്സ്റ്റ് + ഓഡിയോ-വിഷ്വൽ (ബഹുഭാഷാ / OCR / NLP)
ഫോർമാറ്റ്: വീഡിയോകൾ
എണ്ണം: 100K+ പ്രഭാഷണ വീഡിയോകൾ + PPT ദൈർഘ്യമേറിയ ഫോർമാറ്റ് വീഡിയോകൾ
വ്യാഖ്യാനം: ഇല്ല
വിവരണം: ചൈനീസ് പുസ്തകങ്ങൾ, ഇംഗ്ലീഷ് പുസ്തകങ്ങൾ, ജേണലുകൾ, പൊതുനയം, നോവലുകൾ, കുട്ടികൾ, കന്റോണീസ് ഓഡിയോ+ടെക്സ്റ്റ്, പ്രഭാഷണ വീഡിയോ+പിപിടി, ദൈർഘ്യമേറിയ വീഡിയോ അര ബില്യൺ പുസ്തകങ്ങൾ, ചോദ്യോത്തര ജോഡികൾ, ലേഖനങ്ങൾ

