ബാങ്ക് ചെക്ക് ഡാറ്റാസെറ്റ് (ഡോക്യുമെന്റ് AI)
കേസ് ഉപയോഗിക്കുക: ഓസിആര്ചിത്രം
ഫോർമാറ്റ്: .jpg
എണ്ണം: 2023
വ്യാഖ്യാനം: ഇല്ല
വിവരണം: ബാങ്ക് ചെക്ക് ഡാറ്റാസെറ്റ് (ഡോക്യുമെൻ്റ് AI): സിന്തറ്റിക് ബാങ്ക് ചെക്കുകളിൽ യഥാർത്ഥ ചെക്കുകളുടെ രൂപവും ഉള്ളടക്കവും പകർത്താൻ രൂപകൽപ്പന ചെയ്ത കൃത്രിമമായി നിർമ്മിച്ച ചെക്ക് ഇമേജുകൾ അടങ്ങിയിരിക്കുന്നു. പണം സ്വീകരിക്കുന്നയാളുടെ പേരുകൾ, തുകകൾ, തീയതികൾ, ഒപ്പുകൾ, ചെക്ക് നമ്പറുകൾ തുടങ്ങിയ വിവിധ ഘടകങ്ങൾ ഇതിൽ ഉൾപ്പെടുന്നു. ഒപ്റ്റിക്കൽ ക്യാരക്ടർ റെക്കഗ്നിഷൻ (OCR), ചെക്ക് പ്രോസസ്സിംഗ്, ഓട്ടോമേറ്റഡ് ഡാറ്റ എക്സ്ട്രാക്ഷൻ തുടങ്ങിയ ടാസ്ക്കുകളിൽ ഡോക്യുമെൻ്റ് AI സിസ്റ്റങ്ങളെ പരിശീലിപ്പിക്കുന്നതിനും വിലയിരുത്തുന്നതിനും ഈ ഡാറ്റാസെറ്റ് ഉപയോഗിക്കുന്നു, ഇത് യഥാർത്ഥ ചെക്കുകളുടെ സ്വകാര്യത ആശങ്കകളില്ലാതെ മോഡൽ വികസനത്തിന് നിയന്ത്രിത അന്തരീക്ഷം നൽകുന്നു.
റെക്കോർഡിംഗ് അവസ്ഥ: - ക്ലിക്ക് ചെയ്ത ചിത്രങ്ങൾ - സ്കാൻ ചെയ്തു - വെബ് സ്ക്രാപ്പർ
ബാങ്ക് സ്റ്റേറ്റ്മെന്റ് ഡാറ്റാസെറ്റ് (ഡോക്യുമെന്റ് AI)
കേസ് ഉപയോഗിക്കുക: ഓസിആര്ചിത്രം
ഫോർമാറ്റ്: .jpg, png
എണ്ണം: 5366
വ്യാഖ്യാനം: ഇല്ല
വിവരണം: ബാങ്ക് സ്റ്റേറ്റ്മെൻ്റ് ഡാറ്റാസെറ്റ് (ഡോക്യുമെൻ്റ് എഐ): സിന്തറ്റിക് ബാങ്ക് സ്റ്റേറ്റ്മെൻ്റുകളിൽ യഥാർത്ഥ സാമ്പത്തിക രേഖകൾ അനുകരിക്കാൻ രൂപകൽപ്പന ചെയ്ത കൃത്രിമമായി സൃഷ്ടിച്ച ബാങ്ക് സ്റ്റേറ്റ്മെൻ്റുകൾ ഉൾപ്പെടുന്നു. യഥാർത്ഥ ലോക ഫോർമാറ്റുകളും ഉള്ളടക്കവും പ്രതിഫലിപ്പിക്കുന്ന തരത്തിൽ ഘടനാപരമായ വിവിധ ഇടപാട് റെക്കോർഡുകൾ, തീയതികൾ, തുകകൾ, അക്കൗണ്ട് വിശദാംശങ്ങൾ എന്നിവ ഇതിൽ ഫീച്ചർ ചെയ്യുന്നു. ഒപ്റ്റിക്കൽ ക്യാരക്ടർ റെക്കഗ്നിഷൻ (OCR), ഡാറ്റ എക്സ്ട്രാക്ഷൻ, ഡോക്യുമെൻ്റ് അനാലിസിസ് തുടങ്ങിയ ടാസ്ക്കുകളിൽ ഡോക്യുമെൻ്റ് AI സിസ്റ്റങ്ങളെ പരിശീലിപ്പിക്കുന്നതിനും വിലയിരുത്തുന്നതിനും ഈ ഡാറ്റാസെറ്റ് ഉപയോഗിക്കുന്നു, യഥാർത്ഥ സാമ്പത്തിക ഡാറ്റയുടെ സ്വകാര്യത പ്രശ്നങ്ങളില്ലാതെ നിയന്ത്രിത അന്തരീക്ഷം വാഗ്ദാനം ചെയ്യുന്നു.
റെക്കോർഡിംഗ് അവസ്ഥ: - സ്കാൻ ചെയ്തു - ബാങ്ക്_സ്റ്റേറ്റ്മെന്റ് - വെബ് സ്ക്രാപ്പർ
ചൈനീസ് ബില്ലുകളുടെ ഡാറ്റാസെറ്റ്
കേസ് ഉപയോഗിക്കുക: ഓസിആര്ചിത്രം
ഫോർമാറ്റ്: ചിത്രം
എണ്ണം: 6k
വ്യാഖ്യാനം: അതെ
വിവരണം: ചൈനീസ് ബില്ലുകളുടെ ഡാറ്റാസെറ്റിൽ ചൈനീസ് ഭാഷയിൽ എഴുതിയിരിക്കുന്ന ഇൻവോയ്സുകൾ, രസീതുകൾ, പ്രസ്താവനകൾ എന്നിങ്ങനെ വിവിധ തരത്തിലുള്ള ബില്ലുകളുടെ ചിത്രങ്ങളോ ടെക്സ്റ്റ് സാമ്പിളുകളോ ഉൾപ്പെടുന്നു. ഇനത്തിൻ്റെ വിവരണങ്ങൾ, തുകകൾ, തീയതികൾ എന്നിവയുൾപ്പെടെ വൈവിധ്യമാർന്ന ഫോർമാറ്റുകളും ഉള്ളടക്കവും ഇത് അവതരിപ്പിക്കുന്നു. ഒപ്റ്റിക്കൽ ക്യാരക്ടർ റെക്കഗ്നിഷൻ (OCR), ഫിനാൻഷ്യൽ ഡോക്യുമെൻ്റ് പ്രോസസ്സിംഗ്, ഓട്ടോമേറ്റഡ് ഡാറ്റ എക്സ്ട്രാക്ഷൻ തുടങ്ങിയ ജോലികൾക്കായി ഈ ഡാറ്റാസെറ്റ് ഉപയോഗിക്കുന്നു.
ഡോക്യുമെന്റുകൾ / OCR – അറബിക് & ഇംഗ്ലീഷ് OCR ഉള്ളടക്ക ഡാറ്റാസെറ്റ്
കേസ് ഉപയോഗിക്കുക: പ്രമാണങ്ങൾ / OCR
ഫോർമാറ്റ്: ചിത്രങ്ങൾ
എണ്ണം: 1,321
വ്യാഖ്യാനം: ഇല്ല
വിവരണം: അറബിക്, ഇംഗ്ലീഷ് ഉള്ളടക്ക ചിത്ര ശേഖരം: OCR-നുള്ള ചിത്രം + വ്യാഖ്യാനം
പ്രമാണങ്ങൾ / OCR – ബാർകോഡ് വീഡിയോ ഡാറ്റാസെറ്റ്

കേസ് ഉപയോഗിക്കുക: പ്രമാണങ്ങൾ / OCR
ഫോർമാറ്റ്: വീഡിയോകൾ
എണ്ണം: 2,767
വ്യാഖ്യാനം: ഇല്ല
വിവരണം: ബാർകോഡ് വീഡിയോകൾ (കോഡ്128, UPC/EAN, PDF417, ആസ്ടെക്, മൾട്ടി-കോഡ്)
ഡോക്യുമെന്റുകൾ / OCR – വളഞ്ഞ പ്രിന്റഡ് ടെക്സ്റ്റ് ഡാറ്റാസെറ്റ്

കേസ് ഉപയോഗിക്കുക: പ്രമാണങ്ങൾ / OCR
ഫോർമാറ്റ്: ചിത്രങ്ങൾ
എണ്ണം: 18,986
വ്യാഖ്യാനം: ഇല്ല
വിവരണം: വളഞ്ഞ പ്രിന്റ് ചെയ്ത ടെക്സ്റ്റ്: വളഞ്ഞ ടെക്സ്റ്റ് അല്ലെങ്കിൽ രേഖീയമല്ലാത്ത ബേസ്ലൈൻ ഉള്ള ടെക്സ്റ്റ് ഉപയോഗിച്ച് ചിത്രങ്ങൾ ശേഖരിക്കുക.
ഡോക്യുമെന്റുകൾ / OCR – സാമ്പത്തിക ഡോക്യുമെന്റുകൾ (ബാങ്ക്, പേസ്ലിപ്പ്, നികുതി, യുഎസ്)

കേസ് ഉപയോഗിക്കുക: പ്രമാണങ്ങൾ / OCR
ഫോർമാറ്റ്: ചിത്രങ്ങൾ
എണ്ണം: 26,446
വ്യാഖ്യാനം: ഇല്ല
വിവരണം: സാമ്പത്തിക രേഖകൾ: ബാങ്ക് സ്റ്റേറ്റ്മെന്റ്, ചെക്ക്, പേസ്ലിപ്പ്, നികുതി, മോർട്ട്ഗേജ്, ഇൻഷുറൻസ് ക്ലെയിമുകൾ (യുഎസ്)
രേഖകൾ / OCR – സാമ്പത്തിക രേഖകൾ (ഘട്ടം 1 – മോർട്ട്ഗേജ്)
കേസ് ഉപയോഗിക്കുക: പ്രമാണങ്ങൾ / OCR
ഫോർമാറ്റ്: ചിത്രങ്ങൾ
എണ്ണം: 9,192
വ്യാഖ്യാനം: ഇല്ല
വിവരണം: സാമ്പത്തിക രേഖകൾ (ഘട്ടം 1) മോർട്ട്ഗേജ് ഡാറ്റാസെറ്റ് - പ്രിന്റ്, സ്കാൻ, ഫോട്ടോഗ്രാഫ്
രേഖകൾ / OCR – സാമ്പത്തിക രേഖകൾ (ഘട്ടം 2 – ഇൻഷുറൻസ്)

കേസ് ഉപയോഗിക്കുക: പ്രമാണങ്ങൾ / OCR
ഫോർമാറ്റ്: ചിത്രങ്ങൾ
എണ്ണം: 7,636
വ്യാഖ്യാനം: ഇല്ല
വിവരണം: സാമ്പത്തിക രേഖകൾ (ഘട്ടം 2) ഇൻഷുറൻസ് ഡാറ്റാസെറ്റ് - പ്രിന്റ്, സ്കാൻ, ഫോട്ടോഗ്രാഫ്
ഡോക്യുമെന്റുകൾ / OCR – കൈയെഴുത്ത് ടെക്സ്റ്റ് ഡാറ്റാസെറ്റ് (JP/KR/RU)

കേസ് ഉപയോഗിക്കുക: പ്രമാണങ്ങൾ / OCR
ഫോർമാറ്റ്: ചിത്രങ്ങൾ
എണ്ണം: 106,313
വ്യാഖ്യാനം: ഇല്ല
വിവരണം: കൈയക്ഷര വാചകം: കൈയക്ഷര വാചകമുള്ള ലൈവ് ഫോട്ടോകൾ (ജാപ്പനീസ്, കൊറിയൻ, റഷ്യൻ)
ഡോക്യുമെന്റുകൾ / OCR – ബൗണ്ടിംഗ് ബോക്സ് വ്യാഖ്യാനത്തോടുകൂടിയ ഇൻവോയ്സ് ഡാറ്റാസെറ്റ്

കേസ് ഉപയോഗിക്കുക: പ്രമാണങ്ങൾ / OCR
ഫോർമാറ്റ്: ചിത്രങ്ങൾ
എണ്ണം: 87
വ്യാഖ്യാനം: അതെ
വിവരണം: ബൗണ്ടിംഗ് ബോക്സ് അനോട്ടേഷനുകളുള്ള ഇൻവോയ്സ് ഡാറ്റാസെറ്റിൽ സ്കാൻ ചെയ്ത അല്ലെങ്കിൽ ഡിജിറ്റൽ ഇൻവോയ്സുകൾ ഉൾപ്പെടുന്നു, അവിടെ ഇൻവോയ്സ് നമ്പർ, തീയതി, വെണ്ടർ വിശദാംശങ്ങൾ, ലൈൻ ഇനങ്ങൾ, ആകെ തുകകൾ എന്നിവ പോലുള്ള പ്രധാന ഫീൽഡുകൾ ബൗണ്ടിംഗ് ബോക്സുകൾ ഉപയോഗിച്ച് ലേബൽ ചെയ്തിരിക്കുന്നു, ഇത് ഘടനാരഹിതമായ പ്രമാണങ്ങളിൽ നിന്ന് ഘടനാപരമായ വിവരങ്ങൾ കൃത്യമായി കണ്ടെത്താനും വേർതിരിച്ചെടുക്കാനും AI മോഡലുകളെ പ്രാപ്തമാക്കുന്നു.
ഡോക്യുമെന്റുകൾ / OCR – പ്രിന്റ് ചെയ്ത ടെക്സ്റ്റുള്ള ലൈവ് ഫോട്ടോകൾ (JP/KR/RU)
കേസ് ഉപയോഗിക്കുക: പ്രമാണങ്ങൾ / OCR
ഫോർമാറ്റ്: ചിത്രങ്ങൾ
എണ്ണം: 4,944
വ്യാഖ്യാനം: ഇല്ല
വിവരണം: പ്രിന്റ് ചെയ്ത വാചകത്തോടുകൂടിയ ലൈവ് ഫോട്ടോകൾ (ജാപ്പനീസ്, കൊറിയൻ, റഷ്യൻ)
ഡോക്യുമെന്റുകൾ / OCR – ബഹുഭാഷാ രസീതുകൾ/ഇൻവോയ്സുകൾ ഡാറ്റാസെറ്റ്

കേസ് ഉപയോഗിക്കുക: പ്രമാണങ്ങൾ / OCR
ഫോർമാറ്റ്: ചിത്രങ്ങൾ
എണ്ണം: 8,961
വ്യാഖ്യാനം: ഇല്ല
വിവരണം: ബഹുഭാഷാ രസീതുകളുടെയും ഇൻവോയ്സുകളുടെയും ഡാറ്റാസെറ്റിൽ ഒന്നിലധികം ഭാഷകളിലുള്ള വൈവിധ്യമാർന്ന സാമ്പത്തിക രേഖകൾ ഉൾപ്പെടുന്നു, ഇത് ഭാഷാ വാചക തിരിച്ചറിയൽ, കീ ഫീൽഡ് എക്സ്ട്രാക്ഷൻ, പ്രമാണ ധാരണ എന്നിവയ്ക്കായി AI മോഡലുകളെ പരിശീലിപ്പിക്കാൻ പ്രാപ്തമാക്കുന്നു.
ഡോക്യുമെന്റുകൾ / OCR – സിന്തറ്റിക് ബാങ്ക് സ്റ്റേറ്റ്മെന്റുകൾ (40 ടെംപ്ലേറ്റുകൾ)

കേസ് ഉപയോഗിക്കുക: പ്രമാണങ്ങൾ / OCR
ഫോർമാറ്റ്: ചിത്രങ്ങൾ
എണ്ണം: 1,290
വ്യാഖ്യാനം: ഇല്ല
വിവരണം: ബാങ്ക് സ്റ്റേറ്റ്മെന്റുകൾ - അദ്വിതീയ ടെംപ്ലേറ്റ് - 40: സിന്തറ്റിക് ബാങ്ക് സ്റ്റേറ്റ്മെന്റുകൾ
ഡോക്യുമെന്റുകൾ / OCR – സിന്തറ്റിക് പേ സ്ലിപ്പുകൾ (60 ടെംപ്ലേറ്റുകൾ)

കേസ് ഉപയോഗിക്കുക: പ്രമാണങ്ങൾ / OCR
ഫോർമാറ്റ്: ചിത്രങ്ങൾ
എണ്ണം: 2,010
വ്യാഖ്യാനം: ഇല്ല
വിവരണം: ചെക്ക് - യുണീക്ക് ടെംപ്ലേറ്റ് - 60: സിന്തറ്റിക് പേ സ്ലിപ്പുകൾ
ഡോക്യുമെന്റുകൾ / OCR – സിന്തറ്റിക് പേസ്ലിപ്പുകൾ (130 ടെംപ്ലേറ്റുകൾ)

കേസ് ഉപയോഗിക്കുക: പ്രമാണങ്ങൾ / OCR
ഫോർമാറ്റ്: ചിത്രങ്ങൾ
എണ്ണം: 2,023
വ്യാഖ്യാനം: ഇല്ല
വിവരണം: പേസ്ലിപ്പുകൾ - യുണീക്ക് ടെംപ്ലേറ്റ് - 130: സിന്തറ്റിക് ബാങ്ക് ചെക്ക്
പേ സ്ലിപ്പ് ഡാറ്റാസെറ്റ് (ഡോക്യുമെന്റ് AI)

കേസ് ഉപയോഗിക്കുക: ഓസിആര്ചിത്രം
ഫോർമാറ്റ്: .jpg
എണ്ണം: 2010
വ്യാഖ്യാനം: ഇല്ല
വിവരണം: പേ സ്ലിപ്പ് ഡാറ്റാസെറ്റ് (ഡോക്യുമെൻ്റ് AI): കൃത്രിമമായി സൃഷ്ടിച്ച പേ സ്ലിപ്പുകളുടെ ചിത്രങ്ങളാണ് സിന്തറ്റിക് പേ സ്ലിപ്പുകളിൽ വ്യാഖ്യാനങ്ങളില്ലാതെ അടങ്ങിയിരിക്കുന്നത്. OCR, ഡോക്യുമെൻ്റ് പ്രോസസ്സിംഗ് തുടങ്ങിയ ടാസ്ക്കുകളിൽ ഡോക്യുമെൻ്റ് AI സംവിധാനങ്ങൾ പരിശീലിപ്പിക്കുന്നതിനും പരിശോധിക്കുന്നതിനും ഉപയോഗിക്കുന്ന ജീവനക്കാരുടെ പേരുകൾ, ശമ്പളം, തീയതികൾ തുടങ്ങിയ വിവിധ പേ സ്ലിപ്പ് ഫോർമാറ്റുകളും വിശദാംശങ്ങളും ഇതിൽ അവതരിപ്പിക്കുന്നു.
റെക്കോർഡിംഗ് അവസ്ഥ: - സ്കാൻ ചെയ്തു - വെബ് സ്ക്രാപ്പർ

