കമ്പ്യൂട്ടർ വിഷൻ

നിങ്ങളുടെ പ്രോജക്റ്റ് വർദ്ധിപ്പിക്കുന്നതിന് കമ്പ്യൂട്ടർ വിഷനുള്ള 31 സൗജന്യ ഇമേജ് ഡാറ്റാസെറ്റുകൾ [2025 അപ്ഡേറ്റ് ചെയ്തത്]

ഒരു AI അൽഗോരിതം നിങ്ങൾ നൽകുന്ന ഡാറ്റയുടെ അത്ര മികച്ചതായിരിക്കും.

അതൊരു ധീരതയോ പാരമ്പര്യേതര പ്രസ്താവനയോ അല്ല. ഏതാനും പതിറ്റാണ്ടുകൾക്ക് മുമ്പ് AI വളരെ വിദൂരമാണെന്ന് തോന്നാമായിരുന്നു, എന്നാൽ കൃത്രിമബുദ്ധിയും മെഷീൻ ലേണിംഗും അതിനുശേഷം വളരെയധികം മുന്നോട്ട് പോയി.

കമ്പ്യൂട്ടർ ദർശനം കമ്പ്യൂട്ടറുകളെ ലേബലുകളും ചിത്രങ്ങളും മനസ്സിലാക്കാനും വ്യാഖ്യാനിക്കാനും സഹായിക്കുന്നു. ശരിയായ തരത്തിലുള്ള ഇമേജ് ഡാറ്റാസെറ്റുകൾ ഉപയോഗിച്ച് നിങ്ങളുടെ കമ്പ്യൂട്ടറിനെ പരിശീലിപ്പിക്കുമ്പോൾ, വിവിധ മുഖ സവിശേഷതകൾ കണ്ടെത്താനും മനസ്സിലാക്കാനും തിരിച്ചറിയാനും, രോഗങ്ങൾ കണ്ടെത്താനും, സ്വയംഭരണ വാഹനങ്ങൾ ഓടിക്കാനും, മൾട്ടി-ഡൈമൻഷണൽ ഓർഗൻ സ്കാനിംഗ് ഉപയോഗിച്ച് ജീവൻ രക്ഷിക്കാനുമുള്ള കഴിവ് അതിന് ലഭിക്കും.

കമ്പ്യൂട്ടർ വിഷൻ മാർക്കറ്റ് എത്തുമെന്ന് പ്രവചിക്കപ്പെടുന്നു 144.46 ഓടെ 2028 ബില്യൺ ഒരു എളിമയിൽ നിന്ന് 7.04-ൽ $2020 ബില്യൺ, a-ൽ വളരുന്നു 45.64 നും 2021 നും ഇടയിൽ 2028% CAGR.

നിങ്ങളുടെ മെഷീൻ ലേണിംഗ്, കമ്പ്യൂട്ടർ വിഷൻ ടാസ്‌ക്കുകൾ എന്നിവയ്ക്ക് നിങ്ങൾ നൽകുന്നതും പരിശീലിപ്പിക്കുന്നതുമായ ഇമേജ് ഡാറ്റാസെറ്റ് നിങ്ങളുടെ AI പ്രോജക്റ്റിന്റെ വിജയത്തിന് നിർണായകമാണ്. ഗുണനിലവാരമുള്ള ഒരു ഡാറ്റാസെറ്റ് ലഭിക്കുന്നത് വളരെ ബുദ്ധിമുട്ടാണ്. ശക്തമായ മോഡൽ പരിശീലനം ഉറപ്പാക്കുന്നതിനും യഥാർത്ഥ ലോക സങ്കീർണ്ണതയെ നന്നായി പ്രതിഫലിപ്പിക്കുന്നതിനും വൈവിധ്യമാർന്ന ചിത്രങ്ങളുടെ ശേഖരം ഉപയോഗിക്കുന്നത് അത്യാവശ്യമാണ്.

നിങ്ങളുടെ പ്രോജക്റ്റിന്റെ സങ്കീർണ്ണതയെ ആശ്രയിച്ച്, കമ്പ്യൂട്ടർ വിഷൻ ആവശ്യങ്ങൾക്കായി വിശ്വസനീയവും പ്രസക്തവുമായ ഡാറ്റാസെറ്റുകൾ ലഭിക്കാൻ കുറച്ച് ദിവസങ്ങൾ മുതൽ ആഴ്ചകൾ വരെ എടുത്തേക്കാം. വിവിധ കമ്പ്യൂട്ടർ വിഷൻ ജോലികളും യഥാർത്ഥ ലോക സാഹചര്യങ്ങളും ഉൾക്കൊള്ളുന്നതിന് വൈവിധ്യമാർന്ന ഡാറ്റാസെറ്റുകൾ ആവശ്യമാണ്. സമഗ്രമായ മോഡൽ വിലയിരുത്തൽ ഉറപ്പാക്കുന്നതിനും വിപുലമായ ആപ്ലിക്കേഷനുകളെ പിന്തുണയ്ക്കുന്നതിനുമായി ഗവേഷണ ആവശ്യങ്ങൾക്കായി ഗവേഷകർ പലപ്പോഴും ഗണ്യമായ ഒരു ഡാറ്റാസെറ്റ് തേടാറുണ്ട്.

ഇവിടെ, നിങ്ങൾക്ക് ഉടനടി ഉപയോഗിക്കാനാകുന്ന ഓപ്പൺ സോഴ്‌സ് ഇമേജ് ഡാറ്റാസെറ്റുകളുടെ ഒരു ശ്രേണി (നിങ്ങളുടെ എളുപ്പത്തിനായി തരംതിരിച്ചിരിക്കുന്നു) ഞങ്ങൾ നിങ്ങൾക്ക് നൽകുന്നു.

ഇമേജ് ഡാറ്റാസെറ്റ് ടാസ്‌ക്കുകൾ: വർഗ്ഗീകരണം, വിഭജനം, കണ്ടെത്തൽ, കൂടാതെ മറ്റു പലതും

ഇമേജ് ഡാറ്റാസെറ്റുകൾ ആധുനിക കമ്പ്യൂട്ടർ ദർശനത്തിന്റെ നട്ടെല്ലാണ് ഇവ, ദൃശ്യ വിവരങ്ങൾ വ്യാഖ്യാനിക്കാനും മനസ്സിലാക്കാനും യന്ത്രങ്ങളെ പ്രാപ്തമാക്കുന്ന വൈവിധ്യമാർന്ന ജോലികൾക്ക് ശക്തി പകരുന്നു. നിങ്ങൾ സ്വയംഭരണ വാഹനങ്ങൾക്കായി ഒരു മാതൃക നിർമ്മിക്കുകയാണെങ്കിലും, മുഖം തിരിച്ചറിയൽ സാങ്കേതികവിദ്യ വികസിപ്പിക്കുകയാണെങ്കിലും, അല്ലെങ്കിൽ മെഡിക്കൽ ഇമേജ് വിശകലനത്തിൽ പ്രവർത്തിക്കുകയാണെങ്കിലും, ശരിയായ ഇമേജ് ഡാറ്റാസെറ്റ് വിജയത്തിന് അത്യാവശ്യമായ ഒരു ഉപകരണമാണ്.

ചിത്രത്തിന്റെ വർഗ്ഗീകരണം ഏറ്റവും അടിസ്ഥാനപരമായ കമ്പ്യൂട്ടർ ദർശന ജോലികളിൽ ഒന്നാണ്. ഈ പ്രക്രിയയിൽ, ഒരു മോഡൽ അതിന്റെ ഉള്ളടക്കത്തെ അടിസ്ഥാനമാക്കി ഒരു മുഴുവൻ ചിത്രത്തിനും ഒരു ലേബൽ നൽകാൻ പഠിക്കുന്നു. ഉദാഹരണത്തിന്, ഒരു ഇമേജ് വർഗ്ഗീകരണ ഡാറ്റാസെറ്റ് ഒരു മോഡലിനെ പൂച്ചകളുടെയും നായ്ക്കളുടെയും ചിത്രങ്ങൾ തമ്മിൽ വേർതിരിച്ചറിയാൻ അല്ലെങ്കിൽ വ്യത്യസ്ത തരം സസ്യങ്ങളെ തിരിച്ചറിയാൻ സഹായിച്ചേക്കാം. ഓട്ടോമേറ്റഡ് ഫോട്ടോ ടാഗിംഗ്, മെഡിക്കൽ ചിത്രങ്ങളിൽ നിന്നുള്ള രോഗനിർണയങ്ങൾ, രംഗ വർഗ്ഗീകരണ ബെഞ്ച്മാർക്കുകൾ തുടങ്ങിയ ആപ്ലിക്കേഷനുകൾക്ക് ഈ ടാസ്ക് നിർണായകമാണ്.

വസ്തു കണ്ടെത്തൽ ഒരു ചിത്രത്തിനുള്ളിലെ വസ്തുക്കളുടെ സാന്നിധ്യം തിരിച്ചറിയുക മാത്രമല്ല, ബൗണ്ടിംഗ് ബോക്സുകൾ ഉപയോഗിച്ച് അവയുടെ സ്ഥാനങ്ങൾ കൃത്യമായി കണ്ടെത്തുകയും ചെയ്തുകൊണ്ട് കാര്യങ്ങൾ ഒരു പടി കൂടി മുന്നോട്ട് കൊണ്ടുപോകുന്നു. ബൗണ്ടിംഗ് ബോക്സുകളുള്ള വ്യാഖ്യാനിച്ച ചിത്രങ്ങൾ അടങ്ങിയവ പോലുള്ള ഒബ്ജക്റ്റ് കണ്ടെത്തലിനുള്ള ഡാറ്റാസെറ്റുകൾ, ഓട്ടോണമസ് വാഹനങ്ങളിലെ കാൽനടക്കാരെ കണ്ടെത്തൽ, സുരക്ഷാ നിരീക്ഷണം, റീട്ടെയിൽ അനലിറ്റിക്സ് തുടങ്ങിയ ആപ്ലിക്കേഷനുകൾക്ക് അത്യന്താപേക്ഷിതമാണ്. യഥാർത്ഥ ലോക സാഹചര്യങ്ങൾക്കായി ശക്തമായ കമ്പ്യൂട്ടർ വിഷൻ അൽഗോരിതങ്ങൾ വികസിപ്പിക്കുന്നതിലും ഒബ്ജക്റ്റ് ഡിറ്റക്ഷൻ ഒരു പ്രധാന ഘടകമാണ്.

സെമാന്റിക് സെഗ്മെന്റേഷൻ ഒരു ചിത്രത്തിലെ ഓരോ പിക്സലിനെയും ഒരു പ്രത്യേക വിഭാഗമായി തരംതിരിച്ച്, ദൃശ്യത്തെക്കുറിച്ച് വിശദമായ ധാരണ നൽകുന്നത് ഇതിൽ ഉൾപ്പെടുന്നു. അവയവങ്ങളുടെയോ മുഴകളുടെയോ കൃത്യമായ നിർവചനം ആവശ്യമുള്ള മെഡിക്കൽ ഇമേജിംഗ് പോലുള്ള ജോലികളിലും, റോഡുകൾ, നടപ്പാതകൾ, വാഹനങ്ങൾ എന്നിവ തമ്മിൽ വേർതിരിച്ചറിയാൻ നിർണായകമായ സ്വയംഭരണ ഡ്രൈവിംഗിനുള്ള നഗര പരിതസ്ഥിതികളിലും ഈ പിക്സൽ-ലെവൽ ട്രിമാപ്പ് സെഗ്മെന്റേഷൻ പ്രത്യേകിച്ചും പ്രധാനമാണ്.

ഈ പ്രധാന ജോലികൾക്കപ്പുറം, ഇമേജ് ഡാറ്റാസെറ്റുകൾ ഇൻസ്റ്റൻസ് സെഗ്‌മെന്റേഷൻ (ഒരേ ക്ലാസിലെ വ്യക്തിഗത വസ്തുക്കൾക്കിടയിൽ വ്യത്യാസം വരുത്തൽ), ഇമേജ് ക്യാപ്ഷനിംഗ് (ചിത്രങ്ങൾക്കായി വിവരണാത്മക വാചകം സൃഷ്ടിക്കൽ), മുഖം തിരിച്ചറിയൽ (ചിത്രങ്ങളിലെ മനുഷ്യ മുഖങ്ങൾ തിരിച്ചറിയുകയോ പരിശോധിക്കുകയോ ചെയ്യുക) എന്നിവയെ പിന്തുണയ്ക്കുന്നു. മെഷീൻ ലേണിംഗ് മോഡലുകളെ പരിശീലിപ്പിക്കുന്നതിനും സാധൂകരിക്കുന്നതിനും ഈ കമ്പ്യൂട്ടർ വിഷൻ ജോലികളിൽ ഓരോന്നും ഉയർന്ന നിലവാരമുള്ളതും വ്യാഖ്യാനിച്ചതുമായ ചിത്രങ്ങളെ ആശ്രയിച്ചിരിക്കുന്നു.

വൈവിധ്യമാർന്നതും നന്നായി വ്യാഖ്യാനിച്ചതുമായ ഇമേജ് ഡാറ്റാസെറ്റുകൾ പ്രയോജനപ്പെടുത്തുന്നതിലൂടെ, ഡാറ്റാ സയന്റിസ്റ്റുകൾക്കും മെഷീൻ ലേണിംഗ് പ്രാക്ടീഷണർമാർക്കും ഇമേജ് തിരിച്ചറിയൽ, വർഗ്ഗീകരണ ജോലികൾ മുതൽ സങ്കീർണ്ണമായ സെഗ്മെന്റേഷൻ, ഡിറ്റക്ഷൻ പ്രശ്നങ്ങൾ വരെയുള്ള വിവിധ കമ്പ്യൂട്ടർ വിഷൻ വെല്ലുവിളികളെ നേരിടാൻ കഴിയും. ശരിയായ ഡാറ്റാസെറ്റ് ഗവേഷണത്തെയും വികസനത്തെയും ത്വരിതപ്പെടുത്തുക മാത്രമല്ല, യഥാർത്ഥ ലോകത്തിലെ ആപ്ലിക്കേഷനുകളിൽ കമ്പ്യൂട്ടർ വിഷൻ സിസ്റ്റങ്ങൾ കൃത്യമായി പ്രവർത്തിക്കുന്നുവെന്ന് ഉറപ്പാക്കുകയും ചെയ്യുന്നു.

നിങ്ങളുടെ കമ്പ്യൂട്ടർ വിഷൻ മോഡൽ പരിശീലിപ്പിക്കുന്നതിനുള്ള ഇമേജ് ഡാറ്റാസെറ്റുകളുടെ സമഗ്രമായ ലിസ്റ്റ്

പൊതുവായ:

  1. ഇമഗെനെത്

    ഇമേജ്നെറ്റ് വ്യാപകമായി ഉപയോഗിക്കപ്പെടുന്ന ഒരു ഡാറ്റാസെറ്റാണ്, കൂടാതെ ഇത് 1.2 വിഭാഗങ്ങളായി തരംതിരിക്കുന്ന 1000 ദശലക്ഷം ചിത്രങ്ങളുമായി വരുന്നു. ഈ ഡാറ്റാസെറ്റ് വേൾഡ്‌നെറ്റ് ശ്രേണി അനുസരിച്ച് ഓർഗനൈസുചെയ്‌തിരിക്കുന്നു, കൂടാതെ പരിശീലന ഡാറ്റ, ഇമേജ് ലേബലുകൾ, മൂല്യനിർണ്ണയ ഡാറ്റ എന്നിങ്ങനെ മൂന്ന് ഭാഗങ്ങളായി തരംതിരിച്ചിരിക്കുന്നു.

  2. ചലനാത്മകത 700

    700 വ്യത്യസ്ത ഹ്യൂമൻ ആക്ഷൻ ക്ലാസുകളുടെ 650,000-ലധികം ക്ലിപ്പുകളുള്ള ഒരു വലിയ ഉയർന്ന നിലവാരമുള്ള ഡാറ്റാസെറ്റാണ് കൈനറ്റിക്സ് 700. ഓരോ ക്ലാസ് പ്രവർത്തനങ്ങൾക്കും ഏകദേശം 700 വീഡിയോ ക്ലിപ്പുകൾ ഉണ്ട്. ഡാറ്റാസെറ്റിലെ ക്ലിപ്പുകൾക്ക് മനുഷ്യ-വസ്‌തു-മനുഷ്യ-മനുഷ്യ ഇടപെടലുകൾ ഉണ്ട്, അവ വീഡിയോകളിലെ മനുഷ്യ പ്രവർത്തനങ്ങൾ തിരിച്ചറിയുമ്പോൾ വളരെ സഹായകരമാണെന്ന് തെളിയിക്കുന്നു.

  3. സിഫാർ -10

    പത്ത് വ്യത്യസ്‌ത ക്ലാസുകളെ പ്രതിനിധീകരിക്കുന്ന 10 60000 x 32 വർണ്ണ ചിത്രങ്ങളുള്ള ഏറ്റവും വലിയ കമ്പ്യൂട്ടർ-വിഷൻ ഡാറ്റാസെറ്റുകളിൽ ഒന്നാണ് CIFAR 32. ഓരോ ക്ലാസിലും കമ്പ്യൂട്ടർ വിഷൻ അൽഗോരിതങ്ങളും മെഷീൻ ലേണിംഗും പരിശീലിപ്പിക്കാൻ ഉപയോഗിക്കുന്ന ഏകദേശം 6000 ചിത്രങ്ങൾ ഉണ്ട്.

  4. Oxford-IIIT പെറ്റ് ഇമേജസ് ഡാറ്റാസെറ്റ്

    പെറ്റ് ഇമേജ് ഡാറ്റാസെറ്റിൽ ഒരു ക്ലാസിന് 37 ചിത്രങ്ങളുള്ള 200 വിഭാഗങ്ങൾ ഉൾപ്പെടുന്നു. ഈ ചിത്രങ്ങൾ സ്കെയിൽ, പോസ്, ലൈറ്റിംഗ് എന്നിവയിൽ വ്യത്യാസപ്പെട്ടിരിക്കുന്നു, കൂടാതെ ബ്രീഡ്, ഹെഡ് ROI, പിക്സൽ ലെവൽ ട്രൈമാപ്പ് സെഗ്മെൻ്റേഷൻ എന്നിവയ്ക്കുള്ള വ്യാഖ്യാനങ്ങളോടൊപ്പം.

  5. ഗൂഗിളിന്റെ ഓപ്പൺ ഇമേജുകൾ

    ശ്രദ്ധേയമായ 9 ദശലക്ഷം URL-കളോടെ, 6,000 വിഭാഗങ്ങളിലായി ലേബൽ ചെയ്‌തിരിക്കുന്ന ദശലക്ഷക്കണക്കിന് ഇമേജുകൾ അടങ്ങുന്ന പട്ടികയിലെ ഏറ്റവും വലിയ ഇമേജ് ഡാറ്റാസെറ്റുകളിൽ ഒന്നാണിത്.

  6. ചെടികളുടെ ചിത്രങ്ങൾ

    ഈ സമാഹാരത്തിൽ ഏകദേശം 1 സ്പീഷീസുകൾ ഉൾക്കൊള്ളുന്ന, ശ്രദ്ധേയമായ 11 ദശലക്ഷം സസ്യ ചിത്രങ്ങൾ ഉൾക്കൊള്ളുന്ന ഒന്നിലധികം ഇമേജ് ഡാറ്റാസെറ്റുകൾ ഉൾപ്പെടുന്നു.

  7. LSUN

    വിവിധ ദൃശ്യ, വസ്തു വിഭാഗങ്ങളിലായി ദശലക്ഷക്കണക്കിന് ലേബൽ ചെയ്ത ചിത്രങ്ങളുള്ള ഒരു വലിയ തോതിലുള്ള ഇമേജ് ഡാറ്റാസെറ്റാണ് LSUN. മോഡൽ മൂല്യനിർണ്ണയത്തിനായി ഒരു പ്രത്യേക ടെസ്റ്റ് സെറ്റ് ഡാറ്റാസെറ്റിൽ ഉൾപ്പെടുന്നു.

മുഖം തിരിച്ചറിയൽ:

ഫേഷ്യൽ തിരിച്ചറിയൽ

  1. കാട്ടിലെ മുഖങ്ങൾ എന്ന് ലേബൽ ചെയ്തിരിക്കുന്നു

    ഇൻറർനെറ്റിൽ നിന്ന് കണ്ടെത്തിയ ഏതാണ്ട് 13,230 ആളുകളുടെ 5,750-ലധികം ചിത്രങ്ങൾ ഉൾക്കൊള്ളുന്ന ഒരു വലിയ ഡാറ്റാസെറ്റാണ് ഫേസ്ഡ് ഇൻ ദി വൈൽഡ് എന്ന് ലേബൽ ചെയ്തിരിക്കുന്നത്. അനിയന്ത്രിതമായ മുഖം കണ്ടെത്തൽ പഠിക്കുന്നത് എളുപ്പമാക്കുന്നതിനാണ് മുഖങ്ങളുടെ ഈ ഡാറ്റാസെറ്റ് രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത്.

  2. CASIA വെബ്‌ഫേസ്

    CASIA വെബ് ഫെയ്‌സ് നന്നായി രൂപകൽപ്പന ചെയ്‌ത ഡാറ്റാസെറ്റാണ്, അത് മെഷീൻ ലേണിംഗിനെയും അനിയന്ത്രിതമായ മുഖം തിരിച്ചറിയലിനെക്കുറിച്ച് ശാസ്ത്രീയ ഗവേഷണത്തെയും സഹായിക്കുന്നു. ഏതാണ്ട് 494,000 യഥാർത്ഥ ഐഡന്റിറ്റികളുടെ 10,000-ലധികം ചിത്രങ്ങൾ ഉള്ളതിനാൽ, മുഖം തിരിച്ചറിയുന്നതിനും പരിശോധിച്ചുറപ്പിക്കുന്നതിനും ഇത് അനുയോജ്യമാണ്.

  3. UMD ഫേസ് ഡാറ്റാസെറ്റ്

    നിശ്ചല ചിത്രങ്ങളും വീഡിയോ ഫ്രെയിമുകളും - രണ്ട് ഭാഗങ്ങൾ ഉൾക്കൊള്ളുന്ന നന്നായി വ്യാഖ്യാനിച്ച ഡാറ്റാസെറ്റിനെ UMD അഭിമുഖീകരിക്കുന്നു. ഡാറ്റാസെറ്റിൽ 367,800-ലധികം മുഖ വ്യാഖ്യാനങ്ങളും വിഷയങ്ങളുടെ 3.7 ദശലക്ഷം വ്യാഖ്യാന വീഡിയോ ഫ്രെയിമുകളും ഉണ്ട്.

  4. മുഖംമൂടി കണ്ടെത്തൽ

    ഈ ഡാറ്റാസെറ്റിൽ മൂന്ന് ക്ലാസുകളായി തരംതിരിച്ചിരിക്കുന്ന 853 ചിത്രങ്ങൾ ഉൾപ്പെടുന്നു: “മാസ്‌ക് ധരിക്കാതെ,” “മാസ്‌ക് ധരിക്കാതെ,” “മാസ്‌ക് തെറ്റായി ധരിച്ചത്,” കൂടാതെ പാസ്‌ക്കൽ VOC ഫോർമാറ്റിലുള്ള ബൗണ്ടിംഗ് ബോക്‌സുകളും.

  5. ഫെററ്റ്

    മനുഷ്യ മുഖങ്ങളുടെ 14,000-ലധികം വ്യാഖ്യാന ചിത്രങ്ങൾ ഉൾക്കൊള്ളുന്ന ഒരു സമഗ്ര ഇമേജ് ഡാറ്റാസെറ്റാണ് FERET (ഫേഷ്യൽ റെക്കഗ്നിഷൻ ടെക്നോളജി ഡാറ്റാബേസ്).

കൈയക്ഷരം തിരിച്ചറിയൽ:

  1. MNIST ഡാറ്റാബേസ്

    0 മുതൽ 9 വരെയുള്ള കൈയക്ഷര അക്കങ്ങളുടെ സാമ്പിളുകൾ അടങ്ങുന്ന ഒരു ഡാറ്റാബേസാണ് MNIST, ഇതിന് 60,000, 10,000 പരിശീലന ചിത്രങ്ങളും ഉണ്ട്. 1999-ൽ പുറത്തിറങ്ങിയ MNIST, ഡീപ് ലേണിംഗിൽ ഇമേജ് പ്രോസസ്സിംഗ് സിസ്റ്റങ്ങൾ പരീക്ഷിക്കുന്നത് എളുപ്പമാക്കുന്നു.

  2. കൃത്രിമ പ്രതീകങ്ങളുടെ ഡാറ്റാസെറ്റ്

    കൃത്രിമ പ്രതീകങ്ങൾ ഡാറ്റാസെറ്റ്, പേര് സൂചിപ്പിക്കുന്നത് പോലെ, പത്ത് വലിയ അക്ഷരങ്ങളിൽ ഇംഗ്ലീഷ് ഭാഷാ ഘടനയെ വിവരിക്കുന്ന കൃത്രിമമായി സൃഷ്ടിച്ച ഡാറ്റയാണ്. ഇത് 6000-ലധികം ചിത്രങ്ങളുമായി വരുന്നു.

ഒബ്ജക്റ്റ് കണ്ടെത്തൽ:

  1. MS COCO

    MS COCO അല്ലെങ്കിൽ കോമൺ ഒബ്‌ജക്‌ട്‌സ് ഇൻ കോണ്ടക്‌സ് എന്നത് ഒരു ഒബ്‌ജക്റ്റ് കണ്ടെത്തലും അടിക്കുറിപ്പ് നൽകുന്ന ഡാറ്റാസെറ്റും ആണ്.

    കീപോയിന്റ് ഡിറ്റക്ഷൻ, മൾട്ടി-ഒബ്ജക്റ്റ് ഡിറ്റക്ഷൻ, ക്യാപ്ഷനിംഗ്, സെഗ്മെന്റേഷൻ മാസ്ക് വ്യാഖ്യാനങ്ങൾ എന്നിവയോടുകൂടിയ 328,000-ലധികം ചിത്രങ്ങളുണ്ട്. 80 ഒബ്‌ജക്റ്റ് വിഭാഗങ്ങളും ഓരോ ചിത്രത്തിനും അഞ്ച് അടിക്കുറിപ്പുകളുമായാണ് ഇത് വരുന്നത്.

  2. LSUN

    20 ഒബ്‌ജക്‌റ്റ്, 10 സീൻ വിഭാഗങ്ങളിലായി ഒരു ദശലക്ഷത്തിലധികം ലേബൽ ചെയ്‌ത ചിത്രങ്ങളാണ് ലാർജ് സ്‌കെയിൽ സീൻ അണ്ടർസ്റ്റാൻഡിംഗ് എന്നതിന്റെ ചുരുക്കെഴുത്ത് LSUN. ചില വിഭാഗങ്ങൾക്ക് 300,000 ചിത്രങ്ങളുണ്ട്, മൂല്യനിർണ്ണയത്തിനായി പ്രത്യേകമായി 300 ചിത്രങ്ങളും ടെസ്റ്റ് ഡാറ്റയ്ക്കായി 1000 ചിത്രങ്ങളും.

  3. ഹോം ഒബ്ജക്റ്റുകൾ

    ഹോം ഒബ്‌ജക്റ്റ് ഡാറ്റാസെറ്റിൽ വീടിന് ചുറ്റുമുള്ള ക്രമരഹിതമായ വസ്തുക്കളുടെ വ്യാഖ്യാന ചിത്രങ്ങൾ അടങ്ങിയിരിക്കുന്നു - അടുക്കള, സ്വീകരണമുറി, കുളിമുറി. ഈ ഡാറ്റാസെറ്റിന് കുറച്ച് വ്യാഖ്യാനിച്ച വീഡിയോകളും 398 വ്യാഖ്യാനിക്കാത്ത ഫോട്ടോകളും ടെസ്റ്റിംഗിനായി രൂപകൽപ്പന ചെയ്തിട്ടുണ്ട്.

  4. വിഷ്വൽ ജീനോം

    വിഷ്വൽ ജീനോം എന്നത് 108,000-ത്തിലധികം അടിക്കുറിപ്പുകളുള്ള ചിത്രങ്ങളുള്ള ഒരു സമഗ്രമായ ദൃശ്യ വിജ്ഞാന കേന്ദ്രമാണ്. വസ്തുക്കൾ, ആട്രിബ്യൂട്ടുകൾ, ബന്ധങ്ങൾ എന്നിവയ്ക്കായി ഇത് വിപുലമായ വ്യാഖ്യാനങ്ങൾ നൽകുന്നു, ഇത് വസ്തുക്കൾ തിരിച്ചറിയൽ, ഇമേജ് അടിക്കുറിപ്പ് നൽകൽ, മൾട്ടിമോഡൽ പഠന ജോലികൾ എന്നിവയ്ക്ക് വിലപ്പെട്ടതാക്കുന്നു.

ഓട്ടോമോട്ടീവ്:

  1. സിറ്റിസ്‌കേപ്പ് ഡാറ്റാസെറ്റ്

    നിരവധി സൈറ്റുകളുടെ തെരുവ് ദൃശ്യങ്ങളിൽ നിന്ന് റെക്കോർഡുചെയ്‌ത വിവിധ വീഡിയോ സീക്വൻസുകൾക്കായി തിരയുമ്പോൾ പോകേണ്ട ഡാറ്റാസെറ്റാണ് സിറ്റിസ്‌കേപ്പ്. ഈ ചിത്രങ്ങൾ വളരെക്കാലം വ്യത്യസ്ത കാലാവസ്ഥയിലും വെളിച്ചത്തിലും പകർത്തിയതാണ്. എട്ട് വ്യത്യസ്ത വിഭാഗങ്ങളായി തിരിച്ചിരിക്കുന്ന 30 ക്ലാസ് ചിത്രങ്ങളാണ് വ്യാഖ്യാനങ്ങൾ.

  2. ബാർക്ക്ലി ഡീപ് ഡ്രൈവ്

    Barkley DeepDrive സ്വയംഭരണ വാഹന പരിശീലനത്തിനായി പ്രത്യേകം രൂപകൽപ്പന ചെയ്തിട്ടുള്ളതാണ്, കൂടാതെ ഇതിന് 100 ആയിരത്തിലധികം വ്യാഖ്യാന വീഡിയോ സീക്വൻസുകൾ ഉണ്ട്. മാറിക്കൊണ്ടിരിക്കുന്ന റോഡും ഡ്രൈവിംഗ് സാഹചര്യങ്ങളും അനുസരിച്ച് സ്വയംഭരണ വാഹനങ്ങൾക്കുള്ള ഏറ്റവും സഹായകരമായ പരിശീലന വിവരങ്ങളിൽ ഒന്നാണിത്.

  3. മാപ്പില്ലറി

    ലോകമെമ്പാടുമുള്ള 750 ദശലക്ഷത്തിലധികം തെരുവ് ദൃശ്യങ്ങളും ട്രാഫിക് അടയാളങ്ങളും മാപ്പിള്ളറിയിലുണ്ട്, ഇത് മെഷീൻ ലേണിംഗിലും AI അൽഗോരിതത്തിലും വിഷ്വൽ പെർസെപ്ഷൻ മോഡലുകളെ പരിശീലിപ്പിക്കുന്നതിന് വളരെ ഉപയോഗപ്രദമാണ്. വിവിധ ലൈറ്റിംഗും കാലാവസ്ഥയും വ്യൂ പോയിന്റുകളും നിറവേറ്റുന്ന സ്വയംഭരണ വാഹനങ്ങൾ വികസിപ്പിക്കാൻ ഇത് നിങ്ങളെ അനുവദിക്കുന്നു.

മെഡിക്കൽ ഇമേജിംഗ്:

  1. കോവിഡ്-19 ഓപ്പൺ റിസർച്ച് ഡാറ്റാസെറ്റ്

    ഈ യഥാർത്ഥ ഡാറ്റാസെറ്റിന് എപി/പിഎ ചെസ്റ്റ് എക്സ്-റേകളെ കുറിച്ച് ഏകദേശം 6500 പിക്സൽ-പോളിഗോണൽ ശ്വാസകോശ വിഭാഗങ്ങളുണ്ട്. കൂടാതെ, പേര്, സ്ഥാനം, പ്രവേശന വിശദാംശങ്ങൾ, ഫലം എന്നിവയും അതിലേറെയും അടങ്ങുന്ന ടാഗുകളുള്ള കോവിഡ്-517 രോഗിയുടെ എക്സ്-റേയുടെ 19 ചിത്രങ്ങൾ ലഭ്യമാണ്.

  2. 100,000 നെഞ്ച് എക്സ്-റേകളുടെ NIH ഡാറ്റാബേസ്

    ശാസ്ത്ര-ഗവേഷണ സമൂഹത്തിന് ഉപയോഗപ്രദമായ 100,000 ചെസ്റ്റ് എക്സ്-റേ ചിത്രങ്ങളും അനുബന്ധ ഡാറ്റയും അടങ്ങുന്ന പൊതുവായി ലഭ്യമായ ഏറ്റവും വിപുലമായ ഡാറ്റാസെറ്റുകളിൽ ഒന്നാണ് NIH ഡാറ്റാബേസ്. ശ്വാസകോശ സംബന്ധമായ അസുഖമുള്ള രോഗികളുടെ ചിത്രങ്ങൾ പോലും ഇതിലുണ്ട്.

  3. അറ്റ്ലസ് ഓഫ് ഡിജിറ്റൽ പാത്തോളജി

    അറ്റ്ലസ് ഓഫ് ഡിജിറ്റൽ പതോളജി നിരവധി ഹിസ്റ്റോപത്തോളജിക്കൽ പാച്ച് ഇമേജുകൾ വാഗ്ദാനം ചെയ്യുന്നു, വിവിധ അവയവങ്ങളുടെ 17,000 വ്യാഖ്യാന സ്ലൈഡുകളിൽ നിന്ന് മൊത്തത്തിൽ 100-ത്തിലധികം. കമ്പ്യൂട്ടർ കാഴ്ചയും പാറ്റേൺ തിരിച്ചറിയൽ സോഫ്റ്റ്‌വെയറും വികസിപ്പിക്കുന്നതിന് ഈ ഡാറ്റാസെറ്റ് ഉപയോഗപ്രദമാണ്.

രംഗം തിരിച്ചറിയൽ:

രംഗം തിരിച്ചറിയൽ

  1. ഇൻഡോർ സീൻ റെക്കഗ്നിഷൻ

    ഇൻഡോർ സീൻ റെക്കഗ്നിഷൻ എന്നത് മെഷീൻ ലേണിംഗിലും ഡാറ്റ ട്രെയിനിംഗിലും ഉപയോഗിക്കേണ്ട ഒബ്‌ജക്റ്റുകളുടെയും ഇൻഡോർ സീനറിയുടെയും ഏകദേശം 15620 ചിത്രങ്ങളുള്ള ഉയർന്ന തരംതിരിച്ച ഡാറ്റാസെറ്റാണ്. ഇത് 65-ലധികം വിഭാഗങ്ങളുമായി വരുന്നു, ഓരോ വിഭാഗത്തിനും കുറഞ്ഞത് 100 ചിത്രങ്ങളുണ്ട്.

  2. xവ്യൂ

    പൊതുവായി ലഭ്യമായ ഏറ്റവും അറിയപ്പെടുന്ന ഡാറ്റാസെറ്റുകളിൽ ഒന്നായതിനാൽ, xView-ൽ വിവിധ സങ്കീർണ്ണവും വലുതുമായ രംഗങ്ങളിൽ നിന്നുള്ള ടൺ കണക്കിന് വ്യാഖ്യാനിച്ച ഓവർഹെഡ് ഇമേജറി അടങ്ങിയിരിക്കുന്നു. ഏകദേശം 60 ക്ലാസുകളും ഒരു ദശലക്ഷത്തിലധികം ഒബ്‌ജക്‌റ്റ് ഇൻസ്‌റ്റൻസുകളും ഉള്ള ഈ ഡാറ്റാസെറ്റിന്റെ ഉദ്ദേശം സാറ്റലൈറ്റ് ഇമേജറി ഉപയോഗിച്ച് മികച്ച ദുരന്ത നിവാരണം നൽകുക എന്നതാണ്.

  3. സ്ഥലങ്ങൾ

    എംഐടി സംഭാവന ചെയ്ത ഒരു ഡാറ്റാസെറ്റായ സ്ഥലങ്ങളിൽ 1.8 വ്യത്യസ്ത സീൻ വിഭാഗങ്ങളിൽ നിന്ന് 365 ദശലക്ഷത്തിലധികം ചിത്രങ്ങൾ ഉണ്ട്. ഈ വിഭാഗങ്ങളിൽ ഓരോന്നിലും മൂല്യനിർണ്ണയത്തിനായി ഏകദേശം 50 ചിത്രങ്ങളും പരിശോധനയ്ക്കായി 900 ചിത്രങ്ങളും ഉണ്ട്. സീൻ തിരിച്ചറിയൽ അല്ലെങ്കിൽ വിഷ്വൽ റെക്കഗ്നിഷൻ ടാസ്‌ക്കുകൾ സ്ഥാപിക്കുന്നതിന് ആഴത്തിലുള്ള സീൻ സവിശേഷതകൾ പഠിക്കുന്നത് സാധ്യമാണ്.

  4. സൺ ഡാറ്റാബേസ്

    കമ്പ്യൂട്ടർ ദർശനത്തിൽ വ്യാപകമായി ഉപയോഗിക്കുന്ന ഒരു സമഗ്രമായ ദൃശ്യ വർഗ്ഗീകരണ മാനദണ്ഡമാണ് SUN ഡാറ്റാബേസ്. ഓരോ രംഗത്തിനും വിശദമായ വ്യാഖ്യാനങ്ങളോടെ, വിശാലമായ ഇൻഡോർ, ഔട്ട്ഡോർ പരിതസ്ഥിതികളിലായി വ്യാപിച്ചുകിടക്കുന്ന ആയിരക്കണക്കിന് ചിത്രങ്ങൾ ഇതിൽ അടങ്ങിയിരിക്കുന്നു. വ്യത്യസ്ത ദൃശ്യങ്ങളുടെ കവറേജിന് SUN ഡാറ്റാബേസ് അംഗീകരിക്കപ്പെട്ടിരിക്കുന്നു, കൂടാതെ ദൃശ്യ ധാരണ അൽഗോരിതങ്ങൾ വിലയിരുത്തുന്നതിനുള്ള ഒരു സ്റ്റാൻഡേർഡ് റഫറൻസായി ഇത് പ്രവർത്തിക്കുന്നു.

വിനോദം:

  1. IMDB WIKI ഡാറ്റാസെറ്റ്

    IMDB - പ്രായം, ലിംഗഭേദം, പേരുകൾ എന്നിവ ഉപയോഗിച്ച് മതിയായ രീതിയിൽ ലേബൽ ചെയ്ത മുഖങ്ങളുടെ ഏറ്റവും ജനപ്രിയമായ പൊതു ഡാറ്റാബേസുകളിൽ ഒന്നാണ് വിക്കി. ഇതിന് 20 സെലിബ്രിറ്റികളുടെ മുഖങ്ങളും വിക്കിപീഡിയയിൽ നിന്ന് 62 ആയിരവും ഉണ്ട്.

  2. സെലിബ് മുഖങ്ങൾ

    സെലിബ്രിറ്റികളുടെ 200,000 വ്യാഖ്യാന ചിത്രങ്ങളുള്ള ഒരു വലിയ ഡാറ്റാബേസാണ് സെലിബ് ഫേസസ്. ചിത്രങ്ങൾ പശ്ചാത്തല ശബ്‌ദത്തോടെയും പോസ് വ്യതിയാനങ്ങളോടെയും വരുന്നു, കമ്പ്യൂട്ടർ വിഷൻ ടാസ്‌ക്കുകളിൽ ടെസ്റ്റ് സെറ്റുകൾ പരിശീലിപ്പിക്കുന്നതിന് അവ മൂല്യവത്തായതാക്കുന്നു. മുഖം തിരിച്ചറിയൽ, എഡിറ്റിംഗ്, മുഖഭാഗം പ്രാദേശികവൽക്കരണം എന്നിവയിലും മറ്റും ഉയർന്ന കൃത്യത കൈവരിക്കുന്നതിന് ഇത് വളരെ പ്രയോജനകരമാണ്.

  3. YouTube-8M ഡാറ്റാസെറ്റ്

    YouTube-8M എന്നത് ഒരു വലിയ തോതിലുള്ള ലേബൽ ചെയ്ത വീഡിയോ ഡാറ്റാസെറ്റാണ്, അതിൽ ദശലക്ഷക്കണക്കിന് YouTube വീഡിയോ ഐഡികൾ അടങ്ങിയിരിക്കുന്നു, അതിൽ ദൃശ്യ എന്റിറ്റികളുടെ ഉയർന്ന നിലവാരമുള്ള മെഷീൻ-ജനറേറ്റഡ് അനോട്ടേഷനുകൾ ഉൾപ്പെടുന്നു. ഈ ഡാറ്റാസെറ്റ് വലിയ തോതിലുള്ള വീഡിയോ മനസ്സിലാക്കലിനും പരിശീലന ദർശന അൽഗോരിതങ്ങൾക്കും വ്യാപകമായി ഉപയോഗിക്കുന്നു, കാരണം ഇത് YouTube വീഡിയോ ഐഡികൾ വഴി വീഡിയോ ഉള്ളടക്കത്തെ മെറ്റാഡാറ്റയുമായി ബന്ധിപ്പിക്കുന്നു, ഇത് വീഡിയോ ഡാറ്റയുടെ സ്കെയിലബിൾ ശേഖരണവും അനോട്ടേഷനും പ്രാപ്തമാക്കുന്നു.

നിങ്ങളുടെ കൃത്രിമബുദ്ധി യന്ത്രങ്ങൾക്ക് ഇന്ധനം പകരാൻ ഇപ്പോൾ നിങ്ങൾക്ക് ഓപ്പൺ സോഴ്‌സ് ഇമേജ് ഡാറ്റാസെറ്റുകളുടെ ഒരു വലിയ പട്ടികയുണ്ട്. നിങ്ങളുടെ AI, മെഷീൻ ലേണിംഗ് മോഡലുകളുടെ ഫലം പ്രധാനമായും നിങ്ങൾ നൽകുന്ന ഡാറ്റാസെറ്റുകളുടെ ഗുണനിലവാരത്തെ ആശ്രയിച്ചിരിക്കുന്നു, അവ പരിശീലിപ്പിക്കുകയും പരിശീലിപ്പിക്കുകയും ചെയ്യുന്നു. നിങ്ങളുടെ AI മോഡൽ കൃത്യമായ പ്രവചനങ്ങൾ നടത്തണമെങ്കിൽ, അതിന് സമാഹരിച്ച്, ടാഗ് ചെയ്‌ത്, പൂർണതയിലേക്ക് ലേബൽ ചെയ്‌ത ഗുണനിലവാരമുള്ള ഡാറ്റാസെറ്റുകൾ ആവശ്യമാണ്. പ്രായോഗികവും യഥാർത്ഥവുമായ പ്രോജക്റ്റുകളിലൂടെ നിങ്ങളുടെ മെഷീൻ ലേണിംഗ് കഴിവുകൾ വികസിപ്പിക്കുന്നതിനും മെച്ചപ്പെടുത്തുന്നതിനുമുള്ള മികച്ച മാർഗമാണ് ഈ ഡാറ്റാസെറ്റുകൾക്കൊപ്പം പ്രവർത്തിക്കുന്നത്. നിങ്ങളുടെ കമ്പ്യൂട്ടർ വിഷൻ സിസ്റ്റത്തിന്റെ വിജയം വർദ്ധിപ്പിക്കുന്നതിന്, നിങ്ങളുടെ പ്രോജക്റ്റ് വിഷനുമായി ബന്ധപ്പെട്ട ഗുണനിലവാരമുള്ള ഇമേജ് ഡാറ്റാബേസുകൾ ഉപയോഗിക്കണം.

സാമൂഹിക പങ്കിടൽ