നിര്വചനം
യഥാർത്ഥ ലോകത്തിലെ ഡാറ്റയെ അനുകരിക്കുന്ന കൃത്രിമമായി സൃഷ്ടിക്കപ്പെട്ട വിവരങ്ങളാണ് സിന്തറ്റിക് ഡാറ്റ. സിമുലേഷനുകൾ, GAN-കൾ അല്ലെങ്കിൽ മറ്റ് ജനറേറ്റീവ് രീതികൾ ഉപയോഗിച്ച് ഇത് സൃഷ്ടിക്കാൻ കഴിയും.
ഉദ്ദേശ്യം
യഥാർത്ഥ ഡാറ്റ ദുർലഭമോ, സെൻസിറ്റീവോ, ശേഖരിക്കാൻ ചെലവേറിയതോ ആകുമ്പോൾ അത് വർദ്ധിപ്പിക്കുകയോ മാറ്റിസ്ഥാപിക്കുകയോ ചെയ്യുക എന്നതാണ് ഇതിന്റെ ഉദ്ദേശ്യം.
പ്രാധാന്യം
- വ്യക്തിഗത ഡാറ്റയെ ആശ്രയിക്കുന്നത് കുറച്ചുകൊണ്ട് സ്വകാര്യത സംരക്ഷിക്കുന്നു.
- അപൂർവമോ ഗുരുതരമോ ആയ കേസുകൾക്ക് പരിശീലനം പ്രാപ്തമാക്കുന്നു.
- യഥാർത്ഥ ലോക ഡാറ്റയുടെ പൂർണ്ണ സങ്കീർണ്ണത ഇല്ലായിരിക്കാം.
- സുരക്ഷയ്ക്ക് നിർണായകമായ AI-യിൽ കൂടുതലായി ഉപയോഗിക്കുന്നു.
ഇത് എങ്ങനെ പ്രവർത്തിക്കുന്നു
- പകർത്തേണ്ട ഡാറ്റ സവിശേഷതകൾ നിർവചിക്കുക.
- ഡാറ്റ സൃഷ്ടിക്കാൻ സിമുലേഷൻ അല്ലെങ്കിൽ ജനറേറ്റീവ് മോഡലുകൾ ഉപയോഗിക്കുക.
- യഥാർത്ഥ വിതരണങ്ങൾക്കെതിരെ സിന്തറ്റിക് ഡാറ്റ സാധൂകരിക്കുക.
- പരിശീലന പൈപ്പ്ലൈനുകളിൽ സിന്തറ്റിക് ഡാറ്റ ഉപയോഗിക്കുക.
- യാഥാർത്ഥ്യത്തിലെ വിടവുകൾ നിരീക്ഷിക്കുക.
ഉദാഹരണങ്ങൾ (യഥാർത്ഥ ലോകം)
- വേയ്മോ: സ്വയംഭരണ പരിശീലനത്തിനായി സിന്തറ്റിക് ഡ്രൈവിംഗ് രംഗങ്ങൾ ഉപയോഗിക്കുന്നു.
- NVIDIA Omniverse: റോബോട്ടിക്സിനായി സിന്തറ്റിക് 3D ഡാറ്റ സൃഷ്ടിക്കുന്നു.
- ആരോഗ്യ സംരക്ഷണം: ഗവേഷണത്തിനായി സിന്തറ്റിക് രോഗി ഡാറ്റ.
റഫറൻസുകൾ / കൂടുതൽ വായന
- സിന്തറ്റിക് ഡാറ്റയെക്കുറിച്ചുള്ള NIST പ്രത്യേക പ്രസിദ്ധീകരണം.
- ഗോൺകാൽവ്സ് തുടങ്ങിയവർ. “സിന്തറ്റിക് ഡാറ്റയുടെ ജനറേഷനും വിലയിരുത്തലും.” എസിഎം കമ്പ്യൂട്ടിംഗ് സർവേകൾ.
- സിന്തറ്റിക് ഡാറ്റ വോൾട്ട് (എംഐടി).
- AI-യിലെ സിന്തറ്റിക് ഡാറ്റ എന്താണ്?