മലയാളം ഡാറ്റാസെറ്റ്
മലയാളം ഡാറ്റാസെറ്റ്
ഉയർന്ന നിലവാരമുള്ള മലയാളം പൊതു സംഭാഷണം, AI & സ്പീച്ച് മോഡലുകൾക്കായുള്ള പോഡ്കാസ്റ്റ് ഡാറ്റാസെറ്റ്
പൊതു അവലോകനം
പേര് (ഭാഷ)
മലയാളം ഭാഷാ ഡാറ്റാസെറ്റ്
ഡാറ്റാസെറ്റ് തരങ്ങൾ
പൊതു സംഭാഷണം, മീഡിയ (പോഡ്കാസ്റ്റ്) ഡാറ്റ
രാജ്യം
ഇന്ത്യ
വിവരണം
ഈ ഡാറ്റാസെറ്റിൽ ഒരു ഏജന്റും ഉപഭോക്താവും തമ്മിലുള്ള സ്ക്രിപ്റ്റ് ചെയ്യാത്ത സിന്തറ്റിക് ടെലിഫോണിക് സംഭാഷണങ്ങളും (5–15 മിനിറ്റ്) 1 മുതൽ 5 വരെ പങ്കാളികളുള്ള അഭിമുഖങ്ങളും പോഡ്കാസ്റ്റുകളും പോലുള്ള ലൈസൻസുള്ള പബ്ലിക് ഡൊമെയ്ൻ ഓഡിയോ അല്ലെങ്കിൽ വീഡിയോ ഫയലുകളും ഉൾപ്പെടുന്നു (15–60 മിനിറ്റ്).
കേസ് ഉപയോഗിക്കുക
ASR, വെർച്വൽ അസിസ്റ്റന്റ്, ചാറ്റ്ബോട്ട്, സംഭാഷണ AI, സ്പീച്ച് അനലിറ്റിക്സ്, TTS, ലാംഗ്വേജ് മോഡലിംഗ്
ഡാറ്റ സെറ്റ് വിശദാംശങ്ങൾ
| ഡാറ്റാസെറ്റ് തരം | സാമ്പിൾ നിരക്ക് | സ്പീക്കറുകൾ | ചാനൽ | ആകെ മണിക്കൂർ | സ്പീക്കറുകളുടെ ആകെ എണ്ണം |
|---|---|---|---|---|---|
| പൊതു സംഭാഷണം | ക്സനുമ്ക്സ ഹേർട്സ് | 2 സ്പീക്കറുകൾ | ഡ്യുവൽ | 70:46:30 | 576 |
| പൊതു സംഭാഷണം | ക്സനുമ്ക്സ ഹേർട്സ് | 2 സ്പീക്കറുകൾ | ഡ്യുവൽ | 149:39:33 | 296 |
| മീഡിയ ഡാറ്റ | ക്സനുമ്ക്സ ഹേർട്സ് | ഒന്നിലധികം സ്പീക്കറുകൾ | മോണോ | 12:39:24 | 81 |
തിരഞ്ഞെടുത്ത ക്ലയന്റുകൾ
ലോകത്തെ മുൻനിര AI ഉൽപ്പന്നങ്ങൾ നിർമ്മിക്കുന്നതിന് ടീമുകളെ പ്രാപ്തരാക്കുന്നു.
നിങ്ങൾ തിരയുന്നത് കണ്ടെത്താൻ കഴിയുന്നില്ലേ?
എല്ലാ ഡാറ്റ തരങ്ങളിലുടനീളം പുതിയ ഓഫ്-ദി-ഷെൽഫ് ഡാറ്റാസെറ്റുകൾ ശേഖരിക്കുന്നു
നിങ്ങളുടെ ഓഡിയോ/സംഭാഷണ പരിശീലന ഡാറ്റ ശേഖരണ ആശങ്കകൾ ഉപേക്ഷിക്കാൻ ഇപ്പോൾ ഞങ്ങളെ ബന്ധപ്പെടുക