In-car voice data collection

Case Study: Key Phrase Collection for In-car voice-activated systems

പ്രധാന വാക്യ ശേഖരം

ഓട്ടോ ഇൻഡസ്ട്രിയിൽ ഇൻ-കാർ വോയ്‌സ്-ആക്ടിവേറ്റഡ് സിസ്റ്റങ്ങൾക്ക് വർദ്ധിച്ചുവരുന്ന ഡിമാൻഡ് ഉണ്ട്, ഞങ്ങളുടെ മൊബിലിറ്റി വാഹനങ്ങളുമായി ഞങ്ങൾ എങ്ങനെ ഇടപഴകുന്നു എന്ന് പുനർ നിർവചിക്കുന്നു.

ഫോർഡ്, ടെസ്‌ല, ബിഎംഡബ്ല്യു തുടങ്ങിയ പ്രമുഖ കമ്പനികൾ തങ്ങളുടെ വാഹനങ്ങളിൽ വിപുലമായ ശബ്ദ തിരിച്ചറിയൽ സംയോജിപ്പിച്ചുകൊണ്ട് വാഹന വ്യവസായം അതിവേഗം വോയ്‌സ്-ആക്ടിവേറ്റഡ് സംവിധാനങ്ങൾ സ്വീകരിച്ചു. 2022 ഓടെ, പുതിയ കാറുകളിൽ 50% ത്തിലധികം വോയ്‌സ് റെക്കഗ്നിഷൻ കഴിവുകളുള്ളതായി കണക്കാക്കപ്പെടുന്നു. ഈ സംയോജനങ്ങൾ സുരക്ഷ വർദ്ധിപ്പിക്കാൻ ലക്ഷ്യമിടുന്നു, നാവിഗേഷൻ, വിനോദം, ആശയവിനിമയ പ്രവർത്തനങ്ങൾ എന്നിവ ശ്രദ്ധ വ്യതിചലിക്കാതെ പ്രവർത്തിപ്പിക്കാൻ ഡ്രൈവർമാരെ അനുവദിക്കുന്നു.

ഓട്ടോകളിലെ വോയ്‌സ് റെക്കഗ്നിഷന്റെ വിപണി മൂല്യം 1-ഓടെ $2023 ബില്യൺ കവിയുമെന്ന് പ്രവചിക്കപ്പെടുന്നു, ഇത് ഹാൻഡ്‌സ് ഫ്രീ, ഇന്റലിജന്റ് ഇൻ-കാർ ഇന്ററാക്ഷനുകളുടെ വർദ്ധിച്ചുവരുന്ന ഡിമാൻഡ് സൂചിപ്പിക്കുന്നു.

ഓട്ടോമോട്ടീവ്

2022 ആകുമ്പോഴേക്കും 73% ഡ്രൈവർമാരും ഇൻ-കാർ വോയ്‌സ് അസിസ്റ്റന്റ് ഉപയോഗിക്കുമെന്ന് ഗവേഷണങ്ങൾ സൂചിപ്പിക്കുന്നു.

ഓട്ടോമോട്ടീവ് വോയ്‌സ് റെക്കഗ്‌നിഷൻ സിസ്റ്റം മാർക്കറ്റിന്റെ മൂല്യം 2.01-ൽ 2021 ബില്യൺ ഡോളറായിരുന്നു, ഇത് 3.51-ഓടെ 2027 ബില്യൺ ഡോളറിലെത്തുമെന്ന് പ്രതീക്ഷിക്കുന്നു, ഇത് ഏകദേശം 8.07% സിഎജിആർ രജിസ്റ്റർ ചെയ്യുന്നു.

യഥാർത്ഥ ലോക പരിഹാരം

വോയ്‌സ്-ആക്ടിവേറ്റഡ് സിസ്റ്റങ്ങളെ പവർ ചെയ്യുന്ന ഡാറ്റ

കാറുകളിലെ വോയ്സ് ആക്ടിവേറ്റഡ് സംവിധാനങ്ങൾ സുരക്ഷയും സൗകര്യവും വർദ്ധിപ്പിക്കുന്നു. അവർ ഡ്രൈവർമാരെ നാവിഗേഷൻ ആക്‌സസ് ചെയ്യാനും കോളുകൾ ചെയ്യാനും ടെക്‌സ്‌റ്റുകൾ അയയ്‌ക്കാനും സംഗീതം നിയന്ത്രിക്കാനും ചക്രത്തിൽ നിന്ന് കൈകൾ എടുക്കാതെയും റോഡിൽ നിന്ന് കണ്ണെടുക്കാതെയും അനുവദിക്കുന്നു. വാക്കാലുള്ള കമാൻഡുകളോട് പ്രതികരിക്കുന്നതിലൂടെ, ഈ സംവിധാനങ്ങൾ അശ്രദ്ധ കുറയ്ക്കുകയും മൾട്ടിടാസ്കിംഗ് പ്രോത്സാഹിപ്പിക്കുകയും ഡ്രൈവിംഗിൽ തുടർച്ചയായ ശ്രദ്ധ ഉറപ്പാക്കുകയും ചെയ്യുന്നു. 

ബിസിനസ്സുകളെ തങ്ങളുടെ ഉപഭോക്താക്കൾക്ക് അവിശ്വസനീയമായ സംഭാഷണാനുഭവങ്ങൾ നൽകാൻ അനുവദിക്കുന്ന വോയ്‌സ് AI സൊല്യൂഷനുകൾ വാഗ്ദാനം ചെയ്യുന്ന സംഭാഷണ ഇന്റലിജൻസിലെ ആഗോള നേതാവാണ് ക്ലയന്റ്. ബ്രാൻഡഡ് കീ പദസമുച്ചയങ്ങൾ ഉപയോഗിച്ച് അവരുടെ വോയ്‌സ്-ആക്ടിവേറ്റഡ് സിസ്റ്റങ്ങളെ പരിശീലിപ്പിക്കുന്നതിന് അവർ പ്രമുഖ ഓട്ടോമോട്ടീവ് കമ്പനികളുമായി പ്രവർത്തിക്കുന്നു, കൂടാതെ ഓഡിയോ ഡാറ്റ ശേഖരണത്തിൽ ഷൈപ്പിന്റെ വൈദഗ്ധ്യം ആവശ്യമാണ്.

യഥാർത്ഥ ലോക പരിഹാരം
വെല്ലുവിളികൾ

വെല്ലുവിളികൾ

  • ക്രൗഡ് സോഴ്‌സിംഗ്: ആഗോളതലത്തിൽ ഓരോ ഭാഷയിലും 2800+ നേറ്റീവ് സ്പീക്കറുകളെ റിക്രൂട്ട് ചെയ്യുക.
  • ഡാറ്റ ശേഖരണം: നിശ്ചിത സമയപരിധിക്കുള്ളിൽ 200 ഭാഷകളിൽ 12k+ പ്രോംപ്റ്റുകൾ സുരക്ഷിതമാക്കുക.
  • സന്ദർഭവും ഉദ്ദേശ്യവും തിരിച്ചറിയൽ: ഉപയോക്തൃ അഭ്യർത്ഥനകൾ ശരിയായി മനസ്സിലാക്കുന്നതിന്, ഒരേ കീ പദസമുച്ചയത്തിനായി വ്യത്യസ്ത വ്യതിയാനങ്ങളിൽ സിസ്റ്റങ്ങളെ പരിശീലിപ്പിക്കേണ്ടതുണ്ട്.
  • പശ്ചാത്തല ശബ്ദം കൈകാര്യം ചെയ്യൽ: ML മോഡൽ കൃത്യതയ്ക്കായി യഥാർത്ഥ ലോക പശ്ചാത്തല ശബ്ദത്തെ അഭിസംബോധന ചെയ്യുക.
  • പക്ഷപാതം കുറയ്ക്കൽ: ഉൾപ്പെടുത്തൽ ഉറപ്പാക്കാൻ വൈവിധ്യമാർന്ന ജനസംഖ്യാശാസ്‌ത്രങ്ങളിൽ നിന്ന് വോയ്‌സ് സാമ്പിളുകൾ നേടുക.
  • ഓഡിയോ സവിശേഷതകൾ: 16khz 16bits PCM, മോണോ, സിംഗിൾ-ചാനൽ, WAV; പ്രോസസ്സിംഗ് ഇല്ല.
  • റെക്കോർഡിംഗ് പരിസ്ഥിതി: പശ്ചാത്തല ശബ്‌ദമോ ശല്യമോ ഇല്ലാതെ റെക്കോർഡിംഗുകൾക്ക് വൃത്തിയുള്ള ഓഡിയോ ഉണ്ടായിരിക്കണം. സാധാരണ സംഭാഷണം ഉപയോഗിച്ച് രേഖപ്പെടുത്തേണ്ട പ്രധാന പദങ്ങൾ.
  • ഗുണനിലവാര പരിശോധന:  എല്ലാ സംഭാഷണ റെക്കോർഡിംഗുകളും ഗുണനിലവാര വിലയിരുത്തലിനും മൂല്യനിർണ്ണയത്തിനും വിധേയമാകും, സാധുതയുള്ള സംഭാഷണ റെക്കോർഡിംഗുകൾ മാത്രമേ നൽകൂ. Shaip സമ്മതിച്ച ഗുണനിലവാര മാനദണ്ഡങ്ങൾ പാലിക്കുന്നില്ലെങ്കിൽ, അധിക ചിലവുകളില്ലാതെ Shaip ഡാറ്റ വീണ്ടും ഡെലിവർ ചെയ്യും

പരിഹാരം

സംഭാഷണ AI സ്‌പെയ്‌സിലെ വൈദഗ്‌ധ്യമുള്ള Shaip ഇനിപ്പറയുന്നവ ഉപയോഗിച്ച് ക്ലയന്റിനെ പ്രാപ്‌തമാക്കി:

  • ഡാറ്റ ശേഖരണം: നിശ്ചിത സമയപരിധിക്കുള്ളിൽ 208 സ്പീക്കറുകളിൽ നിന്ന് 12 ആഗോള ഭാഷകളിൽ ശേഖരിച്ച 2800k കീ വാക്യങ്ങൾ/ബ്രാൻഡ് നിർദ്ദേശങ്ങൾ
  • വൈവിധ്യമാർന്ന ഉച്ചാരണങ്ങളും ഭാഷകളും: ലോകമെമ്പാടുമുള്ള സ്പെഷ്യലിസ്റ്റുകളെ റിക്രൂട്ട് ചെയ്തു, ആവശ്യമുള്ള ഉച്ചാരണങ്ങളിലും ഭാഷകളിലും പ്രാവീണ്യം.
  • സന്ദർഭവും ഉദ്ദേശ്യവും തിരിച്ചറിയൽ: ഓരോ സ്പീക്കറെയും 20 വ്യത്യസ്‌ത വ്യതിയാനങ്ങളിൽ കീ പദസമുച്ചയങ്ങൾ റെക്കോർഡുചെയ്യാൻ ചുമതലപ്പെടുത്തി, സന്ദർഭത്തിന്റെയും ഉദ്ദേശ്യത്തിന്റെയും അടിസ്ഥാനത്തിൽ ഉപയോക്തൃ അഭ്യർത്ഥനകൾ കൃത്യമായി മനസ്സിലാക്കാൻ ML മോഡലുകളെ പ്രാപ്‌തമാക്കുന്നു.
  • പശ്ചാത്തല ശബ്ദം കൈകാര്യം ചെയ്യൽ: പ്രാകൃതമായ ഓഡിയോ നിലവാരം ഉറപ്പാക്കാൻ, ടിവി, റേഡിയോ, സംഗീതം, സംഭാഷണം അല്ലെങ്കിൽ തെരുവ് ശബ്‌ദങ്ങൾ പോലുള്ള പശ്ചാത്തല ശല്യങ്ങളില്ലാത്ത, 40dB-ൽ താഴെയുള്ള ശബ്‌ദ നിലകളുള്ള ശാന്തമായ അന്തരീക്ഷത്തിലാണ് പ്രധാന ശൈലികൾ ക്യാപ്‌ചർ ചെയ്‌തിരിക്കുന്നതെന്ന് ഞങ്ങൾ ഉറപ്പാക്കി.
  • പക്ഷപാതം കുറയ്ക്കൽ: പക്ഷപാതം കുറയ്ക്കുന്നതിന്, വിവിധ പ്രദേശങ്ങളിൽ നിന്നുള്ള വ്യക്തികളെ ഞങ്ങൾ ഇടപഴകുകയും 50% പുരുഷന്മാരും 50% സ്ത്രീകളും 18 മുതൽ 60 വയസ്സ് വരെ പ്രായമുള്ളവരുമായി സമതുലിതമായ ജനസംഖ്യാ പ്രാതിനിധ്യം നിലനിർത്തുകയും ചെയ്തു.
  • റെക്കോർഡിംഗ് മാർഗ്ഗനിർദ്ദേശങ്ങൾ: വേഗമേറിയതോ സ്ലോ പേസിംഗ് പോലെയോ വ്യത്യാസങ്ങളൊന്നുമില്ലാതെ, സുസ്ഥിരവും സാധാരണവുമായ സംഭാഷണ പാറ്റേണിലാണ് പ്രധാന വാക്യങ്ങൾ ക്യാപ്‌ചർ ചെയ്‌തത്. പ്രസംഗത്തിന്റെ ഒരു ഭാഗവും അശ്രദ്ധമായി ക്ലിപ്പുചെയ്‌തിട്ടില്ലെന്ന് ഉറപ്പുനൽകുന്നതിന് തുടക്കത്തിലും അവസാനത്തിലും 2 സെക്കൻഡ് നിശബ്ദത.
  • റെക്കോർഡിംഗ് ഫോർമാറ്റ: ഓഡിയോ 16kHz, 16-ബിറ്റ് PCM മോണോയിൽ റെക്കോർഡുചെയ്‌തു, ഒരൊറ്റ ചാനൽ ഉപയോഗിച്ച്, WAV ഫയൽ ഫോർമാറ്റിൽ സംരക്ഷിച്ചു. ഓഡിയോ പ്രോസസ്സ് ചെയ്യപ്പെടാതെ തുടരുന്നു, അതായത് കംപ്രഷൻ, റിവേർബ് അല്ലെങ്കിൽ EQ എന്നിവയുടെ പ്രയോഗം ഉണ്ടായിരുന്നില്ല.
  • ഗുണനിലവാരം: ഓരോ സംഭാഷണ റെക്കോർഡിംഗും കർശനമായ ഗുണനിലവാര പരിശോധനകൾക്കും മൂല്യനിർണ്ണയത്തിനും വിധേയമാക്കി. ഈ മൂല്യനിർണ്ണയം വിജയിച്ച റെക്കോർഡിംഗുകൾ മാത്രമാണ് കൈമാറിയത്. സമ്മതിച്ച ഗുണനിലവാര മാനദണ്ഡങ്ങളിൽ കുറവുള്ള എല്ലാ ഫയലുകളും വീണ്ടും റെക്കോർഡ് ചെയ്യുകയും അധിക നിരക്കുകളൊന്നും കൂടാതെ നൽകുകയും ചെയ്തു
പരിഹാരം
ഫലം

ഫലം

ഉയർന്ന നിലവാരമുള്ള ബ്രാൻഡ് കീ വാചകം ഓഡിയോ ഡാറ്റ അല്ലെങ്കിൽ വോയ്‌സ് പ്രോംപ്റ്റുകൾ ഓട്ടോമോട്ടീവ് കമ്പനികളെയും അവരുടെ ഉപഭോക്താക്കളെയും ഇനിപ്പറയുന്നവ ഉപയോഗിച്ച് പ്രാപ്തമാക്കും:

  1. ബ്രാൻഡിംഗും ഐഡന്റിറ്റിയും: ബ്രാൻഡ് തിരിച്ചുവിളിക്കൽ വർദ്ധിപ്പിക്കുന്ന ഉപയോക്താവും ബ്രാൻഡും തമ്മിൽ നേരിട്ടുള്ളതും അവിസ്മരണീയവുമായ ഒരു ബന്ധം സൃഷ്ടിക്കാൻ കമ്പനികളെ പ്രത്യേക ബ്രാൻഡ് ശൈലിയിലുള്ള വോയ്‌സ് പ്രോംപ്റ്റുകൾ സഹായിക്കുന്നു.
  2. ഉപയോഗിക്കാന് എളുപ്പം: വോയ്‌സ് കമാൻഡുകൾ ഡ്രൈവർമാർക്ക് ചക്രത്തിൽ നിന്ന് കൈകൾ എടുക്കാതെയോ റോഡിൽ നിന്ന് കണ്ണുകളെടുക്കാതെയോ വാഹനങ്ങളുമായി ഇടപഴകുന്നത് എളുപ്പമാക്കുന്നു, അതുവഴി റോഡ് സുരക്ഷ വർദ്ധിപ്പിക്കുന്നു.
  3. പ്രവർത്തനം: വോയ്‌സ് കമാൻഡുകൾ കാർ ഫീച്ചറുകൾ ആക്‌സസ് ചെയ്യുന്നതും നിയന്ത്രിക്കുന്നതും കൂടുതൽ അവബോധജന്യമാക്കുന്നു. അതിന്റെ നാവിഗേഷൻ, മീഡിയ പ്ലേബാക്ക്, അല്ലെങ്കിൽ കാലാവസ്ഥാ നിയന്ത്രണം.
  4. മറ്റ് സിസ്റ്റങ്ങളുമായുള്ള സംയോജനം: സ്‌മാർട്ട്‌ഫോണുകൾ, സ്‌മാർട്ട് ഹോം ഉപകരണങ്ങൾ, മറ്റ് ഐഒടി ഉപകരണങ്ങൾ എന്നിവയുമായി നിരവധി വോയ്‌സ്-ആക്ടിവേറ്റഡ് സിസ്റ്റങ്ങൾ സംയോജിപ്പിച്ചിരിക്കുന്നു. ഉദാഹരണത്തിന്, ഒരു ഉപയോക്താവ് വീട്ടിലേക്ക് അടുക്കുമ്പോൾ അവരുടെ കാറിനോട് വീട്ടിലെ ലൈറ്റുകൾ ഓണാക്കാൻ ആവശ്യപ്പെടാം.
  5. കുറയണം അഡ്വാന്റേജ്: നൂതന വോയ്‌സ്-ആക്ടിവേറ്റഡ് സിസ്റ്റങ്ങൾ വാഗ്ദാനം ചെയ്യുന്നത് ഒരു വിൽപ്പന പോയിന്റും ഒരു വ്യതിരിക്തവുമാണ്. ഒരു പുതിയ കാർ വാങ്ങുമ്പോൾ വാങ്ങുന്നവർ ഏറ്റവും പുതിയ സാങ്കേതികവിദ്യയ്ക്കായി നോക്കുന്നു.
  6. ഭാവി പ്രൂഫിംഗ്: സാങ്കേതികവിദ്യ വികസിക്കുകയും IoT ദൈനംദിന ജീവിതവുമായി കൂടുതൽ സംയോജിപ്പിക്കുകയും ചെയ്യുമ്പോൾ, ശക്തമായ വോയ്‌സ്-ആക്റ്റിവേറ്റഡ് സിസ്റ്റം ഉള്ളത് ഭാവിയിലെ സാങ്കേതികവിദ്യയുമായി കൂടുതൽ പൊരുത്തപ്പെടാൻ ഓട്ടോമോട്ടീവ് കമ്പനികളെ സ്ഥാനപ്പെടുത്തുന്നു.
  7. വരുമാന സാധ്യതകൾ: അധിക ധനസമ്പാദന അവസരങ്ങൾ അതായത്, വോയ്‌സ് സിസ്റ്റങ്ങൾ ശുപാർശകൾ അല്ലെങ്കിൽ സംയോജിത ഇ-കൊമേഴ്‌സ് അനുഭവങ്ങൾ (ഭക്ഷണം ഓർഡർ ചെയ്യുന്നതോ അടുത്തുള്ള സേവനങ്ങൾ കണ്ടെത്തുന്നതോ പോലുള്ളവ) വാഗ്ദാനം ചെയ്യുന്നു.
ഗോൾഡൻ-5-നക്ഷത്രം

ഓട്ടോമോട്ടീവ് മേഖലയ്ക്കായി ഞങ്ങൾ വോയ്‌സ് പ്രോംപ്റ്റുകൾ സോഴ്‌സ് ചെയ്യാൻ തുടങ്ങിയപ്പോൾ, വെല്ലുവിളികൾ നിരവധിയായിരുന്നു. ഞങ്ങളുടെ ക്ലയന്റിൻറെ ആഗോള ഉപഭോക്താക്കളെ പ്രതിനിധീകരിക്കുന്നതിന് സംഭാഷണം, ഉച്ചാരണങ്ങൾ, ടോണുകൾ എന്നിവയിലെ വൈവിധ്യം പകർത്തുന്നത് വളരെ പ്രധാനമാണ്. വെണ്ടർ എന്ന നിലയിൽ മാത്രമല്ല, ഒരു യഥാർത്ഥ പങ്കാളി എന്ന നിലയിലും ഷൈപ്പ് വേറിട്ടു നിന്നു. വിവിധ പ്രദേശങ്ങളിൽ നിന്നുള്ള വൈവിധ്യമാർന്ന ശബ്ദങ്ങൾ സുരക്ഷിതമാക്കാനുള്ള അവരുടെ പ്രതിബദ്ധത പ്രശംസനീയമായിരുന്നു. അവർ കേവലം ശബ്ദങ്ങൾ ശേഖരിക്കുന്നതിന് അപ്പുറത്തേക്ക് പോയി; ഞങ്ങളുടെ പ്രോജക്റ്റ് ആവശ്യകതകളുടെ സൂക്ഷ്മതകൾ അവർ മനസ്സിലാക്കി, മികച്ച റെക്കോർഡിംഗുകൾ ഉറപ്പുനൽകുന്നു. ഓഡിയോ കളക്ഷൻ സ്റ്റാൻഡേർഡുകളോടുള്ള അവരുടെ കുറ്റമറ്റ അനുസരണം അവരുടെ പ്രൊഫഷണലിസവും പ്രോജക്റ്റിനോടുള്ള അർപ്പണബോധവും പ്രകടമാക്കി.

നിങ്ങളുടെ സംഭാഷണ AI ത്വരിതപ്പെടുത്തുക
ആപ്ലിക്കേഷൻ വികസനം 100%