സ്പീച്ച് ഇമോഷൻ & സെൻ്റിമെൻ്റ് അനാലിസിസ്

AI- നയിക്കുന്ന സ്ഥിതിവിവരക്കണക്കുകൾ ഉപയോഗിച്ച് മികച്ച കോൾ സെൻ്ററുകൾ പ്രവർത്തനക്ഷമമാക്കുന്നു

മെച്ചപ്പെട്ട ഉപഭോക്തൃ സേവനത്തിനായി തത്സമയ വികാരവും വികാരം കണ്ടെത്തലും വർദ്ധിപ്പിക്കുന്നതിന് ഓഡിയോ ഡാറ്റ ശേഖരണത്തിലും വ്യാഖ്യാനത്തിലും ഷൈപ്പിൻ്റെ വൈദഗ്ദ്ധ്യം പ്രയോജനപ്പെടുത്തുന്നു.

സംഭാഷണ വികാരവും വികാര വിശകലനവും

ഓട്ടോമേറ്റഡ് സ്പീച്ച് ഇമോഷൻ & സെൻ്റിമെൻ്റ് അനാലിസിസ്

കോൾ സെൻ്ററുകൾക്കായി ഒരു ഓട്ടോമേറ്റഡ് സ്പീച്ച് ഇമോഷൻ ആൻഡ് സെൻ്റിമെൻ്റ് അനാലിസിസ് മോഡൽ വികസിപ്പിക്കുന്നതിന് ക്ലയൻ്റ് ഷൈപ്പുമായി സഹകരിച്ചു. യുഎസ്, യുകെ, ഓസ്‌ട്രേലിയൻ, ഇന്ത്യൻ എന്നീ നാല് ഇംഗ്ലീഷ് ഭാഷകളിലുടനീളം 250 മണിക്കൂർ കോൾ സെൻ്റർ ഓഡിയോ ഡാറ്റ ശേഖരിക്കുന്നതും വ്യാഖ്യാനിക്കുന്നതും പ്രോജക്റ്റിൽ ഉൾപ്പെടുന്നു. ഹാപ്പി, ന്യൂട്രൽ, ആംഗ്രി തുടങ്ങിയ വികാരങ്ങളും തത്സമയ ഉപഭോക്തൃ ഇടപെടലുകളിൽ അസംതൃപ്തരും സംതൃപ്തരും പോലുള്ള വികാരങ്ങളും കണ്ടെത്തുന്നതിന് ക്ലയൻ്റിനെ അവരുടെ AI മോഡലുകൾ മെച്ചപ്പെടുത്താൻ ഇത് പ്രാപ്തമാക്കി.

ആക്ഷേപഹാസ്യം കണ്ടെത്തൽ, വ്യത്യസ്തമായ ഓഡിയോ ദൈർഘ്യം, അസംതൃപ്തിയുടെ സൂക്ഷ്മമായ വാക്കാലുള്ള സൂചനകൾ, കൃത്യവും അളക്കാവുന്നതുമായ ഫലങ്ങൾ നൽകൽ തുടങ്ങിയ വെല്ലുവിളികളെ പ്രോജക്റ്റ് അതിജീവിച്ചു.

ഓട്ടോമേറ്റഡ് സ്പീച്ച് ഇമോഷൻ & സെൻ്റിമെൻ്റ് വിശകലനം

പ്രധാന സ്ഥിതിവിവരക്കണക്കുകൾ

കോൾ സെൻ്റർ ഓഡിയോ ഡാറ്റ ശേഖരിക്കുകയും 4 ഇംഗ്ലീഷ് ഭാഷകളിൽ ഉടനീളം വ്യാഖ്യാനിക്കുകയും ചെയ്തു

ചൊവ്വാഴ്ച

ഭാഷകളുടെ എണ്ണം

യുഎസ് ഇംഗ്ലീഷ്, യുകെ ഇംഗ്ലീഷ്, ഓസ്‌ട്രേലിയൻ ഇംഗ്ലീഷ്, ഇന്ത്യൻ ഇംഗ്ലീഷ്

കേസുകൾ ഉപയോഗിക്കുക

ഓട്ടോമേറ്റഡ് സ്പീച്ച് ഇമോഷൻ & സെൻ്റിമെൻ്റ് അനാലിസിസ്

പദ്ധതി വ്യാപ്തി

ഇംഗ്ലീഷിൻ്റെ നാല് ഭാഷകളിൽ 250 മണിക്കൂർ കോൾ സെൻ്റർ ഓഡിയോ ഡാറ്റ ശേഖരിക്കുകയും വ്യാഖ്യാനിക്കുകയും ചെയ്യുക:

  • യുഎസ് ഇംഗ്ലീഷ് (30%)
  • യുകെ ഇംഗ്ലീഷ് (30%)
  • ഓസ്‌ട്രേലിയൻ ഇംഗ്ലീഷ് (20%)
  • ഇന്ത്യൻ ഇംഗ്ലീഷ് (20%)

പരിധിയിൽ

പദ്ധതി മൂന്ന് ഭാഗങ്ങൾ ഉൾക്കൊള്ളുന്നു:

  • മെറ്റാഡാറ്റ ഉൾപ്പെടെയുള്ള നിർദ്ദിഷ്ട എൻ്റിറ്റികളുള്ള ഓഡിയോ ഡാറ്റ.
  • സെഗ്‌മെൻ്റേഷനും ടൈം സ്റ്റാമ്പിംഗ് വിശദാംശങ്ങളും ഉള്ള അനുബന്ധ ട്രാൻസ്‌ക്രൈബ് ചെയ്ത ഫയലുകൾ.
  • വികാരവും വികാരവും വ്യാഖ്യാനങ്ങൾ:
    • ഓഡിയോ ഇമോഷൻ: സന്തോഷം, നിഷ്പക്ഷത, ദേഷ്യം
    • ട്രാൻസ്ക്രിപ്ഷൻ വികാരം: അങ്ങേയറ്റം അസംതൃപ്തൻ, അസംതൃപ്തൻ, നിഷ്പക്ഷത, സംതൃപ്തി, അങ്ങേയറ്റം സംതൃപ്തി

വെല്ലുവിളികൾ

ഭാഷാഭേദങ്ങളുടെ വൈവിധ്യം

ഓഡിയോ ഡാറ്റ നിർദ്ദിഷ്ട ഭാഷകളെ (യുഎസ്, യുകെ, ഓസ്‌ട്രേലിയൻ, ഇന്ത്യൻ) കൃത്യമായി പ്രതിനിധീകരിക്കുന്നുവെന്ന് ഉറപ്പാക്കുന്നത് വെല്ലുവിളി നിറഞ്ഞതാണ്. ഈ വിഭാഗങ്ങൾക്കുള്ളിലെ വ്യത്യസ്‌ത പ്രദേശങ്ങൾ വ്യത്യസ്‌തമായ പദാവലി, ഉച്ചാരണങ്ങൾ, ഉച്ചാരണം എന്നിവ ഉപയോഗിച്ചേക്കാം.

വൈദഗ്ധ്യം ആവശ്യകത

വികാരത്തിനും വികാരത്തിനുമായി ഓഡിയോയും ട്രാൻസ്ക്രിപ്ഷനുകളും വ്യാഖ്യാനിക്കുന്നതിന് ഓരോ ഭാഷയുടെയും സാംസ്കാരിക സൂക്ഷ്മതകളും ഭാഷാപരമായ സൂക്ഷ്മതകളും പരിചിതമായ പരിശീലനം ലഭിച്ച വ്യാഖ്യാനകർ ആവശ്യമാണ്.

വികാരങ്ങളുടെയും വികാരങ്ങളുടെയും സങ്കീർണ്ണത

ഓഡിയോ ഇമോഷനും ട്രാൻസ്‌ക്രിപ്‌ഷൻ വികാരവും എല്ലായ്‌പ്പോഴും യോജിപ്പിക്കില്ല. ഉദാഹരണത്തിന്, ഒരു വ്യക്തിക്ക് ദേഷ്യം തോന്നുമെങ്കിലും യഥാർത്ഥത്തിൽ സംതൃപ്തി പ്രകടിപ്പിക്കാം. ഉദാ, "ഓ, അത്ഭുതം, എൻ്റെ പ്രശ്നം പരിഹരിക്കാൻ കഴിയാത്ത മറ്റൊരാൾ" എന്നതുപോലുള്ള പരിഹാസ വാക്യങ്ങളിൽ പരിഹാസ സംഭാഷണങ്ങൾ കൈകാര്യം ചെയ്യുന്നത് വികാരത്തിനും വികാരത്തിനും ശരിയായി വ്യാഖ്യാനിക്കേണ്ടതുണ്ട്.

ഓഡിയോ ഗുണം

ഓഡിയോ റെക്കോർഡിംഗുകളുടെ ഗുണനിലവാരം വ്യത്യാസപ്പെടാം, ഇത് ട്രാൻസ്ക്രിപ്ഷൻ കൃത്യതയെയും വികാരങ്ങൾ കണ്ടെത്തുന്നതിനെയും ബാധിക്കുന്നു. പശ്ചാത്തല ശബ്‌ദം, ഓവർലാപ്പ് ചെയ്യുന്ന സംഭാഷണങ്ങൾ, വ്യത്യസ്‌ത റെക്കോർഡിംഗ് ഉപകരണങ്ങൾ എന്നിവ കാര്യമായ വെല്ലുവിളികൾ ഉയർത്തും.

കൃത്യമായി പിടിച്ചെടുക്കുന്നു

കനത്ത ശ്വാസോച്ഛ്വാസം അല്ലെങ്കിൽ നിരാശയുടെ മറ്റ് അടയാളങ്ങൾ പോലുള്ള വാക്കാലുള്ള സൂചനകളിലൂടെയുള്ള അസംതൃപ്തി.

പരിഹാരം

അഡ്വാൻസ്ഡ് നാച്ചുറൽ ലാംഗ്വേജ് പ്രോസസ്സിംഗ് (NLP) സാങ്കേതിക വിദ്യകൾ പ്രയോജനപ്പെടുത്തി, ഇനിപ്പറയുന്ന പരിഹാരങ്ങൾ നടപ്പിലാക്കി:

ഡാറ്റ ശേഖരണം

  • 250 മണിക്കൂർ ഓഡിയോ ഡാറ്റ ഭാഷാ-നിർദ്ദിഷ്ട ക്വാട്ടകളായി വിഭജിച്ചു.
    • യുഎസ് ഇംഗ്ലീഷ് (30% അല്ലെങ്കിൽ 75 മണിക്കൂർ)
    • യുകെ ഇംഗ്ലീഷ് (30% അല്ലെങ്കിൽ 75 മണിക്കൂർ)
    • ഓസ്‌ട്രേലിയൻ ഇംഗ്ലീഷ് (20% അല്ലെങ്കിൽ 50 മണിക്കൂർ)
    • ഇന്ത്യൻ ഇംഗ്ലീഷ് (20% അല്ലെങ്കിൽ 50 മണിക്കൂർ)
  • യുഎസ്, യുകെ, ഓസ്‌ട്രേലിയ, ഇന്ത്യ എന്നിവിടങ്ങളിൽ നിന്നുള്ള പ്രാദേശിക ഉച്ചാരണ ഉപയോക്താക്കൾ.
  • വോയ്‌സ് ഇമോഷൻ കോപവും ടെക്‌സ്‌റ്റ് വികാരം അതൃപ്‌തിയോ അങ്ങേയറ്റം അതൃപ്‌തിയോ ഉള്ള സന്ദർഭങ്ങളിൽ പ്രത്യേക ശ്രദ്ധ നൽകിക്കൊണ്ട്, വ്യത്യസ്‌ത സ്വരങ്ങൾ അടങ്ങിയ സ്‌പീച്ച് സാമ്പിളുകൾ.

വാചക വർഗ്ഗീകരണം/വിവരണം

വാചക വർഗ്ഗീകരണം

  • നിർദ്ദിഷ്ട വിഭാഗങ്ങളെ അടിസ്ഥാനമാക്കിയുള്ള വികാരങ്ങളുടെയും വികാരങ്ങളുടെയും വ്യാഖ്യാനം:
    • ഓഡിയോ ഇമോഷൻ: സന്തോഷം, നിഷ്പക്ഷത, ദേഷ്യം.
    • ട്രാൻസ്ക്രിപ്ഷൻ വികാരം: അങ്ങേയറ്റം അസംതൃപ്തി, അസംതൃപ്തി, നിഷ്പക്ഷത, സംതൃപ്തി, അങ്ങേയറ്റം സംതൃപ്തി.
  • ഓരോ ഓഡിയോ സെഗ്‌മെൻ്റിലും ഒരു പ്രാഥമിക വികാരം മാത്രമേ അടങ്ങിയിട്ടുള്ളൂ.
  • സംഭാഷണങ്ങൾക്കുള്ളിൽ വ്യത്യസ്ത കാലതാമസം സെഗ്‌മെൻ്റുകൾ (2 മുതൽ 30 സെക്കൻഡ് വരെ) പ്രയോഗിച്ചു.
  • ഇടത്, വലത് സ്പീക്കർ വിവരങ്ങൾ, വികാര ടാഗുകൾ, അവസാന സെഗ്‌മെൻ്റ് വികാരം എന്നിവ ഉൾപ്പെടെ, ട്രാൻസ്‌ക്രിപ്ഷൻ ഫോർമാറ്റ് JSON ഔട്ട്‌പുട്ടിനെ പിന്തുടർന്നു.

 

ക്വാളിറ്റി അഷ്വറൻസ്

ഗുണമേന്മ
ട്രാൻസ്ക്രിപ്ഷൻ കൃത്യത:

  • കുറഞ്ഞത് 250 മണിക്കൂർ ഓഡിയോ ഡെലിവർ ചെയ്തിട്ടുണ്ടെന്ന് ഉറപ്പാക്കി:
    • 90% ട്രാൻസ്ക്രിപ്ഷൻ പിശക് നിരക്ക് (TER) കൃത്യത.
    • 95% വേഡ് റെക്കഗ്നിഷൻ റേറ്റ് (WER) കൃത്യത.

QA പ്രക്രിയ:

  • ഡാറ്റാസെറ്റിൽ നിന്ന് ക്രമരഹിതമായി തിരഞ്ഞെടുത്ത സാമ്പിളുകളുടെ പതിവ് ഓഡിറ്റുകൾ നടത്തി.
    • ഡാറ്റാസെറ്റിലുടനീളം TER, WER എന്നിവ അളക്കാൻ ഓട്ടോമേറ്റഡ് ടൂളുകൾ ഉപയോഗിച്ചു.
    • ഫ്ലാഗുചെയ്‌ത വിഭാഗങ്ങളുടെ സ്വമേധയാലുള്ള അവലോകനം കൃത്യത പരിധികൾ പാലിക്കുന്നുണ്ടെന്ന് ഉറപ്പാക്കി.

ഫലം

പരിശീലന ഡാറ്റ ഒരു ഓട്ടോമേറ്റഡ് ഇമോഷനും സെൻ്റിമെൻ്റ് ഡിറ്റക്ഷൻ മോഡലും വികസിപ്പിക്കുന്നതിന് പിന്തുണയ്‌ക്കും:

  • കോൾ സെൻ്റർ ഇടപെടലുകളിൽ തത്സമയ വികാരം കണ്ടെത്തൽ.
  • പരിഹാസം അല്ലെങ്കിൽ അസംതൃപ്തി പോലുള്ള സങ്കീർണ്ണമായ കേസുകൾ കൂടുതൽ ഫലപ്രദമായി കൈകാര്യം ചെയ്യുക.
  • ഭാവി പ്രോജക്റ്റുകൾക്കുള്ള സ്കേലബിളിറ്റി, വർദ്ധിച്ച ഡാറ്റ വോള്യങ്ങളിലേക്കും കൂടുതൽ ഭാഷകളിലേക്കും എളുപ്പത്തിൽ പൊരുത്തപ്പെടുന്നു.

ഡെലിവർവർസ്

  • 250 മണിക്കൂർ ഓഡിയോ ഫയലുകൾ (8 kHz PCM WAV ഫോർമാറ്റിൽ, മോണോ)
  • ട്രാൻസ്ക്രിപ്ഷൻ ഫയലുകൾ (സെഗ്മെൻ്റേഷൻ, സെൻ്റിമെൻ്റ് ടാഗുകൾ, സ്പീക്കർ ഐഡൻ്റിഫയറുകൾ എന്നിവയോടൊപ്പം)
  • മെറ്റാഡാറ്റ (ഓഡിയോ ദൈർഘ്യം, സ്പീക്കർ വിശദാംശങ്ങൾ മുതലായവ)

ഞങ്ങളുടെ കോൾ സെൻ്റർ ഡാറ്റ പ്രോജക്റ്റിനായി Shaip-മായി സഹകരിക്കുന്നത് ഞങ്ങളുടെ AI സൊല്യൂഷനുകൾ വികസിപ്പിക്കുന്നതിൽ ഒരു സുപ്രധാന നിമിഷമാണ്. യുഎസ്, യുകെ, ഓസ്‌ട്രേലിയൻ, ഇന്ത്യൻ എന്നീ നാല് പ്രധാന ഇംഗ്ലീഷ് ഭാഷകളിൽ ഉടനീളം 250 മണിക്കൂർ ഓഡിയോ ഡാറ്റ അവരുടെ ടീം വിദഗ്ധമായി ശേഖരിക്കുകയും വ്യാഖ്യാനിക്കുകയും ചെയ്തു. ഈ പ്രദേശങ്ങളിലുടനീളമുള്ള ഭാഷാപരമായ സൂക്ഷ്മതകളിലേക്കുള്ള ശ്രദ്ധ ഞങ്ങളുടെ സംഭാഷണ തിരിച്ചറിയൽ മോഡലുകളുടെ കൃത്യതയെ ഗണ്യമായി മെച്ചപ്പെടുത്തി. കൂടാതെ, സങ്കീർണ്ണമായ ഡാറ്റ വ്യാഖ്യാന പദ്ധതികൾ കൈകാര്യം ചെയ്യുന്നതിൽ ഷായ്‌പിൻ്റെ വൈദഗ്ദ്ധ്യം, സ്കെയിലിൽ വിശ്വസനീയവും അനുസരണമുള്ളതുമായ മോഡലുകൾ നിർമ്മിക്കാൻ ഞങ്ങളെ സഹായിക്കുന്നതിൽ പ്രധാന പങ്കുവഹിച്ചിട്ടുണ്ട്.

ഗോൾഡൻ-5-നക്ഷത്രം