Ses analizi

Vikipedi, özgür ansiklopedi

Ses analizi ya da Konuşma analizi, iletişimi ve gelecekteki etkileşimi iyileştirmek için müşteri bilgilerini toplamak üzere kaydedilen çağrıları analiz etme sürecidir. Süreç, öncelikle müşteri iletişim merkezleri tarafından bir işletmeyle müşteri etkileşimlerinde ihtiyaçları çıkarmak için kullanılır.[1]

Konuşma analitiği, otomatik konuşma ve tanıma unsurlarının varlığına rağmen, konuşmanın duygusal tonu ve etkileşim sırasında konuşma ile konuşmama miktarına bağlı konumlarına göre tartılan konuyu analiz ettiği bilinmektedir. İletişim merkezlerindeki konuşma analitiği, etkin maliyet sınırlaması ve müşteri hizmetleri stratejileri oluşturmak için gerekli olan zekayı ortaya çıkarmak ve kaydedilen müşteri etkileşimlerini araştırmak için kullanılabilir. Teknoloji, maliyet etkenlerini belirleyebilir ve trend analizi yapabilir, süreçler ile birlikte ürünlerinde güçlü ve zayıf yönleri belirleyebilir bunun sonucunda pazarın teklifleri nasıl algıladığını anlamaya yardımcı olmayı sağlamaktadır.[2]

Tanım[değiştir | kaynağı değiştir]

Konuşma analizi, bir şirket ile müşterileri arasındaki kayıtlı telefon görüşmelerinin kategorik analizini oluşturur.[3] Müşteri aramalarından gelişmiş işlevsellik ve değerli istihbarat sağlar. Bu bilgileri strateji, ürün, süreç, operasyonel sorunlar ve iletişim merkezi temsilcisi performansıyla ilgili bilgileri keşfetmek için kullanılabilir.[4] Ek olarak, konuşma analizi, iletişim merkezi temsilcilerinin ek eğitime veya eğitime ihtiyaç duyabileceği alanları otomatik olarak belirleyebilir[5] ve aramalarda sağlanan müşteri hizmetini otomatik olarak izleyebilir.[6]

Süreç, belirli bir süre içinde en sık kullanılan kelimeleri sıralar ve cümleleri teker teker algılayarak kullanımın yükselişte ya da düşüş eğiliminde olduğunu gösterebilir. Bu bilgiler, bir kuruluştaki denetçiler, analistler ve diğer kişiler için tüketici davranışındaki değişiklikleri tespit etmek ve çağrı hacimlerini azaltmak ve müşteri memnuniyetini artırmak için harekete geçmek için kullanışlıdır. Müşterinin düşünce sürecine ilişkin bir fikir sağlar ve bu da şirketlerin ayarlamalar yapması için bir fırsat yaratır.[7]

Kullanım[değiştir | kaynağı değiştir]

Konuşma analizi uygulamaları, günlük hayattaki sesle gerçek zamanlı uyarılar alarak veya kaydedilen konuşma üzerinde bir işlem sonrası adım olarak sözlü anahtar kelimeleri veya cümleleri tespit edebilir. Bu teknik aynı zamanda ses madenciliği olarak da bilinir. Diğer kullanımlar, memnun olmayan müşterilerden gelen çağrıları belirlemek için iletişim merkezi ortamında konuşmanın sınıflandırılmasını içerir.[8]

Bilgi alma alanında yaygın olarak kullanılan Kesinlik ve geri çağırma gibi önlemler, bir konuşma analitiği arama sisteminin yanıtını ölçmenin tipik yollarıdır.[9] Kesinlik, sorguyla alakalı arama sonuçlarının oranını ölçer. Geri çağırma, arama sonuçları tarafından döndürülen toplam ilgili öğe sayısının oranını ölçer. Standartlaştırılmış bir test setinin kullanıldığı durumlarda, farklı konuşma analizi sistemlerinin arama performansını doğrudan karşılaştırmak için hassasiyet ve geri çağırma gibi ölçümler kullanılabilir.

Farklı konuşma analizi sistemlerinin doğruluğunun anlamlı bir karşılaştırmasını yapmak zor olabilir. LVCSR sistemlerinin çıktısı, kelime hata oranı (WER) için bir değer üretmek için referans kelime düzeyinde transkripsiyonlara göre puanlanabilir, ancak fonetik sistemler, kelimeleri değil, temel tanıma birimi olarak telefonları kullandığından, bu ölçüyü kullanarak karşılaştırmalar yapılamaz. . Konuşma analizi sistemleri, söylenen kelimeleri veya cümleleri aramak için kullanıldığında, kullanıcı için önemli olan, döndürülen arama sonuçlarının doğruluğudur. Bireysel tanıma hatalarının bu arama sonuçları üzerindeki etkisi büyük ölçüde değişebileceğinden, kelime hata oranı gibi ölçüler, kullanıcı perspektifinden genel arama doğruluğunu belirlemede her zaman yardımcı olmaz.

ABD Hükûmeti Sorumluluk Bürosuna göre,[10] "veri güvenilirliği, amaçlandıkları kullanımlar göz önüne alındığında, bilgisayarda işlenen verilerin doğruluğu ve eksiksizliği anlamına gelir." Konuşma Tanıma ve Analitik alanında, "tamlık" "algılama oranı" ile ölçülür ve genellikle doğruluk arttıkça algılama oranı düşer.

Teknoloji[değiştir | kaynağı değiştir]

Konuşma analizi satıcıları bir 3. tarafın "motorunu" kullanır ve diğerleri özel motorlar geliştirir. Teknoloji esas olarak üç yaklaşım kullanır. Fonetik yaklaşım, işlem için en hızlı olanıdır, çünkü çoğunlukla gramerin boyutu çok küçüktür ve temel tanıma birimi bir fonemdir. Çoğu dilde onlarca benzersiz ses birimi vardır ve bu tanımanın çıktısı, daha sonra aranabilen bir ses birimi akışıdır. Geniş kelime dağarcığı sürekli konuşma tanıma (LVCSR), daha yaygın olarak konuşmadan metne, tam transkripsiyon veya ASR (otomatik konuşma tanıma olarak bilinir), temel birim olarak bir dizi kelime (bir-gram, iki-gram vb.) Kullanır. Bu yaklaşım, sese karşı eşleşmesi için yüz binlerce kelime gerektirir. Yeni iş sorunlarını ortaya çıkarabilir, sorgular çok daha hızlıdır ve doğruluğu ses bilgisi yaklaşımdan daha yüksektir.

Genişletilmiş konuşma duygu tanıma ve tahmini, üç ana sınıflandırıcıya dayanır: kNN, C4.5 ve SVM RBF Kernel. Bu set, ayrı ayrı alınan her bir temel sınıflandırıcıdan daha iyi performans sağlar. Diğer iki sınıflandırıcı grubuyla karşılaştırılır: Karma çekirdekli bire karşı (OAA) çok sınıflı SVM ve aşağıdaki iki temel sınıflandırıcıdan oluşan sınıflandırıcılar kümesi: C5.0 ve Sinir Ağı. Önerilen varyant, diğer iki grup sınıflandırıcıdan daha iyi performans elde eder.[11]

Gelişim[değiştir | kaynağı değiştir]

Pazar araştırması, konuşma analizinin 2020 yılına kadar milyar dolarlık bir endüstri haline geleceğinin ve Kuzey Amerika'nın en büyük pazar payına sahip olacağının tahmin edildiğini gösteriyor.[12] Büyüme oranı, uyumluluk ve risk yönetimi için artan gereksinimlerin yanı sıra piyasa istihbaratı yoluyla endüstri rekabetindeki artışa bağlanıyor.[13] Endüstrinin telekomünikasyon, BT ve dış kaynak kullanımı segmentlerinin seyahat ve konaklama segmentlerinden beklenen büyüme ile en büyük pazar payına sahip olduğu düşünülmektedir.[12]

Ayrıca bakınız[değiştir | kaynağı değiştir]

Kaynakça[değiştir | kaynağı değiştir]

  1. ^ "Arşivlenmiş kopya". 21 Mayıs 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Mayıs 2021. 
  2. ^ January 8, Mary Shacklett in Big Data on; 2016; Pst, 7:55 Am. "Speech analytics: Why the big data source isn't music to your competitors' ears". TechRepublic (İngilizce). 12 Ocak 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Mayıs 2021. 
  3. ^ "Top five benefits of speech analytics tools for contact centers". SearchCustomerExperience (İngilizce). 27 Eylül 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Mayıs 2021. 
  4. ^ "Workforce Engagement Management Capabilities". Genesys (İngilizce). 14 Ağustos 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Mayıs 2021. 
  5. ^ "Why reduction of silence periods is a goal". Xdroid Voice Analytics (İngilizce). 2 Ağustos 2019. 7 Kasım 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Mayıs 2021. 
  6. ^ "Do Speech Analytics Tools Change Agent Behavior?". www.icmi.com (İngilizce). 19 Eylül 2020 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Mayıs 2021. 
  7. ^ Fotta, Jeffrey (13 Ocak 2015). "Reverse a Pattern of Poor Sales With Speech Analytics". Entrepreneur (İngilizce). 30 Ocak 2015 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Mayıs 2021. 
  8. ^ "The Age of Speech Analytics Is Close at Hand". www.destinationcrm.com. 8 Ekim 2015 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  9. ^ editor., Pennington, Diane Rasmussen, (2012). Indexing and retrieval of non-text information. De Gruyter. ISBN 3-11-026057-3. OCLC 994403879. 
  10. ^ Office., United States. Government Accountability (2009). Assessing the reliability of computer-processed data. U.S. Govt. Accountability Office. OCLC 427865420. 
  11. ^ Theodoros, Anagnostopoulos; Khoruzhnikov, Sergey E.; A, Grudinin Vladimir; Christos, Skourlas (11 Aralık 2014). "EXTENDED SPEECH EMOTION RECOGNITION AND PREDICTION". Journal Scientific and Technical Of Information Technologies, Mechanics and Optics. 94 (6): 137-145. 23 Mayıs 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  12. ^ a b MarketsandMarkets. "Speech Analytics Market Worth 1.60 Billion USD by 2020". www.prnewswire.com (İngilizce). 17 Nisan 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021. 
  13. ^ MENAFN. "Speech-Analytics-Industry-Market-Share-Size-Growth--Forecast-2025". www.menafn.com. 23 Mayıs 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 23 Mayıs 2021.