ग्राहक मंथन: ते ठेवण्यासाठी त्यांना कसे ओळखावे

प्रत्येक कंपनीला आपल्या ग्राहकांना भरभराट होणे आवश्यक आहे. तरीही तेथे नेहमीच ग्राहक निघण्यास तयार असतात. ग्राहकांच्या जोखमीच्या प्रोफाइलवर अवलंबून तो अधिक किंवा कमी गंभीर होऊ शकतो. तरीही आपल्या सर्व ग्राहकांना ते सोडण्याऐवजी ठेवता येईल. परंतु या ग्राहकांना टिकवून ठेवण्यापूर्वी, त्यांना ओळखण्यास सक्षम असणे आवश्यक आहे. आणि येथे विश्लेषणे येतात.

आजच्या जगात आपल्याबरोबर सेवेसह असलेला प्रत्येक संवाद रेकॉर्ड केला जातो - आपण वेबसाइटवर लॉग इन केले किंवा आपण एखादे गाणे ऐकले वगैरे. हे मोठ्या संख्येने डेटाचे प्रतिनिधित्व करते - जे हे कसे संग्रहित करावे या समस्येस उपस्थित करते. तथापि, एकदा ही समस्या सुटल्यानंतर ती कंपनीला काही वास्तविक मूल्य देखील दर्शवू शकते कारण त्यामध्ये ग्राहकांच्या वागणूकीबद्दल बरीच माहिती असते. या ब्लॉग पोस्टमध्ये, ग्राहक जाण्याचा अंदाज लावण्यासाठी आम्ही ही माहिती वापरण्याचे अनेक मार्गांपैकी एक मार्ग सादर करू.

ग्राहक मंथन समजणे

ग्राहक मंथन आम्ही वरील परिच्छेदात केले अगदी तेच आहे. ग्राहक मंथन म्हणजे ग्राहक सेवा सोडतात. काही जण कदाचित एखाद्या स्पर्धकाकडे वळतात, काहींना कदाचित यापुढे सेवेत रस नसतो.

या ग्राहकांच्या जोखमीच्या प्रोफाइलवर अवलंबून हे सुरुवातीस फार गंभीर असू शकत नाही. तथापि त्यांची संख्या वाढल्यास दीर्घकाळ धोकादायक सिद्ध होऊ शकेल. म्हणूनच आम्ही - संगीत प्रवाह सेवा प्रदात्यात निर्णय-निर्माता म्हणून - त्यांना या जाण्यापासून रोखण्याचा प्रयत्न करण्यासाठी हे संभाव्य मंथन ओळखू इच्छितो.

असे करण्यासाठी, आम्ही प्रथम आमच्याकडे स्टोअरमध्ये काय आहे, आमच्याकडे कोणता डेटा आहे आणि तो या समस्येचे निराकरण करण्यात आपल्याला कशी मदत करू शकतो हे पहतो. पुढील भाग म्हणजे आपल्या प्रश्नांची उत्तरे देण्यासाठी सर्वोत्कृष्ट मॉडेल निवडणे - आणि तसे करण्यासाठी “बेस्ट” मॉडेलचा अर्थ काय आहे ते परिभाषित करणे आवश्यक आहे. एकदा आमच्याकडे आमचे मॉडेल आल्यानंतर आम्ही त्याचे लक्षणीय परिणाम होण्यासाठी मोठ्या प्रमाणावर तैनात करू. या निकालांसह आम्ही आमच्या ग्राहकांच्या मंथनाचे प्रमाण कमी करण्यासाठी अखेरीस कारवाई करण्यात सक्षम होऊ.

आमच्याकडे स्टोअरमध्ये कोणता डेटा आहे

प्रथम आपल्याकडे असलेल्या डेटाचे विश्लेषण करुन प्रारंभ करूया.

पूर्ण डेटासेट ही 12 जीबीची जेसन फाइल आहे - जी केवळ स्पार्क सारख्या विशिष्ट साधनाद्वारे हाताळली जाऊ शकते आणि क्लस्टरवर वितरित संगणन केले जाऊ शकते. आमचा डेटा पूर्णपणे समजून घेण्यासाठी, आम्ही प्रथम या डेटासेटच्या उपसेटकडे पाहू - एक 128Mb डेटासेट - जो अधिक सामान्य साधनांद्वारे हाताळला जाऊ शकतो. आम्ही काही अन्वेषण विश्लेषण करु आणि ग्राहक सेवा सोडण्याविषयी भाकीत करण्यासाठी संबंधित चल ओळखू.

सर्व प्रथम आम्हाला आपला डेटासेट लोड करणे आवश्यक आहे.

मग आम्ही आमच्या डेटासेटमध्ये संग्रहित डेटाचे द्रुत विहंगावलोकन वापरू शकतो.

जरी काही चल नावे अगदी स्पष्ट आहेत - जसे की कलाकार किंवा लिंग - या सर्व नसतात. उदाहरणार्थ “पृष्ठ” स्तंभ सेवेसह वापरकर्त्याचे परस्पर संवाद दर्शवितो - वापरकर्त्याने एखादे गाणे पसंत केले किंवा न आवडले किंवा त्याने सेवेस सोडले की नाही. हा स्तंभ सर्वात उपयुक्त ठरेल कारण यामुळे मंथन करणार्‍या ग्राहकांना ओळखण्याची परवानगी मिळते आणि यामुळे आपल्याला वापरकर्ता आणि सेवेमधील वारंवारता आणि परस्परसंवादाचे संकेत मिळू शकतात - खरंच आपण असे गृहित धरू शकतो की बर्‍याच परस्परसंवादाचा वापरकर्ता त्याऐवजी आहे समाधानी आणि सोडण्याची शक्यता नाही.

आता डेटाच्या अधिक तपशीलांकडे पाहू.

प्रथम आम्हाला सेवा सोडलेल्या वापरकर्त्यांची ओळख पटविणे आवश्यक आहे - जे “पृष्ठ” स्तंभाच्या “रद्दबातल पुष्टीकरण” मूल्याद्वारे केले जाऊ शकते.

आता आम्ही या मंथनांबद्दल स्पष्टीकरण शोधू शकतो आणि त्या कशा स्पष्ट करू शकाल. आम्ही 7 वैशिष्ट्ये ओळखली आहेत जी आम्हाला विश्वास आहेत की ग्राहक सेवा का सोडतात हे स्पष्ट करू शकेल. आम्ही मंथनाचे स्पष्टीकरण देऊ शकणारे फरक शोधण्यासाठी ग्राहकांना 2 गटात विभागले.

1. सेवेसह परस्पर संवाद

आम्ही पहात असलेले प्रथम व्हेरिएबल वापरकर्त्यांमधील आणि त्यांच्या सेवेमधील संवादांविषयी होते - “पृष्ठ” व्हेरिएबल. आम्ही प्रत्येक परस्परसंवादासाठी ग्राहकांच्या वर्तनाचे प्रतिनिधित्व करण्यासाठी बॉक्सप्लॉट्स वापरले. आम्ही बॉक्सप्लोट्स वापरला कारण हे दिलेल्या वितरणासाठी किमान, चतुर्थांश आणि कमाल दृश्यमान करण्यास मदत करते.

या बॉक्सप्लॉट्सवरून, आम्ही दोन गटांमध्ये पुढील परस्परसंवादातील महत्त्वपूर्ण फरक पाहू शकतो:

- मित्र जोडा

- प्लेलिस्टमध्ये जोडा

- मदत

- मुख्यपृष्ठ

- बाहेर पडणे

- नेक्स्टसॉन्ग

- उत्तम

लॉगआउट परस्पर संवाद वगळता - या परस्परसंवादाचे त्यांचे प्रोफाइल वाढविणार्‍या ग्राहकांशी संबद्ध केले जाऊ शकते जेणेकरून आम्ही असे मानू शकतो की ते सेवेत खूश आहेत.

२. ग्राहकांचे लिंग

असे दिसते की पुरुषांपेक्षा स्त्रिया सोडण्याची शक्यता जास्त असते.

3. संगीत प्ले करण्याचा सरासरी वेळ

एकूण संगीत प्ले वेळ दरम्यान गुणोत्तर app. is आहे तर लोकांच्या संख्येचे प्रमाण सेवेत राहिलेल्या ग्राहकांच्या बाजूने favor.3 आहे. खरंच हे अगदी स्पष्ट आहे की जेव्हा जेव्हा वापरकर्ता बरेच संगीत ऐकतो तेव्हा याचा अर्थ असा होतो की तो सेवेद्वारे समाधानी असेल ज्यामुळे त्याला सोडण्याची शक्यता नाही.

P. सशुल्क खाते विरुद्ध विनामूल्य खाते

हे शेवटच्या ज्ञात स्तराचे प्रतिनिधित्व आहे - याचा अर्थ असा आहे की त्यांनी सेवेत शेवटच्या वेळी संवाद साधला असेल किंवा जेव्हा त्यांनी सेवा सोडली असेल.

असे दिसते की मोबदला घेणार्‍या वापरकर्त्यांना विनामूल्य वापरकर्त्यांपेक्षा सोडण्याची अधिक शक्यता असते - कारण त्यांना कदाचित सर्वात स्वस्त प्रतिस्पर्धी सापडला असेल. तथापि आपण या क्रमांकावर सावधगिरी बाळगली पाहिजे. खरंच हे शक्य आहे की नाखूष पगाराच्या ग्राहकांनी त्याची सेवा रद्द करण्यापूर्वी त्याची सेवा डाउनग्रेड करण्यासाठी प्रथम निवडले असेल - ज्याचा अर्थ असा होईल की विनामूल्य खाती जास्त अंदाजे आहेत. तरीही ही एक माहिती आहे जी आपल्या मॉडेलमध्ये ठेवली पाहिजे. ज्या ग्राहकांनी त्यांची सेवा डाउनग्रेड केली त्यांच्यास ओळखणे हा आणखी एका अभ्यासाचा विषय आहे आणि आमचे मॉडेल सुधारण्याचे एक मार्ग आहे.

Time. वेळेचे चल: नोंदणी झाल्यापासून किती दिवस, विनामूल्य किंवा पेड ग्राहक म्हणून दिवसांची संख्या?

शेवटी आम्ही वेळ बदलण्यायोग्य ts कडे लक्ष दिले. त्याद्वारे आम्ही आणखी 3 चल काढू शकलो आहोत: नोंदणी झाल्यापासून किती दिवस, विनामूल्य ग्राहक म्हणून दिवसांची संख्या आणि पेड ग्राहकाच्या दिवसांची संख्या. या व्हेरिएबल्सचा बॉक्सप्लोट आपल्याला दर्शवितो की ते खरोखरच आमच्या मॉडेलसाठी संबंधित आहेत.

नोंदणीनंतरचे दिवस:

अगदी स्पष्ट म्हणजे, तुम्ही जितके जास्त वेळ रहाल तेच सेवेत तुम्ही जितके आनंद करता तितकेच तुम्ही सुटण्याची शक्यता कमी आहे.

देय वापरकर्ता म्हणून दिवसांची संख्या:

पुन्हा एकदा आपण सेवेसाठी पैसे देणे सुरू ठेवल्यास, याचा अर्थ असा होऊ शकेल की आपण त्यात आनंदी आहात आणि आपण सोडण्याची शक्यता नाही.

विनामूल्य वापरकर्ता म्हणून दिवसांची संख्या:

यावेळी दोन गटांमधील फरक कमी महत्वाचा आहे. तरीही जर एखादा माणूस जास्त काळ राहिला तर याचा अर्थ असा की एखादी व्यक्ती आनंदी आहे आणि त्याने सोडण्याची शक्‍यता नाही.

आता आम्हाला आमचे स्पष्टीकरणात्मक व्हेरिएबल्स सापडले आहेत, तेव्हा आपण कोणते मॉडेल वापरावे ते पाहू शकतो.

कोणते मॉडेल सर्वोत्कृष्ट आहे

मॉडेलिंग प्रक्रियेच्या तपशीलात डोईव्ह करण्यापूर्वी आपण स्वतःला स्वतःला विचारले पाहिजे की आम्ही आमच्या मॉडेल्सच्या चांगुलपणाचे मूल्यांकन कसे करू शकतो.

आमच्या अभ्यासाचे उद्दीष्ट म्हणजे मंथन होण्याची शक्यता असलेल्या ग्राहकांची ओळख पटविणे. पहिली पायरी म्हणजे आमच्या डेटासेटमध्ये मंथन करणार्‍या ग्राहकांना ओळखणे - म्हणजे अचूक मेट्रिक एक चांगला उमेदवार दिसेल.

तरीही आम्ही कोणत्याही ग्राहकांना गमावू नये म्हणून मंथन करणारा ग्राहक म्हणून ओळखू शकतो - परंतु आम्हाला खरोखर ते हवे आहे का?

लक्षात ठेवा आम्ही मंथलेले वापरकर्ते ओळखू इच्छित आहोत जेणेकरुन आम्ही कारवाई करू - जसे त्यांना सोडून जाऊ नये म्हणून त्यांना प्रोत्साहन किंवा सवलत देणे. जर आम्ही प्रत्येक वापरकर्त्यास संभाव्य मंथन करणारा वापरकर्ता म्हणून ओळखले तर आम्ही केलेल्या क्रियांना खूप किंमत मोजावी लागेल. अशा प्रकारे मला आठवण्याची काळजी घ्यावी - जी संभाव्य मंथनशील ग्राहक म्हणून विश्वासू ग्राहकांची ओळख पटवून देत नाही.

म्हणूनच आम्ही एफ 1 स्कोअरला आमच्या चांगुलपणा मेट्रिक म्हणून निवडणे निवडले आहे - कारण ते अचूकता आणि रिकॉल स्कोअर दरम्यान संतुलन आहे.

आता आम्ही मॉडेलिंग प्रक्रियेस पुढे जाऊ शकतो.

आम्ही 3 भिन्न मॉडेल्सची तुलना करणे निवडले: एक लॉजिस्टिक रीग्रेशन मॉडेल, एक यादृच्छिक फॉरेस्ट क्लासिफायर मॉडेल आणि ग्रेडियंट बूस्टिंग क्लासिफायर मॉडेल. आम्ही क्रॉस वैधता प्रक्रियेसह रीग्रेशन मॉडेलचे आणि रँडम फॉरेस्ट क्लासिफायरचे मापदंड ऑप्टिमाइझ करण्याचा प्रयत्न केला.

या सर्वांनी आम्हाला पुढील परिणाम दिले:

इतके फिनाले हे यादृच्छिक वन वर्गीकरणकर्ता होते जे एफ 1 गुणानुसार आमच्या कार्यासाठी सर्वोत्कृष्ट मॉडेल असल्याचे सिद्ध झाले.

आम्ही निवडलेल्या वैशिष्ट्यांचे महत्त्व देखील पाहू शकतो:

म्हणून सर्वात महत्वाची वैशिष्ट्ये म्हणजे नोंदणी पासून दिवसांची संख्या - जी अगदी तार्किक आहे - आणि पुढे विनामूल्य ग्राहक म्हणून किती दिवस आहेत आणि देय ग्राहक म्हणून किती दिवस आहेत. आम्हाला अद्याप या दोघांबद्दल अधिक तपशील सांगण्याची इच्छा आहे कारण ग्राहकांनी त्यांची सेवा कमी केली आहे.

दुसरीकडे ते पातळीसारखे दिसते आणि लिंग आमच्या मॉडेलसाठी फारसे उपयुक्त नाही. लिंग परिवर्तनासाठी, आम्ही पुरुष आणि स्त्रिया यांच्यात फरक कमी असल्याचे पाहिले परंतु आम्ही ते फक्त बाबतीत ठेवले आहे. लेव्हल व्हेरिएबलसाठी आम्ही विचार करू शकतो की माहिती विनामूल्य किंवा पेड ग्राहक म्हणून दिवसांच्या संख्येविषयी व्हेरिएबल्समध्ये आधीपासून आहे.

आता आमच्या अभ्यासाची अंतिम पायरी म्हणजे संपूर्ण डेटासेटवर मॉडेल तैनात करणे.

आणि संपूर्ण डेटासेटबद्दल काय

आम्ही वैशिष्ट्य अभियांत्रिकी आणि आमचे मॉडेल तयार करण्याच्या पूर्वीच्या चरणांचा पुनरावृत्ती करणार नाही. आम्ही थेट निकालाकडे पाहू.

आमच्या संपूर्ण डेटासेटवर आमच्या यादृच्छिक वन श्रेणीतील एफ 1 स्कोअर 0.82 आहे - आणि मिनी डेटासेटसह गुणांच्या तुलनेत सुधारित झाला आहे.

मंथन झालेल्या अंदाजे %०% ग्राहकांची ओळख योग्य प्रकारे झाली परंतु न सोडणार्‍या ग्राहकांपैकी केवळ%% ग्राहक खोटेपणाने ओळखले गेले.

म्हणूनच एकूणच मॉडेल बिल्ड चांगले सोडले गेले कारण आम्ही मंथन झालेल्या ग्राहकांचे चांगले प्रमाण ओळखण्यास सक्षम होतो आणि आमची लोकसंख्या लक्ष्यित होती.

पुढील चरण: आम्ही काय कारवाई करू शकतो

आता आमच्याकडे एक मॉडेल आहे जे सेवा सोडून कदाचित अधिक योग्यरित्या ग्राहक ओळखू शकेल, आम्ही त्यांना आमच्या पोर्टफोलिओमध्ये ठेवण्यासाठी आम्ही करू शकणा to्या कृतींकडे लक्ष देऊ शकतो.

वैशिष्ट्यांचे महत्त्व विश्लेषित केल्यानुसार, सर्वात महत्वाची म्हणजे नोंदणीनंतरचा काळ. तर आम्ही वाढीव कालावधीसाठी नोंदणीकृत ग्राहकांसाठी बक्षिसेची एक प्रणाली तयार करू शकू.

आम्ही देखील विनामूल्य ग्राहकांना लक्ष्य करू इच्छितो. आम्ही त्यांना प्रीमियम पर्यायांमध्ये विनामूल्य नोंदणी करू शकतो की त्या आतापर्यंत नोंदणीकृत राहतील. अशा प्रकारे त्यांना कदाचित पेमेंट केलेले ग्राहक बनण्याचा मोह होऊ शकेल किंवा पुढील प्रीमियम पर्यायाचा प्रयत्न करण्यासाठी ते विनामूल्य ग्राहक म्हणून जास्त काळ राहू शकतील.

मला आशा आहे की आपण हे पोस्ट वाचण्याइतका आनंद घ्याल.

संगीत स्ट्रीमिंग सेवांमधून ग्राहकांच्या मंथनास ओळखण्यासाठी आम्ही एकत्र एंड-टू-एंड मशीन लर्निंग वर्कफ्लो तयार करतो. डेटासेटच्या आकारामुळे आम्हाला स्पार्क वापरावा लागला - एक मोठा डेटा विश्लेषण फ्रेमवर्क. आम्ही भिन्न वैशिष्ट्ये किंवा भिन्न मॉडेल्स वापरू शकलो असतो, परंतु आमच्याकडे असलेले संसाधन आम्ही देखील विचारात घेतले होते.

महत्त्वाची गोष्ट म्हणजे आम्ही आमच्या मूळ प्रश्नाचे उत्तर देऊ शकलो - जे आपण तयार केलेल्या प्रत्येक मॉडेलचे लक्ष्य असले पाहिजे.