-
यहाँ बताया गया है कि 4 चरणों में डेटा वैज्ञानिक कैसे बनें। मैंने इस तरह से इसे किया।
ए सांख्यिकी पहले जानें
मैंने बहुत देर कर दी, आप जल्दी शुरुआत कर सकते हैं। यह बहुत आसान है, मुझे नहीं पता कि मुझे संकोच क्यों हुआ। शायद मानसिक ब्लॉक हम सब (अच्छी तरह से सभी) गणित के साथ नहीं है।
1. वर्णनात्मक आँकड़े
• डेटा चर के प्रकार
• केंद्रीय प्रवृत्ति के उपाय
• डेटा का प्रसार, डेटा का तिरछा होना
• फैलाव के उपाय
2. अव्यक्त आँकड़े
• जनसंख्या और नमूना (नमूनाकरण विधि वैकल्पिक है लेकिन इसे पढ़ें: सरल यादृच्छिक नमूनाकरण और स्तरीकृत यादृच्छिक नमूनाकरण
• यादृच्छिक चर, संभाव्यता वितरण - सामान्य, पॉइसन
• अनुमान और परिकल्पना परीक्षण।
b. एक्सेल और पावर बीआई आगे सीखें: विश्व स्तर पर 750 मिलियन उपयोगकर्ता, वह टूल और प्लेटफ़ॉर्म जिसने किसी अन्य की तुलना में अधिक डेटा देखा है। इसके अलावा पावर बीआई की माँ, हाँ! पावर बीआई एक सॉफ्टवेयर में विकसित उन्नत एक्सेल विशेषताएं है।
• एक्सेल में टेबल डालने की प्रासंगिकता - डेटा एनालिटिक्स पेशेवरों के लिए एक्सेल में टेबल सम्मिलित करने के 9 महान कारण।
• संगतता दृश्य सुविधाओं के साथ डेटा को समेकित करना
एक्सलस्टेट का उपयोग करके एक्सेल में मशीन सीखने के साथ डेटा हेरफेर
• वर्णनात्मक और हीन सांख्यिकी के लिए विश्लेषण टूलपैक
• पावर व्यू, पावर क्वेरी, पावर पिवट और पावर मैप्स।
सी। जानें आर और पायथन
हाँ आप इन दोनों को देखकर खुश हैं। लेकिन आपको आश्चर्य है कि कौन सा? इसके दोनों!
डी। जानें झांकी (यह पायथन और आर के साथ एकीकृत है)
क्यों? इग्नोर करना बहुत हॉट है। कोशिश करना आसान नहीं है। आप देखें कि डेटा साइंस में डेटा एक्सप्लोरेशन, डेटा एनालिटिक्स और डेटा प्रेजेंटेशन है। झांकी और एक हद तक पावर बीआई अन्वेषण और प्रस्तुति के साथ महान है। आर और पायथन बीच में आने वाले एनालिटिक्स के लिए सुपर हैं। "
-
data ko analyst karna bahut he important kaam hota hai kisse bhi kaam start karne se pehle .kisse bhi field ka data collect kya jata hai fir usko analyst kya jata hai fir kisse bhi decesion pe aaya jata hai .data analyst ka kaam bhut he hard hota hai aur usko properly samajh na. trading me bhi pehele data ko analyst kya jata hai fir trading decesion leya jata hai isleye data analyst is very important for any decesion making.
-
एक डेटा विश्लेषक वह है जो विभिन्न तरीकों की खोज करता है जिसमें डेटा का उपयोग व्यावसायिक सवालों के जवाब देने और उन समस्याओं को हल करने के लिए किया जा सकता है जो एक संगठन का सामना कर रहा है। घटती बिक्री के आंकड़े, कम कर्मचारी उत्पादकता कुछ समस्याओं के उदाहरण हैं जो एक व्यवसाय या कंपनी का सामना कर सकती हैं। आजकल व्यवसाय शायद ही कभी भावना के आधार पर निर्णय लेते हैं, बल्कि निर्णय अत्यधिक डेटा संचालित होते हैं।
यही वजह है कि आईटी सेक्टर में डेटा एनालिस्ट फील्ड का काफी स्कोप है
तो एक डेटा विश्लेषक के लिए आवश्यक कौशल सेट क्या हैं।
1) सांख्यिकी -
हां किसी के पास सांख्यिकीय कौशल होना चाहिए, जो संख्यात्मक डेटा के संग्रह, संगठन, विश्लेषण और व्याख्या का उल्लेख करता है।
2) प्रोग्रामिंग कौशल -
अजगर और आर जैसे प्रोग्रामिंग कौशल में एक अच्छा होना चाहिए। अब एक दिन अधिकांश संगठन उपकरण का विश्लेषण और डेटा तैयार करने के लिए उपयोग कर रहे हैं।
3) कहानी कहने का कौशल -
डेटा स्टोरीटेलिंग डेटा अंतर्दृष्टि को संप्रेषित करने के लिए एक संरचित दृष्टिकोण है, और इसमें तीन प्रमुख तत्वों का एक संयोजन शामिल है: डेटा, विज़ुअल्स और कथा।
ऊपर कौशल हैं जो एक डेटा विश्लेषक होना चाहिए।
कई बार मैंने ऐसे लोगों को देखा है जिनके पास मजबूत प्रोग्रामिंग कौशल नहीं है लेकिन वे डेटा के माध्यम से एक अच्छे कहानीकार हैं। मैं आप लोगों को यह भी बताना चाहूंगा कि कई बड़ी mnc और उत्पाद आधारित फर्म हैं जो डेटा का विश्लेषण करने के लिए टूल का उपयोग करते हैं।
डेटा का विश्लेषण करने के लिए दो चरण हैं एक आपका डेटा तैयार करना है और दूसरा डेटा की कल्पना करना है।
मैं आपको कुछ उपकरण बताता हूं जो प्रसिद्ध हैं और कई कंपनियों में उपयोग किए जाते हैं।
डेटा तैयार / डेटा हार्मोनाइजिंग टूल्स - एलर्टेक्स डिजाइनर, केएनईएम, टैलेंड।
डेटा विज़ुअलाइज़ेशन टूल्स - झांकी, पावर बीआई और क्यूक्लेन्स।
इसलिए उपर्युक्त औजारों के अनुसार इन सभी में व्यक्तिगत रूप से नौकरी के अवसर होते हैं, जिसका अर्थ है कि झांकी डेवलपर के लिए एक भूमिका हो सकती है या एक अल्टरनेक्स डेवलपर इन सभी उपकरणों में व्यक्तिगत नौकरी की भूमिका होती है।
-
डेटा विश्लेषण के बारे में बात करने से पहले हमें यह समझना चाहिए कि डेटा क्या है
डेटा क्या है?
इस दुनिया में हर मौजूदा कणों को डेटा कहा जाता है। यहां तक कि आप कह सकते हैं कि ब्रह्मांड में मौजूद हर चीज डेटा है। उदाहरण के लिए-आपका नाम, उम्र, आपका भोजन, आपने क्या पहना है, तापमान, आवृत्ति, आदि सभी डेटा हैं। लेकिन जब आप डेटा के बारे में सोचते हैं, तो यह आपके विषय से संबंधित होना चाहिए। मान लीजिए हमारा अध्ययन विषय शरीर का तापमान है। इस मामले में हमारे शरीर का तापमान हमारे नाम से संबंधित नहीं है। इसलिए, नाम शरीर के तापमान पर प्रभाव नहीं डालता है। इसलिए हमें नाम को अपने विषय के चर या सूचक के रूप में शामिल नहीं करना चाहिए। लेकिन कुछ समय यह आयु से संबंधित है। इसलिए हम शामिल कर सकते हैं उम्र शरीर के तापमान का एक कारक है। हालांकि, डेटा नालिस करने से पहले अध्ययन के उद्देश्यों को पूरा करने के लिए कुछ कार्यप्रणाली डालना बेहतर है।
डेटा की कुछ मुख्य विशेषताएं
- यह सटीक होना चाहिए।
- यह पूरा होना चाहिए।
- यह समय में होना चाहिए या आवश्यक समय सीमा को कवर करना चाहिए
- यह अध्ययन क्षेत्र से संबंधित होना चाहिए।
- अध्ययन क्षेत्र में उद्देश्य होने चाहिए। आदि।
डेटा विश्लेषण क्या है:
बस, जब हम संबंधित डेटा की तुलना अध्ययन के उद्देश्यों और निष्कर्षों से करते हैं। विश्लेषण भाग के परिणामों को सारणीबद्ध / चित्रमय / सांख्यिकीय विश्लेषण या वर्णनात्मक विधियों में वर्णित किया गया है या इसमें सभी विधियाँ शामिल हैं फिर इसे 'डेटा विश्लेषण' कहा जाता है।
डेटा विश्लेषण की सरल तैयारी
यदि आपके पास सांख्यिकीय पृष्ठभूमि नहीं है, तो एक साधारण विषय लें, जो हमारे दैनिक जीवन से संबंधित है। मान लीजिए कि मैं पिछले महीने के अपने दैनिक जेब खर्च पैटर्न का अध्ययन करना चाहता हूं। इस संबंध में मैं निम्नलिखित चरणों से गुजरूंगा:
उद्देश्य
पिछले दो महीनों के दैनिक पॉकेट खर्च पैटर्न की जांच करने के लिए।
डेटा
डेटा केवल मेरे दैनिक खर्च को कवर करना चाहिए। इसमें आपातकालीन व्यय को कवर नहीं किया जाना चाहिए।
समय
केवल पिछले दो महीनों को कवर करें।
संपूर्णता
इसमें पिछले दो महीनों की सभी दैनिक वस्तुओं को शामिल किया जाना चाहिए।
पद्धति:
सभी आइटम का नाम लिखें / एकत्रित करना और यह तिथि वार व्यय है। तारीख वार को एक तालिका तैयार करना
निष्कर्ष / कॉन्क्लूसिन
अध्ययन आवश्यक दैनिक वस्तुओं और अपेक्षाकृत आवश्यक वस्तुओं को नहीं पाता है।
अध्ययन से पता चलता है कि, यदि हम अपेक्षाकृत दैनिक आवश्यक वस्तु पर ध्यान केंद्रित नहीं करते हैं तो यह हमारे अनावश्यक दैनिक व्यय को कम कर देगा। जिससे बचत बढ़ेगी।
मेरा सुझाव:
मुझे लगता है कि इस प्रकार के डेटा विश्लेषण करने के बाद आप उच्च स्तर के डेटा विश्लेषण के लिए रुचि लेंगे। तब आप डेटा विश्लेषण के लिए अल्पावधि पाठ्यक्रम ले सकते हैं। कई अच्छे संस्थान डेटा विश्लेषण पर दूरी / ऑनलाइन पाठ्यक्रम प्रदान करते हैं। आप इसे खोज सकते हैं।
डेटा विश्लेषण हमारे दैनिक जीवन का एक हिस्सा है। हर काम किसी न किसी डेटा से गुजर रहा है। उदाहरण के लिए- जब आप भोजन तैयार कर रहे होते हैं तो आप तय करते हैं कि भोजन को कितना तैयार करना है, कब तैयार करना है, कब खत्म करना है, इसमें शामिल आइटम आदि।
तो आप पाते हैं कि पहले से ही आप दैनिक जीवन के लिए डेटा विश्लेषण कर रहे हैं। लेकिन यह आपके दिमाग में नहीं आ रहा है। फिर से मैं कहना चाहूंगा कि डेटा विश्लेषण के सभी विश्लेषणात्मक हिस्से को जटिल सांख्यिकीय डेटा विश्लेषण टूल की आवश्यकता नहीं है। आप इसे एक सरल तरीकों में वर्णित कर सकते हैं।
अंत में मैं कहना चाहता हूं कि डेटा विश्लेषण हमारे जीवन को सरल बनाते हैं।
-
डेटा विश्लेषक डेटा के सांख्यिकीय विश्लेषणों को इकट्ठा, संसाधित और निष्पादित करते हैं। उनके कौशल डेटा वैज्ञानिकों के रूप में उन्नत नहीं हो सकते हैं (उदाहरण के लिए, वे नए एल्गोरिदम बनाने में सक्षम नहीं हो सकते हैं), लेकिन उनके लक्ष्य समान हैं - यह पता लगाने के लिए कि डेटा का उपयोग प्रश्नों का उत्तर देने और समस्याओं को हल करने के लिए कैसे किया जा सकता है।
1. गणित, सांख्यिकी, कंप्यूटर विज्ञान, सूचना प्रबंधन, वित्त या अर्थशास्त्र में उच्च शिक्षा की डिग्री प्राप्त करें।
प्रवेश स्तर की नौकरियों के लिए अधिकांश उम्मीदवारों को गणित, सांख्यिकी कंप्यूटर विज्ञान, सूचना प्रबंधन, वित्त या अर्थशास्त्र में स्नातक की डिग्री की आवश्यकता होगी। ये सभी विषय सांख्यिकीय और विश्लेषणात्मक कौशल पर भारी जोर देते हैं। कैरियर की सीढ़ी पर चढ़ने या डेटा वैज्ञानिक की भूमिका के लिए संक्रमण के लिए, आपको संभवतः कंप्यूटर विज्ञान में मास्टर डिग्री या एक समान क्षेत्र में सूचना प्रबंधन या स्नातक प्रमाणपत्र प्राप्त करना होगा।
2. अपने तकनीकी, विश्लेषणात्मक और प्रोग्रामिंग कौशल को फाइन ट्यून करें।
डेटा विश्लेषकों के लिए तकनीकी कौशल:
- सांख्यिकीय तरीके और पैकेज (जैसे SPSS)
- आर और / या एसएएस भाषाएँ
- डेटा भंडारण और व्यापार खुफिया प्लेटफार्मों
- SQL डेटाबेस और डेटाबेस क्वेरी भाषाओं
- प्रोग्रामिंग (जैसे XML, जावास्क्रिप्ट या ETL चौखटे)
- डेटाबेस
- डेटा माइनिंग
- डेटा की सफाई और मंजन
- डेटा विज़ुअलाइज़ेशन और रिपोर्टिंग तकनीक
- Hadoop और MapReduce का कार्यसाधक ज्ञान
- मशीन सीखने की तकनीक
यह एक नमूना सूची और परिवर्तन के अधीन है।
डेटा विश्लेषकों के लिए व्यावसायिक कौशल
- विश्लेषणात्मक समस्या-समाधान:
विस्तार पर गहन ध्यान देते हुए बड़ी मात्रा में डेटा का विश्लेषण करने के लिए सर्वोत्तम प्रथाओं को नियुक्त करना।
- प्रभावी संचार:
आम दर्शकों के लिए जटिल तकनीकी विचारों और तरीकों की व्याख्या करने के लिए रिपोर्टों और प्रस्तुतियों का उपयोग करना।
- रचनात्मक सोच:
डेटा विश्लेषण के लिए स्थापित व्यवसाय प्रथाओं और नए तरीकों पर विचार-विमर्श करना।
- उद्योग ज्ञान:
यह समझना कि आपके चुने हुए उद्योग को कैसे चलाया जाए और डेटा किसी कंपनी / संगठन की रणनीति की सफलता में कैसे योगदान दे सकता है।
3. अतिरिक्त विश्लेषणात्मक प्रमाणपत्रों पर विचार करें।
स्वतंत्र संगठनों और विशिष्ट कंपनियों (जैसे एसएएस) से बड़े डेटा प्रमाणपत्र उपलब्ध हैं। जब संदेह हो, तो सलाह के लिए अपने आकाओं से पूछें, नौकरी लिस्टिंग आवश्यकताओं की जांच करें और यह निर्धारित करने के लिए टॉम के आईटी प्रो "बेस्ट" प्रमाणीकरण सूचियों जैसे लेखों की सलाह दें कि कौन सा आपके कैरियर को आगे बढ़ाने में मदद करेगा।
प्रमाणित विश्लेषिकी पेशेवर
हम डेटा साइंटिस्ट सर्टिफिकेशन पर अपने सेक्शन में इस योग्यता पर एक करीब से नज़र डालते हैं।
प्रमाणित डाटा प्रबंधन पेशेवर (सीडीएमपी)
गैर-लाभकारी डेटा मैनेजमेंट एसोसिएशन इंटरनेशनल (डीएएमए) द्वारा अधिकृत, सीडीएमपी क्रेडेंशियल चार स्तरों पर पेश किया जाता है: सहयोगी, व्यवसायी, मास्टर और साथी। सहयोगी सीडीएमपी बनने के लिए, उम्मीदवारों को अपनी डेटा भूमिका में कम से कम 6 महीने का अनुभव और डीएमबीओके सिद्धांतों का एक मजबूत ज्ञान होना चाहिए। जिन उम्मीदवारों के पास 5 साल से अधिक डेटा प्रबंधन का अनुभव है, वे एक प्रैक्टिशनर के रूप में साथी सीडीएमपी के लिए अपना रास्ता शुरू कर सकते हैं। 10 साल और साबित कौशल विस्तार और डेटा प्रबंधन पेशे में योगदान के बाद, चिकित्सक मास्टर सीडीएमपी बनने के लिए आवेदन कर सकते हैं। CDMP फैलो डेटा प्रबंधन क्षेत्र के भीतर व्यापक अनुभव है और एक वक्ता, अनुसंधान के प्रकाशक, कार्यशाला प्रस्तुतकर्ता और इसी तरह के अन्य साधनों के रूप में क्षेत्र में लगातार योगदान देते हैं।
-
डेटा विश्लेषक उन तरीकों का पता लगाते हैं जिनमें डेटा का उपयोग व्यावसायिक सवालों के जवाब देने और उन समस्याओं को हल करने के लिए किया जा सकता है जिनका संगठन सामना कर रहा है। घटती बिक्री के आंकड़े, कम कर्मचारी उत्पादकता कुछ समस्याओं के उदाहरण हैं जो एक व्यवसाय या कंपनी का सामना कर सकती हैं। आजकल व्यवसाय शायद ही कभी भावना के आधार पर निर्णय लेते हैं, बल्कि निर्णय अत्यधिक डेटा संचालित होते हैं।
डेटा विश्लेषक के रूप में,
• आप संगठनात्मक लक्ष्यों को पूरा करने के लिए आईटी, प्रबंधन और डेटा वैज्ञानिकों जैसी क्रॉस-फ़ंक्शनल टीमों के साथ मिलकर काम करेंगे
• आप अप्रासंगिक जानकारी की पहचान और त्याग करेंगे।
• आप उपलब्ध डेटा सेट में रुझानों और पैटर्न की पहचान करेंगे
• आपको दिए गए समस्या बयानों के लिए डेटा द्वारा समर्थित समाधानों के साथ आना होगा
• आप रिपोर्ट तैयार करेंगे और अपनी कंपनी के गैर-डेटा विश्लेषकों को आपके निष्कर्षों के आधार पर प्रस्तुतियाँ देंगे
• अब जब हमने एक डेटा विश्लेषक की जिम्मेदारियों को देखा है तो आपको यह देखना चाहिए कि आपको कहां से शुरू करना चाहिए।
शिक्षा
डेटा विश्लेषक बनने के लिए पहला कदम एक डोमेन में स्नातक की डिग्री का पीछा करना है जो तार्किक सोच, सांख्यिकीय विश्लेषण और विश्लेषणात्मक सोच पर जोर देता है। कुछ लोकप्रिय विकल्प गणित, सांख्यिकी, कंप्यूटर विज्ञान, वित्त, अर्थशास्त्र और विपणन हैं।
अपने स्नातक के बाद आप बिग डेटा, डेटा साइंस जैसे क्षेत्रों में मास्टर की डिग्री हासिल कर सकते हैं, लेकिन पोस्ट-ग्रेजुएशन करने की सलाह देने से पहले बहुमूल्य अनुभव प्राप्त करना आवश्यक है। ढेर सारी इंटर्नशिप और एंट्री-लेवल जॉब्स हैं जिनका आप लुफ्त उठाने से पहले कोशिश कर सकते हैं।
इंटर्नशिप के लिए आवेदन करने से पहले आपको कुछ कौशल के साथ खुद को लैस करना होगा।
1. सांख्यिकी
डेटा विश्लेषक के रूप में, आपका काम विभिन्न सांख्यिकीय उपकरणों और पैकेजों का उपयोग करके डेटा एकत्र करना, विश्लेषण और व्याख्या करना है। सुनिश्चित करें कि आपके पास माध्य, माध्यियन, मोड, मानक विचलन और भिन्नता, और ऐसी अन्य उच्च विद्यालय अवधारणाओं की ठोस समझ है।
एक बार जब आप अन्य विषयों पर उस कदम के साथ किया जाता है। इस पोस्ट को देखें जो आपको विभिन्न सांख्यिकीय अवधारणाओं का एक विचार देगा जो एक डेटा विश्लेषक को पता होना चाहिए। इसके अलावा, सुनिश्चित करें कि आपके पास मल्टीवीरेबल कैलकुलस और लीनियर अलजेब्रा की मजबूत पकड़ है।
2. प्रोग्रामिंग कौशल
यदि आप एक डेटा साइंटिस्ट थे, तो आप भविष्य का अनुमान लगाने के लिए उपयोग किए जाने वाले मॉडल और एल्गोरिदम का निर्माण करेंगे। इस भूमिका के लिए मजबूत प्रोग्रामिंग कौशल की आवश्यकता होती है और सबसे लोकप्रिय आर, एसक्यूएल और पायथन हैं। दूसरी ओर, डेटा विश्लेषक के रूप में आपका काम आपके द्वारा एकत्र किए गए डेटा के आधार पर इनफ़ेक्शन तक पहुंचना है।
इसलिए आपकी नौकरी के लिए मजबूत प्रोग्रामिंग कौशल की आवश्यकता नहीं है लेकिन R, C / C ++ और Excel, SQL डेटाबेस और डेटाबेस क्वेरी भाषाओं, डेटाबेस खनन और सफाई, डेटा विज़ुअलाइज़ेशन, एक्सएमएल, जावास्क्रिप्ट और ETL चौखटे पर अच्छा ज्ञान का एक बुनियादी ज्ञान है पूर्व अपेक्षित।
लेकिन अगर आप डेटा वैज्ञानिक या डेटा इंजीनियर भूमिकाओं में जाना चाहते हैं तो आपको अपने प्रोग्रामिंग कौशल पर भी ध्यान देना चाहिए।
3. संचार
यह आपकी नौकरी का दूसरा भाग है। आपको रिपोर्ट लिखने और अपने निष्कर्ष प्रस्तुत करने में निपुण होना होगा। दोनों नेत्रहीन और मौखिक रूप से आपको अपने काम का संचार करने में सक्षम होना चाहिए। कभी-कभी आपको अपनी कंपनी के सी-सूट के अधिकारियों के सामने भी एक प्रस्तुति देनी पड़ सकती है, जो आपकी प्रस्तुति के आधार पर महत्वपूर्ण निर्णय लेंगे।
इसलिए यदि आप गैर-डेटा विश्लेषकों को शब्द-मुक्त भाषा में अपने काम की व्याख्या कर सकते हैं तो आप एक महान डेटा विश्लेषक बना सकते हैं।
कार्य अनुभव प्राप्त करना
अब अपने अर्जित कौशल को परीक्षण में लाने का समय है। उन उद्योगों पर शोध करना शुरू करें जो डेटा विश्लेषकों की तलाश में हैं। डेटा विश्लेषकों को रोजगार देने वाले सबसे लोकप्रिय उद्योग हैं मार्केटिंग फर्म, टेक्नोलॉजी कंपनियां और वित्तीय संस्थान।
इन फर्मों में इंटर्नशिप के अवसरों की तलाश करें और आवेदन करें। कुछ प्लेटफ़ॉर्म जिन्हें आप अपनी इंटर्नशिप का उपयोग करने के लिए उपयोग कर सकते हैं, वे हैं, इंटरनेशला, लेट्सइंटरटेन, बीस19.कॉम, लिंक्डइन, इंफॉर्मेट.इन, और अन्य जॉब साइट्स। कुछ इंटर्नशिप के बाद, आप प्रवेश स्तर की नौकरियों के लिए आवेदन कर सकते हैं। ज्यादातर कंपनियां अपने इंटर्न को प्लेसमेंट ऑफर देती हैं, इसलिए सुनिश्चित करें कि आप अपनी इंटर्नशिप अवधि के दौरान अपनी क्षमता का प्रदर्शन करें।
वेतन
पेसेले द्वारा बताए गए डेटा विश्लेषकों के लिए भारत में औसत शुरुआती वेतन लगभग 3.6 लाख / वर्ष है। ग्लासडोर के अनुसार, औसत आधार वेतन लगभग 4.04 लाख / वर्ष है।
अंतिम विचार
डेटा एनालिटिक्स इंडस्ट्री फलफूल रही है। एनालिटिक्स लैब्स के सहयोग से एनालिटिक्स इंडिया मैगज़ीन के एक अध्ययन के अनुसार डेटा साइंस, एनालिटिक्स और बिग डेटा इंडस्ट्री को 33.5% की स्वस्थ सीएजीआर दर से बढ़ने का अनुमान है। यह तेजी से विस्तार करने वाले क्षेत्र का पता लगाने का एक अच्छा समय है।
अधिक उपयोगकर्ता हर दिन इंटरनेट तक पहुंच प्राप्त करने के साथ, निश्चित रूप से डेटा की उपलब्धता में कोई कमी नहीं होगी।
-
डेटा विश्लेषक विभिन्न प्रकार के होते हैं-बिजनेस डेटा एनालिस्ट, क्लीनिकल डेटा एनालिस्ट, मार्केट एनालिस्ट आदि। डेटा के क्षेत्र के आधार पर, नाम अलग-अलग होता है। इसके अलावा, उपयोग किए जाने वाले तरीके, उपकरण, सॉफ्टवेयर भिन्न होते हैं इसलिए यह एक विशाल क्षेत्र है।
मैं एक अनुभवी क्लिनिकल डेटा विश्लेषक हूं। मैं इस नवंबर 2019 में क्लीनिकल डेटा मैनेजमेंट में अपने 4 साल पूरे करूंगा। मैंने आज तक एक कंपनी को स्विच किया है। मेरे पिछले और मेरे वर्तमान नियोक्ता, दोनों दुनिया की शीर्ष 10 सर्वश्रेष्ठ कंपनियों में शामिल हैं। मेरे पास 3 बारनेट प्रमाणपत्र भी हैं।
मैंने अपनी पिछली कंपनी को एक फ्रेशर के रूप में शामिल किया था और क्लाइंट द्वारा 2 महीने के लिए प्रशिक्षित किया गया था, पोस्ट किया कि मेरे पास ऑन जॉब ट्रेनिंग थी और इस तरह मैं सीडीए बन गया। मैंने क्लिनिकल रिसर्च का अध्ययन नहीं किया, मुझे कंपनी द्वारा प्रशिक्षित किया गया था। क्लिनिकल रिसर्च एक विशाल डोमेन है जहां बड़ी दवा कंपनियों द्वारा नई दवाओं के लिए शोध किया जाता है। यह ज्यादातर नैदानिक अनुसंधान संगठनों के लिए आउटसोर्स किया जाता है। इसलिए, हमारे ग्राहक या प्रायोजक ऐसी कोई भी कंपनी होगी, जिसकी दवाएँ केमिस्ट शॉप में बेची जाती हैं।
मैंने कई ग्राहकों के लिए काम किया है, जो सफल दवाओं का एक हिस्सा है जो बाजार में जारी किया गया है। इसलिए, हां हम बीमारियों को ठीक करने में मदद करते हैं और यह उस गुणवत्ता पर आधारित है जो हम वितरित करते हैं। हम रोगी डेटा को संभालते हैं, हम मानव डेटा विज्ञान में हैं। क्लीनिकल रिसर्च में कई विभाग हैं- मेडिकल राइटिंग, फार्माकोविजिलेंस, डेटा मैनेजमेंट, रेगुलेटरी अफेयर्स, एसएएस प्रोग्रामर, डेटा बेस प्रोग्रामर, डेटा साइंटिस्ट आदि। मैं केवल डेटा मैनेजमेंट पर ध्यान दूंगा क्योंकि यह बहुत विशाल है।
डेटा विश्लेषण में निम्नलिखित शामिल हैं:
1. डेटा संग्रह
2. डेटा की सफाई
3. डेटा प्रतिनिधित्व
4. डेटा विश्लेषण
तो, हमें एक विशेष चिकित्सीय क्षेत्र के लिए प्रायोजक से परियोजनाएं मिलती हैं- कार्डियोवास्कुलर, बाल रोग, ऑन्कोलॉजी, ऑटो इम्यून आदि।
प्रोटोकॉल के आधार पर, डेटा बेस को प्रोग्राम बेस प्रोग्रामर द्वारा डिज़ाइन किया गया है। हमारे पास एसएएस प्रोग्रामर हैं जो डेटा प्रबंधन योजना के आधार पर डेटा में विसंगतियों को पकड़ने में हमारी मदद करते हैं जिसमें डेटा प्रतिबंधों के सभी विवरणों को लागू किया जाना है। सफाई के बाद के आंकड़ों को बायस्टैस्टिशियन द्वारा आवश्यक रूप से दर्शाया गया है, मुख्य रूप से टीएफएल (टेबल्स, फ्लो चार्ट, लिस्टिंग) के रूप में और विश्लेषण के लिए एफडीए को प्रस्तुत किया गया है। अंत में, दवा खारिज हो जाती है या अनुमोदित हो जाती है।
डेटा संग्रह दुनिया भर के चिकित्सा केंद्रों द्वारा किया जाता है। डेटा सफाई हमारे द्वारा किया जाता है, डेटा एनालिस्ट्स, बायोस टीम द्वारा प्रतिनिधित्व किया जाता है और वैज्ञानिकों द्वारा गुणवत्ता और विश्वसनीयता के लिए अंत में विश्लेषण किया जाता है। इस बड़ी प्रक्रिया में कई अन्य टीमें मिलकर काम कर रही हैं।
डेटा विश्लेषक के रूप में, एक ICH दिशानिर्देश, GCP और SOPs के माध्यम से होना चाहिए। ईडीसी (इलेक्ट्रॉनिक डेटा कैप्चर) के माध्यम से डेटा एकत्र किया जाता है, इसलिए हमें डेटाबेस से परिचित होना चाहिए। कई हैं- ओरेकल क्लिनिकल, इंफो, रेव, इन-हाउस डेटा बेस आदि, जिनके साथ एक होना चाहिए।
सबसे पहले, डेटाबेस की स्थापना के दौरान, सीडीए द्वारा परीक्षण और QC प्रदर्शन किया जाता है, यह सेटअप चरण है। नीचे सीडीए द्वारा किया जाएगा:
1. टेस्ट केस लेखन
2. परीक्षण
एक बार, सेट अप चरण समाप्त हो गया है, परीक्षण शुरू होता है और डेटा एकत्र किया जाता है, जिसे विभिन्न गतिविधियों के माध्यम से दैनिक और मासिक सफाई की आवश्यकता होती है, अर्थात्:
1. क्वेरी प्रबंधन (सिस्टम और मैनुअल जांच डेटा बेस में फायरिंग)
2. विक्रेता डेटा सुलह
3. SAE सुलह
4. एसएएस लिस्टिंग आउटपुट
5. पीडी सुलह
6. प्रवृत्ति विश्लेषण, यदि कोई हो
7. डेटा सेट की समीक्षा, आदि
प्रत्येक गतिविधि अलग है और विभिन्न पहलुओं से डेटा को साफ करती है।
अंत में, जब कोई परियोजनाएं समाप्त होती हैं, तो डेटा बेस लॉक गतिविधियों (समीक्षा गतिविधियों) को करने के लिए एक सीडीए माना जाता है। अंत में, डेटा बेस को मैन्युअल रूप से सीडीए या स्क्रिप्ट प्रोग्रामर द्वारा लॉक किए गए स्क्रिप्ट रन द्वारा प्रत्येक फॉर्म को लॉक किया जाता है। Excel में CDA के अत्यधिक कुशल होने की उम्मीद है क्योंकि डेटा विश्लेषण तेज हो सकता है। प्रोटोकॉल की समझ, इसके विचलन और अध्ययन डिजाइन, प्रतिबंध के मानदंडों को समझना भी बहुत महत्वपूर्ण है। सॉफ्टवेयर्स का उपयोग, कुछ निश्चित आउटपुट के लिए किया जाता है। अनुप्रयोगों का उपयोग रिपोर्ट पुलिंग आदि के लिए किया जाता है। इसके अलावा, सीडीए को अध्ययन की स्थिति जानने के लिए मैट्रिक्स और रिपोर्टिंग जानना चाहिए। अंतरिम विश्लेषण, निरर्थकता विश्लेषण, डेटा बेस लॉक मील के पत्थर हैं जो स्वच्छ डेटा की मांग करते हैं इसलिए गुणवत्ता हमेशा बनाए रखी जानी चाहिए।
इसकी लाइव डेटा के रूप में गुणवत्ता से समझौता नहीं किया जा सकता है, इसलिए उम्मीदें काफी अधिक हैं। उचित प्रशिक्षण और सलाह के साथ एक अच्छा डेटा विश्लेषक हो सकता है। जैसे-जैसे समय बीतता है, डेटा का विश्लेषण करने की गति भी बढ़ जाती है इसलिए यह समय के साथ बेहतर होता जाता है।
यह एक बहुत ही आरामदायक काम है, इसे घर से भी किया जा सकता है इसलिए बाद में घर-घर बन सकते हैं और किसी भी इच्छित जगह पर शिफ्ट हो सकते हैं जहाँ नेट कनेक्टिविटी अच्छी हो।
-
डेटा विश्लेषक उद्योग में सबसे जिम्मेदार काम में से एक है। इसे दुनिया में शीर्ष भुगतान वाली नौकरियों में भी माना जाता है। लेकिन डिजिटल विश्लेषक बनना इतना आसान नहीं है। डेटा विश्लेषक के पास कुछ महत्वपूर्ण कौशल होने चाहिए जो उनके करियर के लिए आवश्यक हैं। आइए शीर्ष 8 प्रमुख कौशल देखें जो हर डेटा विश्लेषक के पास होने चाहिए।
1. प्रोग्रामिंग कौशल
उनके पास ठीक सांख्यिकी कौशल होना चाहिए, सांख्यिकी कौशल के अलावा उनके पास कुछ प्रोग्रामिंग कौशल भी होना चाहिए। प्रोग्रामिंग कौशल में पायथन, MATLAB, R, आदि पर कमांड शामिल हैं और सांख्यिकी कौशल में SAS और SPSS पर कमांड शामिल हैं। इसके अलावा, वे बड़े डेटा टूल यानी स्पार्क, हाइव एचक्यूएल पर भी कमांड कर सकते हैं। अधिक कौशल के विपरीत, उनके पास उनके लिए सबसे अच्छा डेटा विश्लेषक होने की अधिक संभावना है।
2. सामान्य कौशल
सांख्यिकीय के साथ-साथ प्रोग्रामिंग कौशल में एक नज़र रखने के बाद यह डेटा विश्लेषक के लिए विश्लेषणात्मक कौशल पर एक नज़र डालने का समय है। उनके पास Google Analytics पर एक ठीक आदेश होना चाहिए। इसके अलावा, उनके पास Adobe Analytics पर कुछ कमांड भी हो सकते हैं। उन्हें अपनी पूरी क्षमता पर इन उपकरणों का उपयोग कैसे करना चाहिए।
3 अभियान प्रबंधन कौशल
अभियान प्रबंधन एक जगह में विभिन्न चैनल के डेटा और उसके प्रदर्शन को प्रबंधित करने का कौशल है। एडोब अभियान डेटा विश्लेषक को पूर्णता के साथ काम करने की अनुमति देता है। यह अभियान प्रबंधन के लिए सबसे अच्छे साधनों में से एक है। इस उपकरण का सबसे अच्छा हिस्सा यह है कि यह इन दिनों बहुत लोकप्रिय हो रहा है और बड़े संगठनों द्वारा उपयोग किया जाता है। उन्हें अपने करियर को उज्ज्वल बनाने के लिए इन उपकरणों पर एक मजबूत कमांड रखने की आवश्यकता है।
4. रिपोर्टिंग कौशल
रिपोर्टिंग व्यवसाय के प्रमुख पहलुओं में से एक है। यही कारण है कि यह डेटा विश्लेषक के लिए भी महत्वपूर्ण है। रिपोर्टिंग कौशल में डेटा विज़ुअलाइज़ेशन शामिल है और इसके आधार पर, उन्हें निष्कर्ष निकालने और उस पर एक रिपोर्ट बनाने की आवश्यकता है।
5. रचनात्मकता
रचनात्मकता के बिना, डेटा विश्लेषक अब जीवित नहीं रह सकता है। डेटा एनालिटिक्स का उपयोग करने के लिए उनमें जुनून और रचनात्मकता होनी चाहिए। उनकी रचनात्मकता के आधार पर, वे विज़ुअलाइज़ किए गए डेटा से सर्वश्रेष्ठ आउटपुट कर सकते हैं।
6. उन्नत एमएस एक्सेल
एमएस एक्सेल दुनिया में सबसे शक्तिशाली स्प्रेडशीट सॉफ्टवेयर में से एक है। इसमें बहुत सारे सूत्र और कार्य शामिल हैं जो डेटा विश्लेषक के लिए काफी उपयोगी हैं। यही कारण है कि उन्हें उन्नत एमएस एक्सेल पर एक मजबूत कमांड की आवश्यकता है।
7. एसक्यूएल ज्ञान
SQL के बिना हम प्रोग्रामिंग पर अधिक नहीं कर सकते। वास्तव में, एसक्यूएल डेटा और एनालिटिक्स के लिए एक आवश्यक भाषा है। डेटा एनालिस्ट को SQL का पर्याप्त ज्ञान होना चाहिए। SQL उन्हें डेटाबेस को अधिक गहराई से समझने में मदद करेगा।
8. टीम वर्क
टीम वर्क हर व्यवसाय के लिए सफलता की कुंजी है। इस प्रकार डेटा विश्लेषक के लिए टीमवर्क के प्रयास भी अनिवार्य हैं। लेकिन डेटा एनालिस्ट का ज्यादातर काम व्यक्तिगत आधार पर होता है। लेकिन फिर भी, कुछ कार्य ऐसे हैं जिन्हें पूरा करने के लिए टीम के प्रयासों की आवश्यकता होती है।
-
डेटा विश्लेषण उपयोगी जानकारी की खोज, निष्कर्ष को सूचित करने और निर्णय लेने का समर्थन करने के लक्ष्य के साथ डेटा का निरीक्षण, सफाई, रूपांतरण और मॉडलिंग की एक प्रक्रिया है। डेटा विश्लेषण में कई पहलू होते हैं और विभिन्न प्रकार के नामों के तहत विविध तकनीकों को शामिल किया जाता है, और इसका उपयोग विभिन्न व्यवसाय, विज्ञान और सामाजिक विज्ञान डोमेन में किया जाता है। आज की व्यावसायिक दुनिया में, डेटा विश्लेषण निर्णय को अधिक वैज्ञानिक बनाने में मदद करता है और व्यवसायों को अधिक प्रभावी ढंग से संचालित करने में मदद करता है।
डेटा माइनिंग एक विशेष डेटा विश्लेषण तकनीक है जो विशुद्ध रूप से वर्णनात्मक उद्देश्यों के बजाय पूर्वानुमान के लिए सांख्यिकीय मॉडलिंग और ज्ञान खोज पर केंद्रित है, जबकि व्यापार खुफिया डेटा विश्लेषण को कवर करता है जो मुख्य रूप से व्यावसायिक जानकारी पर ध्यान केंद्रित करते हुए एकत्रीकरण पर निर्भर करता है। सांख्यिकीय अनुप्रयोगों में, डेटा विश्लेषण को वर्णनात्मक आंकड़ों, खोजपूर्ण डेटा विश्लेषण (eda), और पुष्टिकरण डेटा विश्लेषण (cda) में विभाजित किया जा सकता है। eda डेटा में नई सुविधाओं की खोज पर ध्यान केंद्रित करता है, जबकि cda मौजूदा परिकल्पनाओं की पुष्टि या मिथ्याकरण पर केंद्रित है। भविष्य कहनेवाला विश्लेषण पूर्वानुमान या वर्गीकरण के लिए सांख्यिकीय मॉडल के अनुप्रयोग पर ध्यान केंद्रित करता है, जबकि पाठ विश्लेषिकी सांख्यिकीय स्रोतों, भाषाई और संरचनात्मक तकनीकों को लागू करता है, जो कि पाठ्यस्रोत स्रोतों से जानकारी निकालने और वर्गीकृत करने के लिए असंरचित डेटा की एक प्रजाति है। उपरोक्त सभी डेटा विश्लेषण की किस्में हैं।
डेटा एकीकरण डेटा विश्लेषण के लिए एक अग्रदूत है, और डेटा विश्लेषण डेटा विज़ुअलाइज़ेशन और डेटा प्रसार से निकटता से जुड़ा हुआ है।
विश्लेषण, व्यक्तिगत परीक्षा के लिए अपने अलग-अलग घटकों में एक पूरे को विभाजित करने के लिए संदर्भित करता है। डेटा विश्लेषण, कच्चे डेटा प्राप्त करने के लिए एक प्रक्रिया है, और बाद में इसे उपयोगकर्ताओं द्वारा निर्णय लेने के लिए उपयोगी जानकारी में परिवर्तित किया जाता है। डेटा, एकत्र किया गया है और सवालों के जवाब देने के लिए विश्लेषण किया गया है, परिकल्पना का परीक्षण किया गया है, या सिद्धांतों को अस्वीकृत किया गया है।