डेटा विश्लेषण उपयोगी जानकारी की खोज, निष्कर्ष को सूचित करने और निर्णय लेने का समर्थन करने के लक्ष्य के साथ डेटा का निरीक्षण, सफाई, रूपांतरण और मॉडलिंग की एक प्रक्रिया है। डेटा विश्लेषण में कई पहलू होते हैं और विभिन्न प्रकार के नामों के तहत विविध तकनीकों को शामिल किया जाता है, और इसका उपयोग विभिन्न व्यवसाय, विज्ञान और सामाजिक विज्ञान डोमेन में किया जाता है। आज की व्यावसायिक दुनिया में, डेटा विश्लेषण निर्णय को अधिक वैज्ञानिक बनाने में मदद करता है और व्यवसायों को अधिक प्रभावी ढंग से संचालित करने में मदद करता है।
डेटा माइनिंग एक विशेष डेटा विश्लेषण तकनीक है जो विशुद्ध रूप से वर्णनात्मक उद्देश्यों के बजाय पूर्वानुमान के लिए सांख्यिकीय मॉडलिंग और ज्ञान खोज पर केंद्रित है, जबकि व्यापार खुफिया डेटा विश्लेषण को कवर करता है जो मुख्य रूप से व्यावसायिक जानकारी पर ध्यान केंद्रित करते हुए एकत्रीकरण पर निर्भर करता है। सांख्यिकीय अनुप्रयोगों में, डेटा विश्लेषण को वर्णनात्मक आंकड़ों, खोजपूर्ण डेटा विश्लेषण (eda), और पुष्टिकरण डेटा विश्लेषण (cda) में विभाजित किया जा सकता है। eda डेटा में नई सुविधाओं की खोज पर ध्यान केंद्रित करता है, जबकि cda मौजूदा परिकल्पनाओं की पुष्टि या मिथ्याकरण पर केंद्रित है। भविष्य कहनेवाला विश्लेषण पूर्वानुमान या वर्गीकरण के लिए सांख्यिकीय मॉडल के अनुप्रयोग पर ध्यान केंद्रित करता है, जबकि पाठ विश्लेषिकी सांख्यिकीय स्रोतों, भाषाई और संरचनात्मक तकनीकों को लागू करता है, जो कि पाठ्यस्रोत स्रोतों से जानकारी निकालने और वर्गीकृत करने के लिए असंरचित डेटा की एक प्रजाति है। उपरोक्त सभी डेटा विश्लेषण की किस्में हैं।
डेटा एकीकरण डेटा विश्लेषण के लिए एक अग्रदूत है, और डेटा विश्लेषण डेटा विज़ुअलाइज़ेशन और डेटा प्रसार से निकटता से जुड़ा हुआ है।
विश्लेषण, व्यक्तिगत परीक्षा के लिए अपने अलग-अलग घटकों में एक पूरे को विभाजित करने के लिए संदर्भित करता है। डेटा विश्लेषण, कच्चे डेटा प्राप्त करने के लिए एक प्रक्रिया है, और बाद में इसे उपयोगकर्ताओं द्वारा निर्णय लेने के लिए उपयोगी जानकारी में परिवर्तित किया जाता है। डेटा, एकत्र किया गया है और सवालों के जवाब देने के लिए विश्लेषण किया गया है, परिकल्पना का परीक्षण किया गया है, या सिद्धांतों को अस्वीकृत किया गया है।