What is Big Data and its funcanality यह समझना बिल्कुल आसान है,उदाहरण के तौर पर आपसे यह पूछा जाए कि आप दिन भर में मोबाइल का उपयोग कितनी देर करते हैं आपका जवाब होगा कि कम से कम चार पांच घंटा तो यूज़ करते हैं इस चार-पांच घंटे के यूज़ में आप जो भी dataचाहे वह facebook या twitter या अन्य माध्यमों से save करते हैं वह data फेसबुक या अन्य सॉफ्टवेयर कंपनियों के server में save होता है,आपके जैसे लाखों लोग यही काम करते हैं, इसी डाटा को हम बिग डाटा कह सकते हैं इस डाटा को सॉफ्टवेयर कंपनियां big data technology का उपयोग करके प्रोसेस करके इसका उपयोग उपयोगकर्ता व्यवहार विश्लेषण और product marketing में उपयोग में लाती हैं,चलिए जानते हैं,कि यह कार्य कैसे होता है,और इसमें क्या-क्या tools उपयोग में लाए जाते हैं :-
बिग डेटा (Big Data) क्या है|What is Big Data in hindi
Contents
Big Data डिजिटल माध्यम से जो भी data हम चाहे वह facebook हो या whatsapp हो या अन्य माध्यम से एकत्र करने,बनाए रखने और संसाधित करने की एक तकनीक है। जिसमें डेटा का विश्लेषण कर उसका उपयोग business process engineering , मेडिकल क्षेत्र में दवाओं का विश्लेषण करने और human resource management और प्रतिभाओं का सही चयन करने में होता है Big Data को समझने के लिए आपको इसकी विशेषताओं के बारे में भी जानना होगा चलिए जानते हैं इन की क्या-क्या विशेषताएं हैं |
बिग डेटा की विशेषताएँ|Characters of Big Data
बिग डेटा के मुख्य रूप से तीन विशेषताएं होती है Volume ,Variety , Velocity होती है, जिसके आधार पर इन्हें समझा जा सकता है, चलिए जानते हैं कि बिग डाटा की मुख्य विशेषताएं कैसे कार्य करती हैं :-
What is Volume in Big Data
Volume बिग डेटा की सबसे महत्वपूर्ण विशेषता है,क्योंकि इसी के नाम पर इसका नाम बिग डाटा पड़ा है, जब डाटा का विश्लेषण किया जाता है तो उसकी साइज सबसे महत्वपूर्ण है इसी के द्वारा हम जान पाते हैं, कि डाटा कितने साइज का है,नॉर्मल ही बिग डाटा की साइज terabytes और petabytes के लेवल की होती है |
What is Variety in Big Data
Variety बिग डाटा की सबसे महत्वपूर्ण विशेषता है क्योंकि इसी के द्वारा हम पता लगा पाते हैं कि data किस formet का है अगर हम data के नेचर की बात करें तो कोई भी data या तो structured होता है ,जैसे हमारे database में save tabular form data जिसे हम RDBMS database भी कहते हैं, दूसरे तरह का data semi-structured होता है, अंत में बारी आती है unstructured data जिसे structured फॉर में कन्वर्ट करना काफी कठिन काम है, आजकल जो भी data images , audio या social media के द्वारा सेव data unstructured की श्रेणी में आता है,big data का महत्वपूर्ण कार्य इसी unstructured data को उपयोगी format में convert करना है |
What is Velocity in Big Data
Internet की speed बढ़ने के साथ ही data जेनरेशन की speed भी बढ़ गई है, जिसके कारण Velocity जोकि बिग डाटा की महत्वपूर्ण विशेषता है,जिसमें data के generation के समय उसकी frequency और speed का विश्लेषण किया जाता है |
बिग डेटा Architecture | Architecture of Big data
नॉर्मल लाइफ में हम कोई भी काम करने के लिए जैसे कि अगर हमें अपना घर बनवाना है, तब हम सबसे पहले अपने घर की डिजाइन ड्राइंग तैयार करते हैं उसी तरह Big Data में भी Data का एनालिसिस करने के लिए Big Data को मुख्य रूप से 4 लेयर में बांटा जाता है, इनका मुख्य कार्य Data का एनालिसिस कर उसे अलग-अलग components में बांटना है, चलिए जानते हैं, कि इन लेयर का क्या कार्य है.
स्त्रोत परत | Sources layer
Big data sources layer का मुख्य कार्य Data के sources के बारे में पता लगाना और यह भी तय करना है कि Data का format क्या है, जैसे कि कोई डाटा Structured, semi-structured, or unstructured है, इसका निर्णय लेना इस layer का मुख्य कार्य है, Velocity, volume का भी पता लगाना sources layer का कार्य है |
स्टोर परत | Data massaging and store layer
Data massaging and store layer की जिम्मेदारी Data को संरक्षित करना और उसे सही फॉर्मेट में जिससे उसका एनालिसिस किया जा सके कन्वर्ट करना भी है| उदाहरण के तौर पर मान लीजिए कि कोई इमेज फाइल आ रही है और उसे Hadoop Distributed File System (HDFS) में स्टोर करना है तब उसे उस File System के अनुरूप Data को कन्वर्ट करना इस लेयर का कार्य है |
विश्लेषण परत | Analysis layer
बिग डेटा में Analysis layer का कार्य sources layer और store layer से इकट्ठा की गई जानकारी का उपयोग algorithms क्रिएट करने और मौजूदा टूल का उपयोग करके उपयोग में लाई जाने वाली जानकारी के रूप में प्रस्तुत करना है, इस जानकारी का उपयोग एडवरटाइजिंग और बिजनेस इंटेलिजेंट concept क्रिएट करने में होता है |
खपत परत | Consumption layer
Consumption layer का मुख्य कार्य Analysis layer द्वारा प्रदान की गई जानकारी का निरीक्षण करना और उसे बिजनेस इंटेलिजेंस रिपोर्ट में कन्वर्ट करना है, जिसका उपयोग कंपनियों द्वारा अपने competitors कंपनियों के मुकाबले प्रोडक्ट को डिजाइन करने और उसे मार्केट में प्रस्तुत करना है |
बिग डेटा एनालिसिस टेक्नोलॉजी | Big Data Analysis Technology
जब Data Analysis की बात आती है,तो बिग डाटा में इसके लिए बहुत सारे टेक्नोलॉजी डिवेलप किए गए हैं जिसका उपयोग करके data Analysis और Visualization किया जाता है, चलिए जानते हैं, कि इनमें कौन कौन से टेक्नोलॉजी उपयोग में लाई जाती है :-
मशीन लर्निंग | Machine learning
Big data analysis में machine learing का महत्वपूर्ण योगदान है, जो computer algorithms का उपयोग करके डाटा को यूज फुल फॉर्म में कन्वर्ट करता है, जिसका उपयोग Email filtering, speech recognition और मेडिकल क्षेत्र में होता है|मशीन लर्निंग का महत्वपूर्ण कार्य data को computer algorithms के माध्यम से यूज फुल फॉर्म में कन्वर्ट करना है |
क्लाउड कंप्यूटिंग टेक्नोलॉजीज | Cloud computing Technologies
Cloud computing feature की #top 5 technology मे से एक है, Big Data में cloud computing का उपयोग करके Data को useful format में internet पर दिखाया जाता है जिसमें डेटा एक जगह centralized server पर रहता है, और उसका उपयोग हम कहीं भी वर्ल्ड में कर सकते हैं इसका सबसे अच्छा उदाहरण youtube, facebook और अन्य social networking website हैं ,जो cloud computing technology में कार्य करती हैं |
बिग डेटा चार्ट प्रौद्योगिकियां | Big data charts technologies
अगर किसी भी data के स्वरूप को समझना है तो उसे चित्रों के माध्यम से समझना सबसे आसान और उपयोगी है, इसी को देखते हुए Big Data में भी बहुत सारे Visualization Tools मौजूद है जिसका उपयोग करके हम Data को Chart फॉर्म में प्रस्तुत कर सकते हैं Google Chart का उपयोग करके हम Data को विभिन्न रूपों में प्रस्तुत कर सकते हैं |
बिग डाटा टेक्नोलॉजी के क्या क्या लाभ है | What are the benefits of Big Data Technology
जब कोई भी टेक्नोलॉजी आती है तो उसका लाभ हमें तुरंत नहीं मिलता है, इसके बारे में हमें धीरे-धीरे समझ में आता है, जैसे Internet को ही ले लीजिए आजकल ऐसा कोई भी नहीं है जो इंटरनेट का उपयोग नहीं कर रहा हूं इसका उपयोग करके हम अपने समय के साथ साथ पैसे की भी बचत कर रहे हैं, चलिए जानते हैं कि Big Data Technology के क्या क्या benefits है :-
सामान की लागत में कमी आना | Decrease in the cost of the product
आप कोई भी सामान जब internet के माध्यम से online खरीदते हैं तब उसमें एक product report नाम का फॉर्म आपको फिल करना पड़ता है,जो product के बारे में आपकी राय को बताता है,यह सभी डिटेल centralized server में save होती रहती है, जिसे Big Data Technology का उपयोग करके प्रोडक्ट के बारे में राय बनाई जाती है,अगर प्रोडक्ट सही नहीं है, तो उसे हटा दिया जाता है और user requirements के हिसाब से नया प्रोडक्ट डिवेलप किया जाता है, यह सभी प्रोसेस बिग डाटा टेक्नोलॉजी के आ जाने से बहुत कम समय में हो जाती है,जिससे प्रोडक्ट की लागत में कमी आती है |
सामान की बिक्री में वृद्धि और ग्राहक संतुष्ट | Increase in sales of goods and customer satisfaction
दोस्तों जब भी आप कोई भी सामान खरीदते हैं, अगर वह सामान अच्छा है, तो आप उसके बारे में दोस्तों को बताते हैं,जिससे उस सामान की अचानक से demand बढ़ जाती है, क्या आपको पता है इसके पीछे बिग डेटा का हाथ है, जब भी आप सामान online खरीदते हैं तो उसके बारे में अपनी राय दर्ज कराते हैं आपके जैसे लाखों लोग उसके बारे में अपनी राय देते हैं,जिसे data technology का उपयोग करके इस प्रोडक्ट को और अच्छा बनाया जाता है, जिससे ग्राहक तो संतुष्ट होता ही है,सामान की बिक्री में भी अप्रत्याशित वृद्धि होती है |
बिग डेटा टेक्नोलॉजी के नुकसान | Disadvantages of Big Data Technology
जब कोई भी टेक्नोलॉजी आती है, तब उसके एडवांटेज के साथ-साथ डिसएडवांटेज लेकर आती जैसे हम कंप्यूटर का उपयोग करते हैं उसके बहुत सारे लाभ भी हैं और नुकसान भी है,चलिए जानते हैं, कि बिग डाटा टेक्नोलॉजी के क्या क्या डिसएडवांटेज हैं :-
डेटा का रखरखाव ज्यादा खर्चीला है | Data maintenance is more expensive
बिग डेटा का नाम लेते ही आप समझ गए होंगे कि डाटा की मात्रा बहुत ज्यादा है, जिसे सामान्य सरवर में स्टोर करके नहीं रखा जा सकता इसके लिए हाई एंड डाटा सर्वर की जरूरत होती है जिसकी लागत बहुत ज्यादा है,एक कारण यह भी है,कि जो डाटा save है उसे मेंटेन करके रखना पड़ता है, जिसके कारण इसके रखरखाव में भारी लागत आती है |
डाटा का सही फॉर्मेट में ना होना | Data not in correct format
आजकल जो भी डाटा server में save हो रहे हैं,ज्यादातर सोशल मीडिया फाइल जिसमें वीडियो ,इमेज फाइल या अन्य तरह की unstructured फाइलें होती है,जिसे structured फॉर्म में convert करना महंगा है,साथ-साथ टाइम कंजूमिंग भी है,और जरूरी नहीं है,कि यह डाटा बिजनेस एनालिसिस में उपयोगी हो पाए |
बिग डाटा टेक्नोलॉजी भविष्य में क्या बदलाव लेकर आएगी | What changes will big data technology bring in the future
मेडिकल क्षेत्र | Medical field
आजकल प्रत्येक मरीज का रिकॉर्ड ऑनलाइन हो गया है जिसमें उसकी दवाइयों का रिकॉर्ड और बीमारी के बारे में पूरी डिटेल सेंट्रल सर्वर पर सुरक्षित रहती है, बिग डाटा टेक्नोलॉजी का उपयोग करके उस पेशेंट की पूरी हिस्ट्री को आसानी से एनालाइज किया जा सकता है और उसे कौन सी दवाई देनी है इसका भी निर्णय तुरंत हो सकता है जो भविष्य में बिग डाटा टेक्नोलॉजी का सबसे बड़ा योगदान रहेगा |
विपणन क्षेत्र | Marketing filed
आजकल कंपनियां किसी भी प्रोडक्ट की मार्केटिंग में सबसे ज्यादा पैसा खर्च करती हैं चाहे वह ऑनलाइन एडवरटाइजिंग हो या टीवी में देखने वाला विज्ञापन जिसका खर्च बहुत ज्यादा होता है बिग डाटा टेक्नोलॉजी का उपयोग करके भविष्य में कंपनियां इस खर्च को कुछ कम कर सकती हैं उदाहरण के तौर पर समझे तो अगर आप कोई भी प्रोडक्ट खरीदते हैं तब उसके बारे में आपकी राय कंपनी की वेबसाइट या ऑनलाइन वेबसाइट पर दर्ज करानी होती है, जिस की डिटेल कंपनी के पास रहती है, कंपनियां बिग डाटा टेक्नोलॉजी का उपयोग करके भविष्य में इसी डिटेल का उपयोग करके ऐसे प्रोडक्ट बनाएंगे जिसके लिए उन्हें मार्केटिंग में कम धन खर्च करना पड़ेगा |
भारत में बिग डेटा पेशेवर का वेतन | Salary of big data professional in india
जैसे-जैसे लोगों के बीच इंटरनेट का चलन बढ़ रहा है, और Data की खपत बढ़ रही है, बिग डेटा Technology की मांग भी बढ़ती जा रही है, इसका सीधा संबंध लोगों का यह द्वारा उपयोग किया गया डाटा जो इमेज वीडियो f format में Database में सेव हो रहा है, जिसे बिग डाटा टेक्नोलॉजी का उपयोग करके ही उपयोग में लाया जा सकता है बिग डाटा प्रोफेशनल की सैलरी की बात करें तो जॉब प्रोफाइल के अनुसार वेतन में बढ़ोतरी होती है, बिग डाटा इंजीनियर जो अभी प्रेशर है उसका वेतन 50000 से लेकर ₹70000 प्रति माह तक हो सकता है, उसी तरह डाटा साइंटिस्ट की भी सैलरी 50000 के लगभग हो सकती है डाटा विजुलाइजेशन डेवलपर की सैलरी ₹40000 प्रति माह तक हो सकती है, जबकि मशीन लर्निंग साइंटिस्ट की सैलरी 70000 से ऊपर जा सकती है |
निष्कर्ष | Conclusion
बिग डाटा क्षेत्र बहुत ही बड़ा है, इसे एक पोस्ट के माध्यम से नहीं समझाया जा सकता है, मैंने इस पोस्ट के माध्यम से आपको डाटा क्या होता है बिग डाटा की क्या-क्या विशेषताएं हैं और बिग डाटा कौन-कौन सी layers से मिलकर बना होता है के बारे में संक्षिप्त रूप में बताने की कोशिश की है, अगर आपको यह पोस्ट अच्छा लगा हो तो अपने फ्रेंड्स को फॉरवर्ड करिए |
धन्यवाद !