Data Warehouse and Data Lake; a key difference between these two



As far as we’re enhancing the use of technology, we’re proceeding towards the digital era. But in this changing era, the thing which can help us to lead the race is data. Data not only gives important information about the product, but also helps to find the unsolved mysteries about human behaviour, which makes product better than before. Data Warehouse and Data Lake are the terms, which can help us to understand data in a better way.


First of all, let’s talk about Data Lake. An unorganised small chunk protracted in the field of big data, can be known as Data Lake. We use Data Science to make it more organise, more appropriate so that we can find desirable output from this big thing. Hadoop, Azure and Amazon S3 are some of the companies, which are big names in the big world of Data Lake.


When we organise this data with the help of these technologies, this kind of organised big data is known as Data Warehouse. To make it more functional, we put it in appropriate buckets. A complete organised set of big data, from which we can derive appropriate strategy for a company or a product is called as Data Warehouse. It is properly used in Information Technology and Business. Snowflake, Yellowbrick and Teradata are some of the names, who are the big names in the big world of Data Warehouse.


जैसे-जैसे तकनीक का प्रयोग बढ़ता जा रहा है, हम आधुनिक युग की तरफ़ बढ़ रहे हैं। लेकिन इस बदलते दौर में जो हमें दौड़ में सबसे आगे रख सकता है, वह है डाटा। डाटा न केवल आपको किसी प्रोडक्ट के बारे में महत्त्वपूर्ण जानकारी देता है, बल्कि उन अनसुलझे रहस्यों से भी मिलाता है, जो हमारे प्रोडक्ट को दूसरों से बेहतर बना सकता है। डाटा वेयरहाउस और डाटा लेक दो ऐसे बिन्दु हैं, जो डाटा को समझने में हमारी मदद कर सकते हैं।

सबसे पहले बात करते हैं डाटा लेक की, बिग डाटा की दुनिया में फैला हुआ एक बड़ा सा चंक, जो अपने आप में अव्यवस्थित है, डाटा लेक कहा जा सकता है। इस बिग डाटा को अपने हिसाब से व्यवस्थित करने के लिए हम डाटा साइंस का उपयोग करते हैं, और इस डाटा को व्यवस्थित करते हैं, डाटा को व्यवस्थित करने के बाद हम अपने हिसाब से महत्त्वपूर्ण जानकारी निकाल सकते हैं, जो हमारे प्रोडक्ट और कंपनी के लिए महत्त्वपूर्ण है। हडूप, अज़ूरे और एस 3 की मदद से हम इस डाटा को व्यवस्थित कर सकते हैं।

जब हम इस डाटा को व्यवस्थित कर संयोजित कर देते हैं, तो इसे अपने ज़रूरत के हिसाब से बाँट कर या फिर बिना बाँटे भी ज़रूरी स्थान पर रख देते हैं। इस तरह संपूर्ण रूप से व्यवस्थित डाटा डाटा वेयरहाउस कहलाता है। बिग डाटा के इस भाग को हम अपनी ज़रूरत के हिसाब से उपयोग कर सकते हैं और अपनी ज़रूरत के मुताबिक़ सही प्रोजेक्शन कर सकते हैं। इन्फ़ॉर्मेशन टेक्नोलॉजी और बिज़नेस में इसका बहुत इस्तेमाल होता है। स्नोफ्लेक, यलोब्रिक और टेराडाटा कुछ ऐसी कंपनियाँ हैं, जो इस पर काम कर रही हैं।

- मंगलम् भारत

Popular Posts during last month

Bunked the IIMC final exams but won the heart of the nation. Neelesh Misra journey from Storyteller to the Founder of a rural newspaper Gaon Connection.

खुला ख़त, आपकी (ज़ीरो बटे सन्नाटा) इण्टरनेट स्पीड के नाम

10 रुपए की आरटीआई से रामनाथ गोयनका अवॉर्ड तक- नीलेश मिसरा इंटरव्यू- भाग 1