शनिवार, 16 अक्तूबर 2021

फाइल प्रणाली (file system)

फाइल प्रणाली (file system)
फाइल (Files)

  • सूचनाओं व प्रोग्राम जिनका उपयोग कम्प्यूटर में किया जाता है उन्हें फाइल में संग्रहित किया जाता है।
  • फाइल में तार्किक क्रम के अनुसार सूचनायें व रिकार्ड व्यवस्थित होते हैं। 
  • कम्प्यूटर उपयोगकर्ता व कम्प्यूटर मध्य कार्य, फाइलों में डाटा व सूचनाओं को भेजकर होता है। प्रत्येक फाइल का अपना एकल (Unique) नाम होता है और प्रत्येक फाइल को उसके इसी एकल नाम द्वारा जाना जाता है।
  • फाइल के नाम दो भाग होते हैं-
    • प्रथम नाम (प्रारम्भिक नाम) First Name
    • प्रसार (Extension)

फाइल के नामकरण के नियम (Rules for Naniing Files)

  • प्रारम्भिक नाम में अधिकतम अक्षर (Characters) होते हैं।
  • प्रसार नाम के अधिकतम 3 अक्षर होते हैं।
  • प्रसार नाम किसी फाइल में होना अति आवश्यक नहीं है। यह फाइल नाम का भाग हो भी सकता है अथवा नहीं।
  • प्रारम्भिक नाम व प्रसार नामक के मध्य बिन्दु का चिह्न लगाया जाता है।
  • बिन्दु (.) के चिह्न के पहले व बाद में स्थान रिक्त नहीं रहना चाहिए।
  • प्रारम्भिक नाम में न्यूनतम एक अक्षर होना चाहिए।
  • उदाहरणतया - कुछ फाइल नाम निम्न प्रकार हैं-
    • ABC.C
    • RESULT FOR
    • REPORTS.DOC RESUME.TXT
    • A123.COB

फाइल मैनेजमेन्ट सिस्टम (File Management System) 

  • डेटा व्यवस्थित करने की फाइल ओरियटिड अप्रोच में यूजरों को अपनी फाइलें व्यवस्थित बनाने, डिलीट, अद्यतन और उनमें फेर बदल करने की सुविधा के लिए कुछ प्रोग्राम दिए गए हैं। 
  • ये सभी प्रोग्राम मिल कर फाइल मैनेजमेन्ट सिस्टम (FMS) बनाते हैं। फाइल मैनेजमेन्ट सिस्टम में प्राय: पाई जाने वाली विशिष्टताएँ निम्न हैं।

फाइल के प्रकार

डेटा फाइलों को एप्लीकेशन जिस प्रकार उन्हें प्रयोग करती है, उसके आधार पर वर्गीकृत किया जाता है। फाइल मैनेजमेन्ट सामान्यत: निम्न प्रकार की फाइलों का समर्थन करता है-

1. ट्रांजेक्शन फाइल- 

इनपुट डेटा को तब तक स्टोर करती है जब तक वह प्रोसेस न हो जाए। उदाहरण के लिए, कर्मचारियों की मासिक पेस्लिप बनाने के लिए पेरोल एप्लीकेशन में, उस माह की ट्रॉजेक्शन फाइल में हर कर्मचारी का उस महीने का डेटा होता है जैसे कि उसने कितने घंटे कार्य किया, साधारण व ओवर टाइम और यदि निर्मित वस्तुओं पर आधारित है, तो कितनी वस्तुएं बनाई गई।

2. मास्टर फाइल- 

मास्टर फाइल में उस एप्लीकेशन से संबंधित सभी आवश्यक डेटा होता है। उदाहरण के लिए ऊपर दी गई पेरोल एप्लीकेशन में मास्टर फाइल में हर कर्मचारी का स्थायी विवरण (नाम, पता, कोड, वेतन दर, टैक्स दर इत्यादि) होता है और उस समय का कुल वेतन और कुल टैक्स भी होता है। जब पेरोल प्रोग्राम प्रोसेस होता है, वह दोनों मास्टर और उस माह की ट्रॉजेक्शन फाइलों को समन्वित कर उस माह की पेस्लिप बनाता है और मास्टर फाइल को अगले माह की प्रोसेसिंग के लिए तैयार करने के लिए अद्यतन किया जाता है।

3. आउटपुट फाइल- 

कुछ एप्लीकेशन डेटा प्रोसेसिंग के लिए कई प्रोग्रामों का प्रयोग करती हैं। ऐसी एप्लीकेशनों में एक प्रोग्राम द्वारा उत्पन्न आउटपुट दूसरे प्रोग्राम में इनपुट के रूप में दिया जाता है। अत: पहले प्रोग्राम द्वारा बाद में प्रयोग होती है।

4. रिपोर्ट फाइल-

  • रिपोर्ट फाइल डेटा प्रोसेसिंग फाइल द्वारा उत्पन्न रिपोर्ट की एक कॉपी कम्प्यूटर सबल रूप में स्कैन करता है।रिपोर्ट फाइल को आवश्यकता पड़ने पर प्रिंट कर हार्ड कॉपी प्राप्त की जा सकती है। 
  • पेपर डाक्यूमेन्टों के स्थान पर रिपोर्ट फाइलें रखना सरल है क्योंकि वह स्टोर और ले जाने में सरल होती हैं।

5. बैकअप फाइल- 

बैक अप फाइल, फाइल की कॉपी होती है जो एहतियात रूप में बनाई जाती है यदि मूल फाइल खराब हो  जाए या गलती से डिलीट हो जाए। बैक अप फाइलों को नियमित रूप से बनाना अत्यावश्यक होता है।

फाइल व्यवस्था

  • फाइल व्यवस्था में फाइलों के रिकार्ड की भौतिक व्यवस्था की जाती है जिससे उसकी स्टोरेज और करने का चयन एप्लीकेशन टाइप और प्रयोक्ताओं की आवश्यकता अनुसार करते हैं । 
  • बिजनेस डेटा प्रोसेसिंग एप्लीकेशनों में प्रायः प्रयुक्त तीन फाइल व्यवस्थाओं में आती है सीक्वेशियल, डाइरेक्टा रेण्डम और इंडेक्सड सीक्वेंशियल। 
  • फाइल व्यवस्था का चयन एप्लीकेशन के प्रकार पर निर्भर करता है। 
  • एक एप्लीकेशन के लिए सर्वोत्तम फाइल व्यवस्था वही है जो उस एप्लीकेशन को डेटा ऐक्सेस और प्रोसेसिंग आवश्यकताओं को सबसे दक्ष और सस्ते ढंग से पूरा करें। अत: एक एप्लीकेशन डिजाइनर को हर फाइल व्यवस्था के लाभ और हानियाँ, एप्लीकेशन के लिए उसका चयन करने से पहले, जाँचनी चाहिए। 
  • फाइल व्यवस्था के लिए फाइल के हर रिकार्ड में किसी की फील्ड का प्रयोग आवश्यक है। 
  • फाइल के हर रिकार्ड के लिए की फोल्ड की वेल्यू पथक होनी चाहिए, नहीं तो दोहरा देने से गंभीर समस्याएँ उत्पन्न हो सकती हैं। 
  • पेरोल उदाहरण में, कर्मचारी कोड फील्ड को की फोल्ड रूप में प्रयोग कर सकते हैं।

सीक्वेंशियल फाइलें

  • सीक्वेंशियल फाइल में रिकार्ड एक के बाद एक रिकार्ड की फील्ड वेल्यू पर आधारित बढ़ते घटते क्रम में स्टोर होते हैं। 
  • पेरोल उदाहरण में कर्मचारी फाइलों के रिकार्ड कर्मचारी कोड में क्रमशः लगाए जा सकते हैं।
  • मैगनेटिक टेप, सीक्वेंशियल फाइलों के लिए प्रमुख स्टोरेज माध्यम हैं।
  • कम्प्यूटर सीक्वेंशियल फाइलों को उसी क्रम में प्रोसेस करता है जिस क्रम में रिकार्ड स्टोर किए गए हैं अर्थात वह पहले रिकार्ड को प्रथम रीड और प्रोसेस करता है, फिर दूसरे रिकार्ड को और आगे। उदाहरण के लिए, एक विशिष्ट रिकार्ड को एक सीक्वेंशियल फाइल में खोजने के लिए कम्प्यूटर क्रम में सभी रिकार्ड को रीड करता है, पहले से शुरू होकर, और उसकी की फोल्ड वेल्यू इच्छित रिकार्ड से मिलाता है। 
  • जब पढ़े जा रहे रिकार्ड की फोल्ड वेल्यू इच्छित की वेल्यू से मेल खा जाती है तो खोज समाप्त हो जाती है। इस प्रोसेसिंग प्रणाली से यदि हमें केवल सिंगल रिकार्ड प्रोसस करता है तो औसतन लगभग आधी फाइलों को इच्छित रिकार्ड प्रोससिंग के लिए रिट्रीव करने के लिए खोजी जाएगी। 
  • सीक्वंशियल फाइलें उन एप्लीकेशनों के लिए उपयुक्त नहीं हैं जिनमें एक समय पर एक या कुछ रिकार्ड ही प्रोसेस होने हों।
  • सीक्वंशियल फाइल व्यवस्था उन एप्लीकेशनों के लिए सबसे दक्ष और सस्ती फाइल व्यवस्था प्रणाली है जिनमें निश्चित में रिकाडों को  अंतराल पर फाइलों की बड़ी संख्या अद्यतन करनी होती है अर्थात जब एक्टीविटी रेशो (ट्रॉजेक्शन फाइल और मास्टर फाइल कुल संख्या को रेशो) बहुत अधिक हो। 
  • यह बैच प्रोसेसिंग द्वारा निश्चित किया जाता है जिसमें बैच में एक प्रकार की ट्रॉजेक्शन एकत्रित होती है, फिर यह बैच की फील्ड के अनुसार क्रम में लगाए जाते हैं और फिर रिकार्ड का पूरा बैच फाइल में एक बार में प्रोसेस होता है। पेरोल और मासिक बिल वाली एप्लीकेशनों में प्रोसेसिंग इसी प्रकार होती है।

सीक्वेंशियल फाइलों के लाभ


  1. इन्हें स्टोरेज और प्रोसेसिंग के लिए अपेक्षाकृत कम महंगी 1/O मीडिया और डिवाइसिस की आवश्यकता होती है।
  2. यह संभालने और व्यवस्थित करने में आसान होती हैं।
  3. यह समझने और प्रयोग में सरल होती हैं।
  4. यह उन एप्लीकेशनों के लिए उपयोग में दक्ष और सस्ती है जिसमें एक्टीविटी अनुपात बहुत अधिक होता है (अद्यतन रन के दौरान अधिकांश रिकार्ड प्रोसेस होते हैं)।

सीक्वेंशियल फाइलों को हानियाँ

  1. सीक्वेंशियल प्रोसेसिंग में फाइलों को प्रोसेसिंग से पहले अतिरिक्त सॉटिंग की आवश्यकता होती है अर्थात् प्रोसेसिंग से पूर्व दोनों ट्रॉजेक्शन और मास्टर फाइलों को एक से क्रम में सार्ट किया जाना चाहिए।
  2. इनका प्रयोग बैच प्रोसेसिंग तक सीमित है क्योंकि इनमें ट्रॉजेक्शन बैच में होती है। यह प्रोसेसिंग के समय एक्टीविटी अनुपात को अधिक रखने के लिए किया जाता है।
  3. चूँकि प्रोसेसिंग से पूर्व ट्रॉजेक्शनों को बैच में इकट्ठा करने की आवश्यकता होती है, अत: सीक्वेंशियल प्रोसेसिंग में आखिरी समय डेटा डालने की संभावना नहीं होती।
  4. जिन एप्लीकेशनों में एक्टीविटी अनुपात कम हैं उनमें यह प्रयोग में असुविधाजनक और महंगी होती हैं। 
  5. सीक्वेशियल प्रोसेसिंग प्रोसेसिंग द्वारा प्राय: डेटा दोहराने की समस्या आती है क्योंकि एक सा डेट भिन्न की प्रति सीक्वेंस होकर कई फाइलों में स्टोर हो सकता है।

डाइरेक्ट फाइल

  • कई एप्लीकेशनों में अंतिम समय डेटा डालने की आवश्यकता होती है। ऐसी एप्लीकेशनों के प्रयोक्ता ट्रॉजेक्शनों के बैच में प्रोसेसिंग से पूर्व एकत्रित होने की प्रतीक्षा नहीं कर सकते। 
  • उन्हें ट्रॉजेक्शनों की प्रोसेसिंग उसी समय चाहिए होती है जब वे हुई हैं। ऐसी एप्लीकेशनों के उदाहरण एयरलाइंस और रेलवे आरक्षण सेवा, एनसाइक्लोपीडिया इत्यादि। 
  • चूकि एक बार में एक ट्रॉजेक्शन ही प्रोसेस होती है, इसलिये इन एप्लीकेशनों में एक्टीविटी अनुपात बहुत कम होती है जिससे सीक्वेंशियल फाइलों का प्रयोग असफल और महंगा हो जाता है। 
  • ऐसी एप्लीकेशनों के लिए डाइरेक्ट/ रैण्डम फाइल व्यवस्था सुझाई जाती है जिसमें चल रही ट्रांजेक्शन से संबंधित रिकार्ड बिना दूसरे रिकार्डों को जाँचे सीधे उसकी को फील्ड वेल्यू से लोकेट किया जा सकता है। 
  • उदाहरण के लिए, जब तक यात्री रेल में आरक्षण माँगता है तो आरक्षण रिकार्ड रखने वाला कम्प्यूटर सीधे उस ट्रेन का रिकार्ड ऐक्सेस कर उस दी गई यात्रा की तिथि के लिए सीटों की उपलब्धि अद्यतन कर देता है। 
  • संभवतः डाइरेक्ट रैण्डम फाइलों को रिकार्ड की डाइरेक्ट ऐक्सेस सुनिश्चित करवाने के लिए डाइरेक्ट एक्सेस स्टोरेज डिवाइस में स्टोर किया जाता है। 
  • मैगनेटिक/ ऑप्टिकल डिस्क डाइरेक्ट/ रैण्डम फाइलों के लिए प्रयुक्त मुख्य स्टोरेज साधन होता है।
  • प्रश्न उठता है कि डाइरेक्ट फाइल में रिकार्ड किस प्रकार व्यवस्थित किए जाएँ कि उन्हें दी गई की फील्ड वेल्यू द्वारा, इतनी रिकार्ड संख्या में से डाइरेक्ट रूप से एक्सेस किया जा सके। इसे संभव करने के लिए डाइरेक्ट फाइल व्यवस्था एड्रेस जेनरेटिंग फंक्शन का प्रयोग करती है जो रिकार्ड की वेल्यू को डिस्क पर स्टोरेज एड्रेस में बदलती है, जहाँ फाइल स्टोर की जाती है।
  • फाइल में हर रिकार्ड उस स्थान पर स्टोर किया जाता है जिस पर एड्रेस जेनरेटिंग फंक्शन रिकार्ड की की फील्ड वेल्यू को मैप करता है। 
  • इस प्रणाली को हैशिंग कहते हैं और एड्रेस जेनरेटिंग फंक्शन को हैशिंग एलगोरिथम कहते हैं।
  • यद्यपि हैशिंग एलगोरिथम हर रिकार्ड की की वेल्यू के लिए पृथक एड्रैस देने के लिए डिजाइन किया गया है, परंतु वस्तुतः कभी-कभी यह दो या अधिक रिकार्डों की की वेल्यू को एक ही स्टोरेज एड्रैस पर मैप कर है।  इस समस्या को कोलिशन कहते हैं। 
  • कोलिशन को कई तरीकों से बचाया जा सकता है। यह तरीका है कि हैशिंग एलगोरिथम द्वारा निकाले एड्रैस पर पोइंटर प्रयोग करना यह पोइंटर उन सभी रिकार्डों के एड्रैस की जुड़ी हुई सूची की ओर इशारा करता है जिसमें हैशिंग एलगोरिथम द्वारा की वेल्यू निकालने का एड्रेस भौतिक रूप से हैं।
  • रिकार्ड खोजने के लिए, जिसकी की वेल्यू दी गई है, कम्प्यूटर हैशिंग एलगोरिथम दी गई की पर लगा कर उसके अनुरूप एड्रेस निकालता है। यदि निकाले गए एड्रेस पर रिकार्ड प्राप्त होता है, तो खोज समाप्त हो जाती है।
  • अन्यथा कम्प्यूटर पोइंटर द्वारा पोइंट की गई संबंधित सूची जाँचता है जो निकाले गए एड्रैस से मेल खाती है और उस संबंधित सूची में स्टोर एड्रेस को एक्सेस कर एक के बाद एक उनकी की को दी गई की से मिलाता है। 
  • खोज, की से मिलते जुलते रिकार्ड को प्राप्त कर समाप्त हो जाती है।
  • यदि आवश्यकता हो तो, डाइरेक्ट फाइल के रिकार्ड की भी फील्ड वेल्यू के बढ़ते घटते क्रम में सीक्वेंशियली प्रोसेस हो सकते हैं। 
  • परंतु यदि एक बड़ी संख्या में रिकार्डो को सीक्वेंशियली प्रोसेस करने की आवश्यकता होती है (अर्थात, एक्टीविटी अनुपात अधिक है), तो ऐसे में सीक्वेंशियल फाइल की अपेक्षा डाइरेक्ट फाइलें असफल सिद्ध होती है क्योंकि कम्प्यूटर को हैशिंग एलगोरिथम प्रयोग कर हर प्रोसेस करने वाले रिकार्ड के लिए डिस्क के रीड/राइट हेड को पुन: लाना पड़ता है।

डाइरेक्ट फाइलों के लाभ

  1. इसमें प्रोसेसिंग से पूर्व ट्रांजेक्शन को बैच में इकट्ठा करने की आवश्यकता नहीं होती है इन्हें प्रोसेस किया जा सकता है।
  2. प्रोसेसिंग से पूर्व इसमें ट्रॉजेक्शनों को सॉर्ट करने की आवश्यकता नहीं होती है।
  3. यदि आवश्यकता हो तो डाइरेक्ट फाइल रिकार्डों को सीक्वेंशियली भी प्रोसेस किया जा सकता है।
  4. यह इंटरैक्टिव ऑनलाइन एप्लीकेशनों को समर्थित करता है जिससे यूजरों द्वारा की गई पूछताछ की अद्यतन जानकारी दी जा सकती है।
  5. की दिए जाने पर, कोई भी रिकार्ड जल्दी लोकेट और सीधे रिट्रीव किया जा सकता है।

डाइरेक्ट फाइलों की हानियाँ

  1. इन्हें प्रायः विशेष सुरक्षा और एक्सेस समकालीन प्रणाली की आवश्यकता होती है क्योंकि ऑनलाइन डाइरेक्ट फाइलें प्राय: कई ऑनलाइन स्टेशनों द्वारा एक साथ उपलब्ध करवाई जाती हैं।
  2. एड्रैस निकालने के लिए ओवरहेड की वजह से यह सीक्वेंशियल फाइलों की अपेक्षा अधिक एक्टीविटी अनुपात वाली सीक्वेंशियल एप्लीकेशनों में कम दक्ष और महंगी सिद्ध होती है।
  3. इन्हें अपेक्षाकृत महंगे हार्डवेयर और सॉफ्टवेयर रिसैसों की आवश्यकता होती है क्योंकि उन्हें डाइरेक्ट एक्सेस स्टोरे। डिवाइस जैसे डिस्क पर स्टोर करना पड़ता है।

इंडेक्स्ड सीक्वेंशियल फाइलें

हम सभी इंडेक्स के विचार से अवगत हैं। उदाहरण के लिए एक बड्डी बहुमंजिलिय इस व्यक्ति हम डिस्ले बोर्ड (इंडेक्स) में उसका नाम हूँढंग और उसके आगे दी गई मंजिल और कमरा संख्या देखेंगे। इस प्रकार व्यवस्थित क्रम में दी गई तालिका में खोजना, कम से कमरा भटकने की अपेक्षा आसान और शीघ्र होगा। उसी तरह यदि हम इस पुस्तक के भाग प्रिंटर पर पढ़ना चाहते हैं, तो हम पृष्ठ 1 से शुरू होकर तब तक नहीं पड़ेंगे जब तक यह विषय न आ जाए। अपितु हम इस विषय को पुस्तक के शुरू में दी गई विषय तालिका (इंडेक्स) से सीधे उस पृष्ठ को खोलकर उसे पढ़ेंगे। इंडेक्स की गई सीक्वैशियल फाइलें एक जैसे सिद्धांत का पालन करती हैं। इंडेक्स्ड सीक्वेंशियल फाइल व्यवस्था में, हर डेटा फाइल के लिए दो फाइलें होती हैं- डेटा फाइल (जिसमें फाइल में स्टोर किए रिकार्ड होते हैं) और इंडेक्स फाइल (जिसमें डेटा फाइल पर हर स्टोर किए रिकार्ड का डिस्क एड्रेस होता है)। डेटा फाइल में रिकार्ड किसी भी क्रम में स्टोर की जाती है। यह प्रयोक्ताओं को बहुत सक्षम बना देता है क्योंकि फाइलें रेण्डम और सीक्वेंशियल दोनों ढंग से प्रोसेस हो सकती हैं।