ए.एल. के अनुसार सिस्टम का इष्टतम व्यवहार शमीसु. व्यवहार। इष्टतम व्यवहार का नियम इष्टतम व्यवहार

बच्चों के लिए ज्वरनाशक दवाएं बाल रोग विशेषज्ञ द्वारा निर्धारित की जाती हैं। लेकिन बुखार के साथ आपातकालीन स्थितियाँ होती हैं जब बच्चे को तुरंत दवा देने की आवश्यकता होती है। तब माता-पिता जिम्मेदारी लेते हैं और ज्वरनाशक दवाओं का उपयोग करते हैं। शिशुओं को क्या देने की अनुमति है? आप बड़े बच्चों में तापमान कैसे कम कर सकते हैं? कौन सी दवाएँ सबसे सुरक्षित हैं?

संगठनात्मक गतिविधियाँ। संगठनात्मक प्रक्रिया के वैकल्पिक प्रतिमान.

संगठनात्मक गतिविधियों के लिए दृष्टिकोणों की संपूर्ण विविधता को दो वैकल्पिक प्रतिमानों (तालिका 5.1) के रूप में प्रस्तुत किया जा सकता है। उपरोक्त प्रतिमान संगठनात्मक गतिविधि के लिए दो मौलिक रूप से भिन्न दृष्टिकोण दर्शाते हैं। पहले को मोटे तौर पर जबरदस्ती का दृष्टिकोण कहा जा सकता है, जब निर्माण और रखरखाव के लिए प्रयास आवश्यक होता है। जैसे ही ये प्रयास रुकते हैं, सिस्टम अपनी मूल स्थिति में लौट आता है। आप जितनी चाहें उतनी कृत्रिम संगठनात्मक योजनाएँ बना सकते हैं, लेकिन वे नाजुक और अप्रभावी होंगी। इतिहास ऐसे कई उदाहरण जानता है: सामूहिक फार्म, आर्थिक परिषदें, उत्पादन संघ आदि।

तालिका 5.1

संगठनात्मक प्रक्रिया के वैकल्पिक प्रतिमान

दूसरा दृष्टिकोण संगठन की प्राकृतिक प्रक्रियाओं पर केंद्रित है, जो मानव इच्छा के लिए जगह देने के लिए काफी समय से विकसित हो रही है। मानवीय लक्ष्य जो प्राकृतिक विकास की सीमा से बाहर हैं (उदाहरण के लिए, सामूहिक खेतों का निर्माण) विफलता के लिए अभिशप्त हैं, चाहे उन्हें प्राप्त करने के लिए किसी भी संसाधन का उपयोग किया जाए। साथ ही, यहां कोई भाग्यवाद नहीं है - एक व्यक्ति को अपने लक्ष्य-निर्धारण और स्वैच्छिक गतिविधि के साथ विकास प्रक्रिया से बाहर नहीं रखा जाता है, किसी को केवल शर्त को पूरा करने की आवश्यकता होती है: किसी व्यक्ति के लक्ष्यों का स्थान दिशाओं की सीमा के साथ मेल खाना चाहिए प्राकृतिक (सैद्धान्तिक रूप से संभव) विकास का। प्राकृतिक विकास के प्रति रुझान ए. स्मिथ के अध्ययन में भी पाया जा सकता है, जिन्होंने तर्क दिया कि समाज के सामाजिक-आर्थिक विकास के लिए शांति, हल्के कर और प्रबंधन में सहिष्णुता आवश्यक है, और बाकी काम प्राकृतिक तरीके से किया जाएगा। की चीजे।

नियंत्रण प्रणाली - साइबरनेटिक दृष्टिकोण। नियंत्रण सिद्धांत: ओपन-लूप नियंत्रण सिद्धांत; अशांति क्षतिपूर्ति के साथ ओपन-लूप नियंत्रण सिद्धांत; बंद-लूप नियंत्रण सिद्धांत; एक-शॉट नियंत्रण सिद्धांत.

आयोजन की एक प्रक्रिया के रूप में संगठन प्रबंधन के मुख्य कार्यों में से एक है। प्रबंधन फ़ंक्शन को सामग्री की एकता द्वारा एकजुट, दोहराए जाने वाले प्रबंधन कार्यों के एक सेट के रूप में समझा जाता है। चूँकि संगठन (एक प्रक्रिया के रूप में) एक प्रबंधन कार्य के रूप में कार्य करता है, कोई भी प्रबंधन एक संगठनात्मक गतिविधि है, हालाँकि यह यहीं तक सीमित नहीं है।

नियंत्रण एक प्रणाली पर एक विशेष रूप से उन्मुख प्रभाव है, जो यह सुनिश्चित करता है कि उसे आवश्यक गुण या स्थितियाँ दी गई हैं। राज्य की विशेषताओं में से एक संरचना है।

व्यवस्थित करने का अर्थ है, सबसे पहले, एक संरचना बनाना (या बदलना)।

नियंत्रण प्रणालियों के निर्माण के दृष्टिकोण में अंतर के बावजूद, साइबरनेटिक्स में सामान्य सिद्धांत विकसित किए गए हैं। साइबरनेटिक दृष्टिकोण के परिप्रेक्ष्य से, एक नियंत्रण प्रणाली एक नियंत्रण विषय (नियंत्रण प्रणाली), एक नियंत्रण वस्तु (प्रबंधित प्रणाली), साथ ही उनके बीच प्रत्यक्ष और प्रतिक्रिया कनेक्शन का एक अभिन्न सेट है। यह भी माना जाता है कि नियंत्रण प्रणाली बाहरी वातावरण के साथ परस्पर क्रिया करती है।

नियंत्रण प्रणालियों के निर्माण के लिए बुनियादी वर्गीकरण सुविधा, जो प्रणाली के प्रकार और इसकी संभावित क्षमताओं को निर्धारित करती है, नियंत्रण लूप को व्यवस्थित करने की विधि है। उत्तरार्द्ध के अनुसार, नियंत्रण लूप को व्यवस्थित करने के लिए कई सिद्धांतों की पहचान की गई है।

ओपन-लूप (सॉफ़्टवेयर) नियंत्रण का सिद्धांत।यह सिद्धांत सिस्टम पर स्वायत्त प्रभाव के विचार पर आधारित है, इसकी परिचालन स्थितियों की परवाह किए बिना। जाहिर है, इस सिद्धांत के व्यावहारिक अनुप्रयोग का दायरा इसके संचालन की पूरी श्रृंखला में पर्यावरण और प्रणाली की स्थिति के ज्ञान की विश्वसनीयता को मानता है। फिर गणना किए गए प्रभाव के लिए सिस्टम की प्रतिक्रिया को पूर्व निर्धारित करना संभव है, जो एक फ़ंक्शन के रूप में पूर्व-प्रोग्राम किया गया है (चित्र 5.1)।

चावल। 5.1. ओपन-लूप नियंत्रण सिद्धांत

यदि यह प्रभाव अपेक्षित से भिन्न है, तो आउटपुट निर्देशांक में परिवर्तन की प्रकृति में विचलन तुरंत आ जाएगा, अर्थात। सिस्टम शब्द के मूल अर्थ में गड़बड़ी से असुरक्षित रहेगा। इसलिए, एक समान सिद्धांत का उपयोग तब किया जाता है जब सिस्टम की परिचालन स्थितियों के बारे में जानकारी की विश्वसनीयता में विश्वास होता है। उदाहरण के लिए, संगठनात्मक प्रणालियों के लिए ऐसा आत्मविश्वास उच्च कार्यकारी अनुशासन के साथ स्वीकार्य है, जब दिए गए आदेश को बाद के नियंत्रण की आवश्यकता नहीं होती है। कभी-कभी इस प्रकार के प्रबंधन को निर्देशात्मक प्रबंधन कहा जाता है। इस नियंत्रण योजना का निस्संदेह लाभ प्रबंधन संगठन की सादगी है।

गड़बड़ी क्षतिपूर्ति के साथ ओपन-लूप नियंत्रण का सिद्धांत।दृष्टिकोण की सामग्री पहली योजना की सीमाओं को खत्म करने की इच्छा है, अर्थात। सिस्टम के कामकाज पर गड़बड़ी का अनियमित प्रभाव। गड़बड़ी की भरपाई करने की संभावना, और इसलिए प्राथमिक जानकारी की अविश्वसनीयता को समाप्त करना, माप में गड़बड़ी की पहुंच पर आधारित है (चित्र 5.2)।


चावल। 5.2. मुआवजा प्रबंधन सिद्धांत

गड़बड़ी को मापने से क्षतिपूर्ति नियंत्रण निर्धारित करना संभव हो जाता है जो गड़बड़ी के परिणामों का प्रतिकार करता है। आमतौर पर, सुधारात्मक नियंत्रण के साथ-साथ, सिस्टम सॉफ़्टवेयर प्रभाव के अधीन होता है। हालाँकि, व्यवहार में, बाहरी गड़बड़ी के बारे में जानकारी दर्ज करना हमेशा संभव नहीं होता है, सिस्टम मापदंडों में निगरानी विचलन या अप्रत्याशित संरचनात्मक परिवर्तनों का उल्लेख नहीं करना। यदि गड़बड़ी के बारे में जानकारी उपलब्ध है, तो क्षतिपूर्ति नियंत्रण शुरू करके उनकी भरपाई का सिद्धांत व्यावहारिक हित का है।

बंद-लूप नियंत्रण सिद्धांत.ऊपर चर्चा किए गए सिद्धांत खुले नियंत्रण लूप के वर्ग से संबंधित हैं: नियंत्रण की मात्रा वस्तु के व्यवहार पर निर्भर नहीं करती है, बल्कि समय या गड़बड़ी का एक कार्य है। बंद नियंत्रण लूपों का वर्ग नकारात्मक प्रतिक्रिया वाले सिस्टम द्वारा बनता है, जो साइबरनेटिक्स के मूल सिद्धांत को दर्शाता है।

ऐसी प्रणालियों में, यह इनपुट प्रभाव नहीं है जो पहले से प्रोग्राम किया गया है, बल्कि सिस्टम की आवश्यक स्थिति है, अर्थात। नियंत्रण सहित वस्तु पर प्रभाव का परिणाम। नतीजतन, ऐसी स्थिति संभव है जब कोई गड़बड़ी सिस्टम की गतिशीलता पर सकारात्मक प्रभाव डालती है यदि यह अपनी स्थिति को वांछित के करीब लाती है। सिद्धांत को लागू करने के लिए, समय के साथ सिस्टम की स्थिति को बदलने के लिए एक कार्यक्रम कानून स्प्र (टी) को प्राथमिकता दी जाती है, और सिस्टम का कार्य यह सुनिश्चित करने के लिए तैयार किया जाता है कि वास्तविक स्थिति वांछित स्थिति तक पहुंचती है (चित्र 5.3)। इस समस्या का समाधान वांछित स्थिति और वास्तविक स्थिति के बीच अंतर निर्धारित करके प्राप्त किया जाता है:

∆С(t) = Ср(t) – С(t).


चित्र 5. 3 बंद-लूप नियंत्रण सिद्धांत

इस अंतर का उपयोग पता लगाए गए बेमेल को कम करने के लिए नियंत्रण के लिए किया जाता है। यह सुनिश्चित करता है कि नियंत्रित समन्वय प्रोग्राम फ़ंक्शन तक पहुंचता है, चाहे उन कारणों की परवाह किए बिना जो अंतर पैदा करते हैं, चाहे वह विभिन्न मूल की गड़बड़ी या नियंत्रण त्रुटियां हों। नियंत्रण की गुणवत्ता क्षणिक प्रक्रिया की प्रकृति और स्थापित त्रुटि - प्रोग्राम किए गए और वास्तविक अंतिम राज्यों के बीच विसंगति को प्रभावित करती है।

इनपुट सिग्नल के आधार पर, नियंत्रण सिद्धांत भेद करता है:

■ कार्यक्रम नियंत्रण प्रणाली (मामला विचाराधीन);

■ स्थिरीकरण प्रणाली, जब सीपीआर(टी) = 0;

■ ट्रैकिंग सिस्टम जब इनपुट सिग्नल प्राथमिक रूप से अज्ञात हो।

यह विवरण किसी भी तरह से सिद्धांत के कार्यान्वयन को प्रभावित नहीं करता है, बल्कि सिस्टम के निर्माण की तकनीक में विशिष्टता लाता है।

प्राकृतिक और कृत्रिम प्रणालियों में इस सिद्धांत का व्यापक वितरण सर्किट के संगठन की उत्पादकता द्वारा समझाया गया है: नकारात्मक प्रतिक्रिया की शुरूआत के कारण नियंत्रण समस्या को वैचारिक स्तर पर प्रभावी ढंग से हल किया जाता है।

सिस्टम की स्थिति Ср(t) के समय में प्रोग्रामिंग परिवर्तन के मामले पर विचार किया जाता है, जिसका अर्थ है राज्य स्थान में प्रक्षेपवक्र की प्रारंभिक गणना। लेकिन यह कैसे किया जाए यह सवाल नज़रों से ओझल हो गया। उत्तर प्रक्षेपवक्र के लिए दो आवश्यकताओं द्वारा सीमित है, जो होना चाहिए:

1) लक्ष्य से गुजरना;

2) गुणवत्ता मानदंड की चरम सीमा को पूरा करें, अर्थात। इष्टतम हो.

औपचारिक गतिशील प्रणालियों में, ऐसे प्रक्षेपवक्र को खोजने के लिए, विविधताओं की गणना या इसके आधुनिक संशोधनों के उपकरण का उपयोग किया जाता है: एल. पोंट्रीगिन का अधिकतम सिद्धांत या आर. बेलमैन की गतिशील प्रोग्रामिंग। मामले में जब समस्या सिस्टम के अज्ञात पैरामीटर (गुणांक) की खोज करने के लिए आती है, तो इसे हल करने के लिए गणितीय प्रोग्रामिंग विधियों का उपयोग किया जाता है - पैरामीटर स्पेस में गुणवत्ता फ़ंक्शन (संकेतक) के चरम को ढूंढना आवश्यक है। खराब औपचारिक समस्याओं को हल करने के लिए, कोई केवल भविष्य संबंधी पूर्वानुमानों या गणितीय सिमुलेशन मॉडलिंग के परिणामों पर आधारित अनुमानी समाधानों पर भरोसा कर सकता है। ऐसे निर्णयों की सटीकता का आकलन करना कठिन है।

चलिए प्रोग्रामिंग समस्या पर वापस आते हैं। यदि औपचारिक कार्यों के लिए प्रोग्राम प्रक्षेपवक्र की गणना करने का कोई तरीका है, तो नियंत्रण प्रणाली को लक्ष्य पदनाम से संतुष्ट होना स्वाभाविक है, और सीधे नियंत्रण प्रक्रिया (टर्मिनल नियंत्रण) में सिस्टम की स्थिति में प्रोग्राम परिवर्तन ढूंढना स्वाभाविक है। . सिस्टम का ऐसा संगठन, निश्चित रूप से, नियंत्रण एल्गोरिदम को जटिल बना देगा, लेकिन प्रारंभिक जानकारी को कम करने की अनुमति देगा, जिसका अर्थ है कि यह नियंत्रण को और अधिक कुशल बना देगा। 1960 के दशक में भी ऐसा ही एक कार्य। बैलिस्टिक मिसाइलों और अंतरिक्ष यान की गति को नियंत्रित करने के लिए प्रोफेसर ई. गोर्बातोव द्वारा सैद्धांतिक रूप से हल किया गया था।

इष्टतम नियंत्रण समस्या के निर्माण एवं समाधान के संबंध में निम्नलिखित मूलभूत परिस्थिति को ध्यान में रखा जाना चाहिए।

सिस्टम का इष्टतम व्यवहार चुनना तभी संभव है जब संपूर्ण नियंत्रण अंतराल पर अध्ययन की जा रही वस्तु का व्यवहार और जिन परिस्थितियों में गति होती है, वे विश्वसनीय रूप से ज्ञात हों।

इष्टतम समाधान अन्य, अतिरिक्त मान्यताओं को पूरा करके प्राप्त किया जा सकता है, लेकिन मुद्दा यह है कि प्रत्येक मामले को अलग से निर्दिष्ट किया जाना चाहिए, समाधान "शर्तों तक" मान्य होगा;

आइए उच्च परिणाम प्राप्त करने का प्रयास करने वाले धावक के व्यवहार के उदाहरण का उपयोग करके बताई गई स्थिति का वर्णन करें। यदि हम छोटी दूरी (100, 200 मीटर) के बारे में बात कर रहे हैं, तो एक प्रशिक्षित एथलीट समय के प्रत्येक क्षण में अधिकतम गति सुनिश्चित करने का लक्ष्य निर्धारित करता है। लंबी दूरी तक दौड़ते समय, सफलता मार्ग पर बलों को सही ढंग से वितरित करने की उसकी क्षमता से निर्धारित होती है, और इसके लिए उसे अपनी क्षमताओं, मार्ग के इलाके और अपने विरोधियों की विशेषताओं को स्पष्ट रूप से समझना चाहिए। सीमित संसाधनों की स्थिति में, किसी भी समय किसी अधिकतम गति की बात नहीं की जा सकती है।

यह बिल्कुल स्पष्ट है कि उपरोक्त प्रतिबंध केवल समस्या के नियतात्मक सूत्रीकरण के ढांचे के भीतर ही संतुष्ट है, अर्थात। जब सब कुछ निश्चितता के साथ प्राथमिकता से ज्ञात हो। वास्तविक समस्याओं के लिए ऐसी स्थितियाँ अत्यधिक हो जाती हैं: नियतिवाद का प्रोक्रस्टियन बिस्तर सिस्टम की वास्तविक परिचालन स्थितियों के अनुरूप नहीं है। हमारे ज्ञान की प्राथमिक प्रकृति प्रणाली और पर्यावरण तथा किसी वस्तु के साथ उसकी अंतःक्रिया दोनों के संबंध में अत्यंत संदिग्ध है। प्रणाली जितनी जटिल होगी, प्राथमिक जानकारी उतनी ही कम विश्वसनीय होगी, जो संश्लेषण प्रक्रिया का संचालन करने वाले शोधकर्ताओं में आशावाद नहीं जोड़ती है।

इस तरह की अनिश्चितता ने सिस्टम के अस्तित्व की स्टोकेस्टिक स्थितियों को ध्यान में रखते हुए, नियंत्रण सिद्धांत में एक संपूर्ण दिशा के उद्भव को जन्म दिया है। अनुकूली और स्व-समायोजन प्रणालियों के सिद्धांतों के विकास में सबसे रचनात्मक परिणाम प्राप्त हुए।

प्रबंधन अनुकूलन. अनुकूली और स्व-समायोजन प्रणालियाँ।

अनुकूली प्रणालियाँ नियंत्रण प्रक्रिया के दौरान वस्तु की स्थिति और पर्यावरण के साथ उसकी अंतःक्रिया के बारे में अतिरिक्त जानकारी प्राप्त करके अनिश्चितता से निपटना संभव बनाती हैं, इसके बाद सिस्टम की संरचना को पुनर्गठित करती हैं और परिचालन की स्थिति ज्ञात प्राथमिकता से विचलित होने पर इसके मापदंडों को बदलती हैं। वाले (चित्र 5.4)। इस मामले में, एक नियम के रूप में, परिवर्तनों का लक्ष्य सिस्टम की विशेषताओं को नियंत्रण के संश्लेषण में उपयोग की जाने वाली प्राथमिकताओं के करीब लाना है। इस प्रकार, अनुकूलन गड़बड़ी की स्थितियों के तहत सिस्टम होमियोस्टैसिस को बनाए रखने पर केंद्रित है।


चावल। 5.4. अनुकूली प्रणाली

इस कार्य के सबसे कठिन डिजाइन घटकों में से एक पर्यावरण की स्थिति के बारे में जानकारी प्राप्त करना है, जिसके बिना अनुकूलन करना मुश्किल है।

पर्यावरण की स्थिति के बारे में जानकारी के सफल अधिग्रहण का एक उदाहरण पिटोट ट्यूब का आविष्कार है, जो लगभग सभी विमानों से सुसज्जित है। ट्यूब आपको वेग दबाव को मापने की अनुमति देती है - सबसे महत्वपूर्ण विशेषता जिस पर सभी वायुगतिकीय बल सीधे निर्भर होते हैं। माप परिणामों का उपयोग ऑटोपायलट को कॉन्फ़िगर करने के लिए किया जाता है। सामाजिक व्यवस्थाओं में एक समान भूमिका समाजशास्त्रीय सर्वेक्षणों द्वारा निभाई जाती है, जो घरेलू और विदेश नीति की समस्याओं के समाधान को समायोजित करना संभव बनाता है।

किसी नियंत्रण वस्तु की गतिशीलता का अध्ययन करने के लिए एक प्रभावी तकनीक दोहरी नियंत्रण विधि है, जिसे एक बार ए. फेल्डबाम द्वारा प्रस्तावित किया गया था। इसका सार यह है कि, नियंत्रण आदेशों के साथ, वस्तु पर विशेष परीक्षण संकेत भेजे जाते हैं, जिसकी प्रतिक्रिया प्राथमिकता मॉडल के लिए पूर्व निर्धारित होती है। मानक एक से वस्तु की प्रतिक्रिया के विचलन के आधार पर, बाहरी वातावरण के साथ मॉडल की बातचीत का आकलन किया जाता है।

प्रथम विश्व युद्ध के दौरान एक जासूस की पहचान करने के लिए रूसी प्रतिवाद द्वारा इसी तरह की तकनीक का उपयोग किया गया था। राजद्रोह के संदेह वाले कर्मचारियों के एक समूह की पहचान की गई, और इस मंडल में से प्रत्येक को एक अद्वितीय प्रकृति की महत्वपूर्ण लेकिन झूठी जानकारी के साथ "भरोसा" दिया गया। शत्रु की प्रतिक्रिया देखी गई, जिससे गद्दार की पहचान हो गई।

स्व-समायोजन प्रणालियों का वर्ग अनुकूली प्रणालियों से अलग है। बाद वाले को अनुकूलन प्रक्रिया के दौरान समायोजित किया जाता है। हालाँकि, व्यापकता के स्वीकृत स्तर पर, एक स्व-ट्यूनिंग प्रणाली की संरचना एक अनुकूली प्रणाली की संरचना के समान है (चित्र 5.4 देखें)।

अनुकूलन और स्व-ट्यूनिंग की प्रक्रियाओं के संबंध में, यह ध्यान दिया जा सकता है कि विशिष्ट मामलों में उनकी संभावना मुख्य रूप से सिस्टम के उद्देश्य और उसके तकनीकी कार्यान्वयन से निर्धारित होती है। इस तरह का सिस्टम सिद्धांत दृष्टांतों से भरा हुआ है, लेकिन इसमें सामान्यीकृत उपलब्धियाँ शामिल नहीं हैं।

नियंत्रण प्रक्रिया पर प्राथमिक डेटा की अपर्याप्तता को दूर करने का एक अन्य तरीका नियंत्रण प्रक्रिया को इसके संश्लेषण की प्रक्रिया के साथ जोड़ना है। परंपरागत रूप से, एक नियंत्रण एल्गोरिदम गति मॉडल के नियतात्मक विवरण की धारणा के आधार पर संश्लेषण का परिणाम होता है। लेकिन यह स्पष्ट है कि अपनाए गए मॉडल की गति में विचलन लक्ष्य प्राप्त करने की सटीकता और प्रक्रियाओं की गुणवत्ता को प्रभावित करते हैं, अर्थात। मानदंड के चरम से विचलन की ओर ले जाता है। इसका तात्पर्य यह है कि नियंत्रण को एक टर्मिनल नियंत्रण के रूप में बनाया जाना चाहिए, जो वास्तविक समय में प्रक्षेपवक्र की गणना करता है और ऑब्जेक्ट मॉडल और यातायात स्थितियों के बारे में जानकारी अद्यतन करता है। बेशक, इस मामले में भी, पूरे शेष नियंत्रण अंतराल के लिए ड्राइविंग स्थितियों को एक्सट्रपलेशन करना आवश्यक है, लेकिन जैसे-जैसे आप लक्ष्य के करीब पहुंचते हैं, एक्सट्रपलेशन की सटीकता बढ़ जाती है, जिसका अर्थ है कि नियंत्रण की गुणवत्ता में सुधार होता है।

यह उस सरकार के कार्यों के अनुरूप है जो बजट जैसे नियोजित लक्ष्यों को पूरा करने में असमर्थ है। अर्थव्यवस्था की परिचालन स्थितियाँ पूर्वानुमानों के उल्लंघन में अनियोजित तरीके से बदलती हैं, इसलिए अंतिम संकेतकों को प्राप्त करने के प्रयास में, विशेष रूप से, ज़ब्ती को अंजाम देने के प्रयास में नियोजित योजना को लगातार समायोजित करना आवश्यक है। प्राथमिक धारणाओं से विचलन इतना बड़ा हो सकता है कि उपलब्ध संसाधन और किए गए प्रबंधन उपाय अब लक्ष्य की उपलब्धि सुनिश्चित नहीं कर सकते हैं। फिर आपको लक्ष्य को "करीब लाना" होगा, इसे उपलब्धि के नए क्षेत्र में रखना होगा। ध्यान दें कि वर्णित योजना केवल स्थिर प्रणाली के लिए मान्य है। प्रबंधन संगठन की खराब गुणवत्ता अस्थिरता का कारण बन सकती है और, परिणामस्वरूप, संपूर्ण प्रणाली का विनाश हो सकता है।

आइए हम एक और प्रबंधन सिद्धांत पर ध्यान दें जो संचालन अनुसंधान के विकसित सिद्धांत को रेखांकित करता है।

एकमुश्त नियंत्रण सिद्धांत। व्यावहारिक रूप से महत्वपूर्ण कार्यों की एक विस्तृत श्रृंखला प्रबंधन के एक बार के कार्य को करने की आवश्यकता को मानती है, अर्थात् निर्णय लेने के लिए, जिसके परिणाम लंबे समय तक महसूस किए जाते हैं। बेशक, पारंपरिक प्रबंधन की व्याख्या एक बार के निर्णयों के अनुक्रम के रूप में भी की जा सकती है। यहां हमें फिर से विसंगति और निरंतरता की समस्या का सामना करना पड़ता है, जिसके बीच की सीमा स्थिर और गतिशील प्रणालियों के बीच की तरह धुंधली है। हालाँकि, एक अंतर अभी भी मौजूद है: शास्त्रीय नियंत्रण सिद्धांत में यह माना जाता है कि सिस्टम पर प्रभाव एक प्रक्रिया है, समय या राज्य मापदंडों का एक कार्य है, न कि एक बार की प्रक्रिया।

संचालन अनुसंधान की एक और विशिष्ट विशेषता यह है कि यह विज्ञान नियंत्रण - स्थिरांक, सिस्टम मापदंडों के साथ संचालित होता है। फिर, यदि गतिशील समस्याओं में एक गणितीय निर्माण को एक मानदंड के रूप में उपयोग किया जाता है - एक कार्यात्मक जो सिस्टम की गति का मूल्यांकन करता है, तो संचालन के अध्ययन में मानदंड में सिस्टम के अध्ययन किए गए मापदंडों के सेट पर परिभाषित एक फ़ंक्शन का रूप होता है।

संचालन अनुसंधान द्वारा कवर की गई व्यावहारिक समस्याओं का क्षेत्र बहुत व्यापक है और इसमें संसाधन आवंटन, मार्ग चयन, योजना, इन्वेंट्री प्रबंधन, कतारबद्ध समस्याओं में कतार प्रबंधन आदि जैसी गतिविधियां शामिल हैं। प्रासंगिक समस्याओं को हल करते समय, उनके विवरण के लिए ऊपर वर्णित पद्धति मॉडल, राज्य, लक्ष्य, मानदंड, प्रबंधन की श्रेणियों को ध्यान में रखते हुए उपयोग किया जाता है। अनुकूलन समस्या, जिसमें पैरामीटर स्पेस में मानदंड फ़ंक्शन के चरम को ढूंढना शामिल है, को भी तैयार और हल किया गया है। समस्याओं को नियतात्मक और स्टोकेस्टिक दोनों फॉर्मूलेशन में हल किया जाता है।

चूंकि स्थिरांक के साथ संचालन की प्रक्रिया कार्यों के साथ संचालन की तुलना में बहुत सरल है, संचालन अनुसंधान का सिद्धांत सिस्टम के सामान्य सिद्धांत और विशेष रूप से, गतिशील प्रणालियों के नियंत्रण के सिद्धांत की तुलना में अधिक उन्नत निकला। संचालन अनुसंधान व्यावहारिक रूप से महत्वपूर्ण समस्याओं की एक विस्तृत श्रृंखला को हल करने के लिए गणितीय उपकरणों का एक बड़ा शस्त्रागार प्रदान करता है, जो कभी-कभी काफी परिष्कृत होता है। संचालन अनुसंधान की सेवा देने वाले गणितीय तरीकों के पूरे सेट को गणितीय प्रोग्रामिंग कहा जाता है। इस प्रकार, संचालन अनुसंधान के ढांचे के भीतर, निर्णय लेने का सिद्धांत विकसित किया जा रहा है - एक अत्यंत प्रासंगिक क्षेत्र।

निर्णय लेने का सिद्धांत, संक्षेप में, एक वेक्टर मानदंड के विस्तृत विवरण और इसके चरम मूल्य को स्थापित करने की विशेषताओं के लिए स्थितियों को अनुकूलित करने की प्रक्रिया पर विचार करता है। इस प्रकार, किसी समस्या का सूत्रीकरण कई घटकों से युक्त एक मानदंड की विशेषता है, अर्थात। बहुमानदंड समस्या.

मानदंड और निर्णय लेने की प्रक्रिया की व्यक्तिपरकता पर जोर देने के लिए, समस्या के व्यक्तिगत दृष्टिकोण वाले एक निर्णय निर्माता (डीडीएम) को विचार में शामिल किया जाता है। औपचारिक तरीकों का उपयोग करके समाधानों का अध्ययन करते समय, मानदंड के एक या दूसरे घटक का आकलन करते समय यह प्राथमिकताओं की एक प्रणाली के माध्यम से प्रकट होता है।

एक नियम के रूप में, निर्णय लेने के लिए निर्णय निर्माता को कार्रवाई के लिए कई विकल्प प्राप्त होते हैं, जिनमें से प्रत्येक का मूल्यांकन किया जाता है। तंत्र द्वारा तैयार किए गए विकल्पों में से किसी एक को चुनते समय यह दृष्टिकोण एक संगठनात्मक प्रणाली में एक जिम्मेदार विषय की कार्रवाई की वास्तविक स्थितियों के जितना संभव हो उतना करीब होता है। उनमें से प्रत्येक के पीछे अंतिम परिणामों के विश्लेषण के साथ घटनाओं के संभावित पाठ्यक्रम का एक अध्ययन (विश्लेषणात्मक, गणितीय सिमुलेशन) है - एक परिदृश्य। महत्वपूर्ण निर्णय लेने की सुविधा के लिए, स्थिति कक्ष व्यवस्थित किए जाते हैं, जो डिस्प्ले या स्क्रीन पर परिदृश्य प्रदर्शित करने के दृश्य साधनों से सुसज्जित होते हैं। इस उद्देश्य के लिए, विशेषज्ञ (ऑपरेशनलिस्ट) शामिल होते हैं जो न केवल स्थितियों का विश्लेषण करने और निर्णय तैयार करने के गणितीय तरीकों में, बल्कि विषय क्षेत्र में भी कुशल होते हैं।

यह स्पष्ट है कि संचालन अनुसंधान के सिद्धांत, विशेष रूप से, और निर्णय लेने के सिद्धांत को किसी वस्तु पर लागू करने का परिणाम एक निश्चित इष्टतम कार्य योजना है। नतीजतन, एक निश्चित ब्लॉक का इनपुट, एक अनुकूलन एल्गोरिथ्म के साथ "भरा हुआ" और एक स्थिति मॉडल के गणितीय प्रोग्रामिंग की उपयुक्त विधि का उपयोग करके निर्मित, जानकारी के साथ आपूर्ति की जाती है: प्रारंभिक स्थिति, लक्ष्य, गुणवत्ता मानदंड, विभिन्न मापदंडों की सूची, प्रतिबंध। (एल्गोरिदम का निर्माण करते समय सिस्टम मॉडल का उपयोग किया जाता है।) ब्लॉक का आउटपुट वांछित योजना है। साइबरनेटिक्स के दृष्टिकोण से, ऐसे निर्माण को एक खुले नियंत्रण लूप के रूप में वर्गीकृत किया जाता है, क्योंकि आउटपुट जानकारी इनपुट सिग्नल को प्रभावित नहीं करती है।

सिद्धांत रूप में, विचारित दृष्टिकोण को बंद-लूप नियंत्रण के मामले में भी लागू किया जा सकता है। ऐसा करने के लिए, समय के साथ एक पुनरावृत्त प्रक्रिया को व्यवस्थित करना आवश्यक है: योजना को लागू करने के बाद, प्रारंभिक स्थिति के रूप में सिस्टम की एक नई स्थिति पेश करें और चक्र को दोहराएं। यदि कार्य अनुमति देता है, तो आप लक्ष्य को सिस्टम की प्रारंभिक स्थिति के करीब लाकर योजना अवधि को छोटा कर सकते हैं। फिर प्रस्तावित कार्रवाइयों और ऊपर चर्चा की गई पुनरावृत्त टर्मिनल नियंत्रण प्रक्रिया के बीच एक समानता है, जो प्रारंभिक जानकारी के आवधिक अद्यतन पर भी आधारित है। इसके अलावा, प्रक्रियाओं के साथ काम करने वाली एक गतिशील समस्या को कार्यात्मक श्रृंखला द्वारा कार्यों के सन्निकटन तक कम किया जा सकता है। इस मामले में, चर चर पहले से ही ऐसी श्रृंखला के पैरामीटर होंगे, जिसका अर्थ है कि संचालन अनुसंधान के सिद्धांत का तंत्र लागू होगा। (यह संभाव्यता सिद्धांत में किया जाता है, जब यादृच्छिक प्रक्रियाओं को विहित विस्तार द्वारा वर्णित किया जाता है।)

उल्लिखित कार्यप्रणाली को स्थितिजन्य प्रबंधन के संश्लेषण में कृत्रिम बुद्धि के सिद्धांत में आवेदन मिलना शुरू हुआ।

सिस्टम सिद्धांत में अपर्याप्त रूप से सक्षम व्यक्तियों द्वारा निर्णय लेने के सिद्धांत के व्यावहारिक अनुप्रयोग से जुड़े खतरे को इंगित किया जाना चाहिए। इस प्रकार, अक्सर संगठनात्मक प्रणालियों (सरकारी संस्थानों, फर्मों, वित्तीय संगठनों) में निर्णय लेने को निरपेक्ष कर दिया जाता है और कई संकेतकों के साथ संचालन और एक बार के प्रबंधन अधिनियम के इष्टतम कार्यान्वयन तक सीमित कर दिया जाता है। साथ ही, वे सिस्टम के लिए की गई कार्रवाई के परिणामों की दृष्टि खो देते हैं, वे भूल जाते हैं कि वे मानदंड का नहीं, बल्कि सिस्टम का प्रबंधन कर रहे हैं, बंद प्रक्रिया की बहु-चरण प्रकृति को ध्यान में नहीं रखते हुए - सिस्टम से इसकी स्थिति तक, फिर संकेतकों के माध्यम से समाधान तक और फिर सिस्टम तक। बेशक, इस लंबे रास्ते पर, वस्तुनिष्ठ और व्यक्तिपरक कई गलतियाँ की जाती हैं, जो नियोजित परिणामों से गंभीर विचलन के लिए पहले से ही पर्याप्त हैं।

इष्टतमता के सिद्धांत को नियमों के उस समूह के रूप में समझा जाता है जिसकी सहायता से निर्णय निर्माता अपनी कार्रवाई (निर्णय, विकल्प, रणनीति, प्रबंधन निर्णय) निर्धारित करता है जो उसके लक्ष्य की प्राप्ति में सर्वोत्तम योगदान देता है। इष्टतमता का सिद्धांत निर्णय लेने की विशिष्ट स्थितियों के आधार पर चुना जाता है: प्रतिभागियों की संख्या, उनकी क्षमताएं और लक्ष्य, हितों के टकराव की प्रकृति (प्रतिद्वंद्विता, गैर-प्रतिद्वंद्विता, सहयोग, आदि)।

निर्णय लेने वाले मॉडल में, विशेष रूप से गेम थ्योरी में, इष्टतम व्यवहार के बड़ी संख्या में औपचारिक सिद्धांत विकसित किए गए हैं। हम यहां उनमें से कुछ पर ही ध्यान केंद्रित करेंगे।

अधिकतमीकरण (न्यूनीकरण) का सिद्धांत। यह सिद्धांत लागू होता है मुख्य रूप से गणितीय प्रोग्रामिंग समस्याओं में (देखें (2) - (4))।

मानदंड कनवल्शन का सिद्धांत.इसका उपयोग तब किया जाता है जब एक समन्वय केंद्र द्वारा कई मानदंडों को "अनुकूलित" किया जाता है (प्रत्येक मानदंड (उद्देश्य कार्य) के लिए बहु-मानदंड अनुकूलन समस्या (5))।

एफ 1 (यू),...,एफ एन (यू)

"भार" (संख्याएँ) विशेषज्ञों द्वारा निर्दिष्ट किए जाते हैं

जहां α मैं मानदंड के "महत्व या महत्व" को दर्शाता है। इसके बाद, व्यवहार्य समाधानों के सेट से समाधान x* का चयन किया जाता है ताकि मानदंड के दृढ़ संकल्प को अधिकतम (या कम) किया जा सके:

शब्दकोषीय प्राथमिकता का सिद्धांत.यह बहुमानदंड अनुकूलन समस्याओं में इष्टतमता का एक और सिद्धांत है। सबसे पहले, मानदंडों को "महत्व" के आधार पर क्रमबद्ध किया जाता है। निम्नलिखित रैंकिंग बनाई जाए:

एफ 1 (एक्स),एफ 2 (एक्स),...,एफ एन (एक्स)

यदि n+1 शर्तों में से एक पूरी होती है, तो शब्दावली वरीयता के अर्थ में समाधान x*X समाधान xX से "बेहतर" है:

    एफ 1 (एक्स*)>एफ 1 (एक्स);

    एफ 1 (एक्स*)=एफ 1 (एक्स), एफ 2 (एक्स*)>एफ 2 (एक्स);

    एफ 1 (एक्स*)=एफ 1 (एक्स), एफ 2 (एक्स*)=एफ 2 (एक्स), एफ 3 (एक्स*)>एफ 3 (एक्स);

………………

    f i (x*)=f i (x) for i=1,…,n-1, f n (x*)>f n (x);

n+1) f i (x*)=f i (x) के लिए i=1,…,n.

मिनिमैक्स सिद्धांत.इसका उपयोग तब किया जाता है जब दो विरोधी पक्षों के हित टकराते हैं (विरोधी संघर्ष)। प्रत्येक निर्णय निर्माता पहले अपनी प्रत्येक रणनीति (विकल्प) के लिए "गारंटीयुक्त" परिणाम की गणना करता है, फिर अंत में उस रणनीति का चयन करता है जिसके लिए यह परिणाम उसकी अन्य रणनीतियों की तुलना में सबसे बड़ा होता है। इस तरह की कार्रवाई निर्णय लेने वाले को "अधिकतम लाभ" नहीं देती है, बल्कि एक विरोधी संघर्ष की स्थितियों में इष्टतमता का एकमात्र उचित सिद्धांत है। विशेष रूप से, किसी भी जोखिम को बाहर रखा गया है।

संतुलन का सिद्धांत.यह मिनिमैक्स सिद्धांत का सामान्यीकरण है, जब कई पार्टियां बातचीत में भाग लेती हैं, प्रत्येक अपने लक्ष्य का पीछा करती है (कोई सीधा टकराव नहीं होता है)। माना कि निर्णय लेने वालों (गैर-विरोधी संघर्ष में भाग लेने वालों) की संख्या n है। चुनी गई रणनीतियों का एक सेट (स्थिति)x 1 *,x 2 *,…,x n * को संतुलन कहा जाता है यदि इस स्थिति से किसी भी निर्णयकर्ता का एकतरफा विचलन केवल उसके अपने "लाभ" में कमी का कारण बन सकता है। संतुलन की स्थिति में, प्रतिभागियों को "अधिकतम" भुगतान नहीं मिलता है, लेकिन उन्हें इससे चिपके रहने के लिए मजबूर किया जाता है।

पेरेटो इष्टतमता सिद्धांत.यह सिद्धांत उन स्थितियों (रणनीतियों के सेट x 1,...,x n) को इष्टतम मानता है जिसमें किसी व्यक्तिगत भागीदार के "भुगतान" में सुधार करना अन्य प्रतिभागियों के "भुगतान" को खराब किए बिना असंभव है। यह सिद्धांत संतुलन सिद्धांत की तुलना में इष्टतमता की अवधारणा पर कमजोर मांग करता है। इसलिए, पेरेटो-इष्टतम स्थितियाँ लगभग हमेशा मौजूद रहती हैं।

गैर-प्रभुत्व वाले परिणामों का सिद्धांत. यह सिद्धांत सहकारी खेलों (सामूहिक निर्णय लेने) में कई इष्टतमता सिद्धांतों का प्रतिनिधि है और निर्णयों के "मूल" की अवधारणा की ओर ले जाता है। सभी प्रतिभागी एकजुट होते हैं और, संयुक्त समन्वित कार्यों के माध्यम से, "कुल लाभ" को अधिकतम करते हैं। गैर-प्रभुत्व का सिद्धांत प्रतिभागियों के बीच "निष्पक्ष" विभाजन के सिद्धांतों में से एक है। यह एक ऐसी स्थिति है जब कोई भी प्रतिभागी प्रस्तावित विभाजन ("मूल" तत्व) पर उचित रूप से आपत्ति नहीं कर सकता है। कुल जीत के "इष्टतम" विभाजन के लिए अन्य सिद्धांत हैं।

सिद्धांतोंवहनीयता(धमकीऔरजवाबी धमकियाँ)।सभी खतरे-प्रति-खतरे लचीलेपन सिद्धांतों के पीछे का विचार निम्नलिखित है। प्रतिभागियों का प्रत्येक गठबंधन एक वास्तविक खतरे के साथ अपना प्रस्ताव रखता है: यदि प्रस्ताव को शेष प्रतिभागियों द्वारा स्वीकार नहीं किया जाता है, तो ऐसी कार्रवाइयां की जाएंगी जिससे अन्य प्रतिभागियों की स्थिति खराब हो और स्थिति खराब न हो (संभवतः सुधार हो) धमकी देने वाले गठबंधन का. इष्टतम समाधान वह है जिसमें किसी भी गठबंधन के लिए किसी भी खतरे के खिलाफ, किसी गठबंधन से जवाबी खतरा हो।

मध्यस्थता योजनाएँ. आर्थिक संघर्ष एक "सामाजिक मध्यस्थ" के विचार का सुझाव देते हैं। उदाहरण के लिए, हितों का टकराव, खुली धमकियाँ और जवाबी धमकियाँ बनना अवांछनीय है। ऐसे सामाजिक तंत्र होने चाहिए जो प्रत्येक भागीदार की प्राथमिकताओं और रणनीतिक क्षमताओं को ध्यान में रख सकें और संघर्ष का "निष्पक्ष" समाधान प्रदान कर सकें। ऐसा अग्रिम तंत्र, चाहे वह कोई व्यक्ति हो या मतदान प्रणाली, मध्यस्थ कहलाता है। गेम थ्योरी में, मध्यस्थता योजना के अर्थ में एक इष्टतम समाधान, सिद्धांतों की एक प्रणाली का उपयोग करके बनाया जाता है, जिसमें यथास्थिति, पेरेटो इष्टतमता, विकल्पों की रैखिकता, "रैंक" से स्वतंत्रता आदि जैसी अवधारणाएं शामिल हैं।

आइए हम अनिश्चितता की स्थितियों में इष्टतम निर्णय लेने के मुद्दों पर आगे विचार करें। निर्णय निर्माता के इष्टतम व्यवहार को विकसित करने के लिए, ऐसी स्थिति को दो व्यक्तियों के विरोधी खेल के रूप में मॉडल करना उपयोगी होता है, जहां प्रकृति को निर्णय निर्माता के प्रतिद्वंद्वी के रूप में माना जाता है। उत्तरार्द्ध दी गई शर्तों के तहत बोधगम्य सभी संभावनाओं से संपन्न है।

समाधान के सर्वोत्तम विकल्प के लिए "प्रकृति के साथ खेल" के अपने विशिष्ट (यद्यपि न्यूनतम सिद्धांत की याद दिलाते हुए) सिद्धांत हैं।

अत्यधिक निराशावाद का सिद्धांत (वाल्ड मानदंड)। इस सिद्धांत के अनुसार, प्रकृति के साथ खेलना (अनिश्चितता की स्थिति में निर्णय लेना) एक उचित, आक्रामक प्रतिद्वंद्वी के साथ एक खेल के रूप में खेला जाता है जो हमें सफलता प्राप्त करने से रोकने के लिए सब कुछ करता है। एक निर्णय निर्माता की रणनीति को इष्टतम माना जाता है यदि यह "प्रकृति द्वारा अनुमत" से कम लाभ की गारंटी देता है।

मिनिमैक्स जोखिम सिद्धांत (सैवेज मानदंड)। यह सिद्धांत भी निराशावादी है, लेकिन इष्टतम रणनीति चुनते समय, यह "जीत" पर नहीं, बल्कि जोखिम पर ध्यान केंद्रित करने की सलाह देता है। जोखिम को निर्णय लेने वाले के अधिकतम लाभ (प्रकृति की स्थिति के बारे में पूरी जानकारी के अधीन) और वास्तविक लाभ (प्रकृति की स्थिति की अज्ञानता को देखते हुए) के बीच अंतर के रूप में परिभाषित किया गया है। इष्टतम रणनीति वह है जिसमें जोखिम न्यूनतम हो।

निराशावाद का सिद्धांत - आशावाद (हर्विट्ज़ मानदंड)।यह मानदंड अनुशंसा करता है कि समाधान चुनते समय, आपको अत्यधिक निराशावाद ("हमेशा सबसे खराब पर भरोसा करें!") या अत्यधिक आशावाद ("शायद वक्र आपको बाहर ले जाएगा!") द्वारा निर्देशित नहीं होना चाहिए अत्यधिक निराशावाद और अत्यधिक आशावाद के लाभ के बीच भारित औसत अधिकतम होता है। इसके अलावा, स्थितियों के खतरे के बारे में व्यक्तिपरक विचारों के आधार पर "वजन" चुना जाता है।

गतिशील स्थिरता अवधारणा.इष्टतमता के उपरोक्त सभी सिद्धांत स्थिर निर्णय लेने की समस्याओं के संबंध में तैयार किए गए हैं। गतिशील समस्याओं में उनका उपयोग करने का प्रयास सभी प्रकार की जटिलताओं के साथ हो सकता है।

मुख्य बात गतिशील प्रक्रियाओं की विशेषताएं हैं। यह आवश्यक है कि प्रक्रिया की प्रारंभिक अवस्था (समय के प्रारंभिक बिंदु पर) में चुना गया इष्टतमता का एक या दूसरा सिद्धांत, गतिशील प्रक्रिया के अंत तक किसी भी वर्तमान स्थिति (किसी भी समय) में इष्टतम बना रहे। इस सिद्धांत को गतिशील स्थिरता कहा जाता है।

शर्त के तहत Cq -^ O

कार्यात्मक (6.6) में वजन कारक के छोटे मूल्यों के लिए समस्या के समाधान का अध्ययन नियंत्रण तीव्रता पर प्रतिबंध होने पर बंद-लूप प्रणाली की अधिकतम प्राप्य सटीकता का आकलन करने के दृष्टिकोण से महत्वपूर्ण रुचि है (शक्ति) महत्वहीन हैं. इसके अलावा, नियंत्रण कार्रवाई की शक्ति के अधिकतम स्तर का मूल्यांकन करना महत्वपूर्ण लगता है, जिससे अधिक होने पर नियंत्रण सटीकता में और वृद्धि नहीं होती है।

हम निम्नलिखित कथन के रूप में स्थिति c 0 -»0 के तहत इष्टतम प्रणाली के सीमित व्यवहार के अध्ययन के मुख्य प्रावधान प्रस्तुत करते हैं।

प्रमेय 6.3. एक बंद प्रणाली के लिए (6.4), (6.7), जो कार्यक्षमता की दृष्टि से सर्वोत्तम है (6.6), रिश्ते वैध हैं

निम्नलिखित अतिरिक्त संकेतन का उपयोग यहां किया गया है:

और बहुपदबी*(ओं) हर्विट्ज़ है, और सम्मिश्र संख्याएँ(3, Р 2 ,..., Р पी बहुपद M(s) और की सामान्य जड़ें हैंबी*(-एस).

सबूत।आइए हम संकेतन का परिचय दें और, सूत्र (6.26), (6.27) के अनुरूप संबंध लिखें

कहाँ जीजे (आई = एल,एन)- बहुपद G'(-s,7.) की जड़ें।

(6.42)-(6.44) को ध्यान में रखते हुए, सूत्र (6.13)-(6.15) को निम्नलिखित रूप में प्रस्तुत किया जा सकता है:

यह स्पष्ट है कि शर्त के तहत एक बंद-लूप प्रणाली के सीमित व्यवहार पर विचार किया जाता है 0 से -> 0 समकक्षशर्त के तहत इसके सीमित व्यवहार पर विचार एक्स-> स्यू.

प्रमेय के प्रत्यक्ष प्रमाण पर आगे बढ़ने से पहले, हम बहुपद की जड़ों के सीमित व्यवहार पर विचार करते हैं जी*(-एस,एक्स) निर्दिष्ट शर्त के तहत पहचान (6.43) में।

इस प्रयोजन के लिए हम कार्य में प्रस्तुत सुप्रसिद्ध कथन का प्रयोग करेंगे, जिसके अनुसार प्रयास करते समय एक्स-> 00 मीटर बहुपद की जड़ें जी*(-एस,एक्स)बहुपद की जड़ों की ओर प्रवृत्त होते हैं बी*(-s)-नेगुरविट्ज़ फ़ैक्टराइज़ेशन परिणाम:

आराम (पी - टी)बहुपद की जड़ें जी*(-एस,एक्स)मान लें कि एक्स-> °о अनंत तक जाएं, स्पर्शोन्मुख रूप से सीधी रेखाओं के करीब आएं जो निर्देशांक के मूल में प्रतिच्छेद करती हैं और वास्तविक अक्ष के साथ कोण बनाती हैं, जो अभिव्यक्ति द्वारा निर्धारित होता है

और ये सभी जड़ें त्रिज्या के एक वृत्त पर स्थित हैं

उपरोक्त विचारों को ध्यान में रखते हुए, हमारे पास है
जहां नोटेशन का उपयोग किया जाता है

और स्थिर गुणांक /с, (/ =,पी-टी-) X के मान पर निर्भर नहीं है,

अब हम बहुपद के संबंध में दो संभावित विकल्पों पर क्रमिक रूप से विचार करेंगेएमपीबी(-एस)विस्तार में (6.41), क्रमशः स्थितियों द्वारा विशेषताएम आरबी=1 औरएम आरबी एफ 1.

विकल्प 1. मान लें कि शर्त पूरी हो गई हैएम पी बी(~ एस) =1, जो समानता Г) = 0 के बराबर है। इसका मतलब है कि बहुपदमें"(-s) का बहुपद M(s) = B"(-) के साथ कोई उभयनिष्ठ मूल नहीं है

आइए बहुपद के सीमित व्यवहार पर विचार करेंआर(एस,एक्स)(6.47) प्रदान किया गयाएक्स ->°°, यह पहले ही नोट कर लिया था

(6.50) से यह इस प्रकार हैटीबहुपद लिम की जड़ेंजी एफ (-एस,एक्स)बहुपद की जड़ों (3, (/ = 1,m) के साथ मेल खाता हैबी*(-एस), और बाकि(पी - टी)

जड़ें - जड़ों के साथ पी जी (जी =टी + 1,पी)बहुपदपी(-एस,एक्स)(6.53), जो निम्नलिखित अभिव्यक्तियों द्वारा परिभाषित हैं:

इस मामले में, रिश्ते स्पष्ट रूप से संतुष्ट हैं

संबंधों (6.50) और (6.54)-(6.56) को ध्यान में रखते हुए, सीमा बहुपदआर(एस, एक्स)दो सीमा बहुपदों के योग के रूप में दर्शाया जा सकता हैआर^एसवाईएक्स)औरआर2(एस,एक्स):

इनमें से पहला बहुपद केवल मूलों (3) से जुड़ा है, और दूसरा - केवल मूलों p से,:

(6.56) के अनुसार हमारे पास lim Р(-|3-Д) = ईगल हैएक्स1, इसलिए अभिव्यक्ति

टियोन (6.57) को फॉर्म में दर्शाया जा सकता है या

चूँकि, सूत्र (6.51), (6.53) के अनुसार,

ध्यान दें कि बहुपद B,*(s) के परिमित गुणांक हैं जो स्थिति M(P,.)*0 के कारण शून्येतर हैं और इससे स्वतंत्र हैं एक्स।

अब हम निम्नलिखित समानताओं को याद करते हुए संबंध (6.58) को बदलते हैं: डिग्री ए(एस) =पी, एसजे(एस) =एन(एस)/टी(एस)।), degN(s) =पी, degT(s) =क्यू. इसके अलावा, हम इस बात को ध्यान में रखते हैं कि शर्त degB"(-s) = degB"(s) =टी,जैसा कि दिखाना आसान है, रिश्ते की पूर्ति पर जोर देता है

तो हमारे पास हैं

लेकिन सूत्र (6.55) से संबंध (6.60) को ध्यान में रखते हुए यह निम्नानुसार है: और (6.56), (6.51) के अनुसार:

कहाँजी*औरजी**(/ = m + 1,н) - शून्य से भिन्न परिमित मापांक वाली सम्मिश्र संख्याएँ। फिर हमें मिलता है

और तदनुसार

(6.50)-(6.53) और (6.55) के आधार पर हमारे पास है:

और स्थिर सम्मिश्र संख्याएँ r; , आर यू , आर 2आई , के आई , के 2आई , ... , के(एन - एम -2 )मैं (मैं= + 1,i) A के मान पर निर्भर नहीं है।

फिर, असमानता की वैधता दी गई पी-टी> 1 (अन्यथा पीजे(एस,एक्स) = const), हमारे पास lim ?)(s,A)/A = 0 है और सूत्र (6.61) के अनुसार

लेकिन फिर, सर्वसमिका (6.59) और (6.62) के अनुसार, हम प्राप्त करते हैं

इस मामले में, (6.45) और (6.46) के अनुसार, हमारे पास इष्टतम बंद सिस्टम की सीमा हस्तांतरण मैट्रिक्स के लिए निम्नलिखित सूत्र हैं:

विकल्प 2।अब दूसरी स्थिति पर विचार करें, जब पहचान एम बी (-एस) = 1 पूरा नहीं हुआ है, अर्थात्। इस मामले में हम मानते हैं कि बहुपद में"(-एस)और M(s) = B"(-s)RC(s) में D) उभयनिष्ठ जड़ें हैं।

इस मामले में, बहुपद बी-एस)जहां उत्पाद द्वारा दर्शाया गया है

पिछले मामले के विपरीत, जब बहुपद के सीमित व्यवहार पर विचार किया जाता है आर(एस,एक्स)आइए इसे योग के रूप में प्रस्तुत करें तीनशर्तें:

और हम पहला बहुपद बनाएंगे सिर्फ साथबहुपद के मूलों (3, (/ = 1,Г)) का उपयोग करना एमपीबी(-एस),दूसरा - बहुपद के P g (I = T) +1, w) के मूल बी" क्यू (-एस) और तीसरा - जड़ें सी जी (आई = एम + एल, एन) बहुपद पी(एस)।

इस मामले में, दूसरे और तीसरे बहुपद के लिए, पिछले संस्करण के साथ पूर्ण सादृश्य में, हम प्राप्त करते हैं

एक बहुपद के लिए आरएक्सहमारे पास है

चूँकि M(RD = 0 Vie)।

दिए गए सूत्रों से (6.67)-(6.69) यह पहचान lim Kj(s,A,) = का अनुसरण करता है बी*2(एस), और, (6.64) में बहुपद को प्रतिस्थापित करना बी[(ओं)पर बी* 2 (एस),

हम इष्टतम बंद-लूप प्रणाली के लिए सीमित स्थानांतरण मैट्रिक्स का दूसरा संस्करण प्राप्त करते हैं। दोनों विकल्पों को एक ही अंकन के साथ संयोजित करने पर, हमें संबंध (6.37)-(6.41) प्राप्त होते हैं।

प्रमेय पूर्णतः सिद्ध है। ?

आइए हम प्रमेय 6.3 से एक प्राकृतिक परिणाम दें, जिसका स्वतंत्र महत्व है।

प्रमेय 6.4.यदि बहुपद B* की सभी जड़ें(-एस)बहुपद M(s) = के मूल भी हैंबी"(-एस)आरसी(एस),और साथ ही समानता पूरी होती हैआरवाईआर = 0,फिर मैं x0= एनएसएच1 एक्स (0 के साथ) = 0, वे।

बशर्ते कि नियंत्रण क्रिया की शक्ति पर सीमा 1 और 0 = से कम न होएनएसएच7 1((0 से),परिभाषित रूप-

लॉय (6.37 ए), पूर्ण (शून्य त्रुटि के साथ) नियंत्रण सटीकता प्राप्त करने योग्य है।

सबूत। प्रमेय की शर्तों के अनुसार, पहचान (6.41) के आधार पर, संबंध जी) =टी,लेकिन फिर सूत्र (6.40) से पहचान मिलती हैआर"(एस) = 0 .

इस मामले में, सूत्र (6.38), (6.39) और (6.37), (6.37ए) के अनुसार समानता RyR = 0 को पूरा करना और (6.41) को ध्यान में रखना

कहाँ । प्रमेय सिद्ध हो चुका है। ?

आइए निम्नलिखित विशेष स्थिति पर विचार करें।

प्रमेय 6.5.यदि मैट्रिक्सआरएकल गैर-शून्य तत्व r pp के साथ विकर्ण है = 1, यानी बंद-लूप प्रणाली की सटीकता वेक्टर के पी-वें घटक के फैलाव से निर्धारित होती हैएक्स,तो निम्नलिखित संबंध कायम रहेंगे:

ए)यदि बहुपद В р(एस)क्या हर्विट्ज़ या इसकी सभी "सही" जड़ें बहुपद सी पी (एस) की जड़ों के स्पेक्ट्रम में शामिल हैं, तो

बी)यदि बहुपद B p (s) के दाहिने आधे तल में कम से कम एक जड़ है जो बहुपद C ​​p (s) की जड़ नहीं है, तो

और यहां सूत्रों को ध्यान में रखा गया है (6.37ए) और (6.39)-(6.41) (इस मामले में हमारे पास आर

सबूत। सूत्र (6.18) से यह पता चलता है कि मैट्रिक्स 7(5) = ■ हम मान लेंगे कि पदानुक्रम के शीर्ष स्तर पर तत्व A0 है, जिसे केंद्र कहा जाता है। हम सेट Γ = 10\(/40) को 1> असंयुक्त उपसमुच्चय ¿>2 में इस प्रकार विभाजित करते हैं कि .और £¿=7। चलो निरूपित करें

1Г के माध्यम से, ..,^(स्वीकार्य कार्यों के 0 सेट (नियंत्रण)।

ies, रणनीतियाँ) तत्व A0> अल हम मान लेंगे

मान लें कि सामान्य स्थिति में स्वीकार्य क्रियाओं का सेट सिस्टम के उच्च स्तर के तत्वों द्वारा चुने गए नियंत्रणों पर निर्भर करता है और इन नियंत्रणों के किसी भी स्वीकार्य मान के लिए खाली नहीं हैं। हम किसी भी तत्व £е I ​​के लिए मानदंड को सेट 1/x x पर परिभाषित कुछ कार्यात्मक द्वारा परिभाषित करेंगे। ..एल जीएसई ^ई^ओ), . प्रत्येक तत्व अपनी कार्यक्षमता को अधिकतम करने में रुचि रखता है।

हम ऐसी प्रणाली में निर्णय लेने की प्रक्रिया को एक पदानुक्रमित बहुस्तरीय खेल के साथ मॉडल करेंगे, जिसे हम सामान्य रूप का एक पदानुक्रमित खेल कहेंगे।

§ 1.2 में, एक पदानुक्रमित संरचना के साथ नियंत्रण और निर्णय लेने वाली प्रणालियों में अनुकूलन समस्याओं पर चर्चा की गई है, और एक पदानुक्रमित नियंत्रण संरचना की अवधारणा तैयार की गई है। एक पदानुक्रमित प्रणाली में समाधान का चयन करने के लिए उपयोग किया जाने वाला एक विशिष्ट तत्व व्यक्ति की इष्टतम प्रतिक्रियाओं का समूह है

noP सिस्टम घटक या घटकों के समूह /?( ) पर

उच्च स्तर पर उपप्रणालियों के लिए नियंत्रणों का चयन। यह खंड दो-स्तरीय नियंत्रण प्रणालियों में निर्णय लेने के कई विशिष्ट मॉडलों पर चर्चा करता है।

धारा 1.3 गेम-सैद्धांतिक मॉडल में प्रयुक्त इष्टतमता के सिद्धांतों के लिए समर्पित है। यहां हम दो-स्तरीय, पेड़-जैसे खेल और एक सामान्य श्रेणीबद्ध खेल पर विचार करते हैं। इन खेलों में नैश और स्टैकेलबर्ग संतुलन का उपयोग इष्टतमता सिद्धांतों के रूप में किया जाता है। यह दिखाया गया है कि एक ट्री गेम में, मापदंडों के सभी मूल्यों के लिए भुगतान कार्यों के अधिकतम बिंदुओं की विशिष्टता की धारणा के तहत, स्टैकेलबर्ग समाधान न्यू के अनुसार संतुलन स्थितियों के सेट के साथ मेल खाता है।

खेल के लिए हम खिलाड़ियों के संतुलन पदानुक्रमित रणनीतियों की अवधारणा का परिचय देते हैं।

आइए हम इस स्तर पर खिलाड़ियों की इष्टतम प्रतिक्रियाओं के सेट को इस प्रकार परिभाषित करें:

/G(>Y,...U~1b(rLg/£_ ^ H; (u, y,1 .u1~\

आईआर कहाँ है?

vl¡\!^"। - एक नियंत्रण वेक्टर जिसमें £वें घटक को r>/ द्वारा प्रतिस्थापित किया जाता है।

परिभाषा। मैपिंग वी एन., यू]..यू^""1) »प्रत्येक स्वीकार्य सेट को असाइन करना यू>वाई1,.. से संबंधित के-वें स्तर का एकमात्र नियंत्रण

।"इष्टतम प्रतिक्रियाओं के अधीन, हम करेंगे

इसे Lवें स्तर की संतुलन पदानुक्रमित रणनीति कहें

क्या यहां कई इष्टतम प्रतिक्रियाएं हैं?< -го уровня определяется так:

जहां V ( ),...(.) क्रमशः संतुलन पदानुक्रम हैं

&-I,..., b-th स्तरों की तकनीकी रणनीतियाँ।

हम केंद्र के संतुलन पदानुक्रमित समाधान को सभी नियंत्रणों का सेट R0 कहेंगे जो इसके ¿7 को नियंत्रित करता है

लेम्मा 1 साबित करता है कि संतुलन पदानुक्रमित रणनीतियों का कोई भी सेट नैश संतुलन स्थिति बनाता है। खेल के विशेष मामले के लिए, जब पदानुक्रम के प्रत्येक स्तर पर केवल एक खिलाड़ी होता है, तो ई-संतुलन स्थिति के अस्तित्व पर प्रमेय I तैयार किया जाता है।

§ 1.4 में, हीरे के आकार के खेलों में डीटेकेलबर्ग समाधान खोजने की प्रक्रिया पर विस्तार से चर्चा की गई है, जो मिश्रित इष्टतमता सिद्धांत का उपयोग करने वाले बहु-मानदंड हीरे के आकार के नियंत्रण प्रणालियों पर भी विचार किया गया है। इस हीरे के आकार की खेल प्रणाली के अनुरूप, एक एसपी-समाधान की अवधारणा पेश की गई है, जिसमें स्टैकेलबर्ग समाधान के गुण और पेरेटो इष्टतमता की आवश्यकताएं हैं। हीरे के आकार की संरचना वाले सिस्टम में निर्णय लेने की प्रक्रियाओं को चित्रित करने के लिए, हम एक उत्पादन इकाई सी के लिए एक इष्टतम योजना बनाने की समस्या पर विचार करते हैं, जो दो प्रशासनिक केंद्रों बी 1 और ए के अधीनस्थ है, जो बदले में केंद्र ए 0 के भी अधीनस्थ हैं। , और एक पदानुक्रमित उत्पादन प्रणाली में संसाधन आवंटन की ऐसी समस्या। "

पदानुक्रमित संरचना वाले सहकारी खेलों की मुख्य विशेषता यह है कि इन खेलों में विशिष्ट कार्य सूचना संरचना को ध्यान में रखते हुए बनाए जाते हैं। एल.ए. पेट्रोसियन के कार्यों में, नैश संतुलन स्थितियों का उपयोग करके हीरे के आकार के खेलों के विशिष्ट कार्यों का निर्माण किया जाता है। धारा 1.5 गैर-सहकारी खेल जी में खिलाड़ियों की संतुलन पदानुक्रमित रणनीतियों का उपयोग करके सामान्य रूप के सहकारी पदानुक्रमित खेल के विशिष्ट कार्य के निर्माण के लिए एक विधि का प्रस्ताव करती है। निर्मित विशेषता फ़ंक्शन की सुपरएडिटिविटी साबित होती है। प्रमेय 4 स्थापित करता है कि खेल की संतुलन स्थिति में भुगतान वेक्टर एक सहकारी खेल में एक प्रभाग है और इसके सी-कोर से संबंधित है। अनुभाग के अंत में, हीरे के आकार के खेलों में विशिष्ट कार्यों के निर्माण के उदाहरणों पर विचार किया गया है।

आर.डी. औमन, एन.एन. वोरोब्योव, पी.पी. द्वारा वैज्ञानिक प्रकाशनों की 3 श्रृंखला। लुईस, ई. डम्मे, डी. एम. क्रेप्स, एन. कुह्न और अन्य शोधकर्ता

खेलों में संतुलन स्थितियों की स्थिरता की अवधारणा के विभिन्न संशोधनों को विस्तारित रूप में माना जाता है। धारा 1.6 में, सामान्य रूप के पदानुक्रमित गेम में समाधान की स्थिरता की एक नई अवधारणा पेश की गई है। आइए हम इसे निरूपित करें

एम = (ओ, वी,...,आर>एन); u.e/g°, vke ..k = \,r,...,b)

पदानुक्रमित खेल का समाधान, केंद्र के इष्टतम पदानुक्रमित समाधानों का सेट कहां है, /?*( ] केटीएच स्तर के खिलाड़ियों की इष्टतम प्रतिक्रियाओं का सेट है, जो नियंत्रण के सभी स्वीकार्य मूल्यों के लिए गैर-रिक्त है उच्च स्तर के खिलाड़ी.

आइए हम खिलाड़ी r की पदानुक्रमित रणनीतियों को Ε>-(") से और गठबंधन को इससे निरूपित करें

आइए एक स्थिति पर विचार करें (और, y 1(-), ■ ■., ऐसी कि

कोई -ue/?0, = u, A = 1,2,...,1-

मान लीजिए कि M^, M का एक उपसमुच्चय है, जिसमें एक निश्चित केंद्र रणनीति वाले सभी विकल्प शामिल हैं। प्रत्येक k = 1,2,...,1 के लिए, हम सेट का परिचय देते हैं

m1m.... V1"") = ((g>?..., V1): . 1>1.y-"), 1-K..L

परिभाषा। विकल्प (और, V1,... कहा जाता है

स्थिति के संबंध में पदानुक्रमिक रूप से स्थिर यदि किसी k = ■(, 2,..., I) के लिए

यदि समुच्चय M^ से कोई भी विकल्प इस स्थिति के संबंध में श्रेणीबद्ध रूप से स्थिर है तो हम समुच्चय Mi के उपसमुच्चय A/" को स्थिति (.u.uH"),...,Х10) के संबंध में श्रेणीबद्ध रूप से स्थिर कहेंगे। . स्थिति (और<рV-;,... ...»ф^С-)) будем называть абсолютно иерархически устойчивой, если относительно нее устойчиво множество М1о.

आइए हम पहले अध्याय में सिद्ध, पदानुक्रमित स्थिरता के लिए आवश्यक और पर्याप्त शर्तों पर निम्नलिखित प्रमेय तैयार करें।

प्रमेय 6. विकल्प के क्रम में

स्थिति के सापेक्ष पदानुक्रमित रूप से स्थिर था (_ और, $4-),...

-»С-)), यह किसी के लिए भी आवश्यक और पर्याप्त है

£ =1,2,",..,£ शर्त पूरी हुई

पी के-<1()у*"*;,

जहाँ У^ср1^,»1,..., V , £=

प्रमेय 7. इष्टतम स्थिति C, ^"O,--"/?^")) के लिए बिल्कुल पदानुक्रमित रूप से स्थिर होने के लिए, यह आवश्यक और पर्याप्त है कि किसी भी विकल्प के लिए (u, r>1...>y1 )&M1 शर्त पूरी की गई

सभी के लिए ए = (,2., ... ,1 .

अध्याय 2. गतिशील संघर्ष नियंत्रण प्रणाली

पदानुक्रमित संरचना के साथ

यह अध्याय एक पदानुक्रमित संरचना के साथ एक सामान्य गतिशील प्रणाली के संघर्ष प्रबंधन की समस्या को तैयार करता है। पदानुक्रमित नियंत्रण प्रणालियों के लिए, जिनकी गतिशीलता वेक्टर अंतर समीकरणों द्वारा वर्णित है, और भुगतान कार्यात्मकताओं में अभिन्न और टर्मिनल शब्द शामिल हैं, विभिन्न इष्टतमता सिद्धांतों के लिए समाधान की गतिशील स्थिरता की समस्या तैयार की जाती है, जिन स्थितियों के तहत समाधान गतिशील रूप से सामने आते हैं स्थिर का अध्ययन किया जाता है, और अस्थिर इष्टतमता सिद्धांतों के लिए, नियमितीकरण विधियां प्रस्तावित की जाती हैं जो पदानुक्रमित खेलों के समाधानों की गतिशील स्थिरता सुनिश्चित करती हैं।

धारा 2.1 एक पदानुक्रमित संरचना के साथ गतिशील मॉडल में संघर्ष नियंत्रण की समस्या को तैयार करती है, उन स्थितियों पर चर्चा करती है जो रणनीतियों और नियंत्रणों के विभिन्न वर्गों के लिए अंतर समीकरणों की प्रणालियों के समाधान के अस्तित्व और विशिष्टता को सुनिश्चित करती हैं, और ऐसी स्थितियां प्रदान करती हैं जिनके तहत सभी संभव के सेट प्रोग्राम का उपयोग करते समय और संश्लेषण नियंत्रणों का प्रक्षेप पथ मेल खाता है। अनुभाग के अंत में, हम टर्मिनल के साथ दो-स्तरीय अंतर खेलों में संतुलन स्थितियों को खोजने के दो उदाहरणों पर विचार करते हैं

जीत. विचार किए गए उदाहरणों की विशेषता इस तथ्य से है कि उनमें से एक में इष्टतम रणनीतियाँ गतिशील रूप से अस्थिर हो जाती हैं, और दूसरे में उनके पास विपरीत संपत्ति होती है।

पहले पैराग्राफ और पूरे अध्याय में चर्चा की गई सभी संघर्ष पदानुक्रमित प्रणालियों की गतिशीलता को वेक्टर अंतर समीकरण द्वारा वर्णित किया गया है

प्रारंभिक स्थितियों में

मैं वें टी> जीएस को नियंत्रित करता हूं। ई, आर. समय के प्रत्येक क्षण में ई वें को कॉम्पैक्ट सेट से चुना जाता है,..., आरपी, £ = ■1,2,...,पी खिलाड़ियों के भुगतान कार्यों को फॉर्म में माना जाता है

= ¿-0.1....पी.

संघर्ष प्रबंधन प्रणाली में निर्णय लेने के गेम-सैद्धांतिक मॉडल के निर्माण में एक आवश्यक बिंदु इष्टतमता के सिद्धांत का विकल्प है, साथ ही खिलाड़ियों द्वारा उपयोग की जाने वाली रणनीतियों का प्रकार भी है। इस पर पैराग्राफ 2.2 में चर्चा की गई है। स्वीकृत शब्दावली के अनुसार, हम एक खिलाड़ी की रणनीति को उसके नियंत्रण मापदंडों के सेट पर इस खिलाड़ी की जानकारी की मैपिंग के रूप में परिभाषित करते हैं। सामान्य स्थिति में, यह माना जाता है कि पहले खिलाड़ी का रणनीति स्थान मैपिंग ^¿(¿,xO>) का एक सेट है, जहां एक निश्चित I के लिए, (p.(-) पर निर्भर करता है

यह वह मामला है, जब दो व्यक्तियों के पदानुक्रमित विभेदक खेल में, रणनीतियों का उपयोग किया जाता है जिसमें निचले स्तर के खिलाड़ी को ऊपरी स्तर के खिलाड़ी के साथ मिलकर एक निश्चित प्रक्षेपवक्र को ट्रैक करने के लिए आमंत्रित करना शामिल होता है जो दोनों खिलाड़ियों के लिए फायदेमंद होता है। ऐसी रणनीतियों का उपयोग किया गया था, उदाहरण के लिए, ए.एफ. क्लेमेनोव के कार्यों में।

धारा 2.2 में, एक केंद्र के साथ दो-स्तरीय पी-एन व्यक्ति गेम के लिए समान रणनीतियों पर विचार किया जाता है - एक शीर्ष स्तर का खिलाड़ी, जब केंद्र सिस्टम की गतिशीलता को प्रभावित नहीं करता है, बल्कि केवल गेम के भुगतान कार्यों के मूल्य को प्रभावित करता है।

निचले स्तर की चट्टानें. प्रस्तावित समाधान डिज़ाइनों की एक विशिष्ट विशेषता केंद्र में एक यूजी रणनीति की उपस्थिति है; ईए, जो मानता है कि प्रस्तावित प्रक्षेपवक्र के कार्यान्वयन से विचलन के मामले में, केंद्र एक सार्वभौमिक रणनीति पर स्विच करेगा, जिसे दंड रणनीति के रूप में भी समझा जा सकता है। निम्नलिखित अनुच्छेद इष्टतम के सिद्धांत के अनुप्रयोग पर चर्चा करता है! दो और तीन स्तर के अंतर वाले खेलों के लिए स्टैकोलबर्ग प्रकार। अनुभाग के अंत में, ओ खोजने के उदाहरण: Ltakelbsrg के अनुसार टिकात्मक समाधान, साथ ही दो-स्तरीय अंतर खेलों में बीआर-समाधान पर विचार किया गया है।

धारा 2.3 में पदानुक्रमित विभेदक खेलों के समाधानों की गतिशील स्थिरता की समस्या पर चर्चा की गई है। पदानुक्रमित विभेदक खेल ГС^0,ар^м के समाधान M(10>x0) को गतिशील रूप से स्थिर कहा जाता है यदि रणनीतियों के किसी भी सेट के लिए еМ(10,х0) और किसी ¿еЦ0>

बस शर्त जान लो

जहां _ इष्टतम रणनीतियों का संकुचन चालू है

अंतराल Г] . А/((,х(ξ)) वर्तमान गेम का समाधान है जिसमें समय बी पर इष्टतम प्रक्षेपवक्र का बिंदु प्रारंभिक स्थिति के रूप में उपयोग किया जाता है। किसी समाधान की गतिशील स्थिरता की इस परिभाषा से यह पता चलता है कि इष्टतम रणनीतियाँ इष्टतम प्रक्षेपवक्र के साथ खेल की कक्षा की पूरी अवधि के दौरान गतिशील रूप से स्थिर रहने का गुण है?

इस खंड में आगे, कार्यक्रम रणनीतियों की प्रणाली में नोहल संतुलन और पेरेटो-इष्टतम समाधान की गतिशील स्थिरता साबित होती है। यहां विस्तार से चर्चा की गई:< динамические свойства решения по Стапельбергу перархическо! даффереициальной игры двух лиц. Показано, что даже в том с. чае, когда множество оптимальных реакций игрока нижнего ур>nya में एक ही रणनीति शामिल है, स्टैकेल्बे समाधान; सामान्य स्थिति में यह सभी कार्यक्रम और स्थितीय रणनीतियों दोनों में गतिशील रूप से अस्थिर हो जाता है। साथ ही, ऐसे पदानुक्रमित गेम भी हैं जिनमें स्टैकेलबर्ग समाधान गतिशील रूप से स्थिर है। इसकी पुष्टि पैराग्राफ के अंत में दिए गए एक विशिष्ट उदाहरण से होती है।

धारा 2.4 दो-स्तर के नियमितीकरण की विधि के लिए समर्पित है

विभेदक खेल. विधि का लक्ष्य गेम समाधान की गतिशील स्थिरता सुनिश्चित करना है। ऐसा करने के लिए, यह प्रस्तावित है कि प्रत्येक खिलाड़ी समय के क्षण में अभिन्न जीत का इतना हिस्सा भुगतान करे कि खेल के अंत तक शेष किसी भी समय अंतराल पर, खिलाड़ी के लिए चुनी गई रणनीति से विचलित होना लाभदायक नहीं होगा। खेल की शुरुआत में. प्रोग्राम रणनीतियों के वर्ग में दो-स्तरीय गेम के लिए स्टैकेल'एर्ग समाधान की विशेषता संपत्ति को निम्नलिखित लेम्मा में संक्षेपित किया गया है।

लेम्मा 2एल. मान लीजिए M(i0,x0) प्रोग्राम रणनीतियों के वर्ग पर दो-स्तरीय गेम Г का स्टैकेलबर्ग समाधान है। किसी भी स्थिति के लिए (ü,v^,...,vn)

vil, P eRsCü.Li,T)),

जहां रुपये (ñ TU) वर्तमान गेम I में निचले स्तर के खिलाड़ियों की इष्टतम प्रतिक्रियाओं का सेट है। й-lГ]~ = (ß^iyT]).,., vn lít Г]) - इष्टतम नियंत्रणों का संकुचन समय अंतराल में खिलाड़ियों की संख्या.

इस खंड में एक समान लेम्मा दो-स्तरीय अंतर गेम के एस पी-समाधान के लिए तैयार किया गया है।

आइए अब प्रक्षेप पथ X?.(í) ¿0¡x0) स्टैकेलबर्ग इष्टतम की पेंसिल पर विचार करें, जिससे केंद्र il.(i) का नियंत्रण तय हो जाता है। फिर, जैसा कि प्रमेय 2 में दिखाया गया है, स्थिति

एन"°(या,"पी, वीएलटीजे]) = अधिकतम न्यूनतम

यू-"eVCtSJ vt£R^ut) 0 *

जहां vb) वर्तमान गेम में केंद्र की कार्यक्षमता है,

xÍb xí(¿ í„, x\ पल में बीम अनुभाग की एक मनमाना स्थिति है

ओ>>ओ"ओ"

समाधान की गतिशील स्थिरता के लिए nt समय í पर्याप्त है। प्रमेय 3 में एसपी समाधान के लिए एक समान स्थिति स्थापित की गई है। इन प्रमेयों में, प्रकार (I) की एक स्थिति मानती है कि गतिशील रूप से स्थिर संतुलन स्थिति (,ü,v) के मामले में इष्टतम निम्न-स्तरीय प्रतिक्रिया भी एक है सज़ा की रणनीति. हालाँकि, जैसा कि प्रमेय 2 में दिखाया गया है, कुछ सार्वभौमिक दंड रणनीति की अवधारणा को पेश करके इस स्थिति को कमजोर किया जा सकता है

और इस निचले स्तर की रणनीति के लिए पहले से ही शर्त (आई) तैयार कर ली है। इसके अलावा, नियमितीकरण पद्धति को लागू करने के लिए, यह माना जाता है कि खिलाड़ी i का अभिन्न भुगतान a.At), जो

उसे समय पर भुगतान किया जाता है íe[í0,T) , इस प्रकार निर्धारित किया जाता है:

u( (t) = ¡i¿ (b) I h; C^C-c;, ü(T), ü(T)) dr, i=0,i,...,n,

जहां p¿(í) शून्य से एक की सीमा में मान लेने वाले टुकड़े-टुकड़े निरंतर कार्य हैं। इसके अलावा, फ़ंक्शंस ji-(i) के मान, आम तौर पर बोलते हुए, "" पर निर्भर करते हैं। इसलिए, चुने हुए प्रक्षेप पथ से

यह हमें फ़ंक्शन जी (-) को ध्यान में रखते हुए इष्टतम नियंत्रण ¿¿, वीएलआई, टी 3 के संकुचन के लिए खिलाड़ियों के भुगतान कार्यों के मूल्यों की गणना करने की अनुमति देता है, और रणनीतियों के एक सेट के लिए जो चुने गए इष्टतम से मेल नहीं खाता है एक, सामान्य तरीके से. इष्टतम प्रक्षेपवक्र के साथ भुगतान के पुनर्वितरण की इस प्रक्रिया को हम एक पदानुक्रमित अंतर गेम का नियमितीकरण कहेंगे, और एक पदानुक्रमित अंतर गेम जो समय में हस्तांतरणीय भुगतान या ¿-हस्तांतरणीय भुगतान के साथ नियमितीकरण को स्वीकार करता है।

चलो ü(_í) v(i),äi)

परियोजना का समर्थन करें - लिंक साझा करें, धन्यवाद!
ये भी पढ़ें
विदेश मंत्री सर्गेई लावरोव की पत्नी विदेश मंत्री सर्गेई लावरोव की पत्नी पाठ-व्याख्यान क्वांटम भौतिकी का जन्म पाठ-व्याख्यान क्वांटम भौतिकी का जन्म उदासीनता की शक्ति: कैसे Stoicism का दर्शन आपको जीने और काम करने में मदद करता है दर्शनशास्त्र में Stoic कौन हैं उदासीनता की शक्ति: कैसे Stoicism का दर्शन आपको जीने और काम करने में मदद करता है दर्शनशास्त्र में Stoic कौन हैं