ए.एल.नुसार सिस्टमचे इष्टतम वर्तन शमीसू. वागणूक. इष्टतम वर्तनाचा नियम इष्टतम वर्तन

मुलांसाठी अँटीपायरेटिक्स बालरोगतज्ञांनी लिहून दिले आहेत. परंतु तापासह आपत्कालीन परिस्थिती असते जेव्हा मुलाला ताबडतोब औषध देणे आवश्यक असते. मग पालक जबाबदारी घेतात आणि अँटीपायरेटिक औषधे वापरतात. लहान मुलांना काय देण्याची परवानगी आहे? मोठ्या मुलांमध्ये तापमान कसे कमी करावे? कोणती औषधे सर्वात सुरक्षित आहेत?

संस्थात्मक क्रियाकलाप. संस्थात्मक प्रक्रियेचे पर्यायी प्रतिमान.

संघटनात्मक क्रियाकलापांसाठी संपूर्ण विविध दृष्टिकोन दोन पर्यायी प्रतिमानांच्या स्वरूपात सादर केले जाऊ शकतात (तक्ता 5.1). वरील प्रतिमान संस्थात्मक क्रियाकलापांसाठी दोन मूलभूतपणे भिन्न दृष्टीकोन दर्शवतात. पहिल्याला ढोबळपणे बळजबरी दृष्टीकोन म्हटले जाऊ शकते, जेव्हा तयार करणे आणि राखण्यासाठी प्रयत्न करणे आवश्यक असते. हे प्रयत्न थांबताच, प्रणाली त्याच्या मूळ स्थितीत परत येते. तुम्ही तुमच्या आवडीनुसार अनेक कृत्रिम संस्थात्मक योजना तयार करू शकता, परंतु त्या नाजूक आणि कुचकामी असतील. इतिहासाला अशी अनेक उदाहरणे माहीत आहेत: सामूहिक शेततळे, आर्थिक परिषदा, उत्पादन संघटना इ.

तक्ता 5.1

संस्थात्मक प्रक्रियेचे पर्यायी प्रतिमान

दुसरा दृष्टिकोन संस्थेच्या नैसर्गिक प्रक्रियेवर केंद्रित आहे, मानवी इच्छेला जागा देण्यासाठी पुरेसा विकसित होत आहे. नैसर्गिक विकासाच्या मर्यादेबाहेर येणारी मानवी उद्दिष्टे (उदाहरणार्थ, सामूहिक शेतांची निर्मिती) अयशस्वी ठरतात, मग ती साध्य करण्यासाठी कोणतीही संसाधने वापरली जात असली तरीही. त्याच वेळी, येथे कोणताही नियतीवाद नाही - एखाद्या व्यक्तीला त्याच्या ध्येय-सेटिंग आणि स्वैच्छिक क्रियाकलापांसह विकास प्रक्रियेतून वगळले जात नाही, एखाद्याला फक्त अट पूर्ण करणे आवश्यक आहे: एखाद्या व्यक्तीच्या उद्दिष्टांची जागा दिशानिर्देशांच्या श्रेणीशी एकरूप असणे आवश्यक आहे. नैसर्गिक (तत्त्वतः शक्य) विकास. ए. स्मिथ यांच्या अभ्यासातही नैसर्गिक विकासाची दिशा दिसून येते, ज्यांनी असा युक्तिवाद केला की समाजाच्या सामाजिक-आर्थिक विकासासाठी, व्यवस्थापनामध्ये शांतता, हलका कर आणि सहिष्णुता आवश्यक आहे आणि बाकीचे नैसर्गिक मार्गाने केले जातील. गोष्टींचा.

नियंत्रण प्रणाली - सायबरनेटिक दृष्टीकोन. नियंत्रण तत्त्वे: ओपन-लूप नियंत्रण तत्त्व; अडथळा भरपाईसह ओपन-लूप नियंत्रण तत्त्व; बंद-वळण नियंत्रण तत्त्व; एक-शॉट नियंत्रण तत्त्व.

आयोजन प्रक्रिया म्हणून संघटना हे व्यवस्थापनाच्या मुख्य कार्यांपैकी एक आहे. व्यवस्थापन कार्य हे पुनरावृत्ती व्यवस्थापन क्रियांचा संच समजले जाते, जे सामग्रीच्या एकतेने एकत्रित केले जाते. संस्था (एक प्रक्रिया म्हणून) हे व्यवस्थापन कार्य म्हणून काम करत असल्याने, कोणतेही व्यवस्थापन ही संस्थात्मक क्रियाकलाप आहे, जरी ती तिच्यापुरती मर्यादित नाही.

नियंत्रण हा एखाद्या प्रणालीवर विशेष केंद्रित प्रभाव असतो, त्याला आवश्यक गुणधर्म किंवा स्थिती दिल्याची खात्री करून घेणे. राज्य गुणधर्मांपैकी एक म्हणजे रचना.

संघटित करणे म्हणजे, सर्व प्रथम, रचना तयार करणे (किंवा बदलणे).

बिल्डिंग कंट्रोल सिस्टम्सच्या दृष्टिकोनात फरक असूनही, सायबरनेटिक्समध्ये सामान्य तत्त्वे विकसित केली गेली आहेत. सायबरनेटिक दृष्टिकोनाच्या दृष्टीकोनातून, नियंत्रण प्रणाली ही नियंत्रण विषय (नियंत्रण प्रणाली), नियंत्रण ऑब्जेक्ट (व्यवस्थापित प्रणाली), तसेच त्यांच्या दरम्यान थेट आणि अभिप्राय कनेक्शनचा अविभाज्य संच आहे. हे देखील गृहित धरले जाते की नियंत्रण प्रणाली बाह्य वातावरणाशी संवाद साधते.

नियंत्रण प्रणाली तयार करण्यासाठी मूलभूत वर्गीकरण वैशिष्ट्य, जे सिस्टमचा प्रकार आणि त्याची संभाव्य क्षमता निर्धारित करते, नियंत्रण लूप आयोजित करण्याची पद्धत आहे. नंतरच्या मते, नियंत्रण लूप आयोजित करण्यासाठी अनेक तत्त्वे ओळखली जातात.

ओपन-लूप (सॉफ्टवेअर) नियंत्रणाचे तत्त्व.हे तत्त्व त्याच्या ऑपरेटिंग परिस्थितीकडे दुर्लक्ष करून, सिस्टमवर स्वायत्त प्रभावाच्या कल्पनेवर आधारित आहे. साहजिकच, या तत्त्वाच्या व्यावहारिक वापराची व्याप्ती त्याच्या ऑपरेशनच्या संपूर्ण श्रेणीमध्ये पर्यावरण आणि सिस्टमच्या स्थितीच्या ज्ञानाची विश्वासार्हता मानते. मग गणना केलेल्या प्रभावासाठी सिस्टमचा प्रतिसाद पूर्वनिश्चित करणे शक्य आहे, जे फंक्शनच्या स्वरूपात पूर्व-प्रोग्राम केलेले आहे (चित्र 5.1).

तांदूळ. ५.१. ओपन-लूप नियंत्रण तत्त्व

हा प्रभाव अपेक्षित परिणामापेक्षा वेगळा असल्यास, आउटपुट निर्देशांकातील बदलाच्या स्वरूपातील विचलन त्वरित अनुसरेल, म्हणजे. शब्दाच्या मूळ अर्थाने प्रणाली व्यत्ययांपासून असुरक्षित असेल. म्हणून, जेव्हा सिस्टमच्या ऑपरेटिंग परिस्थितींबद्दल माहितीच्या विश्वासार्हतेवर विश्वास असतो तेव्हा समान तत्त्व वापरले जाते. उदाहरणार्थ, संघटनात्मक प्रणालींसाठी असा आत्मविश्वास उच्च कार्यकारी शिस्तीसह स्वीकार्य आहे, जेव्हा दिलेल्या ऑर्डरला त्यानंतरच्या नियंत्रणाची आवश्यकता नसते. कधीकधी या प्रकारच्या व्यवस्थापनास निर्देशात्मक व्यवस्थापन म्हणतात. या नियंत्रण योजनेचा निःसंशय फायदा म्हणजे व्यवस्थापन संस्थेची साधेपणा.

अडथळा भरपाईसह ओपन-लूप नियंत्रणाचे तत्त्व.दृष्टिकोनाची सामग्री ही पहिल्या योजनेच्या मर्यादा दूर करण्याची इच्छा आहे, म्हणजे. प्रणालीच्या कामकाजावर व्यत्ययांचा अनियंत्रित प्रभाव. व्यत्ययांची भरपाई करण्याची शक्यता, आणि म्हणून प्राधान्य माहितीची अविश्वसनीयता काढून टाकणे, मोजमापांमध्ये अडथळा आणण्याच्या सुलभतेवर आधारित आहे (चित्र 5.2).


तांदूळ. ५.२. भरपाई व्यवस्थापन तत्त्व

व्यत्ययांचे मोजमाप केल्याने नुकसानीच्या परिणामांचा प्रतिकार करणारे नुकसानभरपाई नियंत्रण निर्धारित करणे शक्य होते. सहसा, सुधारात्मक नियंत्रणासह, सिस्टम सॉफ्टवेअरच्या प्रभावाच्या अधीन असते. तथापि, व्यवहारात, बाह्य व्यत्ययाबद्दल माहिती रेकॉर्ड करणे नेहमीच शक्य नसते, सिस्टम पॅरामीटर्समधील विचलन किंवा अनपेक्षित संरचनात्मक बदलांचा उल्लेख न करणे. जर व्यत्ययांची माहिती उपलब्ध असेल, तर नुकसानभरपाईचे नियंत्रण सुरू करून त्यांच्या नुकसान भरपाईचे तत्त्व व्यावहारिक हिताचे आहे.

बंद-लूप नियंत्रण तत्त्व.वर चर्चा केलेली तत्त्वे ओपन कंट्रोल लूपच्या वर्गाशी संबंधित आहेत: नियंत्रणाचे प्रमाण ऑब्जेक्टच्या वर्तनावर अवलंबून नसते, परंतु ते वेळेचे किंवा व्यत्ययाचे कार्य असते. क्लोज्ड कंट्रोल लूपचा वर्ग नकारात्मक फीडबॅक असलेल्या प्रणालींद्वारे तयार केला जातो, ज्यात सायबरनेटिक्सच्या मूलभूत तत्त्वाला मूर्त स्वरूप दिले जाते.

अशा प्रणालींमध्ये, आगाऊ प्रोग्राम केलेला इनपुट प्रभाव नाही, परंतु सिस्टमची आवश्यक स्थिती, म्हणजे. नियंत्रणासह ऑब्जेक्टवरील प्रभावाचा परिणाम. परिणामी, अशी परिस्थिती शक्य आहे जेव्हा एखाद्या गडबडीचा सिस्टमच्या गतिशीलतेवर सकारात्मक प्रभाव पडतो जर तो त्याची स्थिती इच्छित स्थितीच्या जवळ आणतो. तत्त्वाची अंमलबजावणी करण्यासाठी, कालांतराने सिस्टमची स्थिती बदलण्यासाठी एक कार्यक्रम कायदा Spr(t) प्राधान्याने शोधला जातो आणि वास्तविक स्थिती इच्छित स्थितीपर्यंत पोहोचते याची खात्री करण्यासाठी सिस्टमचे कार्य तयार केले जाते (चित्र 5.3). या समस्येचे निराकरण इच्छित स्थिती आणि वास्तविक स्थितीमधील फरक निर्धारित करून प्राप्त केले जाते:

∆С(t) = Ср(t) – С(t).


अंजीर 5. 3 बंद-लूप नियंत्रण तत्त्व

हा फरक आढळलेला विसंगती कमी करण्यासाठी नियंत्रणासाठी वापरला जातो. हे सुनिश्चित करते की नियंत्रित समन्वय प्रोग्राम फंक्शनशी संपर्क साधतो, फरक पडण्याची कारणे विचारात न घेता, मग ते विविध उत्पत्तीचे व्यत्यय असो किंवा नियंत्रण त्रुटी असो. नियंत्रणाची गुणवत्ता क्षणिक प्रक्रियेच्या स्वरूपावर आणि स्थापित त्रुटीवर परिणाम करते - प्रोग्राम केलेल्या आणि वास्तविक अंतिम अवस्थांमधील विसंगती.

इनपुट सिग्नलवर अवलंबून, नियंत्रण सिद्धांत वेगळे करतो:

■ कार्यक्रम नियंत्रण प्रणाली (प्रकरण विचाराधीन);

■ स्थिरीकरण प्रणाली, जेव्हा cpr(t) = 0;

■ ट्रॅकिंग सिस्टीम जेव्हा इनपुट सिग्नल अगोदर अज्ञात असतो.

हे तपशील तत्त्वाच्या अंमलबजावणीवर कोणत्याही प्रकारे परिणाम करत नाही, परंतु सिस्टम तयार करण्याच्या तंत्रात विशिष्टतेचा परिचय देते.

नैसर्गिक आणि कृत्रिम प्रणालींमध्ये या तत्त्वाचे विस्तृत वितरण सर्किट संस्थेच्या उत्पादकतेद्वारे स्पष्ट केले आहे: नकारात्मक अभिप्रायाच्या परिचयामुळे संकल्पनात्मक स्तरावर नियंत्रण समस्या प्रभावीपणे सोडविली जाते.

सिस्टीम Ср(t) च्या स्थितीच्या वेळेनुसार प्रोग्रामिंग बदलांचा विचार केला जातो, ज्याचा अर्थ स्टेट स्पेसमधील प्रक्षेपणाची प्राथमिक गणना. पण हे कसं करायचं हा प्रश्न नजरेआड पडला. उत्तर प्रक्षेपणासाठी दोन आवश्यकतांद्वारे मर्यादित आहे, ज्याने हे करणे आवश्यक आहे:

1) लक्ष्यातून जा;

2) गुणवत्तेच्या निकषाची मर्यादा पूर्ण करा, उदा. इष्टतम असणे.

औपचारिक डायनॅमिक सिस्टीममध्ये, अशा प्रकारचा मार्ग शोधण्यासाठी, कॅल्क्युलस ऑफ व्हेरिएशनचे उपकरण किंवा त्यातील आधुनिक बदल वापरले जातात: एल. पॉन्ट्रीयागिनचे कमाल तत्त्व किंवा आर. बेलमनचे डायनॅमिक प्रोग्रामिंग. जेव्हा सिस्टमच्या अज्ञात पॅरामीटर्स (गुणांक) शोधण्यात समस्या येते तेव्हा ते सोडवण्यासाठी गणितीय प्रोग्रामिंग पद्धती वापरल्या जातात - पॅरामीटर स्पेसमध्ये गुणवत्ता फंक्शन (इंडिकेटर) चे टोक शोधणे आवश्यक आहे. खराब औपचारिक समस्यांचे निराकरण करण्यासाठी, एखादी व्यक्ती केवळ भविष्यातील अंदाजांवर किंवा गणितीय सिम्युलेशन मॉडेलिंगच्या परिणामांवर आधारित ह्युरिस्टिक उपायांवर अवलंबून राहू शकते. अशा निर्णयांच्या अचूकतेचे मूल्यांकन करणे कठीण आहे.

चला प्रोग्रामिंग समस्येकडे परत जाऊया. औपचारिक कार्यांसाठी प्रोग्राम प्रक्षेपणाची गणना करण्याचा मार्ग असल्यास, नियंत्रण प्रणालीला लक्ष्य पदनामासह समाधानी असणे आवश्यक आहे आणि नियंत्रण प्रक्रियेमध्ये थेट सिस्टमच्या स्थितीत प्रोग्राम बदल शोधणे स्वाभाविक आहे (टर्मिनल नियंत्रण) . सिस्टमची अशी संस्था, अर्थातच, नियंत्रण अल्गोरिदम गुंतागुंत करेल, परंतु प्रारंभिक माहिती कमी करण्यास अनुमती देईल, याचा अर्थ ते नियंत्रण अधिक कार्यक्षम करेल. 1960 मध्ये एक समान कार्य. बॅलिस्टिक क्षेपणास्त्रे आणि अंतराळ यानाच्या हालचालींवर नियंत्रण ठेवण्यासाठी प्राध्यापक ई. गोर्बाटोव्ह यांनी सैद्धांतिकरित्या सोडवले होते.

इष्टतम नियंत्रण समस्येचे सूत्रीकरण आणि निराकरण करण्याच्या संबंधात, खालील मूलभूत परिस्थिती लक्षात घेतली पाहिजे.

संपूर्ण नियंत्रण अंतरावर अभ्यास केलेल्या ऑब्जेक्टचे वर्तन आणि ज्या परिस्थितीत हालचाल होते ते विश्वसनीयरित्या ज्ञात असल्यासच सिस्टमचे इष्टतम वर्तन निवडणे शक्य आहे.

इतर, अतिरिक्त गृहितकांची पूर्तता करून इष्टतम उपाय मिळू शकतात, परंतु मुद्दा असा आहे की प्रत्येक केस स्वतंत्रपणे निर्दिष्ट केली जावी;

उच्च निकाल मिळविण्यासाठी धडपडणाऱ्या धावपटूच्या वर्तनाचे उदाहरण वापरून सांगितलेली स्थिती स्पष्ट करू. जर आपण थोड्या अंतराबद्दल बोलत आहोत (100, 200 मी), तर प्रशिक्षित ऍथलीट प्रत्येक क्षणी जास्तीत जास्त वेग सुनिश्चित करण्याचे लक्ष्य सेट करतो. लांब अंतरावर धावताना, मार्गावरील सैन्याचे योग्य वितरण करण्याच्या त्याच्या क्षमतेद्वारे यश निश्चित केले जाते आणि यासाठी त्याने त्याच्या क्षमता, मार्गाचा भूभाग आणि त्याच्या विरोधकांची वैशिष्ट्ये स्पष्टपणे समजून घेणे आवश्यक आहे. मर्यादित संसाधनांच्या परिस्थितीत, कोणत्याही क्षणी कोणत्याही कमाल गतीबद्दल बोलू शकत नाही.

हे अगदी स्पष्ट आहे की वरील निर्बंध केवळ समस्येच्या निर्धारवादी सूत्रीकरणाच्या चौकटीतच समाधानी आहेत, म्हणजे. जेव्हा सर्व काही निश्चितपणे प्राधान्याने ओळखले जाते. अशा परिस्थिती वास्तविक समस्यांसाठी अतिरेक ठरतात: निर्धारवादाचा प्रोक्रस्टेन बेड सिस्टमच्या वास्तविक ऑपरेटिंग परिस्थितीशी संबंधित नाही. प्रणाली आणि पर्यावरण आणि या किंवा त्या वस्तूशी त्याचा परस्परसंवाद या दोन्ही बाबतीत आपल्या ज्ञानाचे प्राथमिक स्वरूप अत्यंत संशयास्पद आहे. प्रणाली जितकी अधिक क्लिष्ट असेल तितकी प्राथमिक माहिती कमी विश्वासार्ह असेल, जी संश्लेषण प्रक्रिया आयोजित करणाऱ्या संशोधकांना आशावाद जोडत नाही.

अशा अनिश्चिततेमुळे सिस्टमच्या अस्तित्वाची स्टोकेस्टिक परिस्थिती लक्षात घेऊन नियंत्रण सिद्धांतामध्ये संपूर्ण दिशा निर्माण झाली आहे. अनुकूली आणि स्वयं-समायोजित प्रणालीच्या तत्त्वांच्या विकासामध्ये सर्वात रचनात्मक परिणाम प्राप्त झाले.

व्यवस्थापन ऑप्टिमायझेशन. अनुकूली आणि स्व-समायोजित प्रणाली.

नियंत्रण प्रक्रियेदरम्यान ऑब्जेक्टच्या स्थितीबद्दल आणि पर्यावरणाशी त्याच्या परस्परसंवादाबद्दल अतिरिक्त माहिती मिळवून, अनुकुलन प्रणाली अनिश्चिततेचा सामना करणे शक्य करते, त्यानंतर सिस्टमच्या संरचनेची पुनर्रचना करून आणि जेव्हा ऑपरेटिंग परिस्थिती ज्ञात अग्रक्रमापासून विचलित होते तेव्हा त्याचे पॅरामीटर्स बदलतात. (Fig. 5.4). या प्रकरणात, एक नियम म्हणून, परिवर्तनांचे उद्दिष्ट नियंत्रणाच्या संश्लेषणामध्ये वापरल्या जाणाऱ्या प्रणालीच्या वैशिष्ट्यांच्या जवळ आणणे हे आहे. अशाप्रकारे, अनुकूलन हे व्यत्ययाच्या परिस्थितीत सिस्टम होमिओस्टॅसिस राखण्यावर केंद्रित आहे.


तांदूळ. ५.४. अनुकूली प्रणाली

या कार्यातील सर्वात कठीण डिझाइन घटकांपैकी एक म्हणजे पर्यावरणाच्या स्थितीबद्दल माहिती मिळवणे, त्याशिवाय अनुकूलन करणे कठीण आहे.

पर्यावरणाच्या स्थितीबद्दल माहितीच्या यशस्वी संपादनाचे उदाहरण म्हणजे पिटॉट ट्यूबचा शोध, जो जवळजवळ सर्व विमानांसह सुसज्ज आहे. ट्यूब आपल्याला वेग दाब मोजण्याची परवानगी देते - सर्वात महत्वाचे वैशिष्ट्य ज्यावर सर्व वायुगतिकीय शक्ती थेट अवलंबून असतात. मापन परिणाम ऑटोपायलट कॉन्फिगर करण्यासाठी वापरले जातात. सामाजिक प्रणालींमध्ये अशीच भूमिका समाजशास्त्रीय सर्वेक्षणांद्वारे खेळली जाते, ज्यामुळे देशांतर्गत आणि परराष्ट्र धोरणातील समस्यांचे निराकरण करणे शक्य होते.

नियंत्रण ऑब्जेक्टच्या गतिशीलतेचा अभ्यास करण्यासाठी एक प्रभावी तंत्र म्हणजे दुहेरी नियंत्रण पद्धत, एकदा ए. फेल्डबॉम यांनी प्रस्तावित केली होती. त्याचे सार असे आहे की, नियंत्रण आदेशांसह, विशेष चाचणी सिग्नल ऑब्जेक्टवर पाठवले जातात, ज्याची प्रतिक्रिया प्रायोरी मॉडेलसाठी पूर्व-सेट केलेली असते. मानक एक पासून ऑब्जेक्टच्या प्रतिक्रियेच्या विचलनाच्या आधारावर, बाह्य वातावरणासह मॉडेलच्या परस्परसंवादाचा न्याय केला जातो.

पहिल्या महायुद्धात गुप्तहेर ओळखण्यासाठी रशियन काउंटर इंटेलिजन्सनेही असेच तंत्र वापरले होते. देशद्रोहाचा संशय असलेल्या कर्मचाऱ्यांचे एक वर्तुळ ओळखले गेले आणि या प्रत्येक मंडळाला अनन्य स्वरूपाच्या महत्त्वाच्या परंतु खोट्या माहितीसह "विश्वसनीय" होते. शत्रूची प्रतिक्रिया पाहिली गेली, ज्याद्वारे देशद्रोही ओळखला गेला.

स्व-समायोजित प्रणालींचा वर्ग अनुकूली प्रणालींपासून वेगळा आहे. नंतरचे अनुकूलन प्रक्रियेदरम्यान समायोजित केले जातात. तथापि, सामान्यतेच्या स्वीकृत स्तरावर, स्व-ट्यूनिंग प्रणालीची रचना अनुकूली प्रणालीच्या संरचनेसारखीच असते (चित्र 5.4 पहा).

अनुकूलन आणि स्व-ट्यूनिंगच्या प्रक्रियेबद्दल, हे लक्षात घेतले जाऊ शकते की विशिष्ट प्रकरणांमध्ये त्यांची शक्यता मुख्यतः सिस्टमच्या उद्देशाने आणि त्याच्या तांत्रिक अंमलबजावणीद्वारे निर्धारित केली जाते. अशा सिस्टीम थिअरीमध्ये चित्रे भरलेली आहेत, परंतु त्यात सामान्यीकृत उपलब्धी आहेत असे दिसत नाही.

नियंत्रण प्रक्रियेवरील प्राथमिक डेटाच्या अपुरेपणावर मात करण्याचा दुसरा मार्ग म्हणजे नियंत्रण प्रक्रियेला त्याच्या संश्लेषणाच्या प्रक्रियेसह एकत्र करणे. पारंपारिकपणे, नियंत्रण अल्गोरिदम हे मोशन मॉडेलच्या निश्चित वर्णनाच्या गृहीतकेवर आधारित संश्लेषणाचा परिणाम आहे. परंतु हे स्पष्ट आहे की दत्तक मॉडेलच्या हालचालीतील विचलन लक्ष्य साध्य करण्याच्या अचूकतेवर आणि प्रक्रियेच्या गुणवत्तेवर परिणाम करतात, म्हणजे. निकषाच्या टोकापासून विचलन होऊ शकते. हे खालीलप्रमाणे आहे की नियंत्रण टर्मिनल नियंत्रण म्हणून तयार केले जाणे आवश्यक आहे, रिअल टाइममध्ये प्रक्षेपणाची गणना करणे आणि ऑब्जेक्ट मॉडेल आणि रहदारी परिस्थितीबद्दल माहिती अद्यतनित करणे. अर्थात, या प्रकरणात देखील, संपूर्ण उर्वरित नियंत्रण अंतरासाठी ड्रायव्हिंग परिस्थिती एक्स्ट्रापोलेट करणे आवश्यक आहे, परंतु आपण लक्ष्याजवळ जाताच, एक्स्ट्रापोलेशनची अचूकता वाढते, याचा अर्थ नियंत्रणाची गुणवत्ता सुधारते.

हे सरकारच्या कृतीशी साधर्म्य दाखवते जे नियोजित उद्दिष्टे पूर्ण करू शकत नाही, जसे की बजेट. अंदाजांचे उल्लंघन करून अर्थव्यवस्थेच्या ऑपरेटिंग परिस्थिती अनियोजित मार्गाने बदलतात, म्हणून अंतिम निर्देशक साध्य करण्याच्या प्रयत्नात नियोजित योजना सतत समायोजित करणे आवश्यक आहे, विशेषतः, जप्ती पार पाडण्यासाठी. प्राथमिक गृहितकांमधील विचलन इतके मोठे असू शकते की उपलब्ध संसाधने आणि व्यवस्थापनाचे उपाय यापुढे उद्दिष्टाची प्राप्ती सुनिश्चित करू शकत नाहीत. मग तुम्हाला ध्येय “जवळ” आणावे लागेल, ते साध्यतेच्या नवीन क्षेत्रात ठेवावे लागेल. लक्षात ठेवा की वर्णन केलेली योजना केवळ स्थिर प्रणालीसाठी वैध आहे. व्यवस्थापन संस्थेच्या खराब गुणवत्तेमुळे अस्थिरता येते आणि परिणामी, संपूर्ण प्रणालीचा नाश होतो.

चला आणखी एका व्यवस्थापन तत्त्वावर राहू या जे ऑपरेशन संशोधनाच्या विकसित सिद्धांताला अधोरेखित करते.

एक-वेळ नियंत्रण तत्त्व. व्यावहारिकदृष्ट्या महत्त्वपूर्ण कार्यांच्या विस्तृत श्रेणीमध्ये व्यवस्थापनाची एक-वेळची कृती करणे आवश्यक आहे, म्हणजे निर्णय घेणे, ज्याचे परिणाम दीर्घकाळ जाणवतात. अर्थात, पारंपारिक व्यवस्थापनाचा एक-वेळच्या निर्णयांचा क्रम म्हणून देखील अर्थ लावला जाऊ शकतो. येथे आपल्याला पुन्हा विवेक आणि सातत्य या समस्येचा सामना करावा लागत आहे, ज्यामधील सीमा स्थिर आणि गतिमान प्रणालींमधील अस्पष्ट आहे. तथापि, एक फरक अजूनही अस्तित्वात आहे: शास्त्रीय नियंत्रण सिद्धांतामध्ये असे गृहित धरले जाते की प्रणालीवरील प्रभाव ही एक प्रक्रिया आहे, वेळ किंवा राज्य पॅरामीटर्सचे कार्य आहे, आणि एक-वेळची प्रक्रिया नाही.

ऑपरेशन रिसर्चचे आणखी एक विशिष्ट वैशिष्ट्य म्हणजे हे विज्ञान नियंत्रणासह कार्य करते - स्थिरांक, सिस्टम पॅरामीटर्स. मग, जर डायनॅमिक समस्यांमध्ये गणितीय बांधकाम निकष म्हणून वापरले जाते - एक कार्यात्मक जे सिस्टमच्या हालचालीचे मूल्यांकन करते, तर ऑपरेशन्सच्या अभ्यासामध्ये निकष प्रणालीच्या अभ्यास केलेल्या पॅरामीटर्सच्या सेटवर परिभाषित केलेल्या फंक्शनचे स्वरूप असते.

ऑपरेशन्स रिसर्चमध्ये समाविष्ट असलेल्या व्यावहारिक समस्यांचे क्षेत्र खूप विस्तृत आहे आणि त्यात संसाधनांचे वाटप, मार्ग निवड, नियोजन, इन्व्हेंटरी व्यवस्थापन, रांगेतील समस्यांमधील रांगेचे व्यवस्थापन इत्यादी क्रियाकलापांचा समावेश आहे. संबंधित समस्या सोडवताना, त्यांच्या वर्णनासाठी वर वर्णन केलेली पद्धत मॉडेल, राज्य, उद्दिष्टे, निकष, व्यवस्थापन या श्रेणी विचारात घेऊन वापरला जातो. ऑप्टिमायझेशन समस्या, ज्यामध्ये पॅरामीटर स्पेसमध्ये निकष फंक्शनचे टोक शोधणे समाविष्ट असते, ते देखील तयार केले जाते आणि सोडवले जाते. निर्धारवादी आणि स्टोकास्टिक फॉर्म्युलेशनमध्ये समस्या सोडवल्या जातात.

स्थिरांकांसह कार्य करण्याची प्रक्रिया फंक्शन्ससह कार्य करण्यापेक्षा खूपच सोपी असल्याने, ऑपरेशन्सच्या संशोधनाचा सिद्धांत सिस्टम्सच्या सामान्य सिद्धांतापेक्षा आणि विशेषतः, डायनॅमिक सिस्टम्सच्या नियंत्रणाच्या सिद्धांतापेक्षा अधिक प्रगत असल्याचे दिसून आले. व्यावहारिकदृष्ट्या महत्त्वपूर्ण समस्यांच्या विस्तृत श्रेणीचे निराकरण करण्यासाठी ऑपरेशन्स संशोधन गणितीय साधनांचे एक मोठे शस्त्रागार प्रदान करते, कधीकधी अगदी अत्याधुनिक असते. ऑपरेशन्स रिसर्च देणाऱ्या गणितीय पद्धतींच्या संपूर्ण संचाला गणितीय प्रोग्रामिंग म्हणतात. अशा प्रकारे, ऑपरेशन्सच्या संशोधनाच्या चौकटीत, निर्णय घेण्याचा सिद्धांत विकसित केला जात आहे - एक अत्यंत संबंधित क्षेत्र.

निर्णय घेण्याचा सिद्धांत, थोडक्यात, वेक्टर निकषाच्या तपशीलवार वर्णनासाठी परिस्थिती अनुकूल करण्याच्या प्रक्रियेचा आणि त्याचे अत्यंत मूल्य स्थापित करण्याच्या वैशिष्ट्यांचा विचार करतो. अशाप्रकारे, समस्येचे सूत्रीकरण अनेक घटकांचा समावेश असलेल्या निकषाद्वारे दर्शविले जाते, उदा. एकाधिक मापदंड समस्या.

निकष आणि निर्णय प्रक्रियेच्या व्यक्तिमत्त्वावर जोर देण्यासाठी, समस्येचा वैयक्तिक दृष्टिकोन असलेला निर्णय निर्माता (DDM) विचारात आणला जातो. औपचारिक पद्धतींचा वापर करून उपायांचा अभ्यास करताना, निकषाच्या एक किंवा दुसर्या घटकाचे मूल्यांकन करताना हे प्राधान्यांच्या प्रणालीद्वारे प्रकट होते.

नियमानुसार, निर्णय घेण्यासाठी, निर्णय घेणाऱ्याला कृतीसाठी अनेक पर्याय प्राप्त होतात, ज्यापैकी प्रत्येकाचे मूल्यांकन केले जाते. उपकरणाद्वारे तयार केलेल्या पर्यायांपैकी एक निवडताना हा दृष्टीकोन संस्थात्मक प्रणालीमध्ये जबाबदार विषयाच्या कृतीच्या वास्तविक परिस्थितीच्या शक्य तितक्या जवळ आहे. त्या प्रत्येकाच्या मागे अंतिम परिणामांच्या विश्लेषणासह घटनांच्या संभाव्य अभ्यासक्रमाचा अभ्यास (विश्लेषणात्मक, गणितीय सिम्युलेशन) आहे - एक परिस्थिती. गंभीर निर्णय घेण्याच्या सोयीसाठी, परिस्थिती कक्ष आयोजित केले जातात, डिस्प्ले किंवा स्क्रीनवर परिस्थिती प्रदर्शित करण्याच्या दृश्य माध्यमांनी सुसज्ज असतात. या उद्देशासाठी, तज्ञ (ऑपरेशनलिस्ट) सामील आहेत जे केवळ परिस्थितीचे विश्लेषण आणि निर्णय तयार करण्याच्या गणितीय पद्धतींमध्येच नव्हे तर विषय क्षेत्रात देखील निपुण आहेत.

हे स्पष्ट आहे की ऑपरेशन रिसर्चचा सिद्धांत, विशेषतः, आणि निर्णय घेण्याचा सिद्धांत, एखाद्या वस्तूवर लागू करण्याचा परिणाम म्हणजे कृतीची एक विशिष्ट इष्टतम योजना आहे. परिणामी, विशिष्ट ब्लॉकचे इनपुट, ऑप्टिमायझेशन अल्गोरिदमसह "स्टफ केलेले" आणि परिस्थिती मॉडेलच्या गणितीय प्रोग्रामिंगच्या योग्य पद्धतीचा वापर करून तयार केले गेले आहे, माहिती पुरवली जाते: प्रारंभिक स्थिती, ध्येय, गुणवत्ता निकष, विविध पॅरामीटर्सची सूची, निर्बंध. (अल्गोरिदम तयार करताना सिस्टम मॉडेल वापरले जाते.) ब्लॉकचे आउटपुट इच्छित योजना आहे. सायबरनेटिक्सच्या दृष्टिकोनातून, अशा बांधकामाचे ओपन कंट्रोल लूप म्हणून वर्गीकरण केले जाते, कारण आउटपुट माहिती इनपुट सिग्नलवर परिणाम करत नाही.

तत्वतः, विचारात घेतलेला दृष्टीकोन बंद-लूप नियंत्रणाच्या बाबतीत देखील लागू केला जाऊ शकतो. हे करण्यासाठी, कालांतराने पुनरावृत्ती प्रक्रिया आयोजित करणे आवश्यक आहे: योजना अंमलात आणल्यानंतर, प्रारंभिक स्थिती म्हणून सिस्टमची नवीन स्थिती सादर करा आणि सायकलची पुनरावृत्ती करा. कार्य अनुमती देत ​​असल्यास, आपण लक्ष्य प्रणालीच्या सुरुवातीच्या स्थितीच्या जवळ आणून नियोजन कालावधी कमी करू शकता. नंतर प्रस्तावित कृती आणि वर चर्चा केलेल्या पुनरावृत्ती टर्मिनल नियंत्रण प्रक्रियेमध्ये एक समानता आहे, जी प्रारंभिक माहितीच्या नियतकालिक अद्यतनावर देखील आधारित आहे. शिवाय, प्रक्रियांसह चालणारी डायनॅमिक समस्या फंक्शनल मालिकेद्वारे फंक्शन्सच्या अंदाजे कमी केली जाऊ शकते. या प्रकरणात, व्हेरिएबल व्हेरिएबल्स आधीपासूनच अशा मालिकेचे पॅरामीटर्स असतील, याचा अर्थ ऑपरेशन्सच्या संशोधनाच्या सिद्धांताचे उपकरण लागू होईल. (हे संभाव्यता सिद्धांतामध्ये केले जाते, जेव्हा यादृच्छिक प्रक्रियांचे वर्णन कॅनोनिकल विस्ताराद्वारे केले जाते.)

परिस्थितीजन्य व्यवस्थापनाच्या संश्लेषणामध्ये कृत्रिम बुद्धिमत्तेच्या सिद्धांतामध्ये बाह्यरेखा दिलेल्या पद्धतीचा उपयोग होऊ लागला.

सिस्टीम सिद्धांतामध्ये अपर्याप्तपणे सक्षम असलेल्या व्यक्तींद्वारे निर्णय घेण्याच्या सिद्धांताच्या व्यावहारिक वापराशी संबंधित धोक्याकडे लक्ष वेधले पाहिजे. अशा प्रकारे, अनेकदा संस्थात्मक प्रणालींमध्ये (सरकारी संस्था, कंपन्या, वित्तीय संस्था) निर्णय घेणे निरपेक्ष केले जाते आणि असंख्य निर्देशकांसह कार्य करण्यासाठी आणि एक-वेळच्या व्यवस्थापन कायद्याच्या इष्टतम अंमलबजावणीसाठी कमी केले जाते. त्याच वेळी, ते सिस्टमसाठी केलेल्या कारवाईच्या परिणामांकडे दुर्लक्ष करतात, ते विसरतात की ते निकष नव्हे तर सिस्टम व्यवस्थापित करत आहेत, बंद प्रक्रियेचे बहु-स्टेज स्वरूप लक्षात घेत नाही - सिस्टमकडून त्याच्या स्थितीकडे, नंतर सोल्यूशनच्या निर्देशकांद्वारे आणि पुन्हा सिस्टमकडे. अर्थात, या लांब मार्गावर, अनेक चुका केल्या जातात, वस्तुनिष्ठ आणि व्यक्तिनिष्ठ, जे नियोजित परिणामांपासून गंभीर विचलनासाठी आधीच पुरेसे आहेत.

इष्टतमतेचे तत्त्व हे नियमांचा संच म्हणून समजले जाते ज्याच्या मदतीने निर्णय घेणारा त्याची कृती (निर्णय, पर्यायी, धोरण, व्यवस्थापन निर्णय) निर्धारित करतो जे त्याचे ध्येय साध्य करण्यासाठी सर्वोत्तम योगदान देते. इष्टतमतेचे तत्त्व निर्णय घेण्याच्या विशिष्ट अटींवर आधारित निवडले जाते: सहभागींची संख्या, त्यांची क्षमता आणि उद्दिष्टे, हितसंबंधांच्या संघर्षाचे स्वरूप (विरोध, गैर-विरोध, सहकार्य इ.).

निर्णय घेण्याच्या मॉडेल्समध्ये, विशेषत: गेम थिअरीमध्ये, इष्टतम वर्तनाची मोठ्या प्रमाणात औपचारिक तत्त्वे विकसित केली गेली आहेत. त्यापैकी फक्त काहींवर आम्ही येथे लक्ष केंद्रित करू.

कमालीकरणाचे तत्त्व (कमीतकमी). हे तत्व मध्ये लागू होते प्रामुख्याने गणितीय प्रोग्रामिंग समस्यांमध्ये (पहा (2) - (4)).

निकष परिभ्रमण तत्त्व.एका समन्वय केंद्राद्वारे अनेक निकष "अनुकूलन" करताना (मल्टी-मापदंड ऑप्टिमायझेशन समस्या (5)) प्रत्येक निकषासाठी (उद्देशीय कार्ये) वापरला जातो.

f 1 (u),..., f n (u)

"वजन" (संख्या) तज्ञांद्वारे नियुक्त केले जातात

जेथे α i निकषाचे "महत्त्व किंवा महत्त्व" दर्शवितो. पुढे, निकषांची परिभ्रमण जास्तीत जास्त (किंवा कमी) करण्यासाठी व्यवहार्य उपाय X च्या संचामधून समाधान x* निवडले आहे:

शब्दकोशाच्या प्राधान्याचे तत्त्व.हे मल्टीक्रिटेरिया ऑप्टिमायझेशन समस्यांमध्ये अनुकूलतेचे आणखी एक तत्त्व आहे. प्रथम, निकष "महत्त्व" द्वारे रँक केले जातात. खालील रँकिंग बनवू द्या:

f 1 (x), f 2 (x),..., f n (x)

n+1 पैकी एक अटी पूर्ण झाल्यास कोशशास्त्रीय प्राधान्याच्या अर्थाने समाधान x*X समाधान xX पेक्षा "चांगले" आहे:

    f 1 (x*)>f 1 (x);

    f 1 (x*)=f 1 (x), f 2 (x*)>f 2 (x);

    f 1 (x*)=f 1 (x), f 2 (x*)=f 2 (x), f 3 (x*)>f 3 (x);

………………

    f i (x*)=f i (x) साठी i=1,…,n-1, f n (x*)>f n (x);

n+1) f i (x*)=f i (x) i=1,…,n साठी.

किमान तत्त्व.जेव्हा दोन विरोधी बाजूंचे हितसंबंध टक्कर होतात (विरोधी संघर्ष) तेव्हा ते वापरले जाते. प्रत्येक निर्णय घेणारा प्रथम त्याच्या प्रत्येक रणनीतीसाठी (पर्यायी) “गॅरंटीड” निकालाची गणना करतो, नंतर शेवटी ती धोरण निवडतो ज्यासाठी हा निकाल त्याच्या इतर धोरणांच्या तुलनेत सर्वात मोठा आहे. अशी कृती निर्णय घेणाऱ्याला "जास्तीत जास्त फायदा" देत नाही, परंतु विरोधी संघर्षाच्या परिस्थितीत इष्टतमतेचे एकमेव वाजवी तत्व आहे. विशेषतः, कोणताही धोका वगळण्यात आला आहे.

समतोल तत्त्व.हे मिनिमॅक्स तत्त्वाचे सामान्यीकरण आहे, जेव्हा अनेक पक्ष परस्परसंवादात भाग घेतात, प्रत्येकजण स्वतःच्या ध्येयाचा पाठपुरावा करत असतो (कोणताही थेट संघर्ष नाही). निर्णय घेणाऱ्यांची संख्या (विरोधी नसलेल्या संघर्षात सहभागी) n असू द्या. निवडलेल्या रणनीतींचा संच (परिस्थिती) x 1 *, x 2 *,…, x n * जर समतोल म्हणतात या परिस्थितीतून कोणत्याही निर्णयकर्त्याचे एकतर्फी विचलन केवळ त्याच्या स्वत: च्या "लाभ" मध्ये घट होऊ शकते. समतोल स्थितीत, सहभागींना "जास्तीत जास्त" मोबदला मिळत नाही, परंतु त्यांना त्यास चिकटून राहण्यास भाग पाडले जाते.

पॅरेटो इष्टतमतेचे तत्त्व.हे तत्त्व सर्वोत्कृष्ट अशा परिस्थिती (रणनीती x 1,...,x n) म्हणून गृहीत धरते ज्यामध्ये वैयक्तिक सहभागीचे "पेऑफ" सुधारणे इतर सहभागींचे "पेऑफ" खराब केल्याशिवाय अशक्य आहे. हे तत्त्व समतोल तत्त्वापेक्षा अनुकूलतेच्या संकल्पनेवर कमकुवत मागणी करते. म्हणून, पॅरेटो-इष्टतम परिस्थिती जवळजवळ नेहमीच अस्तित्वात असते.

नॉन-प्रचंड परिणामांचे तत्त्व. हे तत्त्व सहकारी खेळांमध्ये (सामूहिक निर्णय घेणे) अनेक इष्टतम तत्त्वांचे प्रतिनिधी आहे आणि निर्णयांच्या "कोर" च्या संकल्पनेकडे नेत आहे. सर्व सहभागी एकत्र होतात आणि संयुक्त समन्वित कृतींद्वारे, "एकूण नफा" वाढवतात. नॉन-प्रभुत्वाचे तत्त्व हे सहभागींमधील "वाजवी" विभाजनाच्या तत्त्वांपैकी एक आहे. ही अशी परिस्थिती आहे जेव्हा सहभागींपैकी कोणीही प्रस्तावित विभाजनावर (“कोर” घटक) वाजवीपणे आक्षेप घेऊ शकत नाही. एकूण एकूण विजयांच्या “इष्टतम” विभागणीसाठी इतर तत्त्वे आहेत.

तत्त्वेटिकाऊपणा(धमक्याआणिप्रति-धमकी).सर्व धमकी-प्रतिरोधी लवचिकता तत्त्वांमागील कल्पना खालीलप्रमाणे आहे. सहभागींची प्रत्येक युती आपला प्रस्ताव पुढे ठेवते, त्यासोबत खरी धमकी दिली जाते: जर हा प्रस्ताव उर्वरित सहभागींनी स्वीकारला नाही, तर इतर सहभागींची स्थिती बिघडवणारी कृती केली जाईल आणि स्थिती बिघडू नये (शक्यतो सुधारेल). धमकी देणाऱ्या युतीचा. इष्टतम उपाय हा एक आहे ज्यामध्ये, कोणत्याही युतीला कोणत्याही धोक्याच्या विरोधात, काही युतीकडून प्रति-धमकी असते.

लवाद योजना. आर्थिक संघर्ष "सामाजिक मध्यस्थ" ची कल्पना सुचवतात. हितसंबंधांचे संघर्ष होणे अवांछनीय आहे, उदाहरणार्थ, खुल्या धमक्या आणि प्रति-धमक्या. अशी सामाजिक यंत्रणा असली पाहिजे जी प्रत्येक सहभागीची प्राधान्ये आणि धोरणात्मक क्षमता विचारात घेण्यास अनुमती देतील आणि संघर्षावर "वाजवी" तोडगा देईल. अशी आगाऊ यंत्रणा, मग ती व्यक्ती असो किंवा मतदान यंत्रणा, त्याला मध्यस्थ म्हणतात. गेम थिअरीमध्ये, एक इष्टतम समाधान, लवाद योजनेच्या अर्थाने, स्वयंसिद्ध प्रणाली वापरून तयार केले जाते, ज्यामध्ये स्थिती, पॅरेटो इष्टतमता, पर्यायांची रेखीयता, "रँक" पासून स्वातंत्र्य इ.

अनिश्चिततेच्या परिस्थितीत इष्टतम निर्णय घेण्याच्या मुद्द्यांचा विचार करूया. निर्णय घेणाऱ्याचे इष्टतम वर्तन विकसित करण्यासाठी, अशा परिस्थितीला दोन व्यक्तींचा विरोधाभासी खेळ म्हणून मॉडेल करणे उपयुक्त आहे, जिथे निसर्ग निर्णयकर्त्याचा विरोधक मानला जातो. उत्तरार्धात दिलेल्या परिस्थितीनुसार कल्पना करण्यायोग्य सर्व शक्यता आहेत.

समाधानाच्या इष्टतम निवडीसाठी “निसर्गासह खेळ” ची स्वतःची विशिष्ट (मिनिमॅक्स तत्त्वाची आठवण करून देणारी) तत्त्वे असतात.

अत्यंत निराशावादाचे तत्त्व (वाल्ड निकष). या तत्त्वानुसार, निसर्गाशी खेळणे (अनिश्चिततेच्या परिस्थितीत निर्णय घेणे) हा वाजवी, आक्रमक प्रतिस्पर्ध्याशी खेळ म्हणून खेळला जातो जो आपल्याला यश मिळवण्यापासून रोखण्यासाठी सर्वकाही करतो. "निसर्गाने परवानगी दिलेल्या" पेक्षा कमी नफा मिळण्याची हमी दिल्यास निर्णय घेणाऱ्याची रणनीती इष्टतम मानली जाते.

मिनिमॅक्स जोखीम तत्त्व (सॅव्हेज निकष). हे तत्त्व निराशावादी देखील आहे, परंतु इष्टतम रणनीती निवडताना ते "जिंकण्यावर" नव्हे तर जोखमीवर लक्ष केंद्रित करण्याचा सल्ला देते. जोखमीची व्याख्या निर्णयकर्त्याचा जास्तीत जास्त नफा (निसर्गाच्या स्थितीबद्दल पूर्ण माहितीच्या अधीन) आणि वास्तविक नफा (निसर्गाच्या स्थितीबद्दल अज्ञान दिल्याने) यांच्यातील फरक म्हणून केली जाते. इष्टतम रणनीती अशी आहे ज्यामध्ये जोखीम कमी आहे.

निराशावादाचे तत्व - आशावाद (Hurwitz निकष).हा निकष अशी शिफारस करतो की उपाय निवडताना, तुम्ही अत्यंत निराशावाद ("नेहमी सर्वात वाईट मानू नका!") किंवा अत्यंत आशावाद ("कदाचित वक्र तुम्हाला बाहेर काढेल!") या निकषानुसार मार्गदर्शन करू नये अत्यंत निराशावाद आणि आत्यंतिक आशावाद यांच्यातील भारित सरासरी कमाल केली जाते. शिवाय, परिस्थितीच्या धोक्याबद्दल व्यक्तिनिष्ठ विचारांवर आधारित "वजन" निवडले जाते.

डायनॅमिक स्थिरता संकल्पना.इष्टतमतेची वरील सर्व तत्त्वे स्थिर निर्णय घेण्याच्या समस्यांशी संबंधित आहेत. डायनॅमिक समस्यांमध्ये त्यांचा वापर करण्याचा प्रयत्न सर्व प्रकारच्या गुंतागुंतांसह असू शकतो.

मुख्य गोष्ट म्हणजे डायनॅमिक प्रक्रियेची वैशिष्ट्ये. हे आवश्यक आहे की इष्टतमतेचे एक किंवा दुसरे तत्त्व, प्रक्रियेच्या सुरुवातीच्या स्थितीत (वेळेच्या सुरुवातीच्या टप्प्यावर) निवडलेले, गतिशील प्रक्रियेच्या समाप्तीपर्यंत कोणत्याही वर्तमान स्थितीत (वेळेच्या कोणत्याही वेळी) इष्टतम राहते. या तत्त्वाला गतिमान स्थिरता म्हणतात.

अटी अंतर्गत Cq -^ O

फंक्शनल (6.6) मधील वजन घटकाच्या लहान मूल्यांच्या समस्येच्या निराकरणाचा अभ्यास हा नियंत्रणाच्या तीव्रतेवर निर्बंध असताना बंद-लूप प्रणालीच्या जास्तीत जास्त साध्य करण्यायोग्य अचूकतेचे मूल्यांकन करण्याच्या दृष्टिकोनातून महत्त्वपूर्ण स्वारस्य आहे. (शक्ती) बिनमहत्त्वाचे आहेत. याव्यतिरिक्त, नियंत्रण क्रियेच्या शक्तीच्या कमाल पातळीचे मूल्यांकन करणे महत्वाचे आहे, जे ओलांडल्याने नियंत्रण अचूकतेमध्ये आणखी वाढ होत नाही.

आम्ही खालील विधानाच्या स्वरूपात c 0 -»0 अटी अंतर्गत इष्टतम प्रणालीच्या मर्यादित वर्तनाच्या अभ्यासाच्या मुख्य तरतुदी सादर करतो.

प्रमेय 6.3. बंद प्रणालीसाठी (6.4), (6.7), जे कार्यक्षमतेच्या दृष्टीने इष्टतम आहे (6.6), संबंध वैध आहेत

खालील अतिरिक्त नोटेशन येथे वापरले आहे:

बहुपदी सह B*(s) Hurwitz आणि जटिल संख्या आहे(3, Р 2,..., Р p बहुपदी M(s) ची सामान्य मुळे आहेत आणि B*(-s).

पुरावा.नोटेशनची ओळख करून देऊ आणि (६.२६), (६.२७) सूत्रांच्या सादृश्याने, संबंध लिहू.

कुठे gj (i = l,n)- बहुपदी G'(-s,7.) ची मुळे.

(6.42)-(6.44), सूत्रे (6.13)-(6.15) विचारात घेऊन पुढील फॉर्ममध्ये सादर केले जाऊ शकतात:

हे स्पष्ट आहे की अट अंतर्गत बंद-लूप प्रणालीच्या मर्यादित वर्तनाचा विचार केला जातो 0 पासून -> 0 समतुल्यस्थिती अंतर्गत त्याच्या मर्यादित वर्तनाचा विचार एक्स-> syu.

प्रमेयाच्या थेट पुराव्याकडे जाण्यापूर्वी, आम्ही बहुपदीच्या मुळांच्या मर्यादित वर्तनाचा विचार करतो. G*(-s, X) ओळखीत (6.43) निर्दिष्ट स्थितीत.

या उद्देशासाठी, आम्ही कामात सादर केलेल्या सुप्रसिद्ध विधानाचा वापर करू, त्यानुसार आम्ही प्रयत्न करतो एक्स-> बहुपदीची 00 मीटर मुळे G*(-s,X)बहुपदीच्या मुळांकडे कल B*(-s)-नेगुरविट्झ फॅक्टरायझेशन परिणाम:

उर्वरित (पी - ट)बहुपदीची मुळे G*(-s,X)ते दिले एक्स-> °о अनंताकडे जा, असिम्प्टोटिकरीत्या सरळ रेषांकडे जाताना ज्या निर्देशांकांच्या उगमस्थानी छेदतात आणि वास्तविक अक्षासह कोन तयार करतात, अभिव्यक्तीद्वारे निर्धारित

आणि ही सर्व मुळे त्रिज्येच्या वर्तुळावर स्थित आहेत

वरील बाबी लक्षात घेऊन, आमच्याकडे आहे
जेथे नोटेशन वापरले जातात

आणि स्थिर गुणांक /с, (/ =,पी-टी-) X च्या मूल्यावर अवलंबून नाही,

आता आपण बहुपदीच्या संदर्भात दोन संभाव्य पर्यायांचा क्रमाने विचार करूMpb(-s)विस्तारामध्ये (6.41), अनुक्रमे परिस्थितीनुसार वैशिष्ट्यीकृतM rb=1 आणिM rb F 1.

पर्याय 1. अट पूर्ण झाली आहे असे गृहीत धराM p b(~ s) =1, जे समानतेच्या समतुल्य आहे Г) = 0. याचा अर्थ बहुपदीमध्ये"(-s) बहुपदी M(s) = B"(-) सह सामान्य मुळे नाहीत

बहुपदीच्या मर्यादित वर्तनाचा विचार करूयाR(s,X)(6.47) प्रदान केलेX ->°°, पूर्वी ते लक्षात घेतले

(6.50) पासून ते खालीलप्रमाणे आहेबहुपदी लिमची मुळेG f (-s, X)बहुपदीच्या मुळांशी (3, (/ = 1,m) एकरूपB*(-s), आणि बाकीचे(p - t)

मुळे - मुळांसह p g (g =t + 1,p)बहुपदीP(-s,X)(6.53), जे खालील अभिव्यक्तींद्वारे परिभाषित केले आहेत:

या प्रकरणात, संबंध स्पष्टपणे समाधानी आहेत

(6.50) आणि (6.54)-(6.56) संबंध लक्षात घेता, बहुपदी मर्यादाR(s, X)दोन मर्यादा बहुपदांची बेरीज म्हणून प्रस्तुत केले जाऊ शकतेR^SyX)आणिR2(s, X):

यातील पहिली बहुपदी फक्त मुळांशी जोडलेली आहे (3, आणि दुसरी - फक्त p, मुळे:

(6.56) नुसार आपल्याकडे lim Р(-|3-Д) = गरुड आहेएक्स1, म्हणून अभिव्यक्ती

tion (6.57) फॉर्ममध्ये दर्शविले जाऊ शकते किंवा

पासून, सूत्रांनुसार (6.51), (6.53),

लक्षात घ्या की बहुपदी B,*(s) मध्ये मर्यादित गुणांक आहेत जे M(P,.)*0 या स्थितीमुळे शून्य आहेत आणि त्यांच्यापासून स्वतंत्र आहेत. एक्स.

आता आपण रिलेशन (6.58) चे रुपांतर करतो, खालील समानता लक्षात घेऊन: deg A(s) =पी, Sj(s) =N(s)/T(s), degN(s) =p, degT(s) =q. याव्यतिरिक्त, आम्ही degB"(-s) = degB“(s) = ही स्थिती लक्षात घेतोट,दर्शविणे सोपे आहे म्हणून, नात्याची पूर्तता आवश्यक आहे

मग आमच्याकडे आहे

परंतु सूत्र (6.55) वरून (6.60) संबंध लक्षात घेऊन ते खालीलप्रमाणे आहे: आणि (6.56), (6.51) नुसार:

कुठेG*आणिG**(/ = m + 1,н) - शून्यापेक्षा भिन्न मर्यादित मोड्युली असलेल्या जटिल संख्या. मग आम्हाला मिळते

आणि त्या अनुषंगाने

(6.50)-(6.53) आणि (6.55) च्या सद्गुणानुसार आमच्याकडे आहे:

आणि स्थिर जटिल संख्या r; , r u, r 2i, k i, k 2i, ... , k(n - m -2 ) i (i= + 1,i) A च्या मूल्यावर अवलंबून नाही.

मग, असमानतेची वैधता दिली p-t> 1 (अन्यथा Pj(s,X) = const), आमच्याकडे lim?)(s,A)/A = 0 आहे आणि सूत्रानुसार (6.61)

परंतु नंतर, ओळख (6.59) आणि (6.62) नुसार, आम्ही प्राप्त करतो

या प्रकरणात, (6.45) आणि (6.46) नुसार, इष्टतम बंद प्रणालीच्या मर्यादा हस्तांतरण मॅट्रिक्ससाठी आमच्याकडे खालील सूत्रे आहेत:

पर्याय २.आता दुसरी परिस्थिती विचारात घ्या, जेव्हा ओळख M b (-s) = 1 पूर्ण होत नाही, म्हणजे या प्रकरणात आपण असे गृहीत धरू की बहुपदी मध्ये"(-s)आणि M(s) = B"(-s)RC(s) मध्ये D) समान मुळे आहेत.

या प्रकरणात, बहुपद B-s)जेथे उत्पादनाद्वारे दर्शविले जाते

मागील केसच्या विपरीत, बहुपदाच्या मर्यादित वर्तनाचा विचार करताना R(s,X)चला ते बेरीज म्हणून दर्शवू तीनअटी:

आणि आपण प्रथम बहुपदी बनवू फक्त सहबहुपदीची मुळे (3, (/ = 1,Г)) वापरणे Mpb(-s),दुसरा - बहुपदीच्या P g (I = T) +1, w) ची मुळे B" Q (-s) आणि तिसरा - मुळे c g (i = m + l, n) बहुपद P(s).

या प्रकरणात, दुस-या आणि तिस-या बहुपदांसाठी, मागील आवृत्तीशी पूर्ण सादृश्यतेने, आम्ही प्राप्त करतो

बहुपदीसाठी Rxआमच्याकडे आहे

M(RD = 0 Vie पासून .

दिलेल्या सूत्रांमधून (6.67)-(6.69) हे ओळख lim Kj(s,A,) = फॉलो करते. B*2(s), आणि, बहुपदी (6.64) मध्ये बदलत आहे ब[(चे)वर B* 2 (s),

आम्ही इष्टतम बंद-लूप प्रणालीसाठी मर्यादित हस्तांतरण मॅट्रिक्सची दुसरी आवृत्ती प्राप्त करतो. एकाच नोटेशनमध्ये दोन्ही पर्याय एकत्र करून, आम्हाला संबंध (6.37)-(6.41) मिळतात.

प्रमेय पूर्णपणे सिद्ध झाले आहे. ?

स्वतंत्र महत्त्व असलेल्या प्रमेय 6.3 वरून एक नैसर्गिक परिणाम देऊ.

प्रमेय 6.4.जर बहुपदी B ची सर्व मुळे*(-s)बहुपदी M(s) = ची मुळे देखील आहेतB"(-s)RC(s),आणि त्याच वेळी समानता पूर्ण होतेRyR = 0,मग मी x0= Nsh1 x (0 सह) = 0, त्या

जर नियंत्रण क्रियेच्या सामर्थ्यावर मर्यादा 1 आणि 0 = पेक्षा कमी नसेलNsh7 1((0 पासून),परिभाषित फॉर्म-

लॉय (6.37 अ), परिपूर्ण (शून्य त्रुटीसह) नियंत्रण अचूकता साध्य करता येते.

पुरावा. प्रमेयाच्या परिस्थितीनुसार, ओळख (6.41) वर आधारित, संबंध G) =ट,पण नंतर फॉर्म्युला (6.40) वरून ओळख येतेआर"(s) = 0 .

या प्रकरणात, (6.38), (6.39) आणि (6.37), (6.37a) सूत्रांनुसार समानता RyR = 0 पूर्ण करणे आणि (6.41) खात्यात घेतल्यास मिळते.

कुठे . प्रमेय सिद्ध झाला आहे. ?

चला खालील विशिष्ट परिस्थितीचा विचार करूया.

प्रमेय 6.5.मॅट्रिक्स असल्यासआरएकल-शून्य घटक r pp सह कर्ण आहे = 1, म्हणजे क्लोज्ड-लूप सिस्टमची अचूकता वेक्टरच्या p-th घटकाच्या फैलावने निर्धारित केली जाते.X,मग खालील संबंध आहेत:

अ)जर बहुपदी В р(चे)Hurwitz किंवा त्याची सर्व “उजवी” मुळे बहुपदी C p(s) च्या मुळांच्या स्पेक्ट्रममध्ये समाविष्ट केली आहेत, तर

ब)जर बहुपदी B p(s) चे उजव्या अर्ध्या भागामध्ये किमान एक मूळ असेल जे बहुपदी C p(s) चे मूळ नसेल, तर

आणि येथे सूत्रे विचारात घेतली आहेत (6.37अ) आणि (6.39)-(6.41) (या प्रकरणात आमच्याकडे आर

पुरावा. सूत्र (6.18) वरून ते मॅट्रिक्सचे अनुसरण करते 7(5) = ■ आपण असे गृहीत धरू की पदानुक्रमाच्या वरच्या स्तरावर A0 हा घटक आहे, ज्याला केंद्र म्हणतात. आम्ही संच Γ = 10\(/40) 1> विभक्त उपसंच ¿>2 अशा .आणि £¿=7 मध्ये विभागतो. चला सूचित करूया

1Г, ..,^(ग्राह्य क्रियांचे 0 संच (नियंत्रण

ies, रणनीती) घटक A0> Al आम्ही गृहीत धरू

असे गृहीत धरा की सामान्य परिस्थितीत स्वीकार्य क्रियांचे संच सिस्टमच्या उच्च स्तरावरील घटकांद्वारे निवडलेल्या नियंत्रणांवर अवलंबून असतात आणि या नियंत्रणांच्या कोणत्याही स्वीकार्य मूल्यांसाठी रिक्त नाहीत. आम्ही 1/x x सेटवर परिभाषित केलेल्या काही कार्यात्मक द्वारे कोणत्याही घटकासाठी £е I ​​निकष परिभाषित करू. ..l gse ^e^O), . प्रत्येक घटकाला त्याची कार्यक्षमता वाढवण्यात रस आहे.

आम्ही अशा प्रणालीमध्ये निर्णय घेण्याच्या प्रक्रियेचे मॉडेल श्रेणीबद्ध बहुस्तरीय गेमसह करू Г, ज्याला आम्ही सामान्य स्वरूपाचा श्रेणीबद्ध खेळ म्हणू.

§ 1.2 मध्ये, श्रेणीबद्ध संरचनेसह नियंत्रण आणि निर्णय-प्रणालीतील ऑप्टिमायझेशन समस्यांवर चर्चा केली जाते आणि श्रेणीबद्ध नियंत्रण संरचनेची संकल्पना तयार केली जाते. श्रेणीबद्ध प्रणालीमध्ये समाधान निवडण्यासाठी वापरलेला वैशिष्ट्यपूर्ण घटक म्हणजे व्यक्तीच्या इष्टतम प्रतिक्रियांचा संच

noP सिस्टम घटक किंवा घटकांचे गट /?( ) चालू

उच्च स्तरावरील उपप्रणालींसाठी नियंत्रणांची निवड. हा विभाग दोन-स्तरीय नियंत्रण प्रणालींमध्ये अनेक विशिष्ट: निर्णय घेण्याच्या मॉडेलची चर्चा करतो.

विभाग 1.3 गेम-सिद्धांतिक मॉडेल्समध्ये वापरल्या जाणाऱ्या इष्टतमतेच्या तत्त्वांना समर्पित आहे. येथे आपण दोन-स्तरीय, झाडासारखे खेळ आणि एक सामान्य श्रेणीबद्ध खेळ विचारात घेत आहोत. नॅश आणि स्टॅकलबर्ग समतोल या खेळांमध्ये इष्टतम तत्त्वे म्हणून वापरले जातात. हे दर्शविले आहे की ट्री गेममध्ये, पॅरामीटर्सच्या सर्व मूल्यांसाठी पेऑफ फंक्शनलच्या कमाल बिंदूंच्या विशिष्टतेच्या गृहीतकेनुसार, स्टॅकलबर्ग सोल्यूशन Neu नुसार समतोल परिस्थितींच्या सेटशी एकरूप होते.

खेळासाठी Г आम्ही खेळाडूंच्या समतोल श्रेणीबद्ध धोरणांची संकल्पना सादर करतो.

या स्तरावरील खेळाडूंच्या इष्टतम प्रतिक्रियांचा संच खालीलप्रमाणे परिभाषित करूया:

/G(>Y,...U~1b(rLg/£_ ^ H; (u, y,1 .u1~\

ir कुठे आहे

vl¡\!^." - नियंत्रण वेक्टर ज्यामध्ये £th घटक r>/ ने बदलला जातो.

व्याख्या. मॅपिंग V n., u]..u^""1) » प्रत्येक स्वीकार्य संचाला नियुक्त करणे

इष्टतम प्रतिक्रियांच्या अधीन, आम्ही करू

त्याला Lth स्तराची समतोल श्रेणीबद्ध धोरण म्हणा

येथे अनेक इष्टतम प्रतिक्रिया आहेत का?< -го уровня определяется так:

जेथे V ( ),...(.) अनुक्रमे, समतोल पदानुक्रम आहेत

&-I,..., b-th स्तरांची तांत्रिक रणनीती.

केंद्राच्या समतोल श्रेणीबद्ध सोल्युशनला आम्ही सर्व नियंत्रणांचा R0 संच म्हणू.

लेम्मा 1 हे सिद्ध करते की समतोल श्रेणीबद्ध धोरणांचा कोणताही संच नॅश समतोल स्थिती तयार करतो. खेळाच्या विशेष प्रकरणासाठी Г, जेव्हा पदानुक्रमाच्या प्रत्येक स्तरावर एकच खेळाडू असतो, तेव्हा प्रमेय I हे ई-समतोल परिस्थितीच्या अस्तित्वावर तयार केले जाते.

§ 1.4 मध्ये, डायमंड-आकाराच्या गेममध्ये डीटेकलबर्ग सोल्यूशन शोधण्याच्या प्रक्रियेची तपशीलवार चर्चा केली आहे, ज्यामध्ये मिश्रित अनुकूलता तत्त्वाचा वापर केला जातो. या डायमंड-आकाराच्या गेम सिस्टमशी जुळण्यासाठी, एसपी-सोल्यूशनची संकल्पना सादर केली गेली आहे, ज्यामध्ये स्टॅकलबर्ग सोल्यूशनचे गुणधर्म आहेत आणि पॅरेटो इष्टतमतेची आवश्यकता आहे. डायमंड-आकाराच्या संरचनेसह सिस्टममध्ये निर्णय घेण्याची प्रक्रिया स्पष्ट करण्यासाठी, आम्ही दोन प्रशासकीय केंद्र B1 आणि A च्या अधीन असलेल्या उत्पादन युनिट C साठी इष्टतम योजना तयार करण्याच्या समस्येचा विचार करतो, जे यामधून केंद्र A0 च्या अधीन आहेत. , आणि श्रेणीबद्ध उत्पादन प्रणालीमध्ये संसाधन वाटपाची अशी समस्या. "

श्रेणीबद्ध संरचनेसह सहकारी खेळांचे मुख्य वैशिष्ट्य म्हणजे या खेळांमधील वैशिष्ट्यपूर्ण कार्ये माहिती संरचना लक्षात घेऊन तयार केली जातात. L.A. Petrosyan च्या कामांमध्ये, नॅश समतोल परिस्थितींचा वापर करून डायमंड-आकाराच्या खेळांची वैशिष्ट्यपूर्ण कार्ये तयार केली जातात. कलम 1.5 मध्ये गैर-सहकारी खेळ G मधील खेळाडूंच्या समतोल श्रेणीबद्ध रणनीती वापरून सामान्य स्वरूपाच्या सहकारी श्रेणीबद्ध खेळाचे वैशिष्ट्यपूर्ण कार्य तयार करण्याची एक पद्धत प्रस्तावित केली आहे. बांधलेल्या वैशिष्ट्यपूर्ण कार्याची सुपरॲडिटिव्हिटी सिद्ध झाली आहे. प्रमेय 4 हे स्थापित करते की खेळाच्या समतोल स्थितीतील पेऑफ वेक्टर Г हा सहकारी खेळातील एक विभाग आहे आणि त्याच्या C-कोरचा आहे. विभागाच्या शेवटी, डायमंड-आकाराच्या खेळांमध्ये वैशिष्ट्यपूर्ण कार्ये तयार करण्याच्या उदाहरणांचा विचार केला जातो.

R.D. Auman, N.N Vorobyov, P.P. द्वारे वैज्ञानिक प्रकाशनांची 3 मालिका. लुईस, E. Dmmme, D. M. Kreps, N. Kuhn आणि इतर संशोधक

गेममधील समतोल परिस्थितीच्या स्थिरतेच्या संकल्पनेतील विविध बदलांचा विस्तारित स्वरूपात विचार केला जातो. विभाग 1.6 मध्ये, सामान्य स्वरूपाच्या श्रेणीबद्ध गेम Г मध्ये समाधानाच्या स्थिरतेची नवीन संकल्पना सादर केली गेली आहे. द्वारे सूचित करूया

M = (O, V,...,r>n); u.e/g°, vke ..k = \,r,...,b)

श्रेणीबद्ध गेमचे सोल्यूशन Г, केंद्राच्या इष्टतम श्रेणीबद्ध सोल्यूशन्सचा संच कोठे आहे, /?*( ] हा kth स्तरावरील खेळाडूंच्या इष्टतम प्रतिक्रियांचा संच आहे, नियंत्रणांच्या सर्व स्वीकार्य मूल्यांसाठी रिक्त नसलेला उच्च पातळीचे खेळाडू.

Ε>-(") द्वारे खेळाडू r ची श्रेणीबद्ध रणनीती आणि युती द्वारे दर्शवू.

आपण परिस्थितीचा विचार करू या (आणि, y 1(-), ■ ■., अशा

any -ue/?0, = u, A = 1,2,...,1-

प्रत्येक k = 1,2,...,1 साठी निश्चित केंद्र धोरणासह सर्व पर्यायांसह M^ हा M चा उपसंच असू द्या

m1m.... V1"") = ((g>?..., V1): . 1>1.y-"), 1-K..L

व्याख्या. पर्यायी (आणि, V1,... म्हणतात

कोणत्याही k = ■(, 2,..., I

या परिस्थितीच्या संदर्भात संच M^ मधील कोणताही पर्याय श्रेणीबद्धपणे स्थिर असल्यास परिस्थितीच्या संदर्भात Mi पदानुक्रमानुसार स्थिर (.u.uH"),...,Х10)) संच A/" असे उपसंच म्हणू. . परिस्थिती (आणि<рV-;,... ...»ф^С-)) будем называть абсолютно иерархически устойчивой, если относительно нее устойчиво множество М1о.

पहिल्या अध्यायात सिद्ध झालेल्या श्रेणीबद्ध स्थिरतेसाठी आवश्यक आणि पुरेशा परिस्थितींवर आपण खालील प्रमेये तयार करू या.

प्रमेय 6. पर्यायी क्रमाने

परिस्थितीच्या सापेक्ष पदानुक्रमानुसार स्थिर होते (_ आणि, $4-),...

-»С-)), हे कोणासाठीही आवश्यक आणि पुरेसे आहे

£ =1,2,",..,£ अट समाधानी होती

P k-<1()у*"*;,

जेथे У^ср1^,»1,..., V , £=

प्रमेय 7. इष्टतम परिस्थिती C, ^"O,--"/?^")) पूर्णपणे श्रेणीबद्धपणे स्थिर होण्यासाठी, कोणत्याही पर्यायासाठी (u, r>1...>y1) हे आवश्यक आणि पुरेसे आहे. )&M1 अट पूर्ण झाली

सर्व A साठी = (,2., ... ,1 .

धडा 2. डायनॅमिक संघर्ष नियंत्रण प्रणाली

श्रेणीबद्ध संरचनेसह

हा धडा श्रेणीबद्ध संरचनेसह सामान्य डायनॅमिक सिस्टमच्या संघर्ष व्यवस्थापनाची समस्या तयार करतो. श्रेणीबद्ध नियंत्रण प्रणालींसाठी, ज्याची गतिशीलता वेक्टर विभेदक समीकरणांद्वारे वर्णन केली जाते आणि पेऑफ फंक्शनलमध्ये अविभाज्य आणि टर्मिनल अटी असतात, विविध इष्टतमतेच्या तत्त्वांसाठी सोल्यूशन्सच्या गतिशील स्थिरतेची समस्या तयार केली जाते, ज्या परिस्थितीनुसार उपाय गतिशीलपणे बाहेर पडतात. स्थिरांचा अभ्यास केला जातो आणि अस्थिर इष्टतमतेच्या तत्त्वांसाठी, नियमितीकरण पद्धती प्रस्तावित केल्या जातात ज्या श्रेणीबद्ध खेळांच्या समाधानाची गतिशील स्थिरता सुनिश्चित करतात.

विभाग 2.1 श्रेणीबद्ध संरचनेसह डायनॅमिक मॉडेल्समध्ये संघर्ष नियंत्रणाची समस्या तयार करते, विविध प्रकारच्या धोरणे आणि नियंत्रणांसाठी भिन्न समीकरणांच्या प्रणालींचे अस्तित्व आणि विशिष्टता सुनिश्चित करणाऱ्या परिस्थितीची चर्चा करते आणि अशा परिस्थिती प्रदान करते ज्या अंतर्गत सर्व शक्य संच प्रोग्राम वापरताना आणि संश्लेषण नियंत्रणे एकरूप होतात. विभागाच्या शेवटी, आम्ही टर्मिनलसह दोन-स्तरीय भिन्नता गेममध्ये समतोल परिस्थिती शोधण्याच्या दोन उदाहरणांचा विचार करतो.

विजय विचारात घेतलेली उदाहरणे या वस्तुस्थितीद्वारे दर्शविली जातात की त्यापैकी एकातील इष्टतम रणनीती गतिशीलदृष्ट्या अस्थिर असल्याचे दिसून येते आणि दुसऱ्यामध्ये त्यांच्या विरुद्ध गुणधर्म आहेत.

पहिल्या परिच्छेदात आणि संपूर्ण प्रकरणामध्ये चर्चा केलेल्या सर्व संघर्ष श्रेणीबद्ध प्रणालींच्या गतिशीलतेचे वर्णन वेक्टर विभेदक समीकरणाने केले आहे.

सुरुवातीच्या परिस्थितीत

I th T > नियंत्रण gs. ई, आर प्रत्येक क्षणाला कॉम्पॅक्ट सेट्समधून निवडले जाते,..., Рп, £ = ■1,2,...,п खेळाडूंचे पेऑफ फंक्शनल्स फॉर्ममध्ये विचारात घेतले जातात.

= ¿-0.1....p.

संघर्ष व्यवस्थापन प्रणालीमध्ये निर्णय घेण्याचे गेम-सैद्धांतिक मॉडेल तयार करण्याचा एक महत्त्वाचा मुद्दा म्हणजे इष्टतमतेच्या तत्त्वाची निवड, तसेच खेळाडूंनी वापरलेल्या रणनीतींचा प्रकार. परिच्छेद २.२ मध्ये याची चर्चा केली आहे. स्वीकारलेल्या शब्दावलीनुसार, आम्ही खेळाडूची रणनीती त्याच्या नियंत्रण पॅरामीटर्सच्या सेटवर सेट केलेल्या या खेळाडूच्या माहितीचे मॅपिंग म्हणून परिभाषित करतो. सर्वसाधारण बाबतीत, असे गृहीत धरले जाते की 1ल्या खेळाडूची रणनीती जागा मॅपिंगचा एक संच आहे ^¿(¿,xO>), जेथे निश्चित I साठी, (p.(-) वर अवलंबून असते

हे असे आहे जेव्हा, दोन व्यक्तींच्या श्रेणीबद्ध विभेदक खेळामध्ये, धोरणे वापरली जातात ज्यात खालच्या-स्तरीय खेळाडूला ट्रॅक करण्यासाठी आमंत्रित करणे, वरच्या-स्तरीय खेळाडूसह, दोन्ही खेळाडूंना फायदेशीर ठरणारी विशिष्ट मार्गक्रमण समाविष्ट असते. अशा रणनीती वापरल्या गेल्या, उदाहरणार्थ, एएफ क्लेमेनोव्हच्या कामात.

विभाग 2.2 मध्ये, एकाच केंद्रासह दोन-स्तरीय p-N व्यक्ती गेमसाठी समान धोरणांचा विचार केला जातो - एक उच्च-स्तरीय खेळाडू, जेव्हा केंद्र प्रणालीच्या गतिशीलतेवर परिणाम करत नाही, परंतु गेमच्या पेऑफ फंक्शनलच्या मूल्यावर.

खालच्या पातळीचे खडक. प्रस्तावित सोल्यूशन डिझाइनचे वैशिष्ट्यपूर्ण वैशिष्ट्य म्हणजे केंद्रस्थानी UG धोरणाची उपस्थिती; ea, जे गृहीत धरते की प्रस्तावित मार्गाच्या अंमलबजावणीपासून विचलन झाल्यास, केंद्र सार्वत्रिक धोरणाकडे वळेल, ज्याचा अर्थ शिक्षा धोरण म्हणून देखील केला जाऊ शकतो. खालील परिच्छेद इष्टतम तत्त्वाच्या वापरावर चर्चा करतो! दोन आणि तीन स्तरावरील भिन्न खेळांसाठी स्टॅकॉलबर्ग प्रकार. विभागाच्या शेवटी, Ltakelbsrg नुसार o: Tical सोल्यूशन्स शोधण्याची उदाहरणे, तसेच द्वि-स्तरीय भिन्नता गेममधील BR-सोल्यूशन्सचा विचार केला जातो.

विभाग 2.3 मध्ये श्रेणीबद्ध विभेदक खेळांच्या समाधानाच्या गतिशील स्थिरतेच्या समस्येवर चर्चा केली आहे. श्रेणीबद्ध डिफरेंशियल गेम ГС^0,ар^м चे समाधान M(10>x0) कोणत्याही स्ट्रॅटेजीज еМ(10,х0) आणि कोणत्याही ¿еЦ0> साठी डायनॅमिकली स्टेबल असे म्हणतात.

फक्त स्थिती जाणून घ्या

जेथे _ इष्टतम रणनीती संकुचित करणे चालू आहे

मध्यांतर Г] А/((,х(ξ)) हे सध्याच्या खेळाचे एक समाधान आहे ज्यामध्ये b मधील इष्टतम प्रक्षेपकाचा बिंदू प्रारंभिक स्थिती म्हणून वापरला जातो. सोल्यूशनच्या डायनॅमिक स्थिरतेच्या या व्याख्येवरून ते गतिमान स्थिरतेचे अनुसरण करते इष्टतम रणनीतींमध्ये इष्टतम मार्गासह गेमच्या कक्षाच्या संपूर्ण कालावधीत इष्टतमता असते?

पुढे या विभागात, कार्यक्रम धोरणांच्या प्रणालीमध्ये नोहल समतोल आणि पॅरेटो-इष्टतम समाधानाची गतिशील स्थिरता सिद्ध केली आहे. येथे तपशीलवार चर्चा केली:< динамические свойства решения по Стапельбергу перархическо! даффереициальной игры двух лиц. Показано, что даже в том с. чае, когда множество оптимальных реакций игрока нижнего ур>nya मध्ये एकच रणनीती असते, Stackelbe उपाय; सर्वसाधारणपणे, ते सर्व कार्यक्रम आणि स्थितीविषयक धोरणांमध्ये गतिशीलदृष्ट्या अस्थिर असल्याचे दिसून येते. त्याच वेळी, श्रेणीबद्ध खेळ आहेत ज्यामध्ये स्टॅकलबर्ग सोल्यूशन गतिशीलपणे स्थिर आहे. परिच्छेदाच्या शेवटी दिलेल्या विशिष्ट उदाहरणाद्वारे याची पुष्टी केली जाते.

विभाग २.४ द्वि-स्तरीय नियमित करण्याच्या पद्धतीला समर्पित आहे

भिन्न खेळ. गेम सोल्यूशनची गतिशील स्थिरता सुनिश्चित करणे हे या पद्धतीचे ध्येय आहे. हे करण्यासाठी, प्रत्येक खेळाडूने वेळेच्या क्षणी अविभाज्य विजयाचा इतका भाग भरावा असा प्रस्ताव आहे की खेळ संपेपर्यंत कोणत्याही वेळेच्या अंतराने, निवडलेल्या रणनीतीपासून विचलित होणे खेळाडूला फायदेशीर ठरणार नाही. खेळाच्या सुरुवातीला. प्रोग्राम स्ट्रॅटेजीजच्या क्लासमध्ये दोन-स्तरीय गेमसाठी स्टॅकेलअर्ग सोल्यूशनची वैशिष्ट्यपूर्ण गुणधर्म खालील लेमामध्ये सारांशित केली आहेत.

लेमा 2L. M(i0,x0) हे दोन-स्तरीय गेमचे स्टॅकलबर्ग सोल्यूशन असू द्या Г प्रोग्राम स्ट्रॅटेजीजच्या वर्गावर. कोणत्याही परिस्थितीसाठी (ü,v^,...,vn)

vil, P eRsCü.Li,T)),

जेथे Rs(ñ TU) हा सध्याच्या खेळातील खालच्या स्तरावरील खेळाडूंच्या इष्टतम प्रतिक्रियांचा संच आहे I. й-lГ]~ = (ß^iyT]).,., vn lít Г]) - इष्टतम नियंत्रणे कमी करणे वेळेच्या मध्यांतरातील खेळाडूंची.

या विभागातील एक समान लेमा दोन-स्तरीय विभेदक खेळाच्या S P-सोल्यूशनसाठी तयार केला आहे.

आता आपण X?.(í) ¿0¡x0) स्टॅकलबर्ग इष्टतम ट्रॅजेक्टोरीजच्या पेन्सिलचा विचार करू या, ज्याला केंद्र il.(i) चे नियंत्रण निश्चित केले आहे. नंतर, प्रमेय 2 मध्ये दर्शविल्याप्रमाणे, स्थिती

N" °(ya,"P, vltj]) = कमाल मि

u-"eVCtSJ vt£R^ut) 0 *

जेथे vb) सध्याच्या गेममध्ये केंद्राची कार्यक्षमता आहे,

xÍb xí(¿ í„, x\ ही क्षणातील बीम विभागाची अनियंत्रित स्थिती आहे

ओ>>ओ"ओ"

समाधानाच्या गतिशील स्थिरतेसाठी nt वेळ í पुरेसा आहे. प्रमेय 3 मध्ये SP सोल्यूशनसाठी समान स्थिती स्थापित केली गेली आहे. या प्रमेयांमध्ये, प्रकार (I) ची स्थिती असे गृहीत धरते की गतिशील स्थिर समतोल स्थिती (,ü,v) च्या बाबतीत इष्टतम निम्न-स्तरीय प्रतिसाद देखील एक आहे. शिक्षा धोरण. तथापि, प्रमेय 2 मध्ये दर्शविल्याप्रमाणे, काही सार्वत्रिक शिक्षा धोरणाची संकल्पना सादर करून ही स्थिती कमकुवत केली जाऊ शकते.

आणि या खालच्या पातळीवरील धोरणासाठी आधीच अट (í) तयार केली आहे. पुढे, नियमितीकरण पद्धतीची अंमलबजावणी करण्यासाठी, असे गृहीत धरले जाते की खेळाडू i चे अविभाज्य पेऑफ a.At), जे

त्याला íe[í0,T) वेळी पैसे दिले जातात, खालीलप्रमाणे निर्धारित केले जाते:

u(t) = ¡i¿ (b) I h; C^C-c;, ü(T), ü(T)) dr, i=0,i,...,n,

जेथे p¿(í) ही तुकड्यानुसार सतत फंक्शन्स असतात जी शून्य ते एक श्रेणीत मूल्ये घेतात. शिवाय, ji-(i) फंक्शन्सची मूल्ये, सामान्यतः "" वर अवलंबून असतात. म्हणून निवडलेल्या मार्गावरून

हे आम्हाला इष्टतम नियंत्रणांच्या आकुंचनासाठी खेळाडूंच्या पेऑफ फंक्शनलची मूल्ये मोजण्याची परवानगी देते ¿¿, vLi, T3 फंक्शन Ji(-) , आणि निवडलेल्या इष्टतमशी जुळत नसलेल्या रणनीतींच्या संचासाठी. एक, नेहमीच्या मार्गाने. आम्ही इष्टतम मार्गासह पेऑफच्या पुनर्वितरणाच्या या प्रक्रियेला श्रेणीबद्ध विभेदक खेळाचे नियमितीकरण म्हणू आणि एक श्रेणीबद्ध विभेदक खेळ जो वेळेत हस्तांतरणीय पेऑफ किंवा ¿-हस्तांतरणीय पेऑफसह नियमितीकरण मान्य करतो.

चला ü(_í) v(i),äi)

प्रकल्पाला समर्थन द्या - दुवा सामायिक करा, धन्यवाद!
हेही वाचा
सर्गेई लावरोव्हची पत्नी, परराष्ट्र व्यवहार मंत्री सर्गेई लावरोव्हची पत्नी, परराष्ट्र व्यवहार मंत्री धडा-व्याख्यान क्वांटम भौतिकशास्त्राचा जन्म धडा-व्याख्यान क्वांटम भौतिकशास्त्राचा जन्म उदासीनतेची शक्ती: स्टोइकिझमचे तत्वज्ञान तुम्हाला जगण्यास आणि कार्य करण्यास कशी मदत करते तत्वज्ञानातील स्टोइक कोण आहेत उदासीनतेची शक्ती: स्टोइकिझमचे तत्वज्ञान तुम्हाला जगण्यास आणि कार्य करण्यास कशी मदत करते तत्वज्ञानातील स्टोइक कोण आहेत