international journal “information theories and applications ...international journal...

100

Upload: others

Post on 13-Sep-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING
Page 2: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

302

International Journal INFORMATION THEORIES & APPLICATIONS

Volume 20 / 2013, Number 4

Editor in chief: Krassimir Markov (Bulgaria)

Victor Gladun (Ukraine)

Adil Timofeev (Russia) Luis F. de Mingo (Spain) Aleksey Voloshin (Ukraine) Lyudmila Lyadova (Russia) Alexander Eremeev (Russia) Martin P. Mintchev (Canada) Alexander Kleshchev (Russia) Natalia Bilous (Ukraine) Alexander Palagin (Ukraine) Natalia Pankratova (Ukraine) Alfredo Milani (Italy) Nikolay Zagoruiko (Russia) Arkadij Zakrevskij (Belarus) Rumyana Kirkova (Bulgaria) Avram Eskenazi (Bulgaria) Stoyan Poryazov (Bulgaria) Boris Fedunov (Russia) Tatyana Gavrilova (Russia) Constantine Gaindric (Moldavia) Valeriya Gribova (Russia) Galina Rybina (Russia) Vasil Sgurev (Bulgaria) Hasmik Sahakyan (Armenia) Vitalii Velychko (Ukraine) Ilia Mitov (Bulgaria) Vitaliy Lozovskiy (Ukraine) Juan Castellanos (Spain) Vladimir Donchenko (Ukraine) Koen Vanhoof (Belgium) Vladimir Jotsov (Bulgaria) Krassimira B. Ivanova (Bulgaria) Vladimir Ryazanov (Russia) Levon Aslanyan (Armenia) Yevgeniy Bodyanskiy (Ukraine)

International Journal “INFORMATION THEORIES & APPLICATIONS” (IJ ITA) is official publisher of the scientific papers of the members of

the ITHEA International Scientific Society

IJ ITA welcomes scientific papers connected with any information theory or its application. IJ ITA rules for preparing the manuscripts are compulsory.

The rules for the papers for IJ ITA are given on www.ithea.org.

Responsibility for papers published in IJ ITA belongs to authors.

General Sponsor of IJ ITA is the Consortium FOI Bulgaria (www.foibg.com).

International Journal “INFORMATION THEORIES & APPLICATIONS” Vol. 20, Number 4, 2013

Edited by the Institute of Information Theories and Applications FOI ITHEA, Bulgaria, in collaboration with: Institute of Mathematics and Informatics, BAS, Bulgaria, V.M.Glushkov Institute of Cybernetics of NAS, Ukraine,

Universidad Politécnica de Madrid, Spain, Hasselt University, Belgium,

St. Petersburg Institute of Informatics, RAS, Russia, Institute for Informatics and Automation Problems, NAS of the Republic of Armenia

Printed in Bulgaria

Publisher ITHEA®

Sofia, 1000, P.O.B. 775, Bulgaria. www.ithea.org, e-mail: [email protected] Technical editor: Ina Markova

Copyright © 1993-2013 All rights reserved for the publisher and all authors. ® 1993-2013 "Information Theories and Applications" is a trademark of Krassimir Markov

ISSN 1310-0513 (printed) ISSN 1313-0463 (online) ISSN 1313-0498 (CD/DVD)

Page 3: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

303

GENERALIZATION OF DISTRIBUTING METHODS FOR FUZZY PROBLEMS

Voloshyn O., Laver V.

Abstract: We consider rationing problem as a group decision making problem. Fuzzy and crisp generalizations of the classical rationing methods are proposed. The proposed generalizations are illustrated by numerical examples.

Keywords: rationing problem, fuzzy models and methods, decision making.

ACM Classification Keywords: I. Computing Methodologies – I.6. Simulation and modeling – I.6.5. Model Development –Modeling Methodologies.

Introduction

Resource distributing problems (natural, financial resources, labor etc.) as a group decision making problem [Voloshyn, 2010] on different levels of hierarchy (individual, interpersonal, social, regional, state and interstate) became one of the most important problems nowadays. In a certain sense, all other problems are subtasks that provide input data to the different allocation problems. The importance of the issues, considered in this paper, can be illustrated by the number of Nobel Prize winners in the last few years, who got this prestigious award for researches in the fields related to the resource allocation problems: Robert Aumann, Tomas Schelling (2005), Leonid Hurwicz, Eric Maskin, Roger Myerson (2007), Alvin E. Roth, Lloyd S. Shapley (2012) [nobelprize.org, 2012]. Also, the importance of these issues can be shown by the fact that at KDS-2010 the [Voloshyn, Mashchenko] paper was acknowledged the best.

Fair allocation of joint cost (or joint surplus) is one of the central themes in cooperative games theory. In particular, the distribution of some homogeneous good between agents according to a certain profile of claims was popular problem for axiomatic analysis. This distribution model is often referenced as “the bankruptcy problem” [Moulin, 2001].

The most popular rationing methods are: uniform gains method, uniform losses method, proportional and Talmudic method [Herrero, Villar, 2001]. In this paper we consider uniform gains, uniform losses and Talmudic methods. Most of the researchers dedicated their work to the axiomatic characterization of the above-mentioned methods. For axiomatic characterization of uniform gains rule see, for example, [Moulin, 2001], [Dagan,1996], [Herrero, Villar, 2001]. The Talmudic method was introduced in [O’Neill, 1982], [Aumann, Maschler, 1985] (who argue convincingly that its intuition was present already in the ancient Talmudic literature).

Some authors proposed a dynamic approach to the allocation problem with the generalizations of the uniform gains\losses methods being considered [Marchant, 2004]. But all of the above-mentioned papers deal with crisp data. In the series of papers [Voloshyn, Laver, 2009 - 2012] the classical rationing problem [Voloshyn, 2010] and its generalizations are considered, in particular in case of fuzzy conditions [Voloshyn, Laver, 2010]. Also the applications of the proposed models and methods to the real problems are given [Laver, 2010, 2011]. Unlike the “axiomatic” approach, which is used in the cooperative games theory, in this papers the “algorithmic” approach is applied [Moulin, 1991]. According to this approach the principles of finding the solution are given and the analysis of the final solution is provided to the decision maker (DM). In this paper some generalizations of the rationing methods (algorithms) that were considered in [Voloshyn, Laver, 2010] are proposed, in particular, for the rationing models in “cooperative” form [Moulin, 1991].

Page 4: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

304

Rationing problem

Rationing problem is a triple (N,с,b), where N is a finite set of agents, the nonnegative real number c represents

the amount of resources to be divided, the vector Niibb specifies for each agent і a claim ib , and these

numbers are such that .00

Niii bcN:i,b (1)

A solution to the rationing problem is a vector Niixx , specifying a share ix for each agent i, such that

.:,0 Ni

iii cxNibx (2)

There are different ways of interpreting the rationing problem. One of the oldest interpretations is the inheritance problem (here c is the liquidation value of the bankrupt firm; bi is the debt owed to creditor i [Aumann, Maschler, 1985]). Other important examples include taxation and cost sharing of the indivisible public good.

Rationing occurs in markets where the price of a commodity is fixed (for instance, at zero): c is the available

supply and ib is agent i’s demand. Medical triage is an example: c measures the available medical resources

and ib is the quantity needed by agent i for full treatment.

Often the resources to be divided come in indivisible units: organs for transplants, seats in crowded airplanes or in popular sports events, visas to potential immigrants as well as cars allocated by General Motors to its car

dealers. In this case ib and c are integers (e.g. in the case of visas or organs ib can only be 0 or 1) [Moulin,

2001].

Without reducing the generality, let us consider the rationing problem as a cost sharing problem. Thus, c is

interpreted as the production cost of an indivisible public good, ib are interpreted as initial amount of money of

agent i. Both c and ib are non-negative real numbers.

Uniform gains and uniform losses

There are three main principles of cost allocation [Волошин, Мащенко, 2010]:

Equalizing the gains: ,/ ncbbxNi

iii

Ni ;

Equalizing the losses : Nin

cxi , ;

Proportional principle.

In case if the constraint (2) is violated some agent can be forced to pay more than its initial money amount. In this case the agent can refuse to cooperate. When equalizing the losses, it is possible that one agent (or more agents) will be subsidized by others. In this case, all the other agents may refuse to cooperate and the coalition falls apart. If the constraints (2) are satisfied, the principle equalization of gains principle is generalized as uniform gains method and, respectively, equalization of losses is generalized as uniform losses method [Voloshin, Mashchenko, 2010].

Fuzzy generalization of uniform gains and uniform losses methods

Let us consider a rationing problem (N,c,b), where N is a set of agents, |N|=n, c is the value of the costs to be

distributed, vector nbbbb ,...,, 21 is the vector of initial money amounts.

Page 5: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

305

Uniform losses method is defined as iii bbcNulx ,min),,( , where is the solution of

cbNi

i

,min .

Suppose that there are agents whose shares are equal to their money amounts. Let us denote this set of agents as N1. Also, let us assume that there are agents, who agree to pay more than their shares, so the “poor” agents can pay less than their money amount.

Let denote Nixi ,ˆ the share, which uniform losses method assigns to the agent i. We can set the threshold

values: i – how many percents of his share agent i could pay without complaints 1Ni ; j – how many

percents of his share agent j ( 12 \ NNNj ) could overpay to cover the “deficit”. In general, these values are

determined by the initial money amounts of the agents (“progressive taxation”).

Denote ix - maximal amount of money, that agent i 1Ni can pay without complaints, iii bx 1 . The

final share of agent i will belong to the interval ],ˆ[ ii xx . Denote iii xx ˆ the occurring “deficit”. Total deficit

we denote as 1Ni

i . This deficit is covered by agents from the subset 2N .

Consider the set 2N . Denote jx the share of agent j, where 2Nj ; jx - maximal amount of money, which

agent j can pay to cover the deficit, jjj xx 1ˆ . The inequality 2

ˆNj

jj xx has to be satisfied. If it’s

not so, we have to change αі, βj.

Similarly for the uniform gains method. It is defined as iii xbcNugx ),,( , where is the solution of

cxNi

i

(where 0,max zz ).

Denote N1 the set of agent, for which the share equals zero. Maybe for the other agents it is acceptable to subsidize the agents from the subset N1 (for example they may want to prevent the breaking up of the grand

coalition). In this case αi denotes how many percents of his share agent i is subsidized ( 1Ni ), βj – how many

percents of his share agent j ( 12 \ NNNj ) can overpay to subsidize the “poor” agents.

Denote ix the value of subsidy for the agent i, where 1Ni , iii bx ˆ . Then 1

ˆNi

ix is the total amount of

the subsidies, which has to be covered by agents from the subset 12 \ NNN .

Denote jj bx ˆ the share of agent j where 2Nj ; jx - the maximal amount of money the agent j can pay,

jjj bx 1 . The inequality cxNj

j 2

has to be satisfied. If it is not so, we have to change the

threshold values.

For the case of the uniform losses method the cost sharing algorithm is the following:

1. We set the shares of the agents 1Nii as ii xx .

2. Set the shares of the agents 2Njj as jjj xxx ˆ , where jx is the share of the deficit Δ, and

it can be computed using any method (for example uniform gains or uniform losses).

3. If the result is acceptable, the process stops. If not – we correct the thresholds and return to the step 1.

Algorithm for the uniform gains method is similar:

1. Set the shares for the agents 1Nii as ii xx ˆ .

Page 6: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

306

2. Set the shares for the agents 2Njj as jjj xxx ˆ , where jx share of the deficit Δ, and it

can be computed using any method (for example uniform gains or uniform losses).

3. If the result is acceptable, the process stops. If not – we correct the thresholds and return to the step 1.

So we can consider four ways of sharing: UG+UG (we compute both – the initial shares and the shares of the deficit by the uniform gains method), UG+UL (the initial shares are computed using uniform gains method, the shares of the deficit are computed using the uniform losses method), UL+UG (the initial shares are computed using uniform losses method, the shares of the deficit are computed using the uniform gains method), UL+UL (the initial shares and the shares of the deficit are computed by the uniform losses method). Selection of the specific cost allocation mechanism is left for the decision maker.

Fuzzy generalizations of the uniform gains and the uniform losses methods

Let us consider the rationing problem using some results of fuzzy sets theory [Zgurovskyj, Zajchenko , 2011].

Assume that we consider the case of uniform losses and the share of agent 1Nii is a fuzzy number with the

following membership function:

.,0

;ˆ,ˆ

ˆ;0,1

caseotherin

xxxxx

xxxx

x iii

ii

ii

ii

ii

So ii x are right sided trapezoidal fuzzy numbers.

Similarly for agents jNjj we have:

.,0

;ˆ,ˆ

;ˆ0,1

caseotherin

xxxxx

xxxx

x jjj

jj

jj

jj

jj

Denote

.,0

;,1,

cx

cxcx

Nii

Nii

We can consider cx, as membership function of the fuzzy goal and Nkxkk as the membership

function of the fuzzy constraints. Then, according to the Bellman-Zadeh approach, the decision’s membership function will be

cxxxxx iiinD ,;min,...,, 21

We consider nxxxx ,...,, 21 , on which the function )(xD reaches its maximum, as the crisp solution of the

fuzzy rationing problem.

Thus, the process of finding the optimal share is reduced to the following linear programming problem:

Page 7: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

307

.,0,10

,

,,

max,

Nkx

cx

Nkx

k

Nii

kk

If the obtained solution does not satisfy the decision maker, we need to change the threshold values.

For the uniform gains method we have to find the subsidy values first. Then we have to share Δ+с among the

agents from the subset N2 (taking in count the following inequality: cxNj

j 2

). As a result we obtain the

following problem:

.,0,10,

,,

max,

22

2

Njxcx

Njx

jNj

i

jj

Solution of this problem is vector nxxx ,...,, 21 an agents’ “level of satisfaction” λ. If this value does not satisfy

the decision maker, we have to set new threshold values and find new shares.

The case of fuzzy costs

Let the costs is a triangular fuzzy number: cccc ,ˆ, . In this case we need to consider two problems – the

problem in optimistic case ( ccc ˆ, ) and the problem іn pessimistic case ( ccc ,ˆ ) [Zgurovskyj, Zajchenko,

2011].

In the optimistic case the fuzzy uniform losses method will be reduced to a following linear programming problem:

.ˆ,,,0,10

,,)(

,,

max,

cccNkx

cxc

Nkx

k

Niic

kk

)(cc – the fuzzy costs membership function, the agents’ membership functions are computed considering that

the uniform losses method is applied for c .

For the pessimistic case we must recomputed the agents’ shares for c . The problem in this case will have similar

look:

,,

max,

Nkxkk

,,)( cxcNi

ic

cccNkxk ,ˆ,,0,10

kk x - new membership functions of the agents.

When the both problems are solved, we compare in both cases. The solution of the problem will be the share

with maximal . In the case when is equal in both cases, the choice of the solution is left to the decision

maker.

Page 8: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

308

Numerical example

Consider n=5 agents. We have to share among them с=30 units of cost. Initial money amounts are, respectively, 4, 12, 20, 24, 30 [Волошин, Мащенко, 2010]. Let α=25%, β=20%.

For the case of crisp generalizations of uniform losses and uniform gains method we have the following shares: Number of the agent 1 2 3 4 5 с Money amount 4 12 20 24 30 UL 4 6,5 6,5 6,5 6,5 30 UL+UL 3 6,75 6,75 6,75 6,75 30 UL+UG 3 6,5 6,5 6,5 7,5 30 UG 0 0 16/3 28/3 46/3 30 UG+UL -1 -3 20/3 32/3 50/3 30 UG+UG -1 -3 16/3 28/3 58/3 30

For fuzzy generalizations (in particular, for the fuzzy с=(29,30,31)) we obtain: Number of the agent 1 2 3 4 5 с λ Money amount 4 12 20 24 30 UL 4 6,5 6,5 6,5 6,5 30 Fuzzy UL 98/31 208/31 208/31 208/31 208/31 30 26/31 FUL+fuzzy c 113/36 481/72 481/72 481/72 481/72 1075/36 31/36 UL 0 0 16/3 28/3 46/3 30 Fuzzy UL -1 -3 272/45 476/45 782/45 30 1/3 FUL+fuzzy c -1 -3 578/93 986/93 1598/93 30 16/31

For the both methods the higher levels of λ are obtained when the cost, that has to be allocated, is a fuzzy number. The intuitive explanation is that the higher level of fuzziness allows agent to deviate more from his share, so he can choose the share which is the most comfortable for him.

Fuzzy generalization of the Talmudic method

When reducing the rationing problem to a cooperative game and using the egalitarian principle (which coincides with nucleolus of the cooperative game [Voloshyn, 2010]) we have to use uniform gains or uniform losses method, according to the following theorem [Aumann, Maschler, 1985]:

Theorem. Nucleolus corresponds to the following shares, depending on c:

1. .,1,2

,min2

,min:2

111

nib

xcb

bc ii

n

i

in

ii

2. .,1,2

,min2

,min:2

1111

nib

bxcbb

bc iii

n

ii

n

i

in

ii

The shares, chosen by Talmudic method coincide with the nucleolus of the cooperative game.

So there are two extreme cases – when the shares are computed using uniform losses (when

n

iibc

12

1) or

uniform gains method (when

n

iibc

12

1) for the following initial money amounts vector:

nbbbb

2

1,...,

2

1,

2

1

2

121 .

Between these extreme cases there are many compromise allocations.

Page 9: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

309

Let us consider fuzzy generalizations of the Talmudic method. We can break the set of agents in two subsets - N1 and N2. In the first subset we include the agents, who want to pay less than their share; in the second group we include the agents, who can pay more than their shares, to cover the deficit.

Consider the agents of the first group. Denote ix the desired share, ix - the share obtained using the Talmudic

method. The shares will be right sided trapezoidal fuzzy numbers )ˆ,( ii xx . For the second group we denote as

ix the corresponding nucleolus value, ix – the maximal value that agent agrees to pay. Then the shares are

trapezoidal fuzzy numbers ),ˆ( ii xx . Thus, to find the shares we have to solve the linear programming problem:

.,0,10

,

,,,,

max,

21

Nix

cx

NjxNkx

i

Nii

jjkk

The task of finding the optimal solutions can be solved in several stages: if the λ is not satisfying the decision maker, we can change the fuzzy numbers that correspond to the agents’ shares making them narrower. The process continues till we obtain the optimal λ. Note that if λ=1 the shares will coincide with the shares given by the Talmudic method. Let us consider a numerical example. There are three agents with initial money amounts 100, 200, 300. We have to distribute 100 units of cost. Talmudic method gives each agent a share that is

equal 3133 . Consider the extreme cases (uniform losses and uniform gains for b

2

1):

Money amounts 100 200 300

UL( 21 ) 3

133 3133 3

133

UG( 21 ) 0 25 75

TM 3133 3

133 3133

As

n

iibc

12

1, the shares given by Talmudic method TM coincide with UL( 2

1 ).

For the first and the second agent UG( 21 ) is less than TM. Thus, they would rather pay UG( 2

1 ). We include them

in the first subset - N1. In the second subset (N2) we include only one agent – agent 3, because for him UG( 21 ) is

more than TM. Assume that this is the maximal share, he is willing to pay.

The shares will be right sided trapezoidal fuzzy numbers (0, 3133 ), (25, 3

133 ), ( 3133 , 75).

Solving the above-mentioned linear programming problem with this data, we obtain a solution - (14.79; 26.93; 58.28) and λ=0.528. Assume that the result does not satisfy the decision maker. We make the next iteration with

fuzzy shares (14.79; 3

133 ), (26.93; 3133 ), ( 3

133 ; 58.28). The solution is (24.06; 30.14; 45.8) and λ=0.5. We

continue the process, till the obtained result satisfies the decision maker.

Conclusion

Fuzzy models and methods of rationing allow us to take in count the fuzziness of input data, typical for real processes (see in particular [Laver, 2010; Laver, Malyar, 2011]). These methods give us results different from their crisp analogs, although very close to them. Ultimately, the choice of the rationing method is left to the decision maker.

Page 10: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

310

Acknowledgements

The paper is published with financial support by the project ITHEA XXI of the Institute of Information Theories and Applications FOI ITHEA Bulgaria www.ithea.org, and the Association of Developers and Users of Intelligent Systems ADUIS Ukraine www.aduis.com.ua.

Bibliography

[Aumann, Maschler, 1985] Aumann, R. and M. Maschler, “Game theoretic analysis of a bankruptcy problem from the Talmud,” Journal of Economic Theory, 36: 195-213, 1985.

[Dagan, 1996] Dagan N. New characterizations of old bankruptcy rules // Social Choice and Welfare,13: 51-59, 1996. [Herrero, Villar, 2001] Herrero C. and A.Villar The three musketeers: four classical solutions to bankruptcy problems //

Mathematical Social Sciences, Volume 42, issue 3 (November, 2001), p. 307-328, 2001. [Laver, 2010] Laver V.O. Fuzzy models of cost allocation in public good production. - East: Analytical and Informational

Journal. – 2010. – № 7. – P.60-63. (In Ukrainian) [Laver, Malyar, 2011] Laver V.O., Malyar М.М. Cost sharing model in private goods production – Scientific bulletin of

Uzhgorod National University, Serie: Economics, is. 2 (34), 2011. (In Ukrainian) [Marchant, 2004] Marchant, T. Rationing: dynamic considerations, equivalent sacrifice and links between the two approaches

// Working Paper, Ghent University, May, 2004. [Moulin, 1991] Moulin H. Cooperative decision making.-М: Mir, 1991.-464с. (In Russian) [Moulin, 2001] Moulin, Herve. Axiomatic Cost and Surplus Sharing, - Working Papers 2001-06, Rice University, Department

of Economics, 2001.

[nobelprize.org, 2012] http://www.nobelprize.org/nobel_prizes/economics/laureates/ [O’Neill, 1982] O'Neill, B. A problem of rights arbitration from the Talmud,” Mathematical Social Sciences, 2: 345-371, 1982. [Voloshin, Laver, 2009] Voloshin O., Laver V. Collective Product Cost Sharing in Conditions of Managed Economy//

International Book Series “Information Science and Computing”, 2009. – V. 3/2009, N15. – P. 200-205. [Voloshyn, 2010] Voloshyn O.F. and Maschenko S.O. Models and methods of decision making. – K. VTC “Kyivskyj

Universytet”, 2010.- P. 336. (In Ukrainian) [Voloshyn, Laver 2010] Voloshyn O., Laver V. Fuzzy generalizations of the rationing problem // Information Models of

Knowledge, ITHEA, Kiev-Sofia, 2010.-P.215-219. (In Russian) [Voloshyn, Laver 2012] Voloshyn O., Laver V. Generalization of distributing principles for fuzzy conditions // Problems of

Computer Intellectualization, ITHEA, Kiev-Sofia, 2012.-P.219-226. (In Russian) [Voloshyn, Laver, 2009] Voloshyn O.F. and Laver V.O. Cost sharing in public good production under the conditions of

managed economy – Scientific bulletin of Chernivtsi University, is. 493, Economics. (In Ukrainian) [Zgurovskyj, Zajchenko 2011] Zgurovskyj M.Z., Zajchenko Ju.P. Models and methods of decision making under fuzzy

conditions.– К.: Naukova dumka, 2001. – 275 с.

Authors’ Information

Oleksii Voloshyn – Professor, Taras Shevchenko National University, faculty of cybernetics. Kyiv, Ukraine, 01017 Vladimirskaja str. 64; e-mail: [email protected] Major fields of scientific research: decision making, decision support systems, mathematical economics, expert systems, fuzzy analysis , e-learning

Vasyl’ Laver – Assistant, Uzhgorod National University, mathematical faculty, Uzhgorod, Ukraine 88000, Universitetska str. 14, e-mail: [email protected] Major fields of scientific research: decision making, decision support systems, mathematical economics, expert systems, e-learning, fuzzy models and methods

Page 11: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

311

VECTORS AND MATRIXES LEAST SQUARES METHOD: FOUNDATION AND APPLICATION EXAMPLES

Vladimir S. Donchenko, Inna M. Nazaraga, Olga V. Tarasova

Abstract: In this paper the application of the least squares method (LSM) has been substantiated. Case of matrix of observations for the arguments and values of the renewable function of the linear relationship between the components of observation has been considered. The solution of matrix optimization problem for the evaluation of the least squares method explicitly has been submitted, pseudo inverse means have been used. The importance of the results on applied problems of prediction media and macroeconomic indicators was illustrated.

Keywords: Moore-Penrose pseudo inverse, regression, least squares method, macroeconomic indicators, media indicators, prediction.

ACM Classification Keywords: G.3 Probability and statistics, G.1.6. Numerical analysis: Optimization, H.1.m.

Models and Principles: miscellaneous.

Introduction

The Least Squares Method (LSM) is reliable and prevalent means to solve prediction problems in applied research and in econometrics particularly. It is used in the case when the function is represented by its

observations 1( , ), ,i ix y i N . Commonly used statistical form of LSM is called Regression Analysis (RA). It is

necessary to say, that RA is only statistical shape for representing the link between the components

Niyx ii ,1,, in observations 1( , ), ,i ix y i N . So using RA terminology of LSM for solution of function

estimating problem, and correspondingly, - prediction problem, is only the form for problem discussing.

It is opportune to note, that the LSM is equivalent to Maximum Likelihood Method for classic normal regression. Linear regression (LA) within RA has the advantage of having a closed form solution of parameter estimation problem and prediction problem.

Real valued functions of vector argument are the object of investigation in RA in general and in LA in particular. Such suppositions are due to technical capabilities of technique for solving optimization problems in LSM. This technique is in the essence an investigation of extremum necessary conditions. This remark is entirely true for yet another widely used assumption, namely, full column rank assumption for appropriate matrix, which ensure uniqueness of parameter estimation. It’s interesting that another technique: Moore –Penrose pseudo inverse (M-Ppi) ([Moore, 1920; Penrose, 1955]) provides a comprehensive study and solution of parameter estimation problem.

Below in the article the results developing M-Ppi technique are presented. These ones enable operation with matrices as with real valued vectors and in optimization problem of LSM. And, as the consequence, the results enable designing of LSM for observations with matrix components. It is interesting to note, that such results would require the development of a full arsenal M-Ppi conception for objects in matrix Euclidean spaces. But in the case under consideration manage to use M-Ppi results for Euclidean spaces of real valued vectors to solve the

Page 12: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

312

problem of LSM estimation for matrixes observations. Correspondent results are also represented below as well as illustration of its applications for predicting in macroeconomics of Ukraine and in estimating of TV audience performance.

And the remark in conclusion. Obvious advantage of matrixes LSM, besides the explicit closed estimation form, is the fact that matrixes observations preserve relationships between the characteristics of phenomenon under consideration.

Theoretical foundation: the least squares method

The LSM in its classic version – this is a way to "restore" the numeric functions ( , ), ,y f x x from

parametric function family, when this function is represented by this or that collection observations 1 ( , ), ,x y x y R . «Restored function» ˆ ˆˆ ( , ) ( , )y f x f x is defined by choosing appropriate ˆ

(estimation of parameter). The value of parameter and restored function ˆˆ ( , )y f x l call by its estimation

correspondingly.

In the version of the discrete set of observations, a collection of observations (sample) is discrete: 1 1 ( , ) : , , ,i i i ix y x y R i N and parameter is real valued vector: 0 2 1 : ( , ,..., )p T

pR .

"Recovery" can be understood in different ways:

establish the true value of the function when the model observations is 0 01 ( , ), , ,i iy f x i N ;

approximation of the observed values 1 1 ( , ) : , , ,i i i ix y x y R i N by a function from appropriate

parametric family: by the choice of appropriate parameters ˆ . Such choice has to be done in such

a way that the function ˆ( , )y f x were the "best" to conform with the observation 1( , ), ,i ix y i N .

Two previous versions can be combined in a model of observations, which can be described as a model of observations with errors:

0 01 ( , ) , , ,i i iy f x i N , 1 , ,i i n interpreted as errors of observations.

Last model of observations in the version, when 1 , ,i i N - are the values of independent random variables is

the subject of statistical theory, called regression analysis.

Problem "restoration of function" within the first model of observations can be reduced to the solution of simultaneous equations

1 ( , ), ,i iy f x i N (1)

In the rest two cases the approximation criteria ( ) are to be determined.

In the method of least squares such criterion is determined by the formula:

2

1

( ) ( ( , ))N

i ii

y f x , (2)

Correspondingly, ˆ defined as a solution of the optimization problem of LSM:

2

1

min ( ) min ( ( , ))n

i ii

Arg Arg y f x (3)

Page 13: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

313

2

1

ˆ min ( ) min ( ( , ))n

i ii

Arg Arg y f x .

It is easily to check, that the 0 in the first model (the system of equations (1)) belongs to the set of

optimization solutions:

20

1

min ( ) min ( ( , ))N

i ii

Arg Arg y f x .

Thus, the recovery function problem for the function presented by its observations in both of the forms discussed earlier is reduced to solving an optimization problem (3).

Thus, in all cases of the recovery (estimation) problem for the function, presented by its

observations 1( , ), ,i ix y i N , through parameter estimation : ˆ ˆ( , ) ( , )f x f x , can be described as a

solution of the optimization problem from (3) and called LSM estimation for parameter or function correspondingly:

The widespread use of LSM in solving of restoration problem for the function, presented by its observations, is determined by its very attractive feature. It is closed form solution for the parameter estimation problem. For a family of functions

1

0

( , ) ( )p

j jj

f x f x , 0 2 1 ( , ,..., )Tp ,

0 1 ( ), ,jf x j p - known function of vector argument x

Under additional assumption rank X=p.

Closed formed solution in LR for optimization problem (3) \ is determined by formula

1 ˆ ( ) ,T TX X X Y (4)

where Х – matrix determined by relation

1 1 1 ( ) , , , ,j iX f x i N j p ,

Y - vector of observed values of the function: 1 ( ,...., )TNY y y .

Constraint rank X=p.is ttechnical, determined only by the solution method for the optimization problem (3) and ensure uniqueness Gauss- Markov equation of the extremum necessary conditions for the functional in (2).

Functional ( ) of LSM for LR turns to the form

2 || ||Y X .

Correspondingly, and the optimization problem (3) turns to form of 2

min ( ) min || ||Arg Arg Y X

. (5)

Optimization problem (5) is essential element of pseudo inverse definition X of a matrix X by Penrose

[Penrose, 1955] (M-Ppi). By this definition pseudo inverse X for 0Y is determined as norm minimal solution

of optimization problem (5):

2ˆ min|| ||ˆarg min || ||

Arg Y XX Y

.

This definition is only one from more than ten or more equivalent definitions of M-Ppi.

Page 14: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

314

M-Ppi technique enables comprehensive solution of optimization problem (3) in form (5) (see, for example [Кириченко, Донченко, 2005]):

2

min || || ( ) : ( ) ,p p

p pArg Y X X Y E XX R X Y E XX R ,

with M-Ppi X for matrix X .

For classical conditions: under condition rankX p matrix TX X invertible

1 ( )T TX X X X , 0 p pXX E E XX ,

and

2 1

min || || ( ) ( )p T T

pArg Y X X Y E XX R X Y X X X Y

Preferential use estimates from (4) and the equation of Gauss - Markov is quite restrictive in applying LSM, while advanced M-Ppi technique, as it mentioned above, enables comprehensive solution of an optimization problem (5). Such preferences of LSM users seems to be the results of habit and the fact of clarity of the source of Gauss - Markov equation as well as the fact, that M-Ppi technique require additional efforts for its mastering and applying.

Actually, directly Penrose [Penrose, 1955] pseudo inverse matrix A tо m n matrix А defined as

n m - matrix, which specifies a linear operator : m nA R R , whose action for arbitrary 0 ,my R y is

defined by

2

2

min|| ||

min || ||nz R

x Arg Az y

A y arg x . (6)

So, by this definition, A y associated with SLAE (system of linear algebraic equations) Ax y and defined as

smallest norm solution of the optimization problem of best quadratic approximation of the right side of SLAE values of the left side:

2

min || || , ,

n

m n m

x R

Arg y Ax A R y R . (7)

The set of all solutions of the optimization problem (7) (see, for example, [Кириченко, Донченко, 2005]) is determined by relation

2

min || || ( ) : ( ) ,

n

n nn n

x R

Arg y Ax A y E A A R x x A y E A A v v R . (8)

M-Ppi efficiency owes singular valued decomposition (SVD) in its special tensor product form (will be denoted as SVDtp) (see, for example, [Донченко, 2011]): any m n matrix A is represented by singularities of two matrixes

,T TA A AA : by orthonormal collections of eigenvectors 1 1 , , , , ,n mi iv R i r u R i r of ,T TA A AA

correspondingly and common collection of correspondent nonzero eigenvalues 2 21 ... 0,r r rankA :

1

,r

Ti i i

i

A u v

1

, , ,T

i ii i

i i

Av A uu u i r .

For another definitions of SVD see, for example, [Алберт, 1977].

Page 15: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

315

M-Ppi definition by SVDtp among more than a dozen other equivalent, is represented by equality:

1

1

r

Ti i i

i

A u v

M-Ppi is even more than just a tool for working with only vector objects. It provides a means for the manipulating with matrixes. Particularly, M-Ppi technique for real valued vectors enable comprehensive solution of optimization problem type of (3) in form (5) for matrix objects:

2

min || || , ,

n p

m p m ntr

X R

Arg Y AX Y R A R , (9)

where the trace norm || ||tr generated by trace scalar product:

,

( , ) T Ttr ij ij

i j

C D c d trC D sum of the diagonal elements of the matrix C D

Full solution of the optimization problem (9) is given by the theorem 1 below (see, for example, [Донченко, 2011]).

Theorem 1. For any m n matrix A

2

min || || ( ) : ( ) ,

n p

n n n ntr n n

X R

Arg Y AX X Y E A A R Z Z X Y E A A V V R . (10)

As in the vector case, the solutions of matrix optimization problem (10) coincide with the set of all solutions of matrix algebraic equations relatively X:

, , ,AX Y A m n Y m p X n p ,

when such solutions exist.

Optimization problems and its solutions (8), (10) for, correspondingly, vector and matrix objects, namely, the problem of the best quadratic approximation of the right part of linear equation by the left one, constitute the basis for the least squares method for vector and matrix of observations. “Vectors” or “matrixes” case for observations (x,y) means, that both its components:, x, y - are simultaneously the vectors or the matrixes correspondingly under supposition that relation between them determined by the components a m n matrix A.

Theorem 2. Let the collection of vector pairs 1 ( , ) : , , ,n mi i i ix y x R y R i N or matrix pairs

1 ( , ) : , , ,n p m pi i i iX Y X R Y R i N are an observations of linear operator, defined by m n -

matrix : n p m pA R R .

Then the set of LSM estimation of the operator A, is determined by the set of optimization problem solutions

min ( )

m nA R

Arg A

with

2

1

2

1

( , ) ,

( )

( , ) , ma

N

i i i ii

N

i i i i tri

y Ax y Ax vector observations

A

Y AX Y AX trix observations

is equivalent to optimization problem of the best quadratic approximation of the right hand part of algebraic

equation T T TX A Y by it left hand part respectively matrix TA with matrices ,X Y defined by the

components of the observations accordingly to the relations:

Page 16: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

316

1

1

( ... )

( ... )N

N

x x vector observationX

X X matrix observation

, (11)

1

1

( ... )

( ... )N

N

y y vector observationY

Y Y matrix observation

. (12)

Proof. Indeed, It is easy to verify, that simultaneous equations: vectors 1 , ,i iy Ax i N or matrixes

1 , ,i iY AX i N , - in the observations model, are equivalent to matrix equations correspondingly:

1 1 1 ( ... ) ( ... ) ( ... )N N Ny y Ax Ax A x x ,

1 1 1 ( ... ) ( ... ) ( ... )N N NY Y AX Ax A X X ,

which follows from the definition of matrix algebra operations

Thus, in the notation (11), (12) observation models for both types of observations are represented by matrix equation AX Y with known matrixes X,Y and unknown matrix A.

Besides 2

min ( ) min || ||

m n m ntr

A R A R

Arg A Arg AX Y

So, equivalently 2 2

min ( ) min || || min || ||

m n m n T n m

T T Ttr tr

A R A R A R

Arg A Arg AX Y Arg Y X A , (13)

which proves the theorem.

Theorem 2. The set of all solutions for LSM - estimation of the linear operator by its vectors or matrixes observations is given by the relation:

min ( ), ( ) : ( ),

m n

m nn

A R

Arg A A A YX V E XX V R , (14)

Proof. The proof follows directly from theorem 1, relation (10), that describes the solution of matrix algebraic equations through obvious changes in notation and subsequent transposition using commutative property for M-Ppi for matrix and its transpose.

General algorithm of LSM with matrix observations

LSM wit matrixes observation for prediction is implemented in the usual way: by estimation of the function (operator) and using of the estimation on the appropriate argument. Observations, necessary for the estimation procedure to be applied, should be constructed on the basis of a data available. It is the first step of the algorithm proposed.

Step 1. Constructing the matrices components of observations. This step is performed on the based on

statistical data by its aggregating firstly in vector and then - in matrixes 1 2, ,..., kR R R . Such two – step

procedure uses natural elements of phenomenon description. Vector constituents as a rule are a collection of that or those characteristics of phenomenon under consideration which corresponds to fix moments of time. These vectors constituents which correspond some “time window” are aggregated in matrix. Then the “time window” is shifted and new matrix is built, and so on.

Step 2. Constructing the observations. The matrixes 1 2, ,..., kR R R being built the observation pairs ( , )j jX Y

are built by consequence elements of 1 2, ,..., kR R R : 1 1 1 ( , ) ( , ), ,j j j jX Y R R j k .

Page 17: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

317

Figure 1. Aggregated matrixes and observations

Step 3. Parametrization of the model. The relationship between matrixes elements of observations is established by matrix equation Y AX with matrix A as a parameter.

Step 4. LSM – estimation. The essence of this step is constructing the LSM-estimation accordingly to (14) by choosing the one with minimal norm:

A YX , (15)

Step 5. Constructing the prediction formula. Prediction problem solution, based on the estimated operator

A is standard: for any appropriate matrix argument X* predicted Y* is defined by relation * *ˆY AX .

Step 6. Calculations and the accuracy of prediction. The accuracy of prediction in economic research, as a rule, is estimated by formal criterion of accuracy called “absolute percentage error (APE)”, defined by the relation

1

ˆ

, ,t t

t

z zAPE t T

z, where tz - the actual value of the index at the time t , ˆ

tz - prognostic value of the

index at the time t .

It is generally accepted that the value of APE which is less than 10%, corresponds to high prediction accuracy, so, values from 10 to 20% is interpreted as good prediction accuracy, values from 20 to 50% are considerd to be satisfactory, more than 50% - unsatisfactory prediction accuracy.

Example 1: prediction economic indicators

In this example, the statistical data of the State Statistics Service of Ukraine was used [Ukrstat].

As described in [Хаpазiшвiлi, 2007], the regression methods most often used to predict of economic indicators in the normal way. In this example, the theory of matrixes LSM (Sections 1) was used.

In particular, Table 1 - 3 presents the value of gross domestic product (GDP), wages of employees (WE), final consumption expenditure (FCE), exports of goods and services (Е) and imports of goods and services (І) for the

2007 - 2012 years (quarterly and annual data at current prices).

Table 1. The value of 5 indicators for 2007 - 2008 years (at current prices; mln.UAH)

1 quarter

2007

2 quarter

2007

3 quarter

2007

4 quarter

2007

Total

2007

1quarter

2008

2 quarter

2008

3 quarter

2008

4 quarter

2008

Total

2008

GDP 139444 166869 199535 214883 720731 191459 236033 276451 244113 948056

WE 69078 82021 91922 108915 351936 100492 116441 121522 132009 470464

X1 Y1

X*

R1 R2 R3

X2 Y2

Page 18: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

318

FCE 112494 130245 140935 174907 558581 161565 182154 194262 220921 758902

Е 67513 79664 88491 87537 323205 88516 116640 132177 107526 444859

І -76022 -85992 -93895 -108464 -364373 -110802 -135800 -144433 -129553 -520588

Table 2. The value of 5 indicators for 2009 - 2010 years (at current prices; mln.UAH)

1 quarter

2009

2 quarter

2009

3 quarter

2009

4 quarter

2009

Total

2009

1 quarter

2010

2 quarter

2010

3 quarter

2010

4 quarter

2010

Total

2010

GDP 189028 214103 250306 259908 913345 217286 256754 301251 307278 1082569

WE 99206 111616 114251 126270 451343 114062 133690 139108 153791 540651

FCE 172426 188041 196074 216285 772826 194511 216027 232397 271295 914230

Е 86994 95390 114962 126218 423564 112105 134553 145563 157144 549365

І -92892 -96846 -116057 -133065 -438860 -114550 -131242 -156102 -179050 -580944

Table 3. The value of 5 indicators for 2011 - 2012 years (at current prices; mln.UAH)

1 quarter

2011

2 quarter

2011

3 quarter

2011

4 quarter

2011

Total

2011

1 quarter

2012

2 quarter

2012

3 quarter

2012

4 quarter

2012

Total

2012

GDP 261878 314620 376019 364083 1316600 296 970 351 777 392 080 378564 1408889

WE 135831 155367 158186 178727 628111 158094 179159 179228 199638 718159

FCE 236580 268688 285548 314385 1105201 274401 311112 328 868 356607 1269601

Е 156545 179626 184258 187524 707953 165458 181021 185597 181657 717347

І -173046 -187916 -202131 -215935 -779028 -180013 -212142 -215571 -219616 -835394

The use of the algorithm

1. Based on table 1 obvious way form a matrix of observations 1R , based on table 2 – matrix 2R , based on

table 3 – matrix 3R .

2. Pair of input output matrix data 1 1( , )X Y will have the form 1 2( , )R R .

3. Мatrix 1A (see (15)), obtained from the equation 1 1 1 :Y A X

1

0 0 0 0

0 0 0 0 0

0 0 0 0

0 0 0 0 0 0

0 0 0 0 0

,472791 4,27 925 ,44387 2,83749 4,41 361

,53 49 3,94 514 ,71641 2,13 856 2,325999ˆ ,79734 5,886174 ,49137 3,7 521 4,549 89

, 71931 ,956233 ,215418 ,572184 ,742387

,34424 2, 97631 1,975 2 ,54289 ,958

A

84

4. From the equation * *ˆY AX calculate matrix predictive indicators *Y , 2*X X .

0 00 0 0 0 0

0 0 0 0

0 0 0

273694, 338 5,3 333617,9 337446,1 1282763,3 316432,6 39945 ,3 35796 ,9 3379 6,6 141175 ,4

136422,5 169529,1 151972,4 164184,7 6221 8,7 167281,7 217282,3 168935,4 167 3 ,4 72 529,8

248255,2 3 6758,3 27458 ,8 292 74,4 112166 0

0 0 00 0 0

0 0 0 00

8,7 296834,3 377567,3 293639,5 294664,7 12627 5,8

126419,3 145322,3 149113,3 159464,7 58 319,6 1457 4,8 1724 , 172152, 184595,4 674852,2

155678,3 169885,3 184891,2 1927 5,1 7 3159,9 17 727,7 181818,3 2 242,7 232 0

626, 785414,8

Page 19: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

319

5. For matrices predictive indicators *Y and actual indicators 2011 - 2012 years 2Y calculate the matrix APE:

0 0

0

0 0

0 0

4,51% 7,43% 11,28% 7,32% , % 6,55% 13,55% 8,7 % 1 ,74% , %

,44% 9,12% 3,93% 8,14% , % 5,81% 21,28% 5,74% 16,33% , %

4,93% 14,17% 3,84% 7,1 % , % 8,18% 21,36% 1 ,71% 17,37% , %

19,24% 19,1 % 19, 7% 14,96% , % 11,94% 4,76%

2 57 0 20

0 96 0 33

1 49 0 54

18 03

0 0 0 0

7,24% 1,62% , %

1 , 4% 9,6 % 8,53% 1 ,76% , % 5,16% 14,29% 7,11% 5,92% , %

5 92

9 74 5 98

In accordance with the submitted values matrix APE, error prediction GDP in 2011 (as a whole) was 2,57%, WE - 0,96%, FCE - 1,49%, Е - 18,03%, І - 9,74%, error prediction GDP in 2012 (as a whole) was 0,20%, WE - 0,33%, FCE - 0,54%, Е - 5,92%, І - 5,98%, and excess error 20% for some mentioned quarterly indicators can be explained by the fact that prediction is used, in particular, data the years of crisis 2008 - 2009.

In general, comparing the results with the values of the relevant indicators the consensus prediction [Me], it can be argued about the competitiveness of the proposed article approach for forecasting macroeconomic indicators.

Example 2: prediction of TV audience performance

TV advertising market players use predictive performance television audience for programs, films, serials and advertising media planning on Ukrainian TV. The specificity of this approach consists in dependence on the accuracy of the forecast TV indicators of all TV market players. Each year there is a necessity forecasting basic TV performance on the subsequent estimated year in monthly terms based on similar data of prior periods.

In practice, usually following basic TV performance are forecast:

share of TV channel audience (share of the channel - sc) – this index determines the amount of viewers who watched TV from the total number of viewers at the investigated time period;

rating of TV channel audience (ratings of the channel - rc) - this index determines the amount of TV audience, it takes into account the duration of watching TV every spectator in the analyzed period of time;

TotalTV rating (rt) - this index determines the total size of the television audience, it takes into account individual TV time watching by every spectator in the analyzed time period;

advertising TV audience rating of the channel (an advertisement rating - ra) - this index determines the size of TV advertising audience it takes into account the duration of advertisement viewing by every TV viewers.

As described in [Taрaсoвa, 2012], the approximation by the least squares method is most often used to predict television performance in the standard way. In this example, the theory of pseudo inverse is used for forecasting TV performance.

Description of the main data

Page 20: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

320

In Ukraine TV Viewing performance data from 2003 are stored in a special database, which is the result of regular measurement of television audience. For example, we used four indicators data for years 2010-2012 by months which described above.

The result of observations for this period of four television performance (audience share of channel sc, rating of channel rc, TotalTV rating rt, ratings of channel advertising ra) forms the matrix of monthly

observations

1

2

3

4

1 36

( )

( )( ) , ,

( )

( )

r i

r ir i i

r i

r i

.

Respectively 1 1 36( ) , ,r i i — is the row-vector of monthly channel

audience share data; 2 1 36( ) , ,r i i — is the row-vector of monthly

channel rating data; 3 1 36( ) , ,r i i — is the row-vector of monthly

TotalTV data; 4 1 36( ) , ,r i i — is the row-vector of monthly

advertising raiting data.

These monthly data vectors for a given period (in our case - three

years) naturally organizing the matrix of observations R(i),i =1,36 .

To apply the theory of pseudoinverse we use the signs of Sections 1 and construct from the observations matrix the matrix pairs of input and output data of our model. We grouped the observational data matrix

R(i),i =1,36 in the matrix 1 2 3R ,R ,R as follows

1

2

3

1 12

13 24

25 36

( ) ... ( ) ,

( ) ... ( ) ,

( ) ... ( ) .

R r r

R r r

R r r

Then the matrix pair 1 1(X ,Y ) , on which evaluation matrix of the model

parameters A will be calculated from the matrix equation Y = AX , is

as follows 1 1 1 2(X ,Y )= (R ,R ) . The matrix pair 2 2(X ,Y ) is used to

construct the forecast indicators matrix *Y from the matrix equation ˆ*

2Y = AX and accuracy estimation of prediction *Y by the criterion of

accuracy *

2

2

Y - YAPE =

Y, де 2 2 2 3(X ,Y ) = (R ,R ) .

The use of the algorithm

1. We constructed the matrix of annual monthly observations

1 2 3, ,R R R on the basis of the matrix of observations 1 36( ), ,r i i (four basic monthly indicators in 2010-2012

(Table 4)) by grouping data.

2. A pair of input-output data matrices 1 1( , )X Y takes the form 1 2( , )R R .

Table 4. TV data performance by month

period sc rc rt ra

Jan.10 10,19 1,53 15,06 1,32

Feb.10 9,52 1,33 13,92 1,03

Mar.10 8,81 1,19 13,45 0,91

Apr.10 8,79 1,09 12,40 0,94

May.10 9,34 1,13 12,09 0,99

Jun.10 9,06 1,00 11,07 0,81

Jul.10 8,87 0,95 10,66 0,77

Aug.10 10,22 1,13 11,06 1,01

Sept.10 9,25 1,13 12,24 0,96

Oct.10 8,70 1,17 13,41 1,02

Nov.10 9,19 1,27 13,79 1,12

Dec.10 9,47 1,38 14,53 1,17

Jan.11 9,65 1,48 15,36 1,30

Feb.11 9,07 1,32 14,52 1,14

Mar.11 8,66 1,23 14,17 1,08

Apr.11 8,90 1,17 13,16 1,03

May.11 8,59 1,08 12,54 0,91

Jun.11 9,69 1,14 11,77 1,02

Jul.11 10,19 1,14 11,15 1,06

Aug.11 10,56 1,21 11,51 1,15

Sept.11 9,12 1,13 12,39 1,05

Oct.11 8,67 1,19 13,67 1,10

Nov.11 9,30 1,33 14,34 1,21

Dec.11 8,82 1,30 14,79 1,17

Jan.12 8,95 1,39 15,56 1,25

Feb.12 8,71 1,31 15,04 1,18

Mar.12 9,37 1,37 14,63 1,25

Apr.12 9,23 1,21 13,16 1,12

May.12 9,15 1,16 12,62 1,03

Jun.12 8,60 1,03 11,97 0,90

Jul.12 9,56 1,02 10,68 0,88

Aug.12 9,65 1,05 10,88 0,96

Sept.12 8,47 0,99 11,74 0,89

Oct.12 8,41 1,05 12,53 0,94

Nov.12 8,45 1,13 13,40 1,00

Dec.12 9,10 1,29 14,23 1,13

Page 21: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

321

3. Then the matrix of estimates of the model parameters A , that obtained from the equation

1 1 Y AX Y AX

1,371 -3,443 0,110 -0,763

0,055 0,513 0,023 -0,193ˆ0,089 0,247 1,079 -1,657

0,062 0,054 0,026 0,127

A

4. From the equation * *ˆY AX calculate predictive indicators matrix *Y , 2*X X .

*

8,82 8,63 8,38 8,83 8,74 9,87 10,47 10,68 9,17 8,46 8,80 8,33

1,40 1,29 1,23 1,20 1,14 1,20 1,20 1,25 1,17 1,19 1,30 1,27

15,65 14,92 14,59 13,58 13,06 12,16 11,48 11,77 12,72 14,00 14,62 15,13

1,24 1,16 1,11 1,09 1,03 1,10 1,12 1,17 1,08 1,1

Y

0 1,18 1,15

5. A comparison of the predictive indicators matrix *Y and actual performance matrix 2012 2Y gives a matrix of

errors APE:

5 0 9 5 7 2 9 7 6 6 2

5 2 3 4 0 4 9

2

1, % 1, % 11, % 4. % 4, % 1 , % 8, % 9, % 7, % 0,6% 4,0% 9, %

0, % 1, % 11,6% 1. % 1,2% 1 , % 1 , % 16,1% 14,8% 11,6% 12,6% 1,7%

0,6% 0,8% 0,3% 3,1% 3,3% 1,5% 6,9% 7,6% 7,7% 10,5% 8,4% 6,0%

0,8% 2,2% 12,8% 2,6% 0,2% 18,4% 1,3% 17,3% 17,5% 14,2%

15,2% 1,8%

As the errors table shows АРЕ, the average annual forecast indicators error for 2012 is: 6,3% (max 12,9%) – for TV channel audience share, 8,4% (max 16,1%) – for TV channel audience rating, 4,7% (max 10.5%) – for TotalTV rating, 10,4% (max 21,3%) – for TV channel advertising rating. The average prediction accuracy for all four indicators is acceptable for monthly year forecasts. However, exceeding the 10% threshold accuracy in some months is critical and shows the necessity of expert correction. Specifically our example, consideration of UEFA EURO 2012 effect in 6-7 months.

Conclusion

In the article case of matrix of observations for the arguments and values of the renewable function of the linear relationship between the components of observation has been considered.

Based on the matrixes least squares method, approach to prediction of indicators was proposed.

Testing approach with the use of statistical data of the economic and media indicators was made.

Results of prediction with available statistics was compared. The proposed approach for finding predictive values indicators is competitive.

Bibliography

[Me] Official web-site of the Ministry of Economic Development and Trade of Ukraine [Electronic resource] – Mode of access: http://www.me.gov.ua/ control/uk/ publish/category/main?cat_id=73499. – Title from the screen.

[Moore,1920] Moore E.H. On the reciprocal of the general algebraic matrix // Bulletin of the American Mathematical Society. – 26, 1920. – P.394 -395 .

[Penrose, 1955] Penrose R. A generalized inverse for matrices // Proceedings of the Cambridge Philosophical Society 51, 1955. – P.406-413.

Page 22: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

322

[Ukrstat] Official web-site of the State Statistics Service of Ukraine [Electronic resource] - Mode of access: http://www.ukrstat.gov.ua. - Title from the screen.

[Ukrstat] Офiцiйний сайт Деpжавного комiтету cтатиcтики Укpаїни [Електронний ресурс] – Режим доcтyпy: http://www.ukrstat.gov.ua. – Назва з екрану.

[Алберт, 1977] Алберт А. Регрессия, псевдоинверсия, рекуррентное оценивание.– М.: Наука.–1977.– 305 с.

[Донченко, 2011] Владимир Донченко. Евклидовы пространства числовых векторов и матриц: конструткивные методы описания базовых структур и их использование.// International Journal “Information technologies & Knowledge”.- 2011.- Vol. 5.- Number 3.-P.203 - 216.

[Кириченко, Донченко, 2005] Кириченко М.Ф., Донченко В.С. Задача термінального спостереження динамічної системи: множинність розв’язків та оптимізація//Журнал обчислювальної та прикладної математики. – 2005. –№5– С.63-78.

[Кириченко, Донченко, 2007] Кириченко Н.Ф., Донченко. В.С. Псевдообращение в задачах кластеризации// Киб. и СА.- №4, 2007– С.98-122.

[Тарасова, 2012] Тарасова О.В. Про моделювання телемедійних показників // Вісник Державного університету інформаційно-комунікаційних технологій. – Т.10, №4. – 2012.– С.120-127.

[Хаpазiшвiлi, 2007] Хаpазiшвiлi Ю.М. Теоpетичнi оcнови cиcтемного моделювання cоцiально-економiчного pозвиткy Укpаїни: Моногp. - К.: ПолiгpафКонcалтинг, 2007. – 324 c.

Authors' Information

Vladimir S. Donchenko - Professor, Kyiv Taras Shevchenko National University, Faculty of Cybernetics, Ukraine, e-mail: [email protected];

Inna М. Nazaraga – Younger Researcher; Kyiv Taras Shevchenko National University, Faculty of Cybernetics, Ukraine, e-mail: [email protected];

Оlga V. Тarasovа – postgraduate student; Kyiv Taras Shevchenko National University, Faculty of Cybernetics, Ukraine, e-mail: [email protected].

Page 23: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

323

КОМПРОМИСС И КОНСЕНСУС В ТЕОРИИ ПРИНЯТИЯ РЕШЕНИЙ

Альберт Воронин

Аннотация: Рассматриваются два основных подхода к решению многокритериальных задач принятия решений и векторной оптимизации систем управления. Один из них состоит в формализации многокритериальных задач при заданных (фиксированных) ограничениях и ресурсных возможностях системы. Второй подход показывает, какие новые перспективы открываются перед разработчиками, если они имеют возможность в определенных пределах распоряжаться ресурсными запасами (ограничениями) многокритериальных систем.

Ключевые слова: схемы компромиссов, консенсус, ресурсы и ограничения, противоречивость критериев, принцип рациональной организации.

ACM Classification Keywords: H.1 Models and Principles – H.1.1 – Systems and Information Theory; H.4.2 – Types of Systems.

Компромисс

В теории принятия многокритериальных решений рассматриваются два основных подхода к решению задач векторной оптимизации сложных систем. Первый состоит в формализации многокритериальных задач при заданных (фиксированных) ограничениях и ресурсных возможностях системы. Второй подход предполагает, что разработчики имеют возможность в определенных пределах распоряжаться ресурсными запасами (ограничениями) многокритериальных систем.

Для конструктивного решения многокритериальной задачи в рамках первого подхода в различных частных постановках осуществляется структуризация некоторых понятий. Для этого делаются дополнительные частные предположения, помогающие решить следующие проблемы векторной оптимизации:

нормализация частных критериев;

определение области решений, оптимальных по Парето;

выбор схемы компромиссов;

учет приоритета.

Для успешного выполнения поставленной цели при заданных условиях функционирования каждая система обладает определенными запасами и ресурсами (по прочности, термостойкости, количеству топлива и пр.), которые являются ограниченными. Собственно, это и служит физической причиной тех ограничений, которые фигурируют в задачах оптимизации, да и причиной включения тех или иных частных критериев в вектор эффективности. Для концепции первого подхода характерно то, что ограничения и ресурсные возможности системы заданы и фиксированы.

Трудности решения большинства проблем векторной оптимизации носят не вычислительный, а концептуальный характер (речь идет не о том, как найти оптимальное решение, а что следует под ним

Page 24: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

324

понимать). Поэтому разработка формального аппарата решения многокритериальных задач представляет собой одну из наиболее трудных проблем современной теории управления и принятия решений.

В отличие от других проблем векторной оптимизации, только задача определения области Парето является строго объективной и решается научно обоснованными методами без привлечения каких-либо эвристик. Однако область компромиссов представляет собой множество точек, из которых в большинстве случаев необходимо выбрать лишь одну, которая и является искомым многокритериальным решением.

Всякое сужение области эффективных решений, а тем более выбор единственного из них принципиально требует привлечения дополнительной субъективной информации от лица, принимающего решение (ЛПР), или группы людей (экспертов), которые участвуют в решении многокритериальной задачи. Причина в том, что эффективные точки несравнимы между собой формально. Эта дополнительная информация заключается в ответе на вопрос: сколькими единицами выигрыша по одному критерию можно, по мнению ЛПР, компенсировать неизбежный проигрыш единицы по другому (другим) в заданной ситуации? На основании этой дополнительной информации формулируется конкретная схема компромиссов для данной многокритериальной задачи и в итоге находится искомое решение.

Таким образом, при первом подходе определение многокритериального решения по своей природе компромиссно, ситуационно и принципиально основано на использовании субъективной информации. Получив эту информацию и выбрав схему компромиссов, можно перейти от общего векторного выражения к скалярной свертке частных критериев, что является основой для построения конструктивного аппарата решения многокритериальных задач. Если используется способ скалярной свертки, то математически модель решения задачи векторной оптимизации представляется в виде

0* arg min ,x X

x Y y x

где Y(y0) – скалярная функция, имеющая смысл скалярной свертки вектора нормированных частных критериев, вид которой зависит от выбранной в данной ситуации схемы компромиссов.

На основании содержательного анализа функций полезности ЛПР в различных ситуациях предложена концепция нелинейной схемы компромиссов. Скалярная свертка представляется регрессионной моделью

1

0 01 1

, 1 ; 0, 1,s s

k k k kk k

Y y y x

где k = const – коэффициенты регрессии. Таким образом, скалярная свертка критериев по нелинейной схеме компромиссов выражает содержательную регрессионную модель функции полезности ЛПР на всем

диапазоне ситуаций принятия многокритериальных решений, а коэффициенты регрессии отражают

индивидуальные предпочтения конкретного ЛПР. Процедура определения коэффициентов (настройка решающего правила) описана в работах автора.

Таким образом, компромиссно-оптимальное решение многокритериальной задачи в рассмотренном подходе мы можем получить в формализованной процедуре, применяя модель векторной оптимизации с учетом скалярной свертки по нелинейной схеме компромиссов.

Консенсус

Теперь рассмотрим случай, когда ограничения на частные критерии не фиксированы. Начнем с того, что решение любой векторной задачи оптимизации может быть только компромиссно-оптимальным. Каждая схема компромиссов является отражением вполне определенного полезного свойства, которым, по мысли разработчиков, должна обладать проектируемая многокритериальная система в заданной ситуации.

Page 25: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

325

Так, эгалитарный принцип равномерности предполагает реализацию идеи наиболее равномерного изменения уровня каждого из частных критериев. В качестве примера укажем, что грамотно спроектированный механизм срабатывается равномерно и по окончании расчетного времени работы выходит из строя одновременно во всех своих звеньях.

Применение утилитарного принципа интегральной оптимальности говорит о том, что разработчики акцентируют внимание на экономичности суммарного расходования запасов и ресурсов проектируемой системы. Пример: упомянутый механизм должен служить как можно дольше.

Традиционная постановка задачи заставляет выбирать одну, адекватную заданным условиям, схему компромиссов, игнорируя полезные качества, содержащиеся в других принципах оптимальности.

Между тем, практика решения прикладных многокритериальных задач свидетельствует, что не всегда решения, полученные по разным схемам компромиссов, существенно различны. В лучших образцах многокритериальных систем они близки, а иногда практически совпадают. От чего это зависит и о чем это говорит?

Если решения, полученные по разным схемам компромиссов, совпадают (или достаточно близки), то это значит, что ресурсы и запасы проектируемой системы подобраны и использованы настолько удачно, что при заданных условиях функционирования система одновременно отвечает всем требованиям, заложенным в разных принципах оптимальности. Пример: рационально построенный механизм служит долго, а в конце срока эксплуатации оказывается, что все его детали изношены в одинаковой мере. Если же решения существенно различны, то запасы и ресурсы системы подобраны неправильно, они не сбалансированы для заданных условий функционирования и, следовательно, система организована нерационально.

Таким образом, признаком рационально организованной многокритериальной системы является совпадение (близость) решений, полученных по различным принципам оптимальности, а средством рациональной организации является подбор запасов и ресурсов, от которых зависят ограничения системы, определяющие допустимую область решений. Целесообразно не только пассивно констатировать, что данная система спроектирована нерационально (или рационально), а, когда и в какой мере это возможно, включать в постановку задачи целенаправленный подбор (организацию) запасов и ресурсов проектируемой многокритериальной системы.

Принцип рациональной организации

Рассмотрим такую процедуру проектирования, когда разработчики в определенных пределах могут изменять значения всех или некоторых запасов и ресурсов системы, гармонично подбирая адекватный заданным условиям комплекс ограничений и определяя тем самым адекватную допустимую область решений. Сходная постановка задачи анализируется и в рамках теории системной оптимизации. Сформулируем принцип рациональной организации в многокритериальных задачах управления:

в рационально организованной многокритериальной системе при заданных условиях функционирования ограниченные ресурсы и запасы подобраны так, что оптимизация вектора эффективности по различным схемам компромиссов приводит к совпадающим (или близким) решениям.

Принцип рациональной организации универсален и представляет собой логическую основу для формализации решения многокритериальных задач разной природы. При совпадении решений проблема выбора схемы компромиссов отпадает, и соответствующий эвристический элемент из методики решения

Page 26: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

326

многокритериальной задачи исключается. В этом случае задача векторной оптимизации полностью и объективно сводится к скалярной.

Рассмотрим изложенную выше постановку многокритериальной задачи с той разницей, что ограничения А являются не заданными константами, а, наряду с аргументами х, независимыми переменными. В этом

случае результат решения векторной задачи состоит в определении таких векторов хоХ и Ао, при которых удовлетворяется принцип рациональной организации.

Можно утверждать, что если строго соблюдается принцип рациональной организации, то оптимальное решение хо:

принадлежит области Парето;

одновременно удовлетворяет всем схемам компромиссов, приводящим к парето-оптимальным решениям;

является единственным.

Отсюда следует, что математически строгая реализация принципа рациональной организации представляет собой не что иное, как стягивание путем рационального выбора вектора Ао всех паретовских решений к единственной точке хо, которая и является искомым оптимальным решением поставленной многокритериальной задачи.

Пронормируем вектор эффективности вектором ограничений и получим вектор относительных критериев

0 01 1( , ) / , .

s s

k k kk ky x A y x A y x A

В предположении о выполнении условий выпуклости допустимого множества критериев, при которых справедливы леммы Карлина, представим выражение для области компромиссов в виде решения задачи параметрического программирования

01

arg min ,a

sK

k kx X

ka X

X a y x

(1)

где 1

s

k ka a

– формальный векторный параметр, определенный на множестве

1

1, 0 .s

a k kk

X a a a

(2)

Одним из следствий леммы Карлина является то, что, варьируя аХа можно получить любую схему компромиссов, приводящую к парето-оптимальным решениям. Так как при выполнении принципа рациональной организации все решения из множества ХК стягиваются в точку хо, то выражение (1) преобразуется к виду

xо 01

arg min .a

s

k kx X

ka X

a y x

(3)

Из условия единственности точки хо следует требование инвариантности суммы 01

,s

k kk

a y x A в

выражении (3) от параметров аХа. Эта сумма не будет зависеть от указанных параметров только в том случае, когда

у01(х, А) = у02(х,А) =...= у0s(x, A) (4)

Page 27: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

327

Действительно, если выполнено равенство относительных критериев у01 = у02 =...= у0s = , то

рассматриваемая сумма с учетом свойства (2) векторного параметра 1

1s

kk

a

принимает вид

01 1 1

1s s s

k k k kk k k

a y a a

и не зависит от параметров аХа.

С другой стороны, единственная точка хо должна принадлежать области Парето с любым (произвольным) набором параметров а из множества Ха. Пользуясь произвольностью выбора этих параметров и исходя из свойства (2), установим

а1 = а2 = ...= аs = 1/s.

Тогда выражение (3) будет выглядеть так:

xо 0 01 11/

arg min 1/ , arg min 1/ , .k

s s

k kx X x X

k ka s

s y x A s y x A

(5)

Как известно, положение экстремума функции не изменяется от постоянного сомножителя, поэтому коэффициент 1/s можно сократить и

xо 01

arg min , .s

kx X

k

y x A

(6)

Раскрывая выражение (4), получим систему уравнений

y0,j(x, A) – y0,j+1(x,A) = 0, j[1, s–1] (7)

Условие (6) в предположении о том, что решение достигается внутри допустимой области аргументов, порождает систему уравнений

01

, 0, [1, ].s

kki

y x A i nx

(8)

Принцип рациональной организации требует, чтобы уравнения (7) и (8) составляли совместную и полную систему уравнений. Видно, однако, что эта система является неопределенной (не хватает одного уравнения). Это объясняется тем, что решение по принципу рациональной организации может быть получено при бесконечном числе сочетаний абсолютных величин ограничений. Поэтому необходимо доопределить задачу дополнительным условием. Таким условием может быть, например, равенство l-го относительного критерия (и автоматически всех относительных критериев) заданной конкретной величине:

у0l(x, A) = , l[1,s], 0<1 (9)

Кроме того, часто в приложениях одно ограничение бывает заданным

Al = Alо, l[1,s] (10)

и не подлежит изменениям. В этом случае величина не задается, а вместо условия (9) используется (10).

Таким образом, для решения многокритериальной задачи по принципу рациональной организации нужно решить систему уравнений (7)–(8)–(9) или (7)–(8)–(10). В результате получим n искомых компонент вектора решения хо и s оптимальных составляющих вектора ограничений Ао. Изложенная простая и объективная методика может быть применена, если задача рациональной организации имеет точное решение в заданной области аргументов.

Page 28: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

328

Среди решений, получаемых по принципу рациональной организации особое место занимает такое, при котором область компромиссов вырождается в точку. Вырождение области Парето ХК в единственную

точку хо представляется пересечением условий (7) и (8) при = 1. Полученное решение логично назвать к о н с е н с у с о м, так как оно сбалансировано по всем критериям, обеспечено ресурсными возможностями системы и непротиворечиво. Важно уяснить, что наличие области компромиссов всегда свидетельствует о присутствии противоречий в системе, а ее вырождение в точку устраняет почву для противоречий и позволяет считать решение хо согласованным, консенсусным.

Принцип рациональной организации позволяет научно обосновать требования к обеспечению многокритериальной системы необходимыми запасами и ресурсами для ее нормального функционирования в заданных условиях.

Если условия изменяются, этот принцип показывает, как надо изменять ограничения запасов и ресурсов и (или) структуру и параметры системы.

И, наконец, принцип рациональной организации указывает, в какие условия следует поместить заданную систему, чтобы она проявила себя как рационально организованная.

Оценка противоречивости критериев

Понятие консенсуса дает возможность количественно оценить степень противоречивости критериев системы при произвольном задании ограничений. Для этого удобно перейти от пространства

критериальных функций En к критериальному пространству Rs. Каждому решению хХ ставится в

соответствие его векторная оценка в критериальном пространстве {y1(x), ..., ys(x)} Rs. Если решение х для данной альтернативы пробегает все множество Х, то в критериальном пространстве Rs образуется множество Y(X), которое в дальнейшем будем называть множеством векторных оценок. Множеству парето-оптимальных решений ХК в пространстве критериальных функций соответствует множество парето-оптимальных векторных оценок YK=Y(XK) в критериальном пространстве. Напомним, что два топологических пространства называются гомеоморфными, если существует взаимно однозначное непрерывное отображение одного из них на другое, для которого обратное отображение тоже непрерывно. Само отображение называется гомеоморфизмом.

По свойству гомеоморфизма, если в пространстве En область Парето стягивается в точку консенсуса: ХК

хо, то в пространстве Rs соответствующая область компромиссов также вырождается в точку

консенсуса: YK yо.

В теории многокритериальной оптимизации существует понятие идеального вектора уid (утопической точки в критериальном пространстве). Для его определения при заданных условиях и ограничениях задача оптимизации решается s раз (по количеству частных критериев), причем каждый раз с одним (очередным) критерием, как если бы остальных не было вовсе:

* id * * id *1 1 1 1 1arg min ( ) ( );...; arg min ( ) ( )s s s s s

x X x Xx y x y y x x y x y y x

.

Чем более противоречивы частные критерии, тем больше такие решения отличаются друг от друга. Последовательность таких «однокритериальных» решений исходной многокритериальной задачи дает

координаты идеального вектора id id

1.

s

k ky y

В общем случае идеальный вектор недостижим, это фантом, чисто формальное решение (каждая координата показывает, каким замечательным был бы данный критерий, если бы не было необходимости учитывать остальные). И только в одном случае идеальная точка достигается реально – когда область

Page 29: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

329

Парето YK вырождается в точку yо. В этом единственном случае, когда противоречия между критериями исчезают, идеальный вектор уid совпадает с консенсусным решением yо.

Во всех остальных случаях утопическая точка уid отличается от точки консенсуса yо и расстояние между ними количественно выражает степень противоречивости критериев системы:

2id o

1

.s

k kk

y y

МОДЕЛЬНЫЙ ПРИМЕР. Изложенное проиллюстрируем простым модельным примером. Пусть некоторая система оценивается двумя критериями (рис. 1):

y1 = x;

y2 = (x–5)2+2.

Начнем с варианта, когда заданы ограничения: у1А1 = 6.5 и у2А2 = 6. Требуется найти компромиссно-

оптимальное решение х*ХКХ по нелинейной схеме компромиссов. Расчет показывает, что при заданных условиях

х* = 4.08; у1* = 4.08; у2* = 2.85.

Рис. 1 Рис.2

Координаты идеального вектора (рис. 2):

уid1 = (у1id1, у2id1) = (3; 2).

Теперь изменим задачу так, что ограничения А1 и А2 не фиксированы и могут подбираться из открытой области. Получим решение по принципу рациональной организации. Для этого составим систему уравнений (7)–( 8)–( 9)

x/A1=[(x–5)2+2]/A2;

2

1 2/ 5 2 / 0;x A x Ax

x/A1 = .

Решая эту систему при = 1, получим консенсусное решение:

xo = 4.78; y1o = A1o = 4.78; y2o = = A2o = 2.05.

Если задать = 0.9, то получится решение по принципу рациональной организации

хо = 4.78; у1о = 4.78; у2о = 2.05; А1о = 5.26; А2о = 2.25.

Возникает идеальный вектор уid2=(4.5; 2), т.е. появляется противоречивость, степень которой можно измерить по формуле

Page 30: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

330

2 2

2 4.5 4.78 2 2.05 = 0.29.

Степень противоречивости многокритериальной системы при заданных исходных ограничениях, когда имеет место идеальный вектор уid1, оценивается по формуле

2 2

1 3 4.78 2 2.05 =1.78,

т.е. существенно больше, чем 2.

Заключение

В заключение отметим, что рассмотрены два подхода к формализации решения многокритериальных задач. Один из них применяется при фиксированных значениях ограничений на частные критерии и состоит в том, что искомое компромиссно-оптимальное решение х* получается как аргумент минимизации скалярной свертки критериев по нелинейной схеме компромиссов, зависящей от заданных ограничений А. Второй подход применяется когда ограничения А не заданы и имеется возможность рассматривать их как независимые переменные задачи. В этом случае решение хо, Ао получается по принципу рациональной организации, а в пределе, когда область Парето вырождается в точку, получается решение хо, Ао, выражающее консенсус частных критериев.

Оба подхода применялись при решении конкретных задач векторной оптимизации космических систем управления. Так, концепция нелинейной схемы компромиссов использовалась при разработке закона управления глиссадным спуском воздушно-космического корабля «Буран»; при создании регрессионной модели экспертных оценок «надежность-стоимость» в задачах страхования объектов космической деятельности; при разработке эргатических систем аэрокосмического назначения и др. Принцип рациональной организации позволяет наиболее эффективно решать технико-экономические задачи выполнения космических проектов, так как дает возможность гармонично согласовывать ресурсные (финансовые, технические, эргономические и др.) возможности систем при проектировании и реализации проектов в условиях жестких требований.

Благодарности

Статья частично финансирована из проекта ITHEA XX1 Института Информационных теорий и приложений FOI ITHEA и Консорциума FOI Bulgaria (www.ithea.org, www.foibg.com).

Сведения об авторе

Воронин Альберт Николаевич – профессор, доктор технических наук, профессор кафедры компьютерных информационных технологий Национального авиационного университета, проспект Комарова, 1, Киев-58, 03058 Украина; e-mail: [email protected]

Page 31: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

331

МНОГОСОРТНАЯ МОНОТОННАЯ ЛОГИКА ФЛОЙДА-ХОАРА

Андрей Криволап, Николай Никитченко

Аннотация: Рассматривается проблема построения монотонной логики Флойда-Хоара, которая является расширением классической логики Флойда-Хоара для случая частичных предикатов. Обобщается построенная монотонная логика на случай многосортных логик. Для этого вводятся номинативные данные с типами. Доказывается монотонность композиций представленной логики, а также непрерывность композиции Флойда-Хоара.

Ключевые слова: программные логики, композиционно-номинативный подход, монотонные композиции, типизированные данные.

ACM Classification Keywords: F.3.1 Specifying and Verifying and Reasoning about Programs – Logics of Programs

Введение

Верификация является одним из основных этапов разработки программного обеспечения, важность которого нельзя недооценивать. Логика Флойда-Хоара [Floyd, 1967; Hoare, 1969] широко применяется в формальной верификации, поэтому ее исследование и расширение представляет большой интерес. Среди расширений можно выделить логику разделения [Reynolds, 2002] в которой вводятся понятия указателя и новый тип импликации.

Одним из возможных подходов к обобщению логики Флойда-Хоара является переход к частичным квазиарным предикатам над номинативными данными. Использование таких предикатов позволит более адекватно описывать свойства программ и вести рассуждения, ведь в программах мы работаем с именами переменных, присваивая им значения, или оперируя с их значениями.

В случае использования частичных предикатов, все композиции должны быть монотонны в том понимании, что если одна из компонент композиции становиться определенной на новых данных, то если композиция уже была определена на этих данных, ее значение не должно измениться. Таким образом, можно доказывать утверждения для частей программы, и быть уверенными, что они будут истинными и для программы в целом. Логика Флойда-Хоара в классическом определении не монотонна при расширении на частичные квазиарные предикаты, так как композиция Флойда-Хоара не будет монотонной. Монотонный вариант композиции был определен в [Никитченко, Криволап, 2002], где также были исследованы проблемы, возникающие при построении правил вывода.

Так как переменные в программах имеют не только определенные имена, но и типы, возникает проблема перехода от монотонной логики Флойда-Хоара, где значения все переменных принадлежат одному множеству, к многосортной монотонной логике Флойда-Хоара, в которой с каждой переменной ассоциируется определенный тип. Такое обобщение проводится согласно подходу, предложенному в [Nikitchenko, Tymofieiev, 2013]. После чего нужно показать, что композиции полученной логики будут также обладать необходимым свойством монотонности.

Page 32: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

332

Алгебры квазиарных предикатов и функций над типизированными номинативными множествами

Чтобы задать многосортную монотонную логику Флойда-Хоара, будем использовать семантико-синтаксический подход. Для этого сначала зададим семантическую часть в виде алгебр квазиарных предикатов, функций и биквазиарных функций. На основе соответствующих алгебр определим синтаксис в виде языка, композиционные символы которого будут представлять композиции в алгебрах. Таким образом, семантика задает синтаксис. Третьей составляющей будет интерпретация, которая формулам и термам языка будет сопоставлять предикаты и функции соответствующих алгебр.

Для того чтобы говорить про алгебры квазиарных предикатов и функции, определим сначала понятия типизированного номинативного множества, квазиарного предиката, квазиарной функции, биквазиарной функции.

Пускай V – множество имен, T – класс типов, а :V T – тотальное отображение, которое задает

типы переменных.

Если задано V , T и , то класс типизированных номинативных множеств (обозначим ( , , )NST V T , или

если множества V и T фиксированные, то ( )NST ) задается следующей формулой:

( ) { : | ( ( ) ( ) ( ))}A T

NST d V A v V d v d v v

Тут d – частичное отображение, которое именам переменных ставит в соответствие их значения, которые

должны принадлежать типам соответствующих переменных. Другими словами можно сказать, что номинативное множество задает состояние переменных, для которых определен их тип. Будем

представлять d в следующем виде: [ | ]i id v a i I , что обозначает, что переменная iv имеет

значение ia . При помощи ( )d v будем обозначать, что значение переменной v не определено в

номинативном множестве d . При помощи же ( )d v , что определено, аналогично ( )d v a

обозначает, что значение переменной v определено в номинативном множестве d и равно a .

Пусть { , }Bool F T – множество истинных значений. Рассмотрим множество

( , , ) : ( , , )Pr V T NST V T Bool частичных предикатов над типизированными номинативными

данными. Будем обозначать его ( )Pr если ,V T – зафиксированы. Тогда все предикаты из ( )Pr

будем называть многосортными частичными квазиарными предикатами.

Аналогичным образом определим многосортные квазиарные и многосортные биквазиарные функции.

Пусть A T – множество значений принадлежащих одному из типов класса T . Рассмотрим множество

( , , ) : ( , , )AFn V T NST V T A частичных функций над типизированными номинативными данными.

Будем обозначать соответственно ( )AFn если ,V T – зафиксированы. Тогда все функции из ( )AFn

для некоторого типа A T будем называть многосортными частичными квазиарными функциями с типом A .

Рассмотрим множество ( , , ) : ( , , ) ( , , )FPrg V T NST V T NST V T частичных функций над

типизированными номинативными данными. Если ,V T – зафиксированы будем обозначать это

множество ( )FPrg . Функции из ( )FPrg будем называть многосортными частичными биквазиарными

функциями, или многосортными частичными программными функциями. Если номинативные множества понимать как состояние значений переменных, то биквазиарная функция, которая принимает на вход

Page 33: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

333

одно состояние переменных и выдает результат определенных преобразований переменных в виде состояния, может трактоваться как формальное представление интуитивного понятия программы.

Далее постепенно определим алгебры трех уровней:

Алгебра с единственной основой ( , , )Pr V T , которая представляет семантику многосортной

логики чистых квазиарных предикатов.

Алгебра с основами ( , , )Pr V T и ( , , )AFn V T для всех A T , она задает семантику

многосортной квазиарной предикатно-функциональной логики.

Алгебра с основами ( , , )Pr V T , ( , , )AFn V T для всех A T и ( , , )FPrg V T для задания

многосортных программных логик, одной из которых является многосортная монотонная логика Флойда-Хоара.

Операции в соответствующих алгебрах будем называть композициями. Рассмотрим алгебру на первом

уровне. Тогда можно выделить такие композиции над ( , , )Pr V T , как ( , , ) { , , , , }vPr x xyC V T R x .

Они определяются следующим образом, где (d)p T обозначает, что предикат ( )p Pr определен

на состоянии d и равен T , аналогично (d)p F , а (d)p обозначает, что предикат ( )p Pr не

определен на состоянии d .

Бинарная композиция дизъюнкции : ( ) ( ) ( )Pr Pr Pr :

,если ( ) или ( )

( ) ,если ( ) и ( )

,иначе

T p d T q d T

p q d F p d F q d F

Унарная композиция отрицания : ( ) ( )Pr Pr :

,если ( )

( ) ,если ( )

,иначе

T p d F

p d F p d T

Унарная параметрическая композиция реноминации 1 2

1 2

,v , ,v, , , : ( ) ( )n

n

vx x xR Pr Pr , где

1 2 1 2 , , , , , , ,n nx x x v v v V – имена переменных таких, что 1 2 , , , nv v v – различные имена, и

1 1 2 2 ( ) ( ), ( ) ( ), , ( ) ( )n nv x v x v x , тогда:

1 2

1 2 1 2 1 ,v , ,v

, , , ( ) ([ | { , , , }] [ ( ) | ( ) , , ])n

n

vx x x n i i iR p d p v a d v v v v v d x d x i n

Операция накладки : ( ) ( ) ( )NST NST NST определяется на номинативных множествах

следующим образом:

1 1 2

1 2 2 2

( ),если ( ) и ( )

( ) ( ),если ( )

,иначе

d v d v d v

d d v d v d v

Унарная параметрическая композиция квантификации существования : ( ) ( )x Pr Pr с параметром

x V :

Page 34: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

334

,если существует ( ) : ( [ ])

( ) ,если для каждого ( ) : ( [ ])

,иначе

T a x p d x a T

x p d F a x p d x a F

Нуль-арная композиция равенства : ( )xy Pr с параметрами ,x y V , такими, что ( ) ( )x y :

,если ( ) , ( ) ( ) ( )

( ) F,если ( ) , ( ) ( ) ( )

,иначеxy

T x d y d и x d y d

d x d y d и x d y d

Определив все композиции, получаем алгебру для логики чистых квазиарных предикатов. Будем в

дальнейшем называть пару ( , , ), ( , , )PrPr V T C V T многосортной алгеброй квазиарных предикатов.

Рассмотрим алгебру на втором уровне. В данном случае основами будут множества ( , , )Pr V T и

( , , )AFn V T для всех A T и к определенным ранее композициям добавляются композиции над

квазиарными функциями, такие как суперпозиция, деноминация, тогда композицию реноминации можно выразить через суперпозицию и разыменование, а параметрическая унарная композиция равенства заменяется бинарной композицией, аргументами которой являются две функции, а параметром их тип.

Таким образом, множество композиций будет таким ( , , ) { , , , , , }`v

Fn AC V T S x x . Композицию

суперпозиции будем определять как строгую суперпозицию, в которой если значения хоть одной функции на состоянии не будет определенным, то и результат композиции будет неопределенным. На самом деле, для многосортных квазиарных функций и предикатов возникает целый класс суперпозиций. Их параметром будет тип результата, который возвращает первая функция, в которую и производиться подстановка. Для простоты мы будем использовать одну общую суперпозицию, заданную для всех типов квазиарных функций одновременно. Далее определим лишь новые композиции.

N-арная параметрическая композиция суперпозиции 1 2

,v , ,v : ( ( ) ( ))nv A

A T

S Fn Pr

1

( ) ( )( ) ( ) ( ) ( )nv v A

A T

Fn Fn Fn Pr , где 1 2 , , , nv v v V – имена переменных таких, что

1 2 , , , nv v v – различные имена, тогда:

1 21 2

1 1

,v , ,v ( [ ( ) | , ]),если ( ) для всех { , }( , , , , )( )

,иначеnv i i i

n

f d v g d i n g d i nS f g g g d

Бинарная параметрическая композиция равенства : ( ) ( ) ( )A AA Fn Fn Pr с параметром A T :

,если ( ) ,g( ) ( ) ( )

( g)( ) F,если ( ) ,g( ) ( ) ( )

,иначеA

T f d d и f d g d

f d f d d и f d g d

Нуль-арная композиция деноминации ( ): ( )`xx Fn с параметром x V :

( ),если ( )( )`

,иначе

x d x dx d

Покажем, что реноминация и унарное равенство выражается через новые композиции.

1 2 1 2

1 2 1 2 ,v , ,v ,v , ,v

, , , ( , , , , )` ` `n n

n

v vx x x nR p S p x x x

Page 35: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

335

(x)( ) ( )(d)` `xy d x y

Определив все композиции, получаем алгебру для многосортной квазиарной предикатно-функциональной

логики. Будем в дальнейшем называть кортеж ( , , ), { ( , , ) | }, ( , , )AFnPr V T Fn V T A T C V T

многосортной алгеброй квазиарных предикатов и функций.

Рассмотрим алгебру на третьем уровне. В данном случае основами будут множества ( , , )Pr V T ,

( , , )AFn V T для всех A T и ( , , )FPrg V T . Уровень программных логик более широк, чем два

предыдущих, можно вводить различные композиции над биквазиарными функциями, получая разные логики. Ограничимся одним из простейших случаев и введем композиции присваивания, условную композицию, композицию последовательного исполнения, композицию цикла и композицию тождественной программы. Также возможно ввести специальные композиции, которые позволили бы получать предикаты, при помощи которых можно вести рассуждения о свойствах программ. Одной из таких специальных композиций является композиция Флойда-Хоара. Таким образом, множество

композиций будет таким: ( , , ) { , , , , , , , , , , , }`v x

FPrg AC V T S x x AS IF WH id FH . Далее определим

новые композиции.

Унарная параметрическая композиция присваивания (x): ( ) ( )xAS Fn FPrg , где x V – имя

переменной, тогда:

[ ( )]),если ( )( )( )

,иначеx d x f d f d

AS f d

Тернарная условная композиция : ( ) ( ) ( ) ( )IF Pr FPrg FPrg FPrg :

( ),если ( ) и ( )

( , , )( ) ( ),если ( ) и ( )

,иначе

f d b d T f d

IF b f g d g d b d F g d

Бинарная композиция последовательного исполнения : ( ) ( ) ( )FPrg FPrg FPrg :

( ) ( ( ))f g d g f d

Бинарная композиция цикла : ( ) ( ) ( )WH Pr FPrg FPrg :

0 1 0 0 1 0 1 1

0 1

,если существуют , , , ,что , ( ) , (d ), , ( ) , (d ),

( , )( ) ( ) , , ( ) , ( )

,иначе

n n n n n

n n

d d d d d d f d d f f d d f

WH b f d b d T b d T b d F

Тернарная композиция Флойда-Хоара : ( ) ( ) ( ) ( )WH Pr FPrg Pr Pr :

,если ( ) или ( ) и ( ( )) =

( , , )( ) ,если ( ) и ( ) и ( ( )) =

,иначе

T p d F prg d q prg d T

FH p prg q d F p d T prg d q prg d F

Нуль-арная композиция тождественной программы : ( )id FPrg :

( )id d d

Page 36: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

336

Определив все композиции, получаем алгебру для многосортной квазиарной логики Флойда-Хоара. Будем

в дальнейшем называть кортеж ( , , ), { ( , , ) | }, ( , , ), ( , , )AFPrgPr V T Fn V T A T FPrg V T C V T

многосортной алгеброй квазиарных предикатов, функций и биквазиарных функций.

Стоит отметить, что параметрические композиции можно рассматривать как классы композиций, которые мы получаем, подставляя конкретные значения параметров.

Язык многосортной логики Флойда-Хоара

Синтаксис многосортной логики Флойда-Хоара зададим, описав ее язык, определив правила по которым строятся формулы, термы и программные тексты языка.

Пускай S – множество сортов, :V S – тотальное отображение, которое каждому имени переменной

ставит в соответствие ее сорт. Тогда тройку ( , , )S V S будем называть сигнатурой задания сортов.

Множество композиционных символов будем обозначать ( )SCs . Композиционные символы

представляют композиции алгебр, при помощи которых определяется семантика программной логики. Для удобства будем использовать такие же обозначения, как и в соответствующих алгебрах, и считать, что для каждого композиционного символа неявно заданы сорта его аргументов. Таким образом

( ) { , , , , , , , , , , , {}{}}`S v x

ACs S x x AS IF WH id , где {}{} - композиционные символы, отвечающие

за запись троек Хоара { } { }p f q .

Пусть Ps – множество предикатных символов, Fs – множество функциональных символов, Prgs –

множество программных символов, причем для функциональных символов задан их сорт при помощи

тотального отображения : Fs S . Тогда кортеж ( , ( ), , , , )L S SCs Ps Fs Prgs будем называть

сигнатурой языка. Имея сигнатуру, мы можем индуктивно задать язык логики как множество формул

( )LFr , термов ( )LTr и программных текстов ( )LPt а так же множество специальных формул,

троек Хоара ( )LFHFr . Для того чтобы это сделать, введем дополнительные обозначения: тотальное

отображение : ( )LTr S , которое каждому терму приписывает его сорт.

Сначала определим термы:

если F Fs , то ( )LF Tr и ( ) ( )F F

если v V , то ( )`Lv Tr и ( ) ( )v v

если F Fs , 1 2 , , , ( )Lnt t t Tr и 1 2 , , , nv v v V – разные переменные, причем их сорта и

сорта термов совпадают 1 1 2 2 ( ) ( ), ( ) ( ), , ( ) ( )n nt v t v t v , то

1 21 2 , , , ( , , , , ) ( )nv v v L

nS F t t t Tr и 1 21 2 , , ,( ( , , , , )) ( )nv v v

nS F t t t F

Определим формулы:

если P Ps , то ( )LP Fr

если ( )LFr , то ( )LFr

если ( )LFr и v V ,то ( )Lv Fr

если , ( )LFr , то ( )LFr

Page 37: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

337

если P Ps , 1 2 , , , ( )Lnt t t Tr и 1 2 , , , nv v v V – разные переменные, причем их сорта и

сорта термов совпадают 1 1 2 2 ( ) ( ), ( ) ( ), , ( ) ( )n nt v t v t v , то

1 21 2 , , , ( , , , , ) ( )nv v v L

nS P t t t Fr

если 1 2 , ( )Lt t Tr и 1 2 ( ) ( )t t s , то 1 2 ( )LSt t Fr

Определим программные тексты:

( )Lid Pt

если Pr Prgs , то ( )LPr Pt

если ( )LT Tr , v V и ( ) ( )T v , то ( ) ( )v LAS T Pt

если , ( )LP Q Pt , то ( )LP Q Pt

если , ( )LP Q Pt , ( )LF Fr то ( , , ) ( )LIF F P Q Pt

если ( )LP Pt , ( )LF Fr то ( , ) ( )LWH F P Pt

Если ( )Lf Pt , , ( )Lp q Fr , то { } { } ( )Lp f q FHFr .

После того, как был определен язык логики, необходимо дать определение интерпретации. Обозначим

:SI S T – отображение интерпретации сортов. Тогда имея отображение , мы можем определить

SI – отображение задающее типы, и соответственно алгебру

( , , ), { ( , , ) | }, ( , , ), ( , , )AFPrgPr V T Fn V T A T FPrg V T C V T . Также нам нужна дополнительно

интерпретация предикатных символов : ( )PsI Ps Pr , интерпретация функциональных символов

: ( )Fs A

A T

I Fs Fn , интерпретация программных символов : ( )PrgsI Prgs FPrg . Интерпретация

композиционных символов задается определением композиций, поэтому не выделяется явно. Кортеж

( , , , )S Ps Fs PrgsI I I будем называть интерпретацией языка. Теперь индукцией по построению формул,

термов, программных текстов и троек Хоара, можно задать интерпретацию всех элементов языка:

: ( ) ( ) ( ) ( ) ( ) ( ) ( )L L L L A

A T

J Fr Tr FHFr Pt Pr Fn FPrg .

для всех F Fs , ( ) ( )FsJ F I F

для всех P Ps , ( ) (P)PsJ P I

для всех v V , ( )` `J v v

( )J id id

для всех Pr Prs , ( ) ( )PrsJ Pr I Pr

( ) ( )J J

( ) ( )J v vJ

( ) ( ) ( )J J J

1 2 1 2 ( )

( ) ( ( ) ( ))SS I SJ t t J t J t

1 2 1 21 2 1 2 , , , , , ,( ( , , , , )) ( ( ), ( ), ( ), , ( ))n nv v v v v v

n nJ S F t t t S J F J t J t J t

Page 38: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

338

( ( )) ( ( ))v vJ AS T AS J T

( ) ( ) ( )J P Q J P J Q

( ( , , )) ( ( ), ( ), ( ))J IF F P Q IF J F J P J Q

( ( , )) ( ( ), ( ))J WH F P WH J F J P

({ } { }) ( ( ), ( ), ( ))J p f q WH J p J f J q .

Монотонность композиций

Сначала дадим определение монотонной композиции для квазиарных предикатов, функций и биквазиарных функций.

Композиция 1 2: ( ( )) ( ( )) ( ( )) ( ( )) ( ( )) ( )kAA An mC FPrg Pr Fn Fn Fn Pr

называется монотонной, если выполняется следующее условие:

1 1 1 1 1 1

1 1 1 1 1 1

, , , , , , , ,

( , , , , , , , , ) C( , , , , , , , , )n n m m k k

n m k n m k

f g f g p q p q a b a b

C f f p p a a g g q q b b

Аналогично вводится определение монотонности композиций, имеющих результатом квазиарную функцию, или биквазиарную функцию, или имеющий другой порядок и набор аргументов.

Неформально определение монотонности можно понимать следующим образом. Если один из аргументов композиции заменить на более определенный, то значения композиции на тех данных, на которых они были определены, не изменятся. Можно сформулировать следующее утверждение.

на всех данных ( ) ( ) ( ) ( )f g d NST f d g d f d .

Используя это утверждение докажем монотонность всех композиций, кроме нуль-арных

{ , , , , , , , , , }v xAS x AS IF WH FH .

Монотонность .

Мы имеем некоторые ,p p q q , нужно показать, что p q p q . Это аналогично тому, что на

всех данных ( ) ( ) ( ) ( )d NST p q d p q d p q d . Возьмем любое d такое, что

( )p q d . Если ( )p q d T , то или ( ) ( ) T ( ) ( )p d T p d p q d T p q d , или

( ) ( ) T ( ) ( )q d T q d p q d T p q d . В случае, когда ( )p q d F , то

( ) и ( ) ( ) и ( ) ( ) ( )p d F q d F p d F q d F p q d F p q d .

Следовательно, композиция – монотонна.

Монотонность .

Пускай p p , нужно показать, что p p . Возьмем любое d такое, что ( )p d . Тогда

( ) ( ) ( )p d p d p d , откуда по определению ( ) ( )p d p d .

Следовательно, композиция – монотонна.

Монотонность vS .

Page 39: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

339

По определению, из 1 21 2 ,v , ,v ( , , , , )( )nv

nS f g g g d следует, что 1 ( ) для всех { , }ig d i n откуда

будет следовать, что 1 ( ) ( ) для всех { , }i ig d g d i n , и функции, в которые подставляются

значения, будут вычисляться на одинаковых данных, откуда следует монотонность композиции.

Монотонность x .

Пускай p p . Нужно показать x p x p . Возьмем произвольное d такое, что ( )x p d .

Рассмотрим два случая.

( )x p d T , тогда существует ( ) : ( [ ])a x p d x a T , тогда ( [ ])p d x a T , откуда

( ) ( )x p d T x p d .

( )x p d F , тогда для всех ( ) : ( [ ])a x p d x a F , тогда для

всех ( ) : ( [ ])a x p d x a F , откуда ( ) ( )x p d F x p d .

Следовательно, композиция x монотонна.

Монотонность A .

Пускай ,f f g g . Из определения композиции, можно сделать вывод, что

( )( ) ( ) и ( )Af g d f d g d . Откуда ( ) ( ) и ( ) ( )f d f d g d g d и, следовательно

( )( ) ( )( )A Af g d f g d .

Таким образом, композиция A монотонная.

Монотонность xAS .

Из определения xAS следует, что ( )( ) ( )xAS f d f d , откуда аналогично предыдущим случаям

можно сделать вывод, что композиция монотонна.

Монотонность IF .

Пускай , ,f f g g b b возьмем такое d , что ( , , )( )IF b f g d . Рассмотрим два случая.

Если ( ) и ( )b d T f d , то ( ) и ( ) ( ) ( , , )( ) ( , , )( )b d T f d f d IF b f g d IF b f g d .

Если ( ) и ( )b d F g d , то ( ) и ( ) ( ) ( , , )( ) ( , , )( )b d F g d g d IF b f g d IF b f g d .

Следовательно, композиция IF монотонна.

Монотонность .

Пускай ,f f g g возьмем такое d , что ( )f g d . Тогда ( ( )) ( )g f d f d , откуда

( ) ( ) ( (d)) ( ( )) ( ( )) ( ( ))f d f d g f g f d g f d g f d .

Следовательно, композиция монотонна.

Монотонность WH .

Из определенности композиции цикла на определенном данном следует существование последовательности данных, таких, что выполняются условия из определения. Откуда и для доопределенных функций и предиката, условия будут выполняться. Следовательно, общее значение не изменится, откуда композиция WH монотонна.

Монотонность FH .

Page 40: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

340

Пускай , ,f f p p q q . Возьмем произвольное d такое, что ( , , )( )FH p f q d . Рассмотрим

несколько случаев.

( , , )( )FH p f q d T . Тогда либо ( ) ( ) ( , , ) ( , , )p d F p d F FH p f q T FH p f q , либо

( ) и ( ( )) ( ) ( ) и ( ( )) ( , , ) ( , , )f d q f d T f d f d q f d T FH p f q T FH p f q .

( , , )( )FH p f q d F , откуда (d) и ( ) и ( ( ))p T f d q f d F , тогда ( )p d T и

( ) ( ) и ( ( )) ( ( ))f d f d q f d F q f d F , таким образом ( , , ) ( , , )FH p f q F FH p f q

Для всех случаев пришли к требуемому результату, следовательно, композиция будет монотонной.

Было показано, что все композиции будут монотонными, значит построенная квазиарная логика Флойда-Хоара монотонная.

Для композиции Флойда-Хоара можно доказать более сильный результат, а именно, она является непрерывной. Сначала дадим определение непрерывности композиции по одному из ее аргументов.

Цепью функций (предикатов) будем называть бесконечное множество функций (предикатов) 0 1 { , , }f f ,

каждой из которых поставим в соответствие номер, такое, что 1 i if f i .

Границей цепи функций (предикатов) будем называть супремум соответствующего множества, будем ее

обозначать ii

f .

Композиция 1 2: ( ( )) ( ( )) ( ( )) ( ( )) ( ( )) ( )kAA An mC FPrg Pr Fn Fn Fn Pr

называется непрерывной по первому аргументу, если для произвольной цепи { | }if i выполняется:

2 1 1 2 1 1 ( , , , , , , , , , ) C( , , , , , , , , , )i n m k i n m ki i

C f g g p p a a f g g p p a a

Аналогично определяется непрерывность по другим аргументам.

Покажем, что композиция Флойда-Хоара будет непрерывной по первому аргументу, для остальных доказательство проводится по аналогии.

Рассмотрим цепь предикатов { | }ip i . Так как композиция Флойда-Хоара монотонна, то

{ ( , , ) | }iFH p f q i тоже будет цепью. Необходимо показать, что ( , , ) ( , , )i ii i

FH p f q FH p f q .

Возьмем произвольное d , тогда возможны два варианта: либо граница будет определена на этом

данном, либо нет. В первом случае из отношения, установленного на элементах цепи, ни один из

элементов не будет определен на d . Тогда ( ) и ( ) i ji

p d p d j , откуда

( , , )( ) ( , , )( ) i ji

FH p f q d FH p f q d j , а значит и ( , , )( ) ( , , )( )i ii i

FH p f q d FH p f q d .

Если граница определена на этом данном, то можно найти k такое, что

( ) , и , ( ) ( ) ( )k j k ii

p d j k p d p d p d , тогда ( , , )( ) ( , , )( )i ki

FH p f q d FH p f q d и

( , , )( ) ( , , )( )k ii

FH p f q d FH p f q d , так как ( , , )( ) ( , , )( ) k jFH p f q d FH p f q d j k .

Следовательно, ( , , )( ) ( , , )( ) ( , , )( )i k ii i

FH p f q d FH p f q d FH p f q d

Page 41: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

341

Во всех случаях ( , , )( ) ( , , )( )i ii i

FH p f q d FH p f q d , так как данное d произвольное, то получаем,

что ( , , ) ( , , )i ii i

FH p f q FH p f q , что и требовалось доказать.

Доказательство для остальных аргументов композиции не отличается от указанного доказательства для непрерывности по предусловию.

Заключение

Работа является дальнейшим развитием [Никитченко, Криволап, 2002] и [Nikitchenko, Tymofieiev, 2013]. Было построено алгебры более высоких уровней, которые включали в себя квазиарные функции, а не только предикаты. Было доказано, что при переходе к многосортным логикам, модифицированная композиция Флойда-Хоара остается монотонной. Использование многосортных логик позволяет более адекватно описывать свойства программ и является следующим шагом, после перехода к квазиарным частичным предикатам и функциям. Постает проблема исследования систем вывода в многосортных логиках и перенос результатов полученных для монотонных логик Флойда-Хоара без использования типов.

Благодарности

Статья частично финансирована из проекта ITHEA XXI организации ITHEA ISS (www.ithea.org) и ADUIS (www.aduis.com.ua)

Список литературы

[Floyd, 1967] R.W. Floyd Assigning meanings to programs / R.W. Floyd // Proceedings of the American Mathematical Society Symposia on Applied Mathematics. – 1967. – Vol. 19. – pp. 19-31.

[Hoare, 1969] C.A.R. Hoare An axiomatic basis for computer programming / C.A.R. Hoare // Communications of the ACM. – 1969. – № 12. – pp. 576-580,583.

[Nikitchenko, Tymofieiev, 2013] Mykola S. Nikitchenko, Valentyn G. Tymofieiev. Satisfiability and Validity Problems in Many-Sorted Composition-Nominative Pure Predicate Logics. ICT in Education, Research, and Industrial Applications Communications in Computer and Information Science. – 2013. – Volume 347. – pp. 89-110.

[Reynolds, 2002] John C. Reynolds. Separation Logic: A logic for Shared Mutable Data Structures. LICS 2002: p55-74.

[Никитченко, Криволап, 2002] Никитченко Н.С., Криволап А.В. Семантические свойства монотонных логик Флойда-Хоара // Вестник Киевского Университета. Серия: физико-математические науки. – 2012. – № 3. – С. 215-222 (На украинском).

Сведения об авторах

Андрей Владимирович Криволап – Киевский национальный университет имени Тараса Шевченко, факультет кибернетики, Украина, аспирант, e-mail: [email protected]

Николай Степанович Никитченко – Киевский национальный университет имени Тараса Шевченко, факультет кибернетики, Украина, д. ф.-м. н., профессор, e-mail: [email protected]

Page 42: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

342

О ПРИМЕНИМОСТИ ОЦЕНКО МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ ПРИ СРАВНЕНИИ ИНТЕРВАЛЬНЫХ АЛЬТЕРНАТИВ

Стернин М.Ю., Шепелев Г.И.

Аннотация: В практических задачах сравнения альтернатив с интервальными, из-за неопределенности, показателями качества нередко применяются точечные (одно-числовые) оценки, предположительно эквивалентные исходным интервальным. В работе показано, что использование в таких задачах точечных оценок, в частности оценок математического ожидания, без квантификации и дополнительного анализа величины шансов истинности проверяемой гипотезы о предпочтительности одной из альтернатив в их паре неадекватно проблеме сравнения интервальных оценок. Предложен метод вычисления шансов истинности проверяемой гипотезы и риска, связанного с возможной истинностью гипотезы, противоположной анализируемой. Для ряда примеров сравнения интервальных альтернатив проведено сопоставление результатов сравнения по предложенному методу и по средним оценкам. Продемонстрировано, что упомянутые шансы далеко не во всех случаях могут быть представлены как функции математических ожиданий распределений на сравниваемых интервалах. Показано, что корректный анализ задачи сравнения интервальных альтернатив требует расчета указанных шансов и сопоставления их величины с предпочтениями лиц, принимающих решения.

Keywords: comparing interval alternatives, method for estimation of chances of preferability compared alternatives, analysis of adequacy of average point estimates to comparing process

ACM Classification Keywords: H.1.2 Human information processing. G3 Distribution functions. I.2.3 Uncertainty, “fuzzy”, and probabilistic reasoning.

Введение

Сравнение интервальных альтернатив, - альтернатив, показатели качества которых имеют, из-за неопределенности, интервальное представление, достаточно распространенная на практике задача. Возникновение неопределенности часто связано здесь с необходимостью прогнозирования будущих значений анализируемых показателей. Цель такого сравнения дать заключение о предпочтительности какой-либо альтернативы или об эквивалентности альтернатив на момент прогнозирования, т.е. еще в условиях неопределенности. Обычно предполагается, что в интервале [L, R] (L и R левая и правая граница интервальной оценки соответственно) лежат все возможные точечные (одно-числовые) значения анализируемого показателя, но лишь единственное из них реализуется в будущем, когда исходная неопределенность будет устранена.

При сравнении интервальных оценок показателей качества альтернатив существует единственная конфигурация расположения пары сравниваемых интервалов, которая не вызывает трудностей. Это конфигурация, при которой левая граница одного, пусть второго, интервала не менее, чем правая граница первого. Тогда один из интервалов строго предпочтительнее другого. Именно, второй интервал «лучше» первого, если большему значению показателя качества соответствует более предпочтительное

Page 43: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

343

состояние, и «хуже» первого, если меньшему значению показателя качества соответствует более предпочтительное состояние.

Для конфигураций общего положения, когда сравниваемые интервальные оценки имеют ненулевое пересечение, в принципе нельзя с определенностью сделать вывод о предпочтительности какой-либо интервальной альтернативы в их паре, - любая из них может оказаться таковой в будущем. Поэтому на момент сравнения можно судить лишь о шансах на то, что одна альтернатива окажется предпочтительнее другой. При этом всегда существует риск того, что в действительности предпочтительной окажется другая альтернатива.

Таким образом, задача сравнения интервальных оценок не может быть решена чисто математическими методами и превращается в задачу принятия решений, поскольку для вывода о том, достаточна ли оцененная тем или иным способом величина указанных шансов для заключения о предпочтительности одного из интервалов, приходиться привлекать лицо, принимающее решение (ЛПР), или эксперта. Именно их оценка приемлемости упомянутых шансов в конечном счете позволяет принять гипотезу о предпочтительности одной из альтернатив или отклонить ее.

Из всех способов квантификации шансов на предпочтительность той или иной интервальной оценки в настоящей работе выбран аппарат функций распределения теории вероятностей, в наибольшей степени привычный, по нашему мнению, для экспертов, что существенно, поскольку параметры распределения должны быть заданы специалистами. Конечно, для чисто интервальных альтернатив точное распределение шансов на них неизвестно. Но мы можем предположить, что эти распределения унимодальные, и для многих типов распределений можно приближенно аппроксимировать эти неизвестные (но унимодальные) распределения треугольными распределениями. Указанная гипотеза о правомочности такой приближенной замены интервальных альтернатив интервально-вероятностными принята в настоящей работе. Некоторые соображения, связанные с принятием этой гипотезы, обсуждаются ниже.

В наших предыдущих публикациях предложен общий подход к сравнению интервально-вероятностных альтернатив [Стернин, 2011; 2012; Shepelyov, 2011]. Он состоит в следующем.

Пусть для определенности рассматривается ситуация, когда бóльшие значения показателя качества отвечают более предпочтительному состоянию. Пусть проверяется гипотеза о том, что вторая интервальная альтернатива I2 предпочтительнее («больше») первой I1. Если шансы появления различных точечных значений в сравниваемой паре интервалов заданы как распределения вероятностей, численное моделирование процесса реализации точечных оценок может служить основой для оценки шансов предпочтительности интервальных величин и их сравнения. Будем говорить, что пара точечных реализаций (i1, i2) интервальных оценок I1 и I2 принадлежит зеленой зоне, если i2 не меньше, чем i1, и принадлежит красной зоне в противоположном случае. Таким образом, зеленая зона – это зона, благоприятствующая истинности проверяемой гипотезы, а красная зона не благоприятствует ей.

Для сравнения интервалов методом численного моделирования необходимо провести достаточно много (скажем, N) испытаний, при каждом из которых соответствующий интервал заменяется точечной реализацией, и отметить количество попаданий в зеленую Ng и красную зоны Nr соответственно. Будем считать, что параметр Kg = Ng/N служит мерой шансов реализации зеленой зоны (шансов, что альтернатива I2 окажется предпочтительнее альтернативы I1), а Kr = Nr/N аналогичной мерой для красной зоны. Видно, что Kg + Kr = 1. Таким образом, Kg – оценка вероятности того, что второй интервал предпочтительнее первого (I2 I1), а Kr того, что I1 I2.

Введем коэффициент уверенности Kas как разность между Kg и Kr: Kas(I2 I1) = Kg ─ Kr. Ясно, что Kas(I2 I1) = P(I2 I1) ─ P(I1 I2). Так как P(I2 I1) + P(I1 I2) = 1, то Kas(I2 I1) = 2P(I2 I1) – 1 = 1 –

Page 44: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

344

2P(I1 I2). P(I2 I1) = [1 + Kas(I2 I1)]/2, P(I1 I2) = [1 + Kas(I2 I1)]/2. Какой из формул следует пользоваться при расчете коэффициента уверенности, зависит, как мы увидим, от специфики конкретной конфигурации пар сравниваемых интервальных альтернатив.

Коэффициент уверенности показывает, насколько шансы реализации зеленой зоны превышают шансы реализации красной зоны. Другими словами, насколько шансы истинности проверяемой гипотезы о предпочтительности одной из альтернатив превышают шансы истинности противоположной гипотезы. Именно этот показатель предлагается в качестве критерия сравнения пар интервальных альтернатив для всех их модификаций. Будем говорить, что альтернатива I2 теоретически предпочтительнее, чем I1, если значение Kas положительно. Теоретически, поскольку предпочтения ЛПР еще не учтены. Эти предпочтения могут быть выражены введением назначаемого ЛПР порогового значения коэффициента уверенности Kth. Именно, если вычисленное для данной пары интервальных оценок значение Kas не меньше, чем Kth, то I2 следует признать более предпочтительной альтернативой на уровне уверенности Kas с учетом предпочтений ЛПР. Если порог, назначенный ЛПР, не позволяет признать вторую альтернативу предпочтительной, необходимо анализировать ситуацию заново. Можно, например, обсудить с экспертом целесообразность изменения распределения вероятностей, используемого для описания неопределенности, или порогового значения коэффициента уверенности Kth. Если значение Kas отрицательно, необходимо проверить противоположную гипотезу. Отметим, что привлекательные для ЛПР значения коэффициента уверенности начинаются, по нашему мнению, с Kas = 0.4. При этом шансы на предпочтительность второй альтернативы при сравнении с первой оказываются равными 0.7, что в два с лишним раза выше, чем шансы противоположной гипотезы. Конечно, приемлемый пороговый уровень Kth свой для каждого ЛПР и зависит от его склонности к риску.

В работе [Shepelyov, 2011] изучены некоторые свойства коэффициента уверенности. Пусть, как и раньше, Kas(I2 I1) - коэффициент уверенности, полученный при проверке гипотезы о том, что альтернатива I2 более предпочтительна, чем I1. Возможные значения коэффициента уверенности Kas(I2 I1) лежат в диапазоне [- 1, 1]: –1 ≤ Kas(I2 I1) ≤ 1. Отметим, что условие Kas(I2 I1) = 1 соответствует ситуации, когда I2 доминирует I1 (интервалы не пересекаются), а Kas(I2 I1) = ─ 1 отвечает противоположной ситуации. Условие Kas(I2 I1) = 0 соответствует ситуации равнозначности интервальных альтернатив по предпочтению. Как функция двух переменных Kas(I2 I1) является антисимметричной функцией: Kas(I2 I1) = – Kas(I1 I2). Кроме того, определение Kas согласуется с требованием транзитивности отношения предпочтительности. Действительно, если Kas(I2 I1) > 0, тогда (теоретически) I2 I1; если Kas(I3 I2) > 0, то I3 I2, и, поскольку, в силу транзитивности, I3 I1, то Kas(I3, I1) > 0.

Напомним, что в процессе сравнения предполагалось, что неизвестные, но унимодальные, распределения на интервалах могут быть аппроксимированы треугольными распределениями с различными положениями мод. При этом мода может быть значительно смещена вправо для I1 (оптимистическая гипотеза) и влево для I2 (пессимистическая гипотеза). Сдвигая на одинаковые расстояния положения мод от их первоначальных позиций вправо для I2 и влево для I1, можно проанализировать зависимость Kas от локализации мод и, вместе с ЛПР, найти их значения, которые согласуются с Kth. Результаты подобного моделирования могут помочь ЛПР осмыслить свои предпочтения при принятии решений.

Более полную, по сравнению со значением коэффициента уверенности, информацию для принятия решений содержит распределение вероятностей разности D случайных величин I2 и I1, получаемое в процессе численного моделирования совокупности величин i2 – i1. Ясно, что Kas = P(d > 0) – P(d < 0), где P(d) – функция распределения случайной величины D. Подход, основанный на соотношениях для функций распределения вероятностей разности сравниваемых интервально-вероятностных величин,

Page 45: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

345

развит нами в предыдущих работах [Стернин, 2011; 2012; Shepelyov, 2011] и реализован аналитически для случая, когда на обоих сопоставляемых интервалах заданы равномерные распределения. Определенным недостатком этого подхода является известная его громоздкость, приводящая к большому количеству формул, каждая из которых применима в своей области изменения переменной D. Это связано как с вариабельностью формы области интегрирования при расчете плотности распределения вероятностей разности, так и полиморфизмом выражений для некоторых функций распределения, задаваемых на сравниваемых интервалах, например, для треугольных распределений. Поэтому такой, реализуемый в принципе подход, приводит к соотношениям, уместным скорее в справочниках, чем в журнальных публикациях. В связи с этим нами предложен другой подход к получению аналитических выражений для коэффициентов уверенности, изложенный в следующем разделе статьи.

Имеются, однако, и другие, более простые на первый взгляд методы сравнения интервальных величин. Они основаны на замещении интервальных оценок точечными, предположительно эквивалентными при сравнении исходным интервальным. Эти методы подкупают не только своей простотой, но и тем фактом, что, как отмечают эксперты, руководители-практики привыкли работать и предпочитают иметь дело с точечными оценками, в том числе для будущих значений сравниваемых показателей.

Простота и наглядность точечных оценок скрывает некоторые их недостатки. Складывается впечатление, что на их основе могут быть приняты исчерпывающие, при всех условиях верные решения о предпочтительности альтернатив, что, как мы видели, не всегда так. Не упоминается, что в ряде случаев эти оценки являются лишь границами некоторых суженных, по сравнению с исходными, интервалов. Кроме того, эти оценки не сопровождаются оценками шансов истинности проверяемой гипотезы о предпочтительности и риска истинности противоположной гипотезы.

При сравнении интервально-вероятностных альтернатив, которые главным образом рассматриваются в настоящей статье, наиболее употребителен на практике критерий математического ожидания показателей качества альтернатив [Смоляк, 1996]. Поэтому анализ адекватности критерия математического ожидания задачам сравнения интервально-вероятностных альтернатив и сопоставление результатов сравнения по предложенному в статье методу и по средним оценкам – также одна из целей настоящей работы.

Аналитический метод расчета коэффициентов уверенности

Для некоторых распределений вероятностей на сравниваемых интервалах могут быть найдены аналитические выражения для коэффициентов уверенности в истинности проверяемой гипотезы о предпочтительности одного из интервалов в их паре, что позволяет выполнить более общий, по сравнению с численным моделированием, анализ задачи. Это может быть сделано, в частности, при задании равномерных и треугольных распределений на интервалах в различных комбинациях.

Рассматриваются конфигурации: А) L2 > R1; B) L2 < R1 < R2; C) L1 < L2, R2 < R1; D) L1 = L2 = L, R1 = R2 = R, которыми, с точностью до перестановки, исчерпываются все возможные конфигурации сравниваемых пар интервальных оценок. Таким образом, в конфигурации А) интервалы не пересекаются, случай B) – это конфигурация сдвинутых относительно друг друга интервалов с пересечением, C) – вложенные интервалы и D) – совпадающие интервалы.

Идея аналитического метода расчета коэффициентов уверенности Kas(I2 I1) фактически повторяет

идею численного метода: для случайно выбранного фиксированного значения i2f I2 рассчитывается

вероятность P(i2f>i1), i1 I1. Затем такие вероятности для всех возможных i2 суммируются с учетом шансов на реализацию каждого такого i2. Другими словами, должен быть вычислен интеграл от P(i2>i1) по случайной величине i2 с учетом плотности распределения ее вероятностей f(i2).

Page 46: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

346

Рассмотрим вначале случай равномерных распределений на обоих интервалах для всех нетривиальных (D, C, B) конфигураций пар сравниваемых интервалов.

Конфигурация D: P(i2f>i1) = (i2f – L)/S, где S = R – L. .2

1)(

1)(

212 R

L

LzdzS

IIP

Таким образом, в этом случае Kas(I2 I1) = 0.

Конфигурация C: P(i2f>i1) = P(L1< i1 < L2) + P(L2 < i1 < i2f) = (i2f – L1)/S1, где S1 = R1 – L1. Поэтому (S2 = R2 – L2)

.2

2)(

1)(

2

2 1

1221

2112

R

L S

LLRLzdz

SSIIP

Отсюда Kas(I2 I1) = (R2 – R1 + L2 – L1)/S1 = 2(<I2> – <I1>)/S1, где <I2> и <I1> математические ожидания случайных величин на интервалах I2 и I1 соответственно: <Ii> = (Ri + Li)/2. Таким образом, в случае вложенных интервалов при равномерных распределениях вероятностей на них нормированная разность математических ожиданий (при правильно выбранной нормировке) совпадает с шансами предпочтительности проверяемой гипотезы.

Конфигурация B: Здесь целесообразнее использовать соотношение Kas(I2 I1) = 1 – 2P(I1 I2). P(i1>i2f) = = (R1 – i2f)/S1, и

.)(

1)(2

1)(1

2 21

221

121

12

R

L SS

LRzRdz

SSIIKas

Здесь шансы предпочтительности второго интервала не выражаются через средние величины. Для этого случая коэффициент уверенности всегда положителен (второй интервал теоретически предпочтительнее первого), поскольку его числитель равен R1(R2 – R1) + L2(R1 – L2) – L1(R2 – L2), его минимальное значение достигается при L1 = L2 и равно положительной для этой конфигурации величине (R2 – R1)(R1 – L2).

Пусть теперь на первом интервале задано равномерное распределение, а на втором треугольное. Вспомним, что плотность треугольного распределения вероятностей имеет вид (M – мода распределения)

RzMMR

zR

MzLLM

Lz

LRzf

,

, ,2

)(

Для конфигурации D: P(i2f>i1) = (i2f – L)/S,

.3

2)]/())(()/()([

2)( 2

212 S

LRMMRLzzRdzLMLzdz

SIIP

M

L

R

M

Тогда Kas(I2 I1) = (2M– L– R)/(3S) = 2(<I2> – <I1>)/S, <I2> = (L + M + R)/3. Если определить положение моды соотношением M = (1 – h)L + hR, то Kas(I2 I1) = (2h – 1)/3 и зависит только от положения моды треугольного распределения. Вновь величина искомых шансов может быть (при правильно выбранной нормировке) выражена через разность средних величин.

Конфигурация C: Здесь

)./(]))(())((

[2)( 212

12

2

1212

2

2

SSMR

LzzRdz

LM

LzLzdzIIP

R

M

M

L

Отсюда следует, что Kas(I2 I1) = 2[(M + R2 + L2)/3 – (R1 + L1)/2]/S1 = 2(<I2> – <I1>)/S1. Конфигурация B: Вновь, как и выше, P(i1>i2f) = (R1 – i2f)/S1. Необходимо различать случаи M ≥ R1 и M < R1. В первом случае при интегрировании по всем возможным i2 присутствует только левая ветвь плотности вероятности треугольного распределения, а во втором обе ветви. Тогда, при M ≥ R1

Page 47: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

347

)(3

)(21

))((41)(

221

321

2

21

2112

1

2LMSS

LR

LM

LzzRdz

SSIIKas

R

L

А при M < R1

,))(())((

[2

)(1

2 2

21

2

21

2112

R

M

M

L MR

zRzRdz

LM

LzzRdz

SSIIP

и, следовательно,

)].23()(

)23)([(3

21)(21)( 12

2

21

21221

1212 RMRMR

MRLMRLM

SSIIPIIK

Видно, что здесь величина коэффициента уверенности не равна с точностью до нормировки разности соответствующих средних.

Пусть теперь на обоих сравниваемых интервалах заданы треугольные распределения.

Конфигурация D. Здесь при сравнении фиксированных значений i2f со значениями i1 первые могут быть больше моды треугольного распределения M1, заданного на I1, или меньше его: i2f ≥ M1 или i2f < M1. При i2f < M1 P(i2f>i1) = (i2f – L)/[S(M1 – L)], а при i2f ≥ M1 P(i2f>i1) = 1 – (R – i2f)2/[S(R – M1)]. Возможны два расположения мод распределений на сравниваемых интервалах: M1 ≥ M2 или M1 < M2. Рассмотрим случай первого расположения мод. Проходя слева направо по I2, i2 обегает пути 1: M1 > M2 > i2; 2: M1 > i2 > M2 и, наконец, 3: i2 > M1 > M2. Тогда для пути 1 имеем (напомним, что M1 ≥ M2):

.)(2

)(

))((

)(2)( 1

12

32

21

3

212

2

D

M

L

FLMS

LM

LMLM

Lzdz

SIIP

Для пути 2:

.]42

)2)((

)(3

)2)(([

))((

2

))((

)()(2)(

2

42

41

222

21

212

32

31

212

21

2

212

1

2

D

M

M

FMMRLLMM

MMRLLRMM

MRLMSMRLM

zRLzdz

SIIP

Для пути 3:

.]2

1[)(

)(]

)(

)(1[

2)( 3

1

2

21

21

2

12

1

D

R

M

FS

MR

MRS

MR

MR

zR

MRS

zRdz

SIIP

Следовательно, P(I2 I1) = F1D + F2D + F3D, а Kas(I2 I1) = 2P(I2 I1) – 1.

Соответствующие соотношения для случая M1 < M2 следуют из того факта, что для этой конфигурации Kas(I2 I1|M1 = A, M2 = B) = – Kas(I2 I1|M1 = B, M2 = A), A ≥ B. И P(I2 I1|M1 = A, M2 = B) + P(I2 I1|M1 = = B, M2 = A) = 1.

Конфигурация C. Здесь P(I2 I1) = P(L1 < i1 < L2) + P(i2 > i1|i1, i2 [L2, R2]). Необходимо различать случаи различного положения мод распределений. Пусть вначале M1 < L2. Тогда P(L1 < i1 < L2) = 1 – (R1 – L2)2/[S1(R1 – M1)]. А на интервале [L2, R2] P(i2f>i1) = [(R1 – L2)2 – (R1 – i2f)2]/[S1(R1 – M1)]. Это означает, что (при i2f = z)

2

2

2

2

))(()(

2))((

)(

2]),[,|( 21

22221

222222112

R

M

M

L

zRizdzPMRS

LzizdzPLMS

RLiiiiP

И, таким образом, при M1 < L2 имеем:

Page 48: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

348

.)(3

)4)((61)(

111

212222222

22

21

12 MRS

MRRLMRLRLRIIK

При M1 > R2, действуя точно так же, получаем:

.1)(3

)4)((6)(

111

212222222

22

21

12

LMS

MLRLMRLRLLIIK

Пусть теперь L2 < M1 < R2. Тогда P(L1 < i1 < L2) = (L2 – L1)2/[S1(M1 – L1)] = F1C. Следует различать случаи, когда L2 < M1 < M2, и когда M2 < M1. При L2 < M1 < M2 P(i2f>i1| i2f < M1) = [(i2f – L1)2 – (L2 – L1)2]/[S1(M1 – L1)] = =G1(i2f), P(i2f>i1| i2f > M1) = 1 – (L2 – L1)2]/[S1(M1 – L1)] – (R1 – i2f)2]/[S1(R1 – M1)] = G2(i2f). Тогда

.)](

3

)2)((

2

)()()2)((

4[

))((

2))((

)(

2)],,[,|(

221221

1232

31

221

21221

21

22

21

42

41

22112121

22221222112

1

2

C

M

L

FLMLL

LLLMLMLLLLLLMLM

LMLMSSLzzdzG

LMSiMRLiiiiP

.)(

2)]}(

3

)2)((

2

)2)((

4[

)(

1

2

)()(

])(

)(1{[))((

)(

2)],,[|(

3222

12221

1232

31

2121

21

22

41

42

111

221

222

111

212

22222

1222212

2

1

C

M

M

i

FLMS

MMLRRLMM

LRRMMMM

MRS

LMLM

LMS

LLLzzdzG

LMSMiMRLiiiP

.})(

1)](

3

)2)((

2

)2)((

4[]

)(

)(

1[2

)({

)(

2))((

)(

2)|(

4111

1222

1

1232

3221

21

22

22

42

42

111

212

222

22222

2222212

2

2

C

R

M

FMRS

MRRR

RRMRRRRMRRM

LMS

LL

MR

LMSzRzdzG

MRSiMiiP

P(I2 I1) = F1C + F2C + F3C + F4C. Kas(I2 I1) = 2P(I2 I1) – 1.

При L2 < M2 < M1, действуя точно так же, получаем:

.)](3

)2)((

2

)()()2)((

4[

))((

2

))(()(

2)],,[,|(

522221

1232

32

222

21221

21

22

22

42

42

221121

21222

21222112

2

2

C

M

L

FLMLLLLLM

LMLLLLLLMLM

LMLMSS

LzzdzGLMS

iMRLiiiiP

.))((

2)](

3

)2)((

2

)2)((

4)(

2

)()([

))(()(

2)],,[,|(

6112221

21221

1232

31

1221

21

22

42

412

12

222

212

21222

221222112

1

2

C

M

M

FLMMRSS

MMRLLRMM

LRLMMMMLL

MRMR

zRzdzGMRS

MiMRLiiiiP

Page 49: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

349

.]3

)2)((2

2)(2

)2)([())((

1]

)(

)(1[

)(

)(

))(()(

2)],,[,|(

712

31

32

41

42

122

12

212

12

122

221121111

212

222

212

22222

21222112

2

1

C

R

M

FRRMRMR

MRRR

RRRMRMRMRSSLMS

LL

MRS

MR

zRzdzGMRS

iMRLiiiiP

P(I2 I1) = F1C + F5C + F6C + F7C. Kas(I2 I1) = 2P(I2 I1) – 1.

Конфигурация B. Пусть M1 < L2, а M2 > R1. Вновь, как и выше, целесообразнее использовать соотношение

Kas(I2 I1) = 1 – 2P(I1 I2). P(i1>i2f| i1, i2 [L2, R1]) = (R1 – i2f)2/[S1(R1 – M1)]. Используя ту же технику, что и ранее, получаем:

].3

)2)((2

22

))(()2)([(

))(()(

212122

21

22

1

22

2121

212

121221121

2112

LRLRLR

LRLRLR

LRRLRLMMRSS

LRIIP

В случае M1 < L2, M2 < R1 имеем:

]}.3

)2)((2

2

))(()2)((2[

3

)2)((2

22

))(()2)({(

)(

1)(

21122

122

22

2121

212

12122

122

21212222

22

22

1

22

2222

212

1221121

12

RRRMRM

MRMRRRRMRRR

MR

MRLRLMLM

LRLMLM

LRRLMMRSS

IIP

При M1 > L2, M2 > R1 P(i1> i2f| i1, i2 [L2, R1], i2f < M1) = 1 – (i2f – L1)2/[S1(M1 – L1)], P(i1 > i2f| i1, i2 [L2, R1], i2f > >M1) = (R1 - i2f)2/[S1(R1 – M1)]. Тогда

]}.3

)2)((2

2)2)(()(2[

1

3

)2)((2

22

))(()2)({(

)(

1

)(

)()(

2132

31

42

41

2121

22

21212

21

11

21112

12

1

22

1

21

2111

212

1112221222

221

12

LLLM

LMLLLLMLMLL

LM

LRRMRM

LRMRMR

LRRMRLMSSLMS

LMIIP

Аналогичные формулы для случая M1 > L2, M1 < M2 < R1 имеют вид:

]2

)2)((

3

2)((2)(2[

))((

1}

1]

3

)2)((2

2)2)(()(2[

1]

2)

2)((3

)2)((2)(2{[

)(

1

)(

)()(

42

412

12122

21

2132

31

2122

122112111

2132

31

41

42

212

122

21212

21

11

42

412

1

122

21

2132

31

21221

2221222

221

12

MRRRRMR

RRMRMRRR

MRMRSSMR

LRMM

MMLRRMMMMLR

LM

LML

LLLMLLLM

LMLLLMSSLMS

LMIIP

Наконец, для случая M2 < M1 получаем:

Page 50: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

350

.]2)2)((3

))(2(2

2

))(([

)(

1

)(

)(1)(

122121

2122

2222

2212

22

2222

1121222

212

121

BFLLLLLLMLMLMLL

LMLM

LMSSMRS

MRIIP

.)]2)(()(2

3

)2)((2

2[

))((

1)(

22121

22

21212

21

1232

31

42

41

221121122

BFRLLMMMMRL

LRMMMM

MRLMSSIIP

.)]2)(()(2

3

)2)((2

2[

))((

1)(

32121

21

21112

21

1231

31

41

41

221121123

BFRRRRMMRRR

RRMRRM

MRMRSSIIP

И Kas(I2 I1) = 1 – 2P(I1 I2).

Пример расчета коэффициента уверенности

В предыдущем разделе мы показали, что в ряде простых случаев (например, в случаях задания равномерных распределений на сопоставляемых интервалах, а в некоторых случаях и для комбинации равномерного и треугольного распределений) решения задачи сравнения интервальных альтернатив предлагаемым методом и на базе правильно нормированной разности средних для распределений вероятности совпадают. Ни в одном другом случае использование средних оценок не позволяет провести корректное сравнение интервальных альтернатив, поскольку при этом нельзя оценить риск принятия неверной гипотезы. Действительно, как видно из таблицы 1, сравнение по критерию разности математических ожиданий ΔAv правильно описывает тенденцию (знаки величин в столбцах ΔAv и Kas(I2 I1) совпадают), однако сделать заключение о шансах истинности проверяемой гипотезы I2 I1 по этому критерию на наш взгляд невозможно. Не представляется возможным также подобрать единый нормирующий множитель для критерия ΔAv, который приводил бы к значениям искомых шансов. Нельзя отыскать и риск принятия ложной гипотезы, измеряемый вероятностью P(I1 I2), в то время как эта величина просто вычисляется по значениям коэффициента уверенности.

Таблица 1. Сравнение интервальных альтернатив для треугольных распределений

№ п/п Интервал 1 Интервал 2

L1 R1 M1 L2 R2 M2 Kas(I2 I1) ΔAv

1 50 100 90 70 170 80 0.70 26.70

2 50 100 60 70 170 160 0.98 63.30

3 50 100 75 70 170 120 0.96 45.00

4 50 100 75 50 100 75 0.00 0.00

5 50 100 90 50 100 60 -0.49 -10.00

6 50 100 60 50 100 90 0.49 10.00

7 70 170 75 80 150 145 0.52 20.00

8 70 170 160 80 150 100 -0.59 -23.30

9 70 170 120 80 150 115 -0.15 -5.00

Page 51: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

351

Заключение

При работе с интервальными оценками качества альтернатив лица, принимающие решения, в процессе решения задач выбора в условиях неопределенности часто предпочитают заменить неопределенную интервальную оценку детерминированной точечной. Помимо оценок математического ожидания при этом используются и другие точечные оценки, такие как коэффициенты «пессимизма – оптимизма» Гурвица [Hurwicz, 1951] и детерминированные эквиваленты теории ожидаемой полезности [Keeney, 1993]. Однако в силу неопределенности будущего исхода критериальная оценка не должна, как показано в настоящей работе, выражаться одним числом и, как следствие, всегда присутствует риск того, что принимаемое решение окажется неверным. Адекватный задаче метод сравнения должен позволять соизмерить шансы проверяемой гипотезы о предпочтительности и противоположной ей. В ряде отдельных простых случаев, как мы показали на примере оценок математического ожидания, разность точечных оценок при надлежащей нормировке действительно может быть использована для анализа шансов истинности гипотезы о предпочтительности одной из сравниваемых альтернатив. Так ли это для других типов точечных оценок еще предстоит проверить. Вместе с тем уже сейчас ясно, что в случае конфигураций пар сравниваемых альтернатив и распределений вероятностей на них общего вида необходимо использовать специализированные методы вычисления упомянутых шансов.

Благодарности

The paper is published with financial support by the project ITHEA XXI of the Institute of Information Theory and Applications FOI ITHEA (www.ithea.org) and the Association of Developers and Users of Intelligent Systems ADUIS (www.aduis.com.ua).

Библиография

[Hurwicz, 1951] Hurwicz L. Optimality criteria for decision making under ignorance. ‘Cowles Commission Discussion Paper’, Statistics, # 370, New Haven. 1951.

[Keeney, 1993] Keeney R., Raiffa H. Decisions with Multiple Objectives: Preferences and Value Tradeoffs. Cambridge University Press. 1993.

[Shepelyov, 2011] Shepelyov G., Sternin M. Methods for comparison of alternatives described by interval estimations// International Journal of Business Continuity and Risk Management. 2011. Vol. 2, No. 1. Pp.56-69.

[Смоляк, 2011] Смоляк С.А. О сравнении альтернатив со случайным эффектом. // Экономика и мат. методы. 1996. Т. 32. Вып. 4.

[Стернин, 2011] Стернин М.Ю, Шепелев Г.И. Сравнение интервальных альтернатив. // Труды Института системного анализа Российской академии наук. 2011. Т. 61, вып. 2. Cс. 7 – 11.

[Стернин, 2012] Стернин М.Ю., Шепелев Г.И. Оценка интервальных альтернатив: неопределенности и предпочтения. //International journal “Information models and analysis”. 2012. V.1, No 4. Pp. 357 – 369.

Информация об Авторах

Михаил Стернин – старший научный сотрудник Института системного анализа Российской академии наук, Россия, 117312, Москва, просп. 60-летия Октября, 9, ИСА РАН; e-mail: [email protected]

Геннадий Шепелёв – заведующий лабораторией ИСА РАН; e-mail: [email protected]

Page 52: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

352

АКСИОМАТИЧЕСКИЙ ПОДХОД К СУЖЕНИЮ МНОЖЕСТВА ПАРЕТО: ВЫЧИСЛИТЕЛЬНЫЕ АСПЕКТЫ

Владимир Ногин

Аннотация: Обсуждаются вычислительные аспекты аксиоматического подхода к решению проблемы сужения множества Парето на основе определённой числовой информации об отношении предпочтения лица, принимающего решение (ЛПР). Этот подход развивается автором, начиная с 1983 г. Его применение предполагает принятие определённых четырёх аксиом «разумного» поведения ЛПР в процессе принятия решений. Предполагается, что в дополнение к указанным аксиомам известны некоторые сведения об отношении предпочтения ЛПР («кванты» информации). На основе этих сведений можно сократить множество Парето и, тем самым, облегчить последующий выбор выбираемых (наилучших) решений. Прослеживается эволюция развития аксиоматического подхода и формулируется алгоритм учёта произвольного конечного набора «квантов» информации об отношении предпочтения ЛПР. Работа алгоритма проиллюстрирована примером.

Ключевые слова: множество Парето, многокритериальный выбор, сужение множества Парето

ACM Classification Keywords: F.4.3 – Decision problems

Введение

В 1983 г. автор выступил с докладом на одной из Всесоюзных конференций по принятию решений [Ногин, 1983]. С этого момента начинается развитие подхода, основанного на использовании определённой числовой информации об отношении предпочтения ЛПР и предназначенного для удаления из числа возможных тех решений, которые заведомо не могут быть выбранными (наилучшими). Указанная информация состоит из конечного набора пар несравнимых по отношению Парето векторов, относительно которых ЛПР может определённо сказать, какой именно вектор пары предпочтительнее другого вектора. Впоследствии подобного рода информация была названа автором набором «квантов» информации об отношении предпочтения, а сам подход получил наименование аксиоматического, поскольку в его основе лежит принятие нескольких аксиом «разумного» поведения ЛПР, ограничивающих класс рассматриваемых бинарных отношений предпочтения ЛПР. В книге [Ногин, 1986] автором было введено словосочетание проблема сужения множества Парето и подробно развит аксиоматический подход для решения этой проблемы в случае двух критериев. В работе [Noghin, 1990] рассмотрение было продолжено в общем случае произвольного конечного числа критериев. Существенное развитие данный подход получил в работе [Noghin, 1996], где впервые в самом широком классе многокритериальных задач (в которых на векторную функцию и допустимое множество не накладывается никаких ограничений) было установлено, что любое множество выбираемых решений содержится в «новом» множестве Парето, которое можно построить с использованием «нового» векторного критерия, число компонент которого не менее размерности «старого» критерия. Тем самым, для искомого множества выбираемых решений (векторов) была построена оценка сверху в виде указанного «нового» множества Парето. Эта оценка в

Page 53: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

353

существенной степени зависит как конкретного вида «кванта» используемой информации, так и имеющихся в наличии векторного критерия и множества допустимых решений. В крайних случаях эта оценка может состоять как из одноэлементного множества (тогда окончательный выбор определён однозначно), так и совпадать с исходным множеством Парето (т.е. не приводить к его сужению). Впоследствии автором и его учениками был получен целый ряд результатов подобного типа. С их помощью можно осуществлять сужение множества Парето с использованием того или иного набора «квантов» информации. Место рассматриваемого аксиоматического подхода в числе прочих, предназначенных для сужения множества Парето, а также его взаимосвязь с ними, была проанализирована в [Ногин, 2006]. На данный момент можно констатировать, что в принципе аксиоматический подход получил своё окончательное завершение, поскольку недавно [Ногин, Басков, 2011; Ногин, 2013] появились алгоритмы, с помощью которых можно построить «новый» векторный критерий при наличии любого конечного непротиворечивого набора «квантов» информации.

Далее рассматриваются основные этапы эволюции аксиоматического подхода с точки зрения вычислительных аспектов, связанных с построением «новых» векторных критериев, на основе которых можно построить оценку сверху для произвольного множества выбираемых решений.

Задача многокритериального выбора. Аксиомы разумного выбора

Последующее рассмотрение связано с задачей многокритериального выбора, включающей произвольный

числовой векторный критерий f и произвольное непустое множество возможных (допустимых) решений

(вариантов) X . Множество выбираемых решений (векторов) будем обозначать ))(()( YCXC . Эти

множества являются решением задачи многокритериального выбора и подлежат нахождению. Кроме того, в данной задаче присутствует бинарное отношение предпочтения , которое является продолжением на

всё критериальное пространство mR отношения предпочтения ЛПР, заданного на множестве

)(XfY . Это отношение на практике обычно неизвестно, однако считается, что оно удовлетворяет

следующим четырём аксиомам.

Аксиома 1. Для любой пары векторов Yyy , , удовлетворяющих соотношению yy ,

выполнено )(YCy .

Аксиома 2. Отношение является транзитивным.

Аксиома 3. Каждый из критериев mfff ,...,, 21 согласован с отношением предпочтения в том

смысле, что для каждого i и любых двух векторов mRyy , , таких, что

),...,,,,...,( 111 miii yyyyyy , ),...,,,,...,( 111 miii yyyyyy , ii yy ,

верно yy .

Аксиома 4. Отношение предпочтения является инвариантным относительно линейного

положительного преобразования, т.е. для любых mRc ,0 из соотношения yy следует

справедливость cycy для всех векторов Yyy , .

Первая аксиома представляет собой некоторое уточнение понятия множества выбираемых решений. Остальные аксиомы среди всех возможных выделяют определённый достаточно широкий класс бинарных отношений. В целом, приведённая аксиоматика отражает такое поведение ЛПР в процессе принятия решений, которое вполне можно охарактеризовать, как «разумное». Заметим, что в

Page 54: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

354

сформулированных аксиомах на множество возможных вариантов X и векторный критерий f никаких

ограничений не накладывается.

Сужение множества Парето на основе «квантов» информации

Приведём определение, лежащее в основе рассматриваемого аксиоматического подхода.

Определение 1. Пусть имеется некоторая пара парето-оптимальных векторов yy , , не связанных друг

с другом отношением , т.е. существуют такие два непустых подмножества номеров критериев

},...,2,1{, mIBA , что

Aiwyyyy iiiii 0, , Bjwyyyy jjjjj 0,

)(\, BAIsyy ss .

В этом случае, если выполнено yy , то говорят, что задан «квант» информации об отношении

предпочтения с параметрами )(),( BjwAiw ji .

Очевидно, наличие данного «кванта» в силу Аксиомы 1 даёт возможность сократить множество Парето на

один элемент y . Такое сужение множества Парето, как правило, не облегчает процесса выбора.

Однако, благодаря Аксиомам 1−4, действительное сужение множества Парето оказывается более значительным. А именно имеет место следующее утверждение.

Теорема 1 (Ногин, 2005). В предположении выполнения Аксиом 1– 4 для любого множества выбираемых вариантов C(X), справедливы включения

)()()( XPXPXC fg , (1)

причём «новый» векторный критерий g формируется из функций if для всех BIi \ и

jiijij fwfwg для всех BjAi , .

Таким образом, для учёта «кванта» информации, следует пересчитать исходный векторный критерий по

указанной формуле, а затем построить новое множество Парето )(XPg . Это множество и будет оценкой

сверху для искомого множества )(XC , которая является более точной, чем )(XPf .

Определение 2. Пусть имеется два «кванта» информации с множествами 11, BA и 22 , BA . Если все эти

множества попарно не пересекаются, то данная информация называется взаимно независимой. В противном случае она – взаимно зависима.

Это определение легко распространяется на случай любого конечно набора «квантов» информации.

В случае взаимно независимой информации для её использования в целях сужения множества Парето можно применять Теорему 1 столько раз, сколько потребуется. Однако если информация в виде конечного набора квантов информации является взаимно зависимой, то указанный способ непригоден. В каждом подобном случае необходимо отдельное исследование.

В монографии [Ногин, 2005] содержится целый ряд утверждений, в которых указываются формулы

пересчёта исходного векторного критерия f для учёта некоторых простейших наборов «квантов»

взаимно зависимой информации.

В статье [Климова, Ногин 2006] изучается ситуация, когда имеется набор из двух «квантов» взаимно

зависимой информации с множествами 11, BA и 22 , BA , причем 21 BA и 12 BA , а

Page 55: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

355

остальные возможные попарные пересечения - пустые. Установлены условия, когда этот набор является непротиворечивым, а также выписан «новый» векторный критерий g , при котором имеют место

включения (1). Прикладная многокритериальная задача, в которой для сужения множества Парето используется указанный набор «квантов», рассматривается в работе [Климова, 2007].

В работах [Захаров, 2011; Захаров 2012] исследован вопрос непротиворечивости и учёта так называемой замкнутой информации об отношении предпочтения. Простейшим примером такого рода информации служит ситуация, когда имеется набор из трёх «квантов», причём

}{},{},{ 322131 kABjABiBA . Для нового векторного критерия g , при котором имеет

место (1), Захаровым А.О. получены соответствующие формулы. Кроме того, разработанный подход был распространён на общий случай непротиворечивой замкнутой информации, когда групп критериев любое конечное число, причём сами это группы содержат более одного элемента.

В [Ногин, 2009; Ногин, 2010] аналогичные вопросы исследованы для набора так называемой информации точечно-множественного, а также множественно-точечного типа.

Невозможно получить конечные формулы для пересчёта векторного критерия с целью учёта п р о и з в о л ь н о г о конечного набора непротиворечивых «квантов» информации и построения нового множества

Парето )(XPg , являющегося в силу (1) более точной оценкой сверху для неизвестного множества

выбираемых вариантов, чем исходное множества Парето. Однако удалось разработать алгоритмы подобного пересчёта. Эта задача была решена в [Ногин, Басков, 2011; Ногин, 2013].

Алгоритмы построения критерия g в случае произвольного конечного набора «квантов»

В [Ногин, 2005] было указано, что благодаря инвариантности отношения предпочтения задание «квантов»

информации об отношении предпочтения ЛПР равносильно указанию набора векторов mk Ruu ,...,1 ,

обладающих тем свойством, что среди компонент каждого вектора имеется хотя бы одна положительная

и по крайней мере одна отрицательная компоненты, причём 0iu , ki ,...,1 . Там же была

сформулирована задача выпуклого анализа, состоящая в разработке алгоритма, позволяющего строить внутренние нормали к (m-1)-мерным граням выпуклого телесного конуса, порождённого векторами

kuu ,...,1 совместно с единичными векторам пространства mR . Собственно, решение этой задачи

выпуклого анализа и даёт возможность сформировать новый векторный критерий g , с помощью которого

определяется множество )(XPg и, таким образом, учитывать конечный набор «квантов» информации в

процессе выбора.

Одним из алгоритмов отыскания указанных выше внутренних нормалей может служить алгоритм Моцкина-Бургера [Черников, 1968], предназначенный для построения общего решения конечной системы линейных неравенств. Мы его здесь обсуждать не будем.

Автором был разработан геометрический подход к построению внутренних нормалей конечнопорождённого телесного конуса. На вход этого алгоритма подаётся конечный набор векторов

kaa ,...,1 , порождающих телесный выпуклый конус, а на выходе (в памяти) образуется набор nbb ,...,1 , с

помощью которого выписывается новый векторный критерий, множество Парето относительно которого будет представлять собой сужение исходного множества Парето на основе произвольного конечного набора «квантов» информации.

Page 56: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

356

Шаг 1 (открытие цикла по перебору векторов). Открыть цикл по переменной i от 1 до 1mkC генерирования

всех возможных поднаборов из 1m векторов набора kaa ,...,1 .

Шаг 2 (проверка на линейную независимость). Если текущий i-й поднабор )1(1,..., mii aa , выбранный из kaa ,...,1 , линейно зависим, то увеличить номер i на единицу и вернуться к началу шага 2. Когда

увеличение номера i невозможно, т.е. i = 1mkC , необходимо перейти к шагу 5. В противном случае, т.е.

когда указанный поднабор линейно независим, выполнить шаг 3.

Шаг 3 (построение ортогонального вектора). Образовать из вектор-столбцов поднабора )1(1,..., mii aa

квадратную матрицу D n-го порядка, приписав к указанным столбцам справа любой вектор из множества

},...,{\},...,{ )1(11 miiki aaaaI , образующий вместе с )1(1,..., mii aa линейно независимую систему.

Найти последний столбец обратной матрицы матрицы 1)( TD , где T – символ транспонирования.

Найденный вектор-столбец (обозначим его iy ) следует запомнить.

Шаг 4 (проверка вектора yi на принадлежность искомому множеству nbb ,...,1 ). Вычислить скалярные

произведения ij ya , для всех векторов ij Ia . Если хотя бы одно такое скалярное произведение

окажется отрицательным, то удалить из памяти вектор yi. Увеличить номер i на единицу и перейти на шаг 2 (когда такое увеличение невозможно, – выполнить шаг 5).

З а м е ч а н и е. Для сокращения перебора и исключения записи в памяти одинаковых (с точностью до положительного множителя) искомых векторов для каждого записанного в память yi, на шаге 4 следует

запоминать соответствующий ему набор Yi из всех векторов kaa ,...,1 , ортогональных вектору yi (т.е. тех

aj, для которых 0, ij ya ). А на шаге 2 всякий раз в случае, когда текущий поднабор )1(1,..., mii aa

оказывается подмножеством хотя бы одного образованного ранее множества Yi, пропускать такой поднабор, сразу увеличивая номер i на единицу.

Шаг 5 (формирование нового векторного критерия). В результате выполнения полного цикла по переменной i в памяти будут записаны вектор-столбцы, которые в ходе выполнения алгоритма

записывались в память как yi. Обозначим все эти векторы через nbb ,...,1 . Необходимо построить

векторный критерий по формуле g(x)= ))(,,...,)(,( 1 xfbxfb n .

Нижеследующая теорема указывает способ применения описанного алгоритма.

Теорема 2 (Ногин, 2013). Пусть выполнены Аксиомы 1 - 4 и задан непротиворечивый набор «квантов»

информации в форме векторов kuu ,...,1 , для которых выполнено 0Yiu , ki ,...,1 . Тогда для

любого множества выбираемых вариантов C(X) выполняются включения (1), где векторный критерий g(x) (n ≥ m), построен в результате применения описанного выше алгоритма к набору, состоящему из

векторов kuu ,...,1 , задающих «кванты» информации, вместе с m единичными ортами пространства mR .

Согласно теореме, применяя алгоритм, следует построить новый векторный критерий g, множество Парето относительно которого даст оценку сверху (1) для неизвестного множества выбираемых вариантов C(X) с учётом выявленного набора «квантов» информации.

Хотя приведённый выше алгоритм является чисто переборным, что ведёт в общем случае к довольно большому объёму вычислительной работы, тем не менее, как показывает нижеследующий пример, в

Page 57: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

357

случае относительно небольшого числа критериев и «квантов», им можно воспользоваться «вручную», т.е. без привлечения компьютера.

Иллюстративный пример

Пусть 2,3 km , 0)1,3,2(1 u , 0)1,1,4(2 u . Применим описанный алгоритм для

формирования нового векторного критерия. В соответствии с теоремой 2 на вход алгоритма следует

подать набор из пяти векторов },,,,{ 21321 yueee , где )1,0,0(),0,1,0(),0,0,1( 321 eee .

Длина цикла алгоритма будет равна 1025 C .

Рассмотрим первый поднабор из двух векторов },{ 21 ee . Очевидно, ортогональным к этим векторам

является вектор }{ 3e , причем 13, ue 23 , ue = 01, 33 ee . Следовательно, на основании

утверждения вектор 31 ey следует запомнить.

Перейдём ко второму поднабору },{ 31 ee . Вектор 2e ортогонален обоим векторам рассматриваемого

поднабора, но 03, 12 ue и 01, 22 ue . Это означает, что вектор 2e запоминать не

следует.

Теперь рассмотрим },{ 32 ee . Здесь для ортогонального вектора 1e выполняется 02, 11 ue ,

04, 21 ue . Поэтому данный вектор тоже должен быть пропущен.

Для набора },{ 11 ue в качестве ортогонального вектора можно взять, например, )3,1,0( . Поскольку

01),3,1,0( 2 e , 04),3,1,0( 2 u , данный вектор также пропускаем.

Для набора },{ 12 ue можно выбрать вектор )2,0,1(2 y , который следует запомнить. Далее

аналогично, нетрудно проверить, что для набора },{ 13 ue можно запомнить, например, вектор

)0,2,3(3 y , для набора },{ 21 ue – вектор )1,1,0(4 y , для набора },{ 22 ue ортогональный вектор

следует пропустить, для набора },{ 23 ue – запомнить вектор )0,4,1(4 y и, наконец, после

рассмотрения набора },{ 21 uu можно запомнить вектор )10,6,4(5 y .

В итоге найдены пять векторов 51,..., yy . Им отвечает новый векторный критерий g с компонентами

)()( 31 xfxg , )(2)()( 212 xfxfxg , )(2)(3)( 213 xfxfxg , )()()( 324 xfxfxg ,

)(10)(6)(4)( 3215 xfxfxfxg . Согласно сформулированной выше теореме, множество Парето

относительно этого 5-мерного критерия будет являться более точной оценкой для неизвестного множества выбираемых векторов (вариантов), чем исходное множество Парето.

Чтобы получить конкретный результат, выберем в качестве Y, например, следующее конечное множество

},,,{ 4321 yyyyY , где

1 (1, 4.5, 2)y 2 (2, 3, 1)y

3 (3, 2, 1.5)y 4 (5, 1.5, 2)y

Нетрудно видеть, что все эти векторы парето-оптимальны. Простые вычисления показывают, что

)}9,5.3,19,9,2(),9,5.3,13,7,5.1(),16,4,12,4,1(),11,5.6,5.17,5,2{()( Yg . В этом

множестве второй и третий векторы не являются парето-оптимальными. Следовательно,

Page 58: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

358

))(()(ˆ XPfYP g = },{ 41 yy , т.е. после использования имеющейся информации множество Парето

сократилось в 2 раза.

Заключение

В работе рассмотрены вычислительные аспекты аксиоматического подхода к решению проблемы сужения множества Парето на основе числовой информации об отношении предпочтения ЛПР в виде так называемых «квантов». К настоящему времени получены формулы, по которым легко пересчитать векторный критерий, если имеется набор определённых «квантов». Установлено, что множество Парето относительно этого критерия является оценкой сверху для неизвестного множества выбираемых вариантов, более точной, чем исходное множество Парето. В общем случае наличия произвольного конечного набора «квантов» информации конечные формул получить не удаётся, однако можно воспользоваться специальными алгоритмами. Один из таких алгоритмов связан с именами Моцкина и Бургера, второй разработан автором. Приведено описание второго алгоритма и рассмотрен иллюстративный пример его работы.

Благодарность

Автор выражает признательность ITHEA International Scientific Society и Российскому Фонду Фундаментальных Исследований (проект № 11-07-00449) за финансовую поддержку.

Литература

1. Захаров А.О. Сужение множества Парето на основе взаимно зависимой информации замкнутого типа // Искусственный интеллект и принятие решений. 2011. № 1. С. 95-109.

2. Захаров А.О. Сужение множества Парето на основе замкнутой информации о нечётком отношении предпочтения лица, принимающего решения// Вестник Санкт-Петербургского университета. Сер. 10: Прикладная математика. Информатика. Процессы управления. 2012. Вып. 3. С. 33-47.

3. Климова О.Н., Ногин В.Д. Учёт взаимно зависимой информации об относительной важности критериев в процессе принятия решений// Журнал вычислительной математики и математической физики. 2006. Т. 46, № 7. С. 2179-2191.

4. Климова О.Н. Задача выбора оптимального химического состава судостроительной стали\\ Известия РАН. Теория и системы управления. 2007. № 6. С. 66-70.

5. Ногин В.Д. Оценки для множества оптимальных решений в условиях отношения предпочтения, инвариантного относительно линейного положительного преобразования// Тезисы докладов на IV Всесоюзном семинаре по исследованию операций и системному анализу «Принятие решений в условиях многокритериальности и неопределённости», М.− Батуми: 1983. С. 37.

6. Ногин В.Д. и др. Основы теории оптимизации. М.: Высшая школа, 1986.

7. Noghin V.D. Estimation of the set of nondominated solutions// Numerical Functional Analysis and Applications. 1991. V. 12, No 5&6, P. 507-515.

8. Noghin V.D. Relative importance of criteria: a quantitative approach// J. Multi-Criteria Decision Analysis. 1997. No 6, P. 355-363.

9. Ногин В.Д. Принятие решений в многокритериальной среде: количественный подход (2-е изд., исправленное и дополненное). М.: Физматлит. 2005.

10. Ногин В.Д. Проблема сужения множества Парето: подходы к решению//Искусственный интеллект и принятие решений. 2008. № 1. С. 98-112.

Page 59: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

359

11. Ногин В.Д. Сужение множества Парето на основе информации о предпочтениях ЛПР точечно-множественного типа // Искусственный интеллект и принятие решений. 2009. № 5, С. 1-16.

12. Ногин В.Д. Сужение множества Парето на основе информации о предпочтениях ЛПР множественно-точечного типа // Искусственный интеллект и принятие решений, 2010, № 2, С. 54-63.

13. Ногин В.Д., Басков О.В. Сужение множества Парето на основе учёта произвольного конечного набора числовой информации об отношении предпочтения// Доклады Академии Наук РФ (информатика). 2011. Т. 438, № 4, С. 1-4.

14. Ногин В.Д. Алгоритм сужения множества Парето на основе произвольного конечного набора «квантов» числовой информации//Искусственный интеллект и принятие решений. 2013, №1 (в печати).

15. Черников С.Н. Линейные неравенства. М.: Наука, 1968.

Информация об авторе

Владимир Ногин – профессор Санкт-Петербургского государственного университета, Санкт-Петербург, 198504, Петродворец, Университетский пр. 35, Россия; e-mail: [email protected], web-page: http://www.apmath.spbu.ru/ru/staff/nogin/

Основная область научных интересов: принятие решений при многих критериях, многокритериальная оптимизация

Page 60: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

360

ПРИМЕНЕНИЕ МЕТОДОВ ПСЕВДООБРАЩЕНИЯ К ЗАДАЧАМ ОПТИМИЗАЦИИ СТРУКТУР

Григорий Кудин

Abstract: We present analytical expressions for the perturbations of pseudoinverse and projection matrices pozvolyayuschienahodit solutions of optimal synthesis of linear systems with fuzzy parameters of the task. В работе приводятся аналитические выражения для возмущений псевдообратных и проекционных матриц позволяющиенаходить решений задач оптимального синтеза линейных систем с нечётко задаными параметрами.

Keywords: возмущения псевдообратных и проекционных матриц оптимальный синтез линейных систем.

ACM Classification Keywords: Computing Methodologies. Simulation and modeling. optimum synthesis

Введение

Многочисленные задачи, возникающие при решении современных проблем цифровой обработки информации: распознавание образов, кластеризации, построения ассоциативной памяти, обучения нейрокомпьютеров, анализа и решения систем уравнений, сводятся к исследованию линейных моделей линейные. Современные требования к математическим методам, применяемым для этих целей, существенно повысились: необходимо учитывать неопределённость, нечёткость, противоречивость в задании параметров моделей, возможность учитывать многофакторность и многокритериальность оптимизационных постановок задач, другие усложняющие процесс решения задач обстоятельства. В часности, современный взгляд на проблему решения системы линейных алгебраических уравнений (СЛАУ) порождает проблему анализа точности представления исходной информации, учёта вычислительных погрешностей и т. п. [Волошин, Кудин, 2010]. Одним из направлений исследования СЛАУ – анализ конечномалых возмущений линейных моделей в процессе её численного решения (анализ, исследование) [Кудин, 2010]. Альтернативным подходом является получение аналитических зависимостей влияния малых возмущений на решение с дальнейшей численной реализацией. Последний подход основан на математическом аппарате теории псевдообратных матриц [Алберт], дополненный новыми результатами: обратные формулы Гревиля, аналитическое представление возмущений псевдообратных матриц при возмущении элементов исходных матриц или изменении самой структуры матриц [Кириченко, 1997 , 2001, 2009]. В предлагаемой работе обобщены результаты по методам нахождения производных от псевдообратных матриц [Кудин Г] и получены аналитические представления возмущений псевдообратных и проекционных матриц, вызванных возмущениями исходных матриц. Приведены примеры вычислительной полезности их для оптимизации решений СЛАУ, синтеза линейных систем.

Будут приняты следующие способы представления матрицы

Page 61: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

361

nmRA : .1,1,11

nm

njmiij

Tm RaaanaaA

где ninijii

mTmjijj RaRja ),...,...,(,),...,...,( 1)(1 , mi ,1 , nj ,1 .

Для матрицы nmRA псевдообратная по Пенроузу [8] матрица nmRA определяется соотношением:

,minarg)(

2

bx

m

A

xbARb

где 2

min)( bAxArgbnRx

A

.

В практике применения псевдообращения важными являются проекционные матрицы, которые

определяются и вычисляются с использованием матриц A и A :

1. проекционная матрица AAAP )( - ортогональный проектор на подпространство TAL ,

порождённое векторами – строками матрицы A , т.е. на подпространство значений TA ;

2. проекционная матрица AAAP T )( - ортогональный проектор на подпространство AL ,

порождённое векторами - столбцами матрицы A , т.е. на подпространство значений A ;

3. проекционная матрица )()( APIAZ n - ортогональный проектор на подпространство,

ортогональное подпространству TAL ;

4. проекционная матрица )()( Tm

T APIAZ - ортогональный проектор на под-

пространство, ортогональное подпространству AL ;

5. матрица TAAAR )()( , матрица AAAR TT )()( - R - операторы.

Псевдообращение при возмущении элементов исходной матрицы.

Формулы возмущения псевдообратной и проекционных матриц в условиях матричного возмущения предоставляют возможность получить формулы псевдообращения при условии возмущения отдельных

элементов матрицы A . Ниже подаются и исследуются такие формулы.

Пусть для матрицы nmRA вида (1), известна её псевдообратная матрица mnRA , для которой

введены обозначения:

mn

mjniij

Tn RpppmppA

,1,111 ,

,),...,...,( 1nT

njijj Rpppjp mj ,1 , mTimijii Rpppp ),...,...,( 1)( , ni ,1 .

Если элемент ij матрицы nmRA изменяется на некоторую величину Rij , т.е. она приобретает

возмущённый вид )(~

ijAAA .

Возмущение )( ijA можно представить в матричном виде ,)()()( jeieA Tnmijij где векторы

nn Rje )( , m

m Rie )( единичные векторы.

Page 62: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

362

Возникает задача - определить влияние возмущение такого вида на элементы псевдообратной матрицы AAA ij

~)( на представление возмущений Z - проекционных матриц

)()~

(),( AZAZAZ ij , )()~

(),( TTij

T AZAZAZ , а также возмущений для R -

операторов )()~

(),( ARARAR ij , )()~

(),( TTij

T ARARAR .

Очевидно, что составляющие матрицы возмущений )( ijA - векторы )(iem и )( jeTn - это векторы,

соответствующие векторам a и Tb матричных возмущений к матрице A в работе [Кириченко, 1997].

Таким образом, задача описания псевдообращения для поэлементно возмущённой матрицы сводится к рассмотрению четырёх вариантов линейной зависимости или независимости от векторов – столбцов и

векторов - строк матрицы A векторов )(iem и )( jeTn соответственно. Условия линейной зависимости

векторов )(iem и )( jeTn от векторов – столбцов и векторов - строк матрицы A имеют вид

0)()( ieAZie mTT

m , 0)()()( jeAZje nTn соответственно.

С учётом представлений для Z - проекционных матриц mm

тТ RAAIAZ )()( , nn

n RAAIAZ )()( , эти условия переписываются в виде:

1)( 0)()( )( ipameAZme Tii

TTi , .1)(0)()()( )( japneAZne T

jjTj

При этом условия линейной независимости векторов )(iem и )( jeTn от векторов – столбцов и векторов -

строк матрицы A принимают вид 1)()( ipaTi .

Теорема. Если для матрицы nmRA известна её псевдообратная матрица mnRA и некоторый

её элемент ij изменяется на величину Rij , то формулы возмущений для псевдообратной и

проекционных матриц имеют следующий вид:

1) если 1)()( ipaTi , 1)()( japT

j , т.е. когда векторы )(mei и )(neTj линейно независимы от

векторов – столбцов и векторов - строк матрицы A соответственно:

)1

()()()()()( )(ij

jiTT

ijT

jjTT

iij pAZmeneAZpneAZAZmeipA

,

,)()(),( AZneneAZAZ Tjjij ,)()(),( TT

iiT

ijT AZmemeAZAZ

ipipApneAZAZnepAAR TTTjj

Tjjij )()( )()(),(

)1

)()()(()()(2

)(ij

jiTj

Tj

Tjjj pAZneipipneAZAZneneAZp

2)1

()()(ij

jiTjj pAZneneAZ

,

2) если 1)()( ipaTi , 1)()( japT

j , т.е. когда вектор )(mei линейно зависим от векторов - столбцов,

а вектор )(neT

j линейно независим от векторов - строк матрицы A :

Page 63: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

363

AAKA ijij ),()( , 12)(

),(22

ijijij

T

ijpip

kkAK

, )()( neipk jij ;

)()(12)(

),(22 nene

pip

kkAZ T

jj

ijijij

T

ij

,

)()(12

),(22

)(

memepp

kkAZ T

ii

ijjiijj

TTT

ijT

, )()( mepk ijijT ;

),()(),())(( ijnijnij AKIARAKIAAR .

3) если 1)()( ipaTi , 1)()( japT

j

и при этом 1ijjip , т.е. когда векторы )(mei и )(neTj линейно зависимы от векторов –

столбцов и векторов – строк матрицы A соответственно, а ранг возмущённой матрицы

)()( nemeA Tjiij падает:

.1)())()(( AranknemeArank Tjiij

Для этого случая

)(2

)(

)(

2)()(

)(

)(

)(

)()())((

j

T

j

Tj

T

ijp

p

ip

ip

p

ppAA

ip

ipipAAA jj

))(

)((

)(

)(

ip

ipA

p

p T

j

Tj ,

)(

)(

)(

)(),(

j

Tj

ijp

p

ip

ipAZ , 2

)(

)( )(),(j

Tj

ijT

p

ppAZ j ,

Tijij

T

ijT

ijij AAAAAAAR )())((())(())((),( .

4) если 1)()( ipaTi , 1)()( japT

j и при этом 1ijjip , т.е. когда векторы )(mei и )(neTj

линейно зависимы от векторов - строк и векторов - столбцов матрицы A соответственно, а ранг

возмущённой матрицы )()( nemeA Tji не падает: ).())()(( AranknemeArank T

jiij

Для этого случая

ijji

Tj

ijij p

pipA

1)( )( , 0),(),( ij

Tij AZAZ ,

ipipp

pippAApip

pAR T

ijji

jijTj

TTj

ijji

ijij 2

2

)(2

)()( )1()(

1),(

,

Очевидно, что малые возмущения элемента ij матрицы A при условиях линейной независимости от

векторов – строк и векторов - столбцов матрицы A векторов )(mei и )(nej соответственно, могут

существенно изменить псевдообратную матрицу A - в формуле есть слагаемое обратно

пропорциональное величине возмущения. Как следствие, могут существенно измениться также R -

Page 64: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

364

операторы - матрицы )(,)( TARAR . Проекционные матрицы )(,)( TAZAZ при возмущении

элемента ij исходной матрицы A не изменяются.

Малые возмущения элемента ij матрицы A , соответствующие второму случаю, вызвают малые

возмущения для псевдообратной матрицы A , а также для всех проекционных матриц.

Возмущения элемента ij матрицы A при условиях линейной зависимости от векторов - строк и

векторов - столбцов матрицы A векторов )(mei и )(nej соответственно, обуславливают независимые

от ij возмущения для псевдообратной матрицы A , а также для проекционных матриц

)(,)( TAZAZ и взвешенной проекционной матрицы )(AR .

Возмущения элемента ij матрицы A при условиях линейной зависимости от векторов - строк и

векторов - столбцов матрицы A векторов )(mei и )(nej соответственно, удовлетворяющими условию

(64), изменяют элементы псевдообратнщй матрицы A и проекционных матриц )(,)( TARAR

пропорционально возмущению элемента ij матрицы A , проекционные матрицы )(,)( TAZAZ при

этом не изменяются.

Численный эксперимент

Полученные зависимости псевдообратной матрицы A от возмущений )( ijA исходной матрицы A ,

позволяют аналитически, в явном виде, вычислять возмущённые псевдообратные матрицы, используя

только невозмущённый её прообраз, величину возмущения и свойства векторов )(mei и )(nej .

Ниже рассмотрены фрагменты решения таких задач:

1. минимизация нормы главного решения системы линейных алгебраических уравнений;

2. приближение псевдорешения системы линейных алгебраических уравнений к желаемому решению.

1. Пусть задана система линейных неоднородных алгебраических уравнений (СЛАУ)

yxA , где nmRA - действительная матрица вида (1), nRx , mRy .

Согласно теории псевдообратных и проекционных матриц известно, что

1) при выполнении условия 0)( yAZy TT система уравнений совместна;

2) при выполнении условия 0det AAT решение (псевдорешение) системи уравнений единственное;

3) множество решений ( псевдорешений ) системы описывается формулой nRvvAZyAx ,)(ˆ .

При этом так называемое главное решение СЛАУ:

yAAAyAAAyAx TTTTгл

)()( 1 ,

в котором для случая квадратной невырожденной матрицы A имеет место равенство 1 AA .

Page 65: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

365

В задачах управления линейными дискретными системами [Бублик] возникает необходимость выбора параметров математической модели так, чтобы найти минимальное возможное значение функции, которая определяет норму управления - норму главного решения некоторого СЛАУ, т.е. функции

yARyAD TTгл )

~()

~( .

Предполагается, что элемент ij матрицы A изменяется на некоторую величину Rij , выполняются

условия четвёртого случая возможных возмущений, т.е. )()()( nemeA Tjiijij и при этом векторы

)(mei и )(neTj линейно зависимы с вектор - столбцами и вектор - строками матрицы A

соответственно ( 0),(,0),( jjzniizm ), а также 1ijjip . Задача сводится к нахождению в

окрестности нулевого значения возмущения ij такого 0 , чтобы

0)())((),,( 00 ADAADAD глглijгл ,

т.е. чтобы 0),(),,( 00 yARуAD TTijгл ,

Используя представление для возмущённого R - оператора несложно получить

221 )

1(

1),,(

ijij

ij

ijij

ijijijгл p

gp

gAD

,

где ,,,,22

222111 jглijT

i xiplqlgpAylqlg jT

jглT

i pyxyipq ),( ,

jглx - j – ая компонента главного решения системы .

Исследование функции ),,( ijijгл AD усложнено наличием параметров, поэтому целесообразно

ограничиться некоторыми подмножествами их значений. Если предположить, что

,0,0,0,0 1221 lplllppij 0iq ,

то будет иметь место неравенство 0),,( ijijгл AD при )2/(20 1210 plllij . Более того,

если )/(0 1211 plllij , то функция ),,( ijijгл AD монотонно убывает к значению

22

11 /),,( llqAD iijгл .

2. Задача формулируется так: необходимо определить возможное возмущение элемента ij матрицы

A так, чтобы уменьшить расстояние главного решения СЛАУ (70) - yAx ˆ от некоторого заданного

вектора *x , т.е. минимизировать функцию )()()( ** yAxyAxAD T .

Как и прежде, предполагается, что элемент ij матрицы A изменяется в соответствии с условиями

четвёртого случая возможных возмущений, т.е. )()()( nemeA Tjiijij и при этом векторы

)(mei и )(neTj линейно зависимы с вектор - столбцами и вектор - строками матрицы A

соответственно ( 0),(,0),( jjzniizm ), а также 1ijjip .

Решение задачи можно свести к решению задачи на минимум нормы главного решения соответствуюшей

СЛАУ. Действительно, если ввести дополнительно вектор *y :

Page 66: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

366

** Axy ,то будет иметь место тождество

))(()()()()( **** yyARyyyAxyAxAD TTT Таким образом после введения вектора

yyy * исследование проводится по схеме исследования функции нормы главного решения

системы линейных алгебраических уравнений.

Выводы

Псевдообращение является мощным методом исследования в прикладных задачах, дающим возможность конструктивного описания решений задач, расширяющим возможности при исследовании проблемы оптимизации структуры математической модели. Метод возмущения псевдообратных матриц в настоящей работе распространён на определение аналитической зависимости возмущений элементов псевдообратных и проекционных матриц от возмущений отдельных элементов исходной матрицы. Полученные зависимости найдут в дальнейшем применение при решении задач синтеза линейных моделей, оптимизации алгоритмов цифровой обработки информации, аппроксимации функций, прогноза временных процессов.

Библиография

[Алберт]Алберт А. Регрессия, псевдоинверсия, рекуррентное оценивание. /Пер. с англ. –М.: Наука, 1977.305 с.

[Бублик] Бублик С.Б , Кудін Г.І., Задачі керування лінійними системами з дискретним аргументом і крайовими умовами// Колективна монографія ‘Сучасні методи та інформаційні технології математичного моделювання, аналізу і оптимізації складних систем’. – 2006. - Київ: КНУ.- 198 c. – С. 73-92.

[Волошин, Кудин, 2010] Волошин А, Кудин В., Кудин Г. Методы анализа малых возмущений линейных моделей // Natural and Artificial Intelligence, ЇТНЕА, Sofia, 2010. - P. 41-47.

[Кириченко, 1997 ] Кириченко Н.Ф. Аналитическое представление возмущений псевдообратных матриц. // Кибернетика и системный анализ. – 1997.–№2.–С.98-107.

[Кириченко, 2001] Кириченко Н.Ф.,Лепеха Н.П. Возмущение псевдообратных и проекционных матриц и их применение к идентификации линейных и нелинейных зависимостей. //Проблемы управления и информатики.–2001.-№1.-С.6-22

[Кириченко, 2009] Кириченко Н.Ф., Кудин Г.И. Анализ и синтез систем классификации сигналов средствами возмущений псевдообратных и проекционных операций // Кибернетика и системный анализ. – 2009. – №3. – С. 47-57

[Кудин Г] Кудін Г.І. Псевдообернені матриці: функції та їх похідні // Журнал обчислювальної та прикладної математики -2003., №2(89),--С. 66-70

[Кудин, 2010] Кудин В., Богаенко В. О принятии решений при анализе малых возмущений линейных моделей // Information Models of Knowledge, ITHEA, Kiev-Sofia, 2010. - P. 226-231.

Сведения об авторе

Григорий Кудин – кандидат физико-математичкских наук, профессор, Киевский национальный университет имени Тараса Шевченка, Украина, 01017 Киев, ул. Владимирская, 64, е-mail: [email protected]

Сфера научных интересов: теория линейных систем, псевдообращения матри;, цифровая обработка информации,

Page 67: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

367

МОДАЛЬНЫЕ ЛОГИКИ ЧАСТИЧНЫХ ПРЕДИКАТОВ И СЕКВЕНЦИАЛЬНЫЕ СИСТЕМЫ ЛОГИЧЕСКОГО ВЫВОДА В ЭТИХ ЛОГИК

Оксана Шкильняк

Аннотация: Исследованы программно-ориентированные логические формализмы – транзиционные композиционно-номинативные модальные логики частичных эквитонных предикатов. Описаны семан-тические модели и языки чистых первопорядковых транзиционных модальных логик. Для таких логик построены исчисления секвенциального типа, доказаны корректность и полнота этих исчислений.

Ключевые слова: модальная логика, предикат, логический вывод, секвенциальное исчисление.

ACM классификация ключевых слов: F.3.1 Specifying and Verifying and Reasoning about Programs; F.4.1 Mathematical Logic – Proof theory

Вступление

Для описания и моделирования разнообразных аспектов деятельности человека с большим успехом ис-пользуются модальные логики, в первую очередь темпоральные и эпистемические. Аппарат темпораль-ных логик успешно применяется для моделирования динамических систем, спецификации и верификации программ (см., напр., [Logic 2008]). На базе этих логик построен ряд систем и языков спецификаций (Temporal Logic, TLA+, TLS, StateCharts, GIL, CSP и др.). Эпистемические логики используются для описания интеллектуальных информационных систем, экспертных систем, баз данных и баз знаний.

Традиционные модальные логики базируются на классической логике тотальных конечно-арных предика-тов. Однако классическая логика имеет существенные ограничения, что затрудняет ее использование в информатике и программировании. Она недостаточно учитывает неполноту, частичность, структурирован-ность информации о предметной области. Это мотивирует необходимость построения новых, програм-мно-ориентированных логических формализмов модального типа. Такими являются композиционно-номи-нативные модальные логики (КНМЛ) частичных предикатов. КНМЛ строятся базе предложенного М.С. Ни-китченко композиционно-номинативного подхода, они синтезируют возможности традиционных модаль-ных логик и композиционно-номинативных логик частичных квазиарных предикатов [Нікітченко, 2008]. Важнейшим классом КНМЛ являются транзиционные модальные логики (ТМЛ), они отражают аспект изме-нения и развития предметных областей, описывая переходы от одного состояния мира к другому. В рам-ках ТМЛ естественным образом можно рассматривать традиционные модальные логики. Подклассами ТМЛ являются мультимодальные (ММЛ) и темпоральные (ТмМЛ) композиционно-номинативные логики. Частными случаями ММЛ являются эпистемические КНМЛ (ЭМЛ) и общие ТМЛ (ОТМЛ). Различные клас-сы ОТМЛ, ТмМЛ и ММЛ изучались в [Шкільняк, 2009], [Shkilniak, 2009], [Нікітченко, 2011], [Шкільняк, 2012].

Целью данной работы является исследование семантических свойств чистых первопорядковых ТМЛ экви-тонных предикатов и построение для этих логик исчислений секвенциального типа. Такие исчисления формализуют отношения логического следствия для множеств специфицированных состояниями формул. Для предложенных исчислений доказаны теоремы корректности и полноты.

Page 68: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

368

Понятия, которые здесь не определены, понимаем в смысле работ [Нікітченко, 2008; Нікітченко, 2011].

Композиционно-номинативные модальные системы

Для облегчения чтения укажем вначале основные понятия и определения.

Будем писать f(d), если значение f(d) определено, и f(d), если f(d) не определено.

Для первопорядковых КНЛ предикаты задаются на именных множествах – множествах пар, первая компо-нента которых – имя, а вторая – его значение. Формально V-именное множество (V-ИМ) над A – это

однозначная функция вида : V A. Здесь V и A – множества предметных имен и предметных значений.

V-ИМ представляем в виде [v1a1, ..., vnan, ...], где vіV, aіA. Класс всех V-ИМ над A обозначим VA.

Для ИМ вводим функцию asn : VA2V таким образом: asn() = {vV | va для некоторого aA}.

Введем операцию наложения d1d2 = d2 {vad1 | vasn(d2)}.

Операцию реноминации 1

1

,...,,...,

n

n

v vx xr : VА VA зададим так: 1

1

,...,,...,

n

n

v vx xr (d) = d [v1d(x1),...,vnd(xn)].

Запись вида y1,…, yn сокращенно запишем как y . Тогда реноминации сокращенно обозначим в виде vxr .

V-квазиарным предикатом на множестве A назовем однозначную частичную функцию вида Р : VA {T, F}.

Здесь {T, F} – множество истинностных значений.

Областью истинности и областью ложности V-квазиарного предиката Р на A назовем множества

T(P) = {dVA | P(d) = T} и F(P) = {dVA | P(d) = F}.

V-квазиарный предикат P частично истинный, если для произвольных dVA имеем P(d) = T или P(d).

V-квазиарный предикат P эквитонный, если из условия P(d) и d d следует P(d) = P(d).

Имя xV несущественно для эквитонного предиката P, если для произвольных dVA и a, bA из условия

P(dxa) и P(dxb) следует P(dxa) = P(dxb).

Понятие композиционно-номинативной модальной системы (КНМС) является центральным понятием КНМЛ. КНМС – это объект вида M = (Cms, Fт, Jт), где Cms – композиционная модальная система (КМС), Fm –множество формул языка КНМЛ, Jт – отображение интерпретации формул на состояниях.

КМС задают семантические аспекты мира, это семантические модели реляционного типа. КМС имеют вид

Cms = (S, R, Pr, C), где S – множество состояний мира, R – множество отношений на S вида S Sn, Pr – множество предикатов на состояниях мира, C – множество композиций на Pr. Такое C определяется базовыми модальными композициями и базовыми общелогическими композициями соответствующего

уровня. Для чистых первопорядковых логик базовые общелогические композиции – это , , R ,vx x.

Логические связки , и композиция реноминации Rvx задаются следующим образом:

T(P) = F(P); F(P) = T(P);

T(PQ) = T(P)T(Q); F(PQ) = F(P)F(Q);

T(Rvx (P)) =

vxr (T(P)); F(R v

x (P)) = vxr (F(P)).

Для первопорядковых КНМЛ конкретизируем S как множество алгебр (алгебраических систем) данных

вида = (A, Pr), где Pr – множество эквитонных частичных предикатов вида VA {T, F}. Тогда

Page 69: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

369

S

A A – множество всех базовых данных мира,

S

Pr Pr – множество предикатов всех состояний

мира.

Назовем транзиционной модальной системой (ТМС) КНМС, в которой R состоит из отношений вида

S S. Трактуем как отношения перехода (достижимости) на состояниях.

ТМС с базовыми модальными композициями {Кi | iI} и R = {i | iI}, где каждому i сопоставлено Кi ,

назовем мультимодальными (ММС). ТМС с единственной базовой модальной композицией

(необходимо), в которых R= {}, назовем общими (ОТМС). ТМС, в которых R= {}, а базовые модальные

композиции – это (всегда будет) и (всегда было), назовем темпоральными (ТмМС).

Для ОТМС и ТмМС также можно задать дуальные модальные композиции (возможно), (когда-то

будет), (когда-то было): Р, Р, Р означают Р, Р, Р соответственно.

В зависимости от свойств отношений перехода можно определять различные классы ТМС. Традиционно рассматривают случаи рефлексивности, симметричности или транзитивности этих отношений. Если в

ММС все i рефлексивные, то в названии ММС запишем символ R; если все i транзитивные, то запишем

T; если все i симметричные, запишем S. Таким образом, получим следующие чистые типы ММС:

R-ММС, T-ММС, S-ММС, RT-ММС, RS-ММС, TS-ММС, RTS-ММС.

Аналогично получаем соответствующие классы ТмМС и ОТМС:

R-ОТМС, T-ОТМС, S-ОТМС, RT-ОТМС, RS-ОТМС, TS-ЗОТМС, RTS-ОТМС;

R-ТмМС, T-ТмМС, S-ТмМС, RT-ТмМС, RS-ТмМС, TS-ТмМС, RTS-ТмМС.

Для ММС возможны и более сложные, смешанные типы.

Например, 1 симметрично, 2 транзитивно и рефлексивно, 2 рефлексивно и т.п.

ММС с конечными множествами однотипних отношений перехода назовем эпистемическими. Они явля-ются семантическими моделями эпистемических КНМЛ.

Языки чистых первопорядковых ТМС. Алфавит языка составляют: множество V предметных имен

(переменных); множество Ps предикатных символов (ПС); символы базовых композиций , , ,vxR x;

множество Ms символов базовых модальных композиций (модальная сигнатура).

Множество Fm формул языка определяется индуктивно:

FA) каждый pPs – (атомарная) формула;

FL) пусть , Fт; тогда , , ,vxR xFт;

FM) пусть Fт, Ms; тогда Fт.

В случае ММС имеем Ms = {Кi | iI}, тогда п. FM принимает вид:

FК) пусть Fт, Кi Ms; тогда Кi Fт.

Для ОТМС Ms = {}, тогда п. FM принимает соответствующий вид:

FG) пусть Fт, тогда Fт.

Для ТмМС имеем Ms = {, }, п. FM примет вид:

FT) пусть Fт; тогда , Fт.

Page 70: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

370

Зададим отображение Im : Рs S Pr интерпретации атомарных формул на состояниях, при этом

Imт(p, ) Pr . Такое Im продолжим до отображения интерпретации Jm : Fm S Pr. При этом

Jm(, ) Pr.

IA) Jт(p, ) = Iт(p, ) для всех pPs;

IL) Jт(, ) = (Jт(, )); Jт(, ) = (Jт(, ), Jт(, )); ( , ) R ( ( , ));v vx xJm R Jm

Jт(x, )(d)

, если ( , )( ) для некоторого ,

, если ( , )( ) для всех ,

неопределено в остальных случаях.

T Jm d x a T a A

F Jm d x a F a A

В случае ММС добавим следующий пункт:

IК) Jт(Кi , )(d)

, если ( , )( ) для всех : ,

, если существует : и ( , )( ) ,

неопределено в остальных случаях.

i

i

T Jm d T S

F S Jm d F

Если для не существует такого , что i , то Jт(Кi , )(d) для каждого dVA.

В случае ТмМС добавляем пункт:

IT) Jm(, )(d)

, если ( , )( ) для всех : ,

, если существует : и ( , )( ) ,

неопределено в остальных случаях.

T Jm d T S

F S Jm d F

Jm(, )(d)

, если ( , )( ) для всех : ,

, если существует : и ( , )( ) ,

неопределено в остальных случаях.

T Jm d T S

F S Jm d F

Если для не существует такого , что , то Jт(, )(d) для каждого dVA; если для не

существует такого , что , то Jт(, )(d) для каждого dVA.

Тип ТМС определяется ее модальной сигнатурой Мs, однотипностью отношений из R для каждого Мs и сигнатурой синтетической несущественности [Нікітченко, 2008].

Предикат Jт(, ) – значение формулы в – обозначим .

истинна в ТМС M (обозначим M |= ), если предикат частично истинный для каждого S.

истинна (обозначим |= ), если M |= для всех ТМС M одного типа.

ТМС сокращенно обозначаем в виде (S, R, А, Jт).

Можна выделить [Шкільняк, 2009] ТМС с сильным условием определенности на состояниях, названные St-ТМС, и ТМС с общим условием определенности на состояниях, названные Gn-ТМС. Модальные компо-зиции St-ТМС не сохраняют [Шкільняк, 2009] эквитонность предикатов, что может нарушить информаци-онную монотонность. В то же время модальные композиции Gn-ТМС условие эквитонности сохраняют.

Теорема 1. | v vx xR R для каждого Ms.

Итак, модальные композиции можно проносить через реноминации. В то же время взаимодействие мо-дальных композиций и кванторов более сложно.

Теорема 2. |= x x и |= x x для каждого Ms.

Page 71: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

371

В то же время [Шкільняк, 2009] имеем | x x и | x x.

Формула xx известна как формула Баркан. Формула xx – это ее конверсия, она опровергается на некоторых реляционных моделях традиционной модальной логики, но в то же время (теорема 2) эта формула истинна в каждой общей ТМС. Однако противоречия здесь нет, потому что в таких моделях неопределенность трактуется как ложь, а мы рассматриваем частичные предикаты.

Отношение логического следствия для множеств формул. Рассмотрим отношение логического след-

ствия для множеств специфицированных состояниями формул. Такие формулы имеют вид , где –

формула, – её спецификация (отметка), которую трактуем как имя состояния мира.

Пусть M – ТМС с множеством состояний S, – множество специфицированных состояниями формул, в котором спецификации (имена состояний) составляют множество S.

Множество согласовано с ТМС M, если задана инъекция S в S.

Пусть и – множества специфицированных формул.

- логическое следствие в согласованной с ними ТМС M (обозначим |=M ), если для всех dVA из

условия (d) = T для всех следует невозможность Ψ(d) = F для всех Ψ.

Далее в записи |=M подразумеваем согласованность M с и .

- логическое следствие относительно ТМС определенного типа (обозначим |= ), если |=M для всех ТМС M определенного типа.

Рассмотрим основные свойства отношения |=M. Не связанные с модальностями свойства повторяют соот-ветствующие свойства логического следствия для множеств формул логики эквитонных предикатов. Это

свойства типа , , RT, N, RR, R, R (см., напр., [Шкільняк, 2012]), к которым добавляем:

С) если , то |=M ;

U) пусть и . Тогда |=M |=M ;

Rp|) ( ) ,x

yR x |=M х, |=M ;

Rp|) |=M , ( )xyR x |=M , х;

RR|) ,

, ( ) ,u xv yR x |=M ( ) ,u

vR x |=M ;

RR|) |=M , ,, ( )u x

v yR x |=M , ( ) ;uvR x

R|) , ( )vxR |=M , ( )v

xR |=M , где Ms;

R|) |=M , ( )vxR |=M , ( ) ,v

xR где Ms.

Свойства, связанные с элиминацией кванторов:

R|–) ( ) ,uvR x |=M ,

, ( ) ,u xv yR |=M (здесь yVT, ynm(, , ( ))u

vR x );

|–) х, |=M ( ) ,xyR |=M (здесь уVT и упт(, ,));

R–|) |=M , ,, ( ) ,u x

v yR ( )uvR x |=M , ( )u

vR x ;

–|) |=M , ( ) ,xyR х |=M , х.

Рассмотрим свойства, связанные с элиминацией модальностей. В случае ММС имеем (здесь Кi Ms):

Кi |–) Кi , |=M { | i } |=M ;

Кi –|) |=M , Кi |=M , для всех S таких, что i .

Page 72: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

372

В случае ТмМС получаем:

|–) , |=M { | } |=M ;

–|) |=M , |=M , для всех S таких, что ;

|–) , |=M { | } |=M ;

–|) |=M , |=M , для всех S таких, что .

Указанные свойства (кроме С и U) отношения |= логического следствия для множеств специфицирован-ных состояниями формул индуцируют соответствующие секвенциальные формы исчисления ТМЛ, а свой-ство С задает условие замкнутости секвенции.

Cеквенциальные исчисления первопорядковых транзиционных модальных логик

Построим исчисления секвенциального типа для чистых первопорядковых ТМЛ эквитонных предикатов (в частности, для ММЛ, ТмМЛ, ОТМЛ). Предложенные секвенциальные исчисления индуцированы реля-ционной семантикой этих логик.

В работе будем использовать форму записи секвенций в стиле аналитических таблиц (см. [Смирно-ва, 1996]). Секвенцию понимаем как множество специфицированных формул. Это значит, что каждая фор-

мула секвенции отмечена (специфицирована) слева словом вида |– (|–-спецификация) или –| (–|-специ-

фикация), которое назовем спецификацией состояния. Здесь |– и –| – специальные символы, – имя состояния в котором рассматривается специфицированная формула. Именуем состояния натуральными числами, начальное состояние обозначаем 0. Выделяя формулы с |–-спецификациями и –|-специфика-

циями, секвенции обозначаем в виде |––|.

Секвенции обогащаем построенными на данный момент вывода множествами состояний мира и отноше-ний на состояниях. Секвенциальные формы должны учитывать возможность изменения носителей состо-

яний, поэтому для каждого S нужно указывать построенное на данный момент множество его базовых

данных A. Пусть – множество специфицированных формул, пусть {A}, {A}, … – построенные на данный момент состояния с множествами их базовых данных, M – схема модели мира, т.е. построенные на данный момент отношения достижимости, записанные для имен состояний, St – построенное на дан-ный момент множество имен состояний.

Обогащенные секвенции записываем как // {A}, {A}, … // M, сокращенно // St // M.

Секвенция замкнута, если существуют имя состояния и формула такие, что |– и –|.

Если секвенция |––| замкнута, то |= .

Вывод в секвенциальных исчислениях имеет вид дерева, вершины которого – секвенции. Такие деревья называют секвенциальными.

Правила вывода секвенциальных исчислений – секвенциальные формы, они являются синтаксическими

аналогами соответствующих свойств отношения |=. Базовые формы записываем как

или

.

Секвенциальное дерево замкнуто, если каждый его лист – замкнутая секвенция. Секвенция выводима,

или имеет вывод, если существует замкнутое секвенциальное дерево с корнем – вывод секвенции .

Page 73: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

373

Опишем базовые секвенциальные формы исчислений чистых первопорядковых ММЛ эквитонных предика-тов. Формы, аналогичные соответствующим формам исчислений логики эквитонных квазиарных предика-

тов [Нікітченко, 2008], не меняют схему модели мира, но формы |– и |–R изменяют состояния.

|–RT

|

,| ,

( ), // //M

( ), // //M

vx

z vz x

R A St

R A St; –|RT

|

,| ,

( ), // //M

( ), // // M

vx

z vz x

R A St

R A St;

|–N

|

,| ,

( ), // // M

( ), // // M

vx

y vz x

R A St

R A St, где у(A); –|N

|

,| ,

( ), // // M

( ), // // M

vx

y vz x

R A St

R A St, где у(A);

|–RR

|

,| ,

( ), // //M

( ), // // M

uv

u xv y

R xA St

R xA St, где { }x u ; –|RR

|

,| ,

( ), // // M

( ), // //M

uv

u xv y

R xA St

R xA St, где { }x u ;

|–Rp

|

|

, // // M

( ), // //Mxy

xA St

R xA St; –|Rp

|

|

, // // M

( ), // //Mxy

xA St

R xA St;

Формы типов RT, N, RR, Rp назовем вспомогательными, остальные базовые формы – основные.

|–RR

|

|

(A), // // M

( (A)), // // M

v wx y

v wx y

R St

R R St; –|RR

|

|

(A), // // M

( (A)), // // M

v wx y

v wx y

R St

R R St;

|–R

|-

|-

( ), // //M

( ), // //M

vx

vx

R A St

R A St; –|R

|

|

( ), // // M

( ), // //M

vx

vx

R A St

R A St;

|–R

|

|

( ) ( ), // // M

( ), // //M

v vx x

vx

R A R B St

R A B St; –|R

|

|

( ) ( ), // // M

( ), // //M

v vx x

vx

R A R B St

R A B St;

|–

|

|

, // //M

, // //M

A St

A St; –|

|

|

, // //M

, // //M

A St

A St;

|–

| |

|

, // //M , // // M

, // // M

A St B St

A B St; –|

| |

|

, , // // M

, // //M

A B St

A B St;

|–

|

|

( ), // '// M

, // //M

xzR A St

xA St; –|

| |

|

, ( ), // //

, // //

xyxA R A St M

xA St M;

|–R

,| ,

|

( ), // '//M

( ), // // M

u xv z

uv

R A St

R xA St; –|R

,| | ,

|

( ), ( ), // //

( ), // //

u u xv v y

uv

R xA R A St M

R xA St M.

Для |– и |–R имя z тотально несущественное, при этом znт(, А) для |– и znm(, ( ))uvR xA для |–R,

а к носителю A состояния добавляется новый элемент z.

Формы для пронесения реноминации через модальные операторы (здесь Ms):

|R

|

|

( ), // //M

( ), // //M

vx

vx

R A St

R A St

; |R

|

|

( ), // //M

( ), // //M

vx

vx

R A St

R A St

.

Секвенциальные формы элиминации модальных операторов | Кi и | Кi записываются по-разному в зави-симости от свойств отношений перехода. Традиционно рассматривают случаи, когда эти отношения могут быть транзитивными, рефлексивными или симметричными.

Рассмотрим для примера формы | Кi и | Кi исчислений ММЛ для следующих трех случаев.

Page 74: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

374

1. Общий случай: на i не наложены ограничения. Тогда имеем:

| Кi

| |

|

K , , // //M

K , // //Mi

i

A A St

A St; | Кi

|

|

, // '//M { }

K , // // Mi

i

A St

A St.

Форма | Кi применяется к | Кi A для всех имеющихся в данный момент (согласно схеме модели мира М)

состояний таких, что I . Если таких состояний нет, то вводим новое состояние , полагаем A = A,

затем добавляем I к схеме модели мира М.

Для формы | Кi вводим новое состояние , к схеме модели мира М добавляем I и задаем A = A .

2. Отношение i транзитивное и рефлексивное. Тогда имеем:

| Кi

| | |

|

K , , K , // // M

K , // // Mi i

i

A A A St

A St; | Кi

|

|

, // '//M { }

K , // // Mi

i

A St

A St.

Форма | Кi применяется к | Кi A для всех имеющихся в данный момент (согласно схеме М) состояний

таких, что i . Заметим, что формула | Кi A необходима в силу транзитивности i. В силу

рефлексивности i при первом применении формы | Кi посылка имеет вид | Кi A, |A, // St // M.

Для формы | Кi вводим новое состояние , к М добавляем I , задаем A = A .

3. Отношение i транзитивное, рефлексивное и симметричное. Тогда имеем:

| Кi

| | |

|

K , , K , // // M

K , // // Mi i

i

A A A St

A St; | Кi

|

|

, // '//M { , }

K , // // Mi i

i

A St

A St.

Форма | Кi применяется к | Кi A для всех имеющихся в данный момент (согласно схеме М) состояний

таких, что i или i . Формула | Кi A необходима в силу транзитивности i. В силу рефлексивности

i при первом применении формы | Кi посылка имеет вид | Кi A, |A, // St // M.

Для формы | Кi вводим новое состояние , к М добавляем I и I , задаем A = A .

Базовые секвенциальные формы для случаев ТмМЛ и ОТМЛ задаются аналогично (см. [Шкільняк, 2009]).

Для ТмМЛ операторы и при симметричности действуют идентично, поэтому при условии такой

симметричности темпоральные исчисления идентичны соответствующим исчислениям ОТМЛ.

Принимая во внимание свойства отношения |=, имеем:

Теорема 3. Пусть

| |

| |

// ' // M '

// // M

St

St и

| | | |

| |

// // M // // M

// // M

St St

St – базовые секвенциаль-

ные формы. Тогда имеем:

1) |= |= ; |= и |= |= ; 2) | | ; | | или | .

Page 75: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

375

Корректность и полнота секвенциальных исчислений

Процедура построения вывода секвенции в исчислении ТМЛ в целом аналогична соответствующей проце-дуре для секвенциальных исчислений логик квазиарных предикатов [Нікітченко, 2008]. Рассмотрим её осо-

бенности на примере построения вывода (секвенциального дерева) секвенции |––| в исчислении ММЛ.

Построение дерева ведем одновременно с построением схемы модели мира. Эта схема обновляется в резуль-

тате применения | Кi-форм (в некоторых случаях |Кi-форм), которые прибавляют новые состояния. Постро-ение дерева разбито на этапы. Перед началом построения зафиксируем бесконечный список TN "новых" тотально несущественных имен, не встречающихся в начальной секвенции. Каждое применение формы про-изводится к конечному множеству доступных на данный момент формул. Перед применением основной

формы в случае необходимости применяем нужное количество раз формы типов RT, N, RR, Rp. На

каждом этапе построения сначала выполняем все |–-формы и |–R-формы, при этом берем новый уTN в соответствующем состоянии, затем – оставшиеся основные формы, кроме элиминации модальностей.

Формы –| и |–R применяем многократно для всех имен доступных формул данной секвенции и ее потомков.

Далее выполняем | Кi-формы, а после них многократно (согласно схемы модели мира) | Кi-формы.

Процедура построения завершена положительно, если получили замкнутое дерево. Если же получено конечное незамкнутое дерево либо процедура не может завершиться, то в дереве существует конечный или

бесконечный незамкнутый путь . Каждая из формул секвенции |––| встретится на и станет доступной.

Теорема 4 (корректности). Пусть секвенция |––| выводима. Тогда |= .

Пусть |––| выводима, тогда для нее можно построить замкнутое секвенциальное дерево. Все его листья

– замкнутые секвенции, поэтому для каждого такого листа |––| имеем |= . От листьев дерева к его корню движемся с помощью секвенциальных форм. Согласно теореме 3, отношение |= сохраняется при

переходе от посылок к следствиям форм. Поэтому для каждой вершины секвенциального дерева |––|

имеем |= . В частности, для секвенции |––| – корня дерева – тоже имеем |= .

Для доказательства полноты секвенциальных исчислений ТМЛ используем метод систем модельных мно-жеств [Семантика, 1981].

Система модельных множеств – это пара ({Н | S}, M), где Н – модельное множество состояния , M –

схема моделей мира, заданная множеством отношений R на S. Множества Н определяются условием корректности (индуцируется условием замкнутости секвенции) и условиями перехода (индуцируются выполнением соответствующих форм).

Множество Н специфицированных формул из W = nm(Н) – модельное множество состояния , если

выполняются условие корректности MС и условия перехода M, M, MN, MT, MRR, MRp, MRR, MR,

MR, M, MR, MRК, MК.

MС) Для каждой лишь одна из специфицированных формул |– или –| может принадлежать Н.

M) Если |–Н, то –|Н; если –|Н, то |–Н.

M) Если |–Н, то |–Н или |–Н; если –|Н, то –|Н и –|Н.

MN) Пусть у(); если ,| , ( ) ,y v

z xR H то | ( ) ;vxR H если ,

| , ( ) ,y vz xR H то | ( ) .v

xR H

MT) Если ,| , ( ) ,z v

z xR H то | ( ) ;vxR H если ,

| , ( ) ,z vz xR H то | ( ) .v

xR H

MRR) Если ,| , ( ) ,u x

v yR x H то | ( ) ;uvR x H если ,

| , ( ) ,u xv yR x H то | ( ) .u

vR x H

MRp) Если | ( ) ,xyR x H то |–хН; если | ( ) ,x

yR x H то –|хН.

Page 76: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

376

MRR) Если | ( ( )) ,v wx yR R H то | ( ) ;v w

x yR H если | ( ( )) ,v wx yR R H то | ( ) .v w

x yR H

MR) Если | ( ) ,vxR H то | ( ) ;v

xR H если | ( ) ,vxR H то | ( ) .v

xR H

MR) Если | ( ) ,vxR H то | ( ) ( ) ;v v

x xR R H

если | ( ) ,vxR H то | ( ) ( ) .v v

x xR R H

M) Если |–хН, то существует уW: | ( ) ;xyR H

если –|хН, то для всех уW имеем | ( ) .xyR H

MR) Если | ( ) ,uvR x H то существует уW такое, что ,

| , ( ) ;u xv yR H

если | ( ) ,uvR x H то для всех уW имеем ,

| , ( )u xv yR H (здесь { }x u ).

MRК) Если | (K ) ,vx iR H то | K ( ) ;v

i xR H если | (K ) ,vx iR H то | K ( )v

i xR H (Кi Ms).

MК) Если |– Кi Н, то |–Н для всех S: i ;

если –| Кi Н, то –|Н для некоторого S: i (Кi Ms).

Теорема 5. Пусть – незамкнутый путь в секвенциальном дереве, Н – множество всех специфици-

рованных |– или –| формул секвенций пути , где S, M – объединение всех схем моделей мира

секвенций пути . Тогда НM = ({Н | S}, M) – система модельных множеств.

Для перехода от нижней вершины пути к верхней используется одна из базисных секвенциальных форм. Переходы согласно этих форм соответствуют пунктам определения системы модельных множеств. Каж-

дая непримитивная формула на пути рано или поздно будет разложена согласно соответствующей

секвенциальной форме. Все секвенции пути незамкнуты, поэтому выполняется пункт MС определения системы модельных множеств.

Теорема 6. Пусть НM – система модельных множеств, пусть W = nт(НM). Тогда существуют ММС

M = (S, R, А, Іт) и инъективная функция VA, где |А| = |W| и asn() = W, такие:

1) |–Н () = Т; 2) –|Н () = F.

Доказательство проводим индукцией по сложности формулы согласно построению системы модельных

множеств. Возьмем некоторое множество А такое, что |А| = |W|, и некоторую инъективную функцию VA

из asn() = W. Такая – биекция W на A. Пусть W = nт(Н), тогда А = (W), – биекция W на A.

Сначала определим значения базовых предикатов на и на ИМ вида ( ).vxr

Если |–рН, то зададим р() = Т; если –|рН, то зададим р() = F.

Если | ( ) ,vxR p H то зададим ( ( )) ;v

xp r T если | ( ) ,vxR p H то зададим ( ( )) .v

xp r F

В остальных случаях значение р(d) задаем произвольным образом, учитывая эквитонность и ограничения

несущественности имен: для всех d, h WA таких, что d||-(p) = h||-(p), имеем р(d) = р(h). Заданные

таким образрм значения базовых предикатов продолжим по эквитонности, учитывая условия

несущественности имен, на соответствующие hWA. Понятно, что значения базовых предикатов заданы

однозначно, причем учтена несущественность для р имен у(p).

Page 77: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

377

Для элементарных формул (вида ( )vxR p или атомарных) утверджение теоремы следует из определения

значений базовых предикатов. Шаг индукции доказывается обычным образом. Укажем здесь доказа-

тельство для пунктов M и MК.

Пусть |–хН. В силу определения НM существует уW такое, что | ( ) .xyR H По предположению

индукции ( ( )) ( ) .xyR T Отсюда (х(у)) = Т. Но (у)А согласно уW, поэтому для а = (у)А

имеем (ха) = Т, откуда (х)() = Т.

Пусть –|хН. В силу определения НM тогда | ( )xyR H для всех уW. По предположению

( ( )) ( )xyR F для всех уW. Отсюда (х(у)) = F для всех уW. Но каждое bА имеет вид

b = (у) для некоторого уW, ведь определяет биекцию : WA. Отсюда (хb) = F для всех

bА, откуда (х)() = F.

Пусть |– Кi Н, где КiMs. По определению НM имеем |–Н для всех таких, что i . По предпо-

ложению индукции тогда () = Т для всех таких, что i . По определению Кi имеем (Кi )() = T.

Пусть –| Кi Н, где КiMs. По определению НM имеем –|Н для некоторого такого, что i . По

предположению индукции () = F. Отсюда в силу определения Кi имеем (Кi )() = F.

На основании теорем 5 и 6 получаем теорему полноты.

Теорема 7 (полноты). Пусть |= . Тогда секвенция |––| выводима.

Предположим обратное: |= (т.е. |=M для каждой согласованной ММС M) и секвенция |––|

невыводима. Если |––| невыводима, то в секвенциальном дереве для |––| существует незамкнутый

путь. В силу теоремы 5 тогда НM = ({Н | S}, R) – система модельных множеств (здесь Н – множество

всех специфицированных |– или –| формул секвенций этого пути, R – множество отношений на S). В силу

теоремы 6 существуют ММС M = (S, R, А, Im) и VA такие, что |–Н () = Т и

–|Н () = F. В частности, это верно для формул секвенции |––|. Поэтому для всех име-

ем () = Т и для всех Ψ имеем Ψ() = F. Это отрицает |=M . Итак, предположение о невыво-

димости |––| неверно, что и доказывает теорему.

Заключение

В работе исследованы программно-ориентированные логические формализмы модального типа – транзиционные композиционно-номинативные модальные логики частичных эквитонных предикатов. Выделены важные подклассы таких логик – мультимодальные, темпоральные, эпистемические, общие транзиционные. Описаны семантические модели и языки чистых первопорядковых транзиционных модальных логик, рассмотрены основные семантические свойства, в частности, свойства отношения логического следствия для множеств специфицированных состояниями формул. Используя эти свойства, для таких логик предложены исчисления секвенциального типа. Характерной их особенностью является использование упрощенных форм элиминации модальностей и форм элиминации кванторов под реноминациями. Для построенных исчислений доказаны теоремы корректности и полноты.

Page 78: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

378

Литература

[Logics, 2008] Logics of Specification Languages. EATCS Series, Monograph in Theoretical Computer Sciens. Eds. D. Bjorner and M.C. Henson. – Heidelberg: Springer, 2008. – 624 p.

[Shkilniak, 2009] Shkilniak O.S. Composition nominative modal and temporal logics // INFORMATICS 2009: international conference: proceedings. – Herl'any, Slovakia, 2009. – P.148–153.

[Нікітченко, 2008] Нікітченко М.С., Шкільняк С.С. Математична логіка та теорія алгоритмів. – К.: ВПЦ Київський універ-ситет, 2008. – 528 с.

[Нікітченко, 2011] Нікітченко М.С., Шкільняк О.С., Шкільняк С.С. Побудова модальних логік темпорального та епістеміч-ного типу на основі композиційно-номінативного підходу // Вісник Київського ун-ту. Серія: фіз.-мат. науки. – 2011. – Вип. 3. – С. 204–211.

[Семантика, 1981] Семантика модальных и интенсиональных логик. – M.: Прогресс, 1981. –494 с.

[Смирнова, 1996] Смирнова Е.Д. Логика и философия. – М.: РОССПЕН, 1996. – 304 с.

[Шкільняк, 2009] Шкильняк О.С. Семантичні властивості композиційно-номінативних модальних логік // Пробл. програ-мування. – 2009. – № 4. – C. 11–23.

[Шкільняк, 2012] Шкільняк О.С. Секвенційні числення мультимодальних композиційно-номінативних логік // Вісник Київського ун-ту. Серія: кібернетика. – К., 2012. – Вип. 12. – C. 55–59.

Информация об авторе

О.С. Шкильняк – кандидат физ.-мат. наук, ассистент Киевского национального университета имени Тараса Шевченко; e-mail: [email protected]

Основные области научных исследований: формальные методы спецификации программ, модальные логики частичных предикатов, исчисления секвенциального типа

Page 79: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

379

СЕМАНТИЧЕСКИЕ СВОЙСТВА И СЕКВЕНЦИАЛЬНЫЕ ИСЧИСЛЕНИЯ ЧИСТЫХ КОМПОЗИЦИОННО-НОМИНАТИВНЫХ ЛОГИК ПЕРВОГО ПОРЯДКА

Николай Никитченко, Степан Шкильняк

Аннотация: Исследованы чистые первопорядковые композиционно-номинативные логики частичных однозначных предикатов. Введено расширение логики специальными предикатами, которые определя-ют наличие значений для переменных. На этой основе для таких логик построены исчисления секвен-циального типа. Для этих исчислений доказаны теоремы корректности и полноты.

Ключевые слова: логика, предикат, логическое следствие, вывод, секвенциальное исчисление.

ACM классификация ключевых слов: F.3.1 Specifying and Verifying and Reasoning about Programs; F.4.1 Mathematical Logic – Proof theory

Вступление

Расширение сферы применения математической логики в информатике и программировании привело к созданию множества разнообразных логических систем (см., напр., [Handbook, 1994–2000]). В их основе, как правило, лежит классическая логика предикатов. Но такая логика имеет принципиальные ограничения, что существенно усложняет ее применение. В первую очередь следует отметить то, что для программиро-вания характерным является использование частичных неоднозначных отображений над сложными дан-ными, а классическая логика базируется на традиционных математических структурах однозначных то-тальных конечно-арных отображений. Ограничения классической логики предикатов делают актуальной проблему разработки новых логических формализмов на общей для логики и программирования основе. Такой естественной основой является композиционно-номинативний подход [Никитченко, 1999] к постро-ению моделей программ и ориентированных на них логик. На его базе разработано много разнообразных логических систем, находящихся на разных уровнях абстрактности и общности (см. [Нікітченко, 2008], [Шкільняк, 2010]. [Нікітченко, 2011], [Шкільняк, 2012]). Программно-ориентированные логические форма-лизмы, построенные на основе композиционно-номинативного подхода, названы композиционно-номина-тивными логиками (КНЛ). Причиной их возникновения стала необходимость усиления возможностей клас-сической логики для решения новых задач информатики и програмирования. КНЛ базируются на общих классах частичных отображений, заданных на произвольных наборах именованных значений. Такие ото-бражения названы квазиарными.

Целью данной работы является исследование чистых КНЛ первого порядка и формализация вывода в этих логиках путем построения специальных исчислений секвенциального типа. Описаны языки и семанти-ческие модели таких логик, исследованы их семантические свойства, в частности, свойства отношения ло-гического следствия для множеств формул. Предложенные исчисления базируются на идее расширения логики специальными предикатами, определяющими наличие значений для предметных имен (перемен-ных). Для построенных исчислений доказаны теоремы корректности и полноты.

Понятия, которые здесь не определены, понимаем в смысле работ [Нікітченко, 2008], [Нікітченко, 2011].

Page 80: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

380

Языки и семантические модели композиционно-номинативных логик

Под предикатом на множестве D будем понимать произвольную функцию вида P : D {T, F}, где {T, F} – множество истинностных значений. В данной работе рассматриваем частичные однозначные предикаты.

Областью истинности и областью ложности однозначного предиката Р на D назовем множества

T(P) = {dD | P(d) = T} и F(P) = {dD | P(d) = F}.

Предикат P назовем неопровержимым, или частично истинным, если F(P) = ;

Предикат P назовем выполннимым, если T(P) .

Согласно композиционно-номинативному подходу, построение КНЛ начинаем с гранично-абстрактных уров-ней, постепенно их конкретизируя.

Hа пропозициональном уровне предикаты имеют вид Р : D {T, F}, где D – совокупность абстрактных дан-ных. Композиции пропозиционального уровня называют логическими связками, наиболее распостранен-

ными из них являются отрицание , дизъюнкция , конъюнкция &, импликация , эквиваленция .

На номинативных уровнях сложные данные строятся из более простых на основе отношений именования (номинативных отношений), такие данные названы номинатами. Основным из номинативных является уровень однозначных номинатов (именных множеств), на нем далее выделяем реноминативный и перво-порядковые уровни. Определяющей особенностью первопорядковых уровней является наличие мощных композиций квантификации. Базовый первопорядковый уровень – кванторный, его можно назвать по ана-логии с классической логикой уровнем чистых КНЛ первого порядка (ЧКНЛ).

Именными множествами называют множества пар "имя-значение". Формальное определение такое.

V-именное множество (V-ИМ) над A – это произвольная однозначная функция вида : V A. Здесь V и A – множества предметных имен и предметных значений. Класс всех V-ИМ над A обозначаем VA.

V-ИМ представляем в виде [v1a1,...,vnan,...], где vіV, aіA, vі vj при і j.

Вводим функцию asn : VA2V определения означенных имен: asn() = {vV | va для некоторого aA}.

Определяем ||Х = {va | vXV}. Вместо ||(V \ Х) пишем ||–Х .

Операцию наложения вводим так: 12 = 2 (1 ||(V \ asn(2))).

Операцию реноминации 1

1

,...,,...,

n

n

v vx xr : VА VA зададим так: 1

1

,...,,...,

n

n

v vx xr () = [v1(x1),...,vn(xn)]( ||(V\{v1,...,vn})).

Для реноминации также используем сокращенное обозначение vxr .

Функцию вида Р : VA {T, F} называют V-квазиарным предикатом на A.

Класс V-квазиарных предикатов на A обозначаем PrA.

Имя xV (строго) несущественно для PPrA, если P(dxa) = P(d ||–х) для каждых dVA и aA.

Базовыми композициями ЧКНЛ есть пропозициональные связки и , реноминации R ,vx кванторы x.

Они задаются, используя области истинности и ложности соответствующих предикатов, таким образом:

T(P) = F(P); F(P) = T(P);

T(PQ) = T(P)T(Q); F(PQ) = F(P)F(Q);

T(Rvx (P)) = r v

x (T(P)); F(R vx (P)) = r v

x (F(P));

T(xP) = {dVA | Р(dxa) = T для некоторого aA}; F(xP) = {dVA | Р(dxa) = F для всех aA}.

Page 81: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

381

Композиции , &, , х – производные, они выражаются через базовые композиции , , х так:

PQ = PQ; P&Q = (PQ); PQ = (P&Q)(Q&P); хР = хР.

Семантическими моделями ЧКНЛ являются композиционные системы квазиарных предикатов кванторно-

го уровня (VА, PrA, C), где C задается базовыми композициями , , R ,vx x. Термы соответствующей

композиционной алгебры (PrA, C) трактуем как формулы языка ЧКНЛ. Алфавит языка: символы базовых композиций, множество Ps предикатных символов (ПС), множество V предметных имен (переменных).

Множество Ps образует сигнатуру языка. Множество Fr формул языка ЧКНЛ задается индуктивно:

1) каждый рPs – формула, такие формулы назовем атомарными;

2) если и – формулы, то , Ф, vxR , x – формулы.

Формулу вида ( )vxR будем называть R-формулой.

Будем обозначать nm() множество всех предметных имен, фигурирующих в формуле .

Отображение интерпретации формул J : FrPrA определяется с помощью тотального однозначного

отображения I : Ps PrA, которое сопоставляет символам из Рs базовые предикаты.

1) J(р) = I(p) для каждого рPs;

2) J() = (J()), J() = (J(), J()), J ( )vxR = Rv

x (J()), J(x) = x(J()).

Отображение I : Ps Pr связывает алгебру данных (А, Pr) с языком ЧКНЛ. Получаем алгебраическую сис-тему (АС) с приданной сигнатурой – объект вида ((A, PrA), I), обозначаемую (A, I). Такая АС задает компо-зиционную систему (VA, PrA, C), поэтому АС с приданной сигнатурой являются интегрированными семан-тическими моделями, связывающими язык логики с алгебрами данных. Назовем их моделями языка (МЯ).

Предикат J() – значение формулы при интерпретации на модели языка A = (A, I), – обозначаем A.

Имя xV несущественно для формулы , если для каждой МЯ A некоторого класса моделей имя x

несущественно для A.

Формула истинна в МЯ A, или неопровержима в A (обозн. A |= ), если A неопровержим.

Формула всюду истинна, или неопровержима (обозн. |= ), если A |= для каждой МЯ A.

Формула – следствие формулы в МЯ A (обозн. A|= ), если T(A)F(A) = .

Понятно, что A|= A |= .

Формула – логическое следствие формулы (обозн. |= ), если A|= для каждой МЯ A.

Формулы и логически эквивалентны (обозн. ), если |= и |= .

Формулы и строго эквивалентны в МЯ A (обозн. ATF ), если T(A) = T(A) и F(A) = F(A).

Формулы и логически строго эквивалентны (обозн. TF ), если ATF для каждой МЯ A.

Основой эквивалентных преобразований формул является теорема семантической эквивалентности.

Теорема 1. Пусть ' получена с формулы заменой некоторых вхождений формул 1,..., n на

1,..., n соответственно. Если 1 1, ..., n n, то ' (здесь – это или TF ).

Для каждого рPs множество синтетически (строго) несущественных предметных имен зададим с

помощью тотальной функции : Ps2V, которая затем продолжается до : Fr2V таким образом:

() = (Ф);

() = ()();

Page 82: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

382

(x) = (){x};

1

1

,...,,...,( )n

n

v vx xR = ((){v1,...,vn})(V\{xi | vi(), i{1,…, n}}).

Для ЧКНЛ постулируем бесконечность множества

( )Tp Ps

V p тотально несущественных имен.

Формула примитивная, если она атомарная либо имеет вид vxR p , причем отсутствуют тождественные

переименования и не содержит несущественных для p имен.

Основные свойства формул, связанные с пропозициональными композициями, аналогичны свойствам со-ответствующих классических логических связок. Это следующие свойства:

– коммутативность , & и ;

– ассоциативность и &;

– дистрибутивность относительно & и & относительно ;

– идемпотентность и &; – законы контрапозиции, снятия двойного отрицания, де Моргана.

Укажем свойства формул, связанные с композицией реноминации.

RT) ,, ( )z v

z xR TF ( )vxR . В частности, ( )z

zR TF .

R) ( )vxR TF ( )v

xR .

R) R ( )vx P Q TF R ( )v

x P R ( )vx Q .

Подобным образом записываем свойства R&, R, R.

RR) vxR ( ( ))w

yR TF ( )v wx yR .

RN) Пусть имя у несущественно для . Тогда ,, ( )y v

z xR TF ( )vxR .

NR) y ,, ( )y v

z xR TF,, ( )y v

z xR и y ,, ( )y v

z xR TF,, ( )y v

z xR при y{ ,z x } – несущественность верхних имен

реноминаций. В частности, при y z имеем y ( )yzR TF ( )y

zR и y ( )yzR TF ( )y

zR .

RR) ,, ( )u x

v yR x TF ( )uvR x – свертка по квантифицированному имени (здесь { }x u ).

В частности, имеем ( )хуR x TF x .

RB) ( )vuR x TF ( )v

uxR при x{ ,v u } – ограниченная R-дистрибутивность.

Аналогичные свойства RR и RB можно записать для х.

Наличие несущественных имен позволяет делать переименования.

RNm) Пусть уV несущественно для формулы . Тогда x TF у ( )xуR и x TF у ( )x

уR .

Основные свойства, связанные с композициями квантификации:

Q1) xy TF yx и xy TF yx;

Q2) x TF x и x TF x;

Q3) x TF xx, x TF xx; x TF xx, x TF xx;

Q4) xx TF x() и x&x TF x(&);

Q5) x(&)|= x&x и xx|= x();

Q6) yx |= xy; в то же время xy| yx;

Q7) x |= x; в то же время | x, x | ;

Page 83: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

383

Q8) |= x (x) и |= x (x); |= x (x) и |= x (x);

Свойства Q1–Q8 аналогичны соответствующим свойствам классической логики.

Для логики квазиарных предикатов значение предиката P(d) может быть разным в зависимости от того, входит или не входит в d компонента с определенным предметным именем. Поэтому в общем случае логики квазиарных предикатов некоторые важные законы классической логики уже неверны.

Пример 1. Существуют МЯ A и формулы , такие: A| x и x A| .

Интерпретируем ПС p на МЯ A так: , если ( ),

( ), если ( ).A

T x asn dp d

F x asn d

Пусть – это ПС p, – это p. Тогда T(xA) = T(x pA) = VA, F(pA); F(xA) = F(xpA) = VA,

T(A) = T(pA). Отсюда T(xA) F(A) , T(A) F(xA) . Отсюда A| x и x A| .

Пример 2. Существуют МЯ A и формула : A|= x и x A| .

Пусть – это формула x p p для ПС p. Интерпретируем ПС p на МЯ A так, как в примере 1. Тогда

имеем: T(pA) VA, F(pA) VA, T(x pA) = VA, F(x pA) = , T(x(x p p)A) = VA,

F(x(x p p)A) = , T(x(x p p)A) = VA, F(x(x p p)A) = , T((x p p)A) VA,

F((x p p)A) VA. Отсюда A|= x и x A| .

Таким образом, в общем случае логики квазиарных предикатов имеем свойства:

Q9) не всегда верны |= x и |=x;

Q10) для некоторых формул возможно: |= x и неверно |= x.

Итак, при интерпретациях формул целесообразно явно указывать означенные и неозначенные имена. Для этого вводим специальные 0-арные композиции – параметризованные по предметным именам

предикаты z, определяющие наличие значения для zV, т.е. наличие в данных компоненты с этим z.

Предикаты-индикаторы z наличия в dVA значения для предметных имен zV определяются так:

z(d) = T, если d(z); z(d) = F, если d(z).

Дадим определение предиката z через его области истинности и ложности.

F(zA) = {d | d(z)} = {dVA | zasn(d)}; T(zA) = {d | d(z)} = {dVA | zasn(d)}.

Теорема 2. T ,,( ( ))u x

v yR P F(y) T ( ( ))uvR xP и F ( ( ))u

vR xP F(y) F ,,( ( ))u x

v yR P .

Доказательство. Пусть dT ,,( ( ))u x

v yR P F(y), тогда d(y) и ,, ( )( )u x

v yR P d = T, откуда d(y)a для некоторого

aA и P ( ( ) ( ))d u d v x d y = T. Итак, P ( ( ) )d u d v x a = T для некоторого aA, откуда

(xP)(r ( ))uv d = T, поэтому ( )( )u

vR xP d = T, что дает dT ( ( ))uvR xP . Итак, T ,

,( ( ))u xv yR P F(y) T( ( )u

vR xP .

Пусть dF ,,( ( ))u x

v yR P F(y), тогда d(y) и ( )( )uvR xP d = F. Из последнего имеем (xР) ( ( ))d u d v = F,

поэтому Р ( ( ) )d u d v x b = F для всех bA. В силу d(y) имеем d(y)a для некоторого aA, тогда

P ( ( ) ( ))d u d v x d y = F, откуда ,, ( )( )u x

v yR P d = F, dF ,,( ( ))u x

v yR P . Итак, F ( )uvR xP F(y) F ,

,( ( ))u xv yR P .

Как отдельный случай теоремы 2 имеем: T ( ( ))xyR P F(y) T(xР) и F(xР) F(y) F ( ( ))x

yR P .

Заметим, что без использования предикатов-индикаторов z теорема 2 уже неверна.

Пример 3. Соотношения T( xyR (Р)) T(x(Р)) и F(x(Р)) F( x

yR (Р)) верны не всегда.

Для опровержения возьмем в качестве Р предикат pA примера 1.

Page 84: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

384

Отношение логического следствия для множеств формул

Пусть , Fr. – логическое следствие в МЯ A (обозн. A|= ), если

( ) ( )A AT F .

– логическое следствие (обозн. |= ), если A|= для каждой МЯ A.

Теорема 3 (замены эквивалентных). Пусть TF . Тогда , |= , |= и |= , |= , .

Укажем основные свойства отношения |=.

C) Если , то |= .

U) Пусть и , тогда |= |= .

|–) , |= |= , ; –|) |= , , |= .

|–) , |= , |= и , |= ; –|) |= , |= , , .

RT|–) ,, ( )z v

z xR , |= ( )vxR , |= ; RT–|) |= , ,

, ( )z vz xR |= , ( )v

xR .

N|–) ,, ( )y v

z xR , |= ( )vxR , |= ; N–|) |= , ,

, ( )y vz xR |= , ( )v

xR .

RR|–) vxR ( w

yR ()), |= vxR w

y (), |= ; RR–|) |= , vxR ( w

yR ()) |= , vxR w

y().

R|–) vxR (), |= v

xR (), |= ; R–|) |= , vxR () |= , v

xR ().

R|–) vxR (), |= v

xR () vxR (), |= ; R–|) |= , v

xR () |= , vxR () v

xR ().

RR|–) ,, ( ),u x

v yR x |= ( ),uvR x |= ; RR–|) |= , ,

, ( )u xv yR x |= , ( )u

vR x .

Rp|–) ( ),xyR x |= х, |= ; Rp–|) |= , ( )x

yR x |= , х.

Укажем свойства, связанные с элиминацией кванторов.

R|–) ( ),uvR x |= ,

, ( ),u xv zR |= , z (при условии { },x u zVT и znm(, , ( ))u

vR x ).

|–) х, |= ( ),xzR |= , z (при условии zVT и znm(, , х).

Rf–|) |= , ( )uvR x |= , ( ),u

vR x ,, ( ),u x

v zR z (при условии { },x u zVT, znm(, , ( ))uvR x ).

f–|) |= , х |= , х, ( ),xzR z (при условии zVT и znm(, , х)).

Rv–|) |= , ( ),uvR x y |= , ( ),u

vR x ,, ( ),u x

v yR y (при условии { }x u ).

v–|) |= , х, y |= , х, ( ),xyR y.

Rd–|) |= , ( )uvR x y, |= , ( )u

vR x и |= , ( ),uvR x ,

, ( ),u xv yR y (при условии { }x u ).

d–|) |= , х y, |= , х и |= , х, ( ),xyR y.

Cеквенциальные исчисления чистых КНЛ первого порядка

Исчисления секвенциального типа для ЧКНЛ строим на основе свойств отношения логического следствия для множеств формул. Секвенцией назовем множество формул, специфицированных (отмеченных) специ-альными символами |– и –|, не входящими в алфавит языка. Формулы секвенции, отмеченные символом |–,

назовем T-формулами, а формулы, отмеченные символом –|, – F-формулами Секвенции обозначаем |––|,

или, не детализируя, как . Секвенциальные исчисления строим так: |––| имеет вывод |= .

Аксиомами секвенциального исчисления есть замкнутые секвенции. Замкнутость |––| значит, что |= .

Базовое условие замкнутости: секвенция замкнута, если существует формула такая, что |– и –|.

Page 85: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

385

Введем дополнительное условие замкнутости секвенции – unv-замкнутость (unv – cокращение unvalued).

Для секвенции |––| введем множества val(|––|) = {xV | x} означенных и unv(|––|) = {xV | x} неозначенных переменных, или множества val-переменных и unv-переменных. При интерпретатациях

предметные имена (переменные) множества val(|––|) трактуем как означенные, а имена множества

unv(|––|) – как неозначенные.

Пусть Un = unv(|––|). Пусть R-формула 1 1 1

1 1 1,... , ,... , ,...

,... , ,... , ,...k n m

k n m

r r x x u us s y y v vR такая: {r1,…, rk, s,…, sk, y1,…, yn} Un,

{x1,…, xn}Un = , {v1,…, vm}Un = .

Un-unv-форма формулы 1 1 1

1 1 1,... , ,... , ,...

,... , ,... , ,...k n m

k n m

r r x x u us s y y v vR – это выражение вида 1 1

1 ,... , ,..., ,..., , ,...,

n m

m

x x u uv vR , где специальный символ

обозначает неопределенное значение.

R-формулы и назовем unv-эквивалентными относительно множества unv-переменных Un, или

Un-unv-эквивалентными, если и имеют одинаковые Un-unv-формы.

Если R-формулы и Un-unv-эквивалентны, то для каждых МЯ A и dVA, имеем:

uA(d) = T для всех uUn A(d) = A(d).

Секвенцию |––| назовем unv-замкнутой, если существует пара Un-unv-эквивалентных R-формул и

таких, что и (здесь Un = unv(|––|)).

Теорема 4. Если секвенция |––| unv-замкнута, то |= .

Доказательство. Пусть секвенция |––| unv-замкнута. Тогда она имеет вид {|–u}uUn, |–, |– , –|, –|, где

R-формулы и Un-unv-эквивалентны. Зафиксируем произвольные МЯ A = (A, I) и dVA. Возможны два

случая. Пусть uA(d) = T для всех uUn; в силу Un-unv-эквивалентности R-формул и имеем

A(d) = A(d) для всех dVA, поэтому невозможно dT(A) F(A). Пусть теперь uA(d) = F для

некоторой uUn, тогда невозможно dT({uA}uUn). Итак, T({uA}uUn) T(A) T(A) F(A) F(A) = ,

откуда {u}uUn, , A|= , , то есть A|= . Отсюда |= .

Правила вывода секвенциальных исчислений – секвенциальные формы. Они являются синтаксическими

аналогами семантических свойств отношения |=. Базовые формы записываем как

или

.

Выводы в секвенциальных исчислениях имеют вид дерева, вершины которого – секвенции. Секвенциальное дерево замкнуто, если каждый его лист – замкнутая секвенция.

Секвенция выводима, если существует замкнутое секвенциальное дерево с корнем .

Такое дерево назовем выводом секвенции .

На основе свойств отношения |= для множеств формул вводим такие базовые секвенциальные формы:

|–RT

|

,| ,

( ),

( ),

vx

z vz x

R A

R A; –|RT

|

,| ,

( ),

( ),

vx

z vz x

R A

R A;

|–N

|

,| ,

( ),

( ),

vu

y vz u

R A

R A, где у(A); –|N

|

,| ,

( ),

( ),

vu

y vz u

R A

R A, где у(A);

|–RR

|

,| ,

( ),

( ),

uv

u xv y

R xA

R xA, где { }x u ; –|RR

|

,| ,

( ),

( ),

uv

u xv y

R xA

R xA, где { }x u ;

|–Rp

|

|

,

( ),xy

xA

R xA; –|Rp

|

|

,

( ),xy

xA

R xA.

Page 86: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

386

Формы типов RT, N, RR, Rp назовем вспомогательными, остальные базовые формы – основные.

|–RR

|

|

( ),

( ( )),

v wx y

v wx y

R A

R R A; –|RR

|

|

( ),

( ( )),

v wx y

v wx y

R A

R R A;

|–R

|

|

( ),

( ),

vx

vx

R A

R A; –|R

|

|

( ),

( ),

vx

vx

R A

R A;

|–R

|

|

( ) ( ),

( ),

v vx x

vx

R A R B

R A B; –|R

|

|

( ) ( ),

( ),

v vx x

vx

R A R B

R A B;

|–

|

|

,

,

A

A; –|

|

|

,

,

A

A;

|– | |

|

, ,

,

A B

A B

; –|

| |

|

, ,

,

A B

A B;

Мы вводим две разновидности форм для элиминации кванторов: элиминации квантора под реноминацией

(R-формы) и элиминации внешнего квантора (-формы).

|–

| |

|

( ), ,

,

xzR A z

xA; |–R

,| , |

|

( ), ,

( ),

u xv z

uv

R A z

R xA;

–|f

| | |

|

, ( ), ,

,

xzxA R A z

xA; –|Rf

,| | , |

|

( ), ( ), ,

( ),

u u xv v z

uv

R xA R A z

R xA.

Для |– и –|f условие: zVT, znm(, xА); для |–R и –|Rf условие: { }x u , zVT, znm(, ( ))uvR xA .

Для –|f и –|Rf дополнительное условие: не содержит специальных символов вида –|z.

–|v

| | |

| |

, ( ), ,

, ,

xyxA R A y

xA y; –|Rv

,| | , |

| |

( ), ( ), ,

( ), ,

u u xv v y

uv

R xA R A y

R xA y.

–|d

| | | | |

|

, , , ( ), ,

,

xyy xA xA R A y

xA; –|Rd

,| | | | , |

|

, ( ), ( ), ( ), ,

( ),

u u u xv v v y

uv

y R xA R xA R A y

R xA.

Для–|Rv и –|Rd условие: { }x u . Для–|d и –|Rd дополнительное условие: y не входит в состав .

Секвенциальные формы –|f и –|Rf назовем формами типа f (-first), формы–|v и –|Rv назовем форма-

ми типа v (-valued), 2-посылочные формы –|d и –|Rd – формами типа d (-distributed).

Формы |–R и |– назовем T-формами, формы –|f, –|Rf, –|v, –|Rv, –|d, –|Rd – F-формами.

Секвенциальные исчисления логик квазиарных предикатов с вышеуказанными базовыми секвенциальны-ми формами назовем QSC-исчислениями.

На основании своств отношения |= получаем определяющее свойство базовых секвенциальних форм:

Теорема 5. Пусть

| |

| |

и

| | | |

| |

– базовые секвенциальные формы. Тогда:

1) |= |= ; |= и |= |= ; 2) | | ; | | или | .

Опишем процедуру построения секвенциального дерева для заданной секвенции .

Значение предиката P(d) может быть разным в зависимости от того, входит или не входит в d компонента с определенным именем. В процедуре построения секвенциального дерева эта особенность проявляется

Page 87: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

387

при формировании F-формами частных случаев (примеров) для F-формул вида x и ( )uvR x : приме-

ры могут иметь только вид ( )xyR и ,

, ( )u xv yR , где имя у – означено. При построении вывода выделение

означенных и неозначенных имен делаем с помощью специальных ПС вида у. Для секвенции вхож-

дение |–у в трактуем как неозначенность у, а вхождение –|у в – как означенность у. Заметим, что в

наших исчислениях специальные ПС x являются вспомогательным инструментом построения выводов, они фигурируют как отдельные атомарные формулы и не входят в состав других формул секвенции.

Для выводов конечных секвенций введем понятие финальной секвенции. Незамкнутую вершину-секвен-

цию вывода (секвенциального дерева) секвенции назовем финальной, если к ней уже неприменима

ни одна секвенциальная форма, либо если каждое применение секвенциальной формы к не вводит

новых формул, т.е. формул, отличных от формул секвенций на пути от к . Последнее означает стабилизацию на данном пути, т.е. ситуацию повторения незамкнутой секвенции.

Процедура построения дерева для секвенции начинается с корня дерева. Такую процедуру разбиваем на этапы. Каждое применение секвенциальной формы производим к конечному множеству доступных на данный момент формул. В начале каждого этапа выполняется шаг доступа. Это означает, что к списку доступных формул добавляем по одной формуле списка T-формул и списка F-формул. Если в секвенции недоступных T-формул либо F-формул нет (соответствующий список исчерпан), то на дальнейших шагах доступа прибавляем по одной формуле неисчерпанного списка. В начале построения дерева доступна лишь пара первых формул списков (либо единственная T-формула либо F-формула, если один со списков

пуст). Перед построением дерева для секвенции зафиксируем некоторый бесконечный список TN "новых"

тотально несущественных имен такой, что имена из TN не встречаются в формулах секвенции .

В начале этапа и после выполнения каждой формы проверяем секвенции-вершины на замкнутость (берем во внимание только доступные формулы секвенций). Замкнутые секвенции – это листы секвенциального дерева, при появлении замкнутой секвенции к ней уже неприменима ни одна форма, и процесс построения дерева на этом пути обрывается. Если все листы замкнуты, то процедура завершена позитивно, мы получили замкнутое секвенциальное дерево. Если нет, то в случае вывода конечной секвенции проверяем, будет ли хоть один из листов финальной секвенцией. Появление финальной секвенции говорит о негативном завершении процедуры построения дерева и о наличии в нем пути (от корня к данной финальной секвенции), все вершины которого незамкнуты, – незамкнутого пути.

Если процедура не завершена, то для каждого незамкнутого листа делаем следующий шаг доступа, пос-

ле чего достраиваем конечное поддерево с вершиной следующим образом.

(1) активизируем все доступные (кроме примитивных) формулы секвенции ; (2) применяем к каждой активной формуле основную секвенциальную форму (так, как это описано ниже).

В процессе применения основных секвенциальных форм удаляем, при их наличии, тождественные переи-менования и пары имен реноминаций по несущественным или квантифицированным верхним именам,

применяя вспомогательные формы типов RT, N, RR, Rp. После применения основной формы полу-ченные формулы на данном этапе пассивны. К таким формулам на данном этапе основные секвенциаль-ные формы уже не применяются. Повторы формул в секвенциях удаляем.

Сначала выполняем (если можно) все T-формы. При каждом таком применении берем со списка TN новое тотально несущественное z как первое незадействованное на даном пути от корня к данной вершине.

Затем к оставшимся активным формулам применяем соответствующую форму типа RR, R, R, , .

Далее выполняем F-формы. Если в момент применения F-формы к F-формуле секвенции имеем

val() = , то применяем соответствующую форму типа f; если val() , то применяем соответствую-

Page 88: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

388

щую форму типа v, что делаем для каждого zval(). Пусть после такого применения формы типа f или

v получена секвенция . Затем к этой F-формуле многократно, для каждого уnm() \ (val() unv()), применяем соответствующую форму типа d, достраивая конечное поддерево с вершиной .

При построении секвенциального дерева возможны такие случаи: 1) процедура завершена позитивно, имеем конечное замкнутое дерево; 2) процедура завершена негативно, имеем конечное незамкнутое дерево; 3) процедура не завершается, имеем бесконечное секвенциальное дерево. По известной лемме Кенига [Клини, 1973] бесконечное дерево с конечным разветвлением имеет хотя бы один бесконечный путь.

В случаях 2) и 3) в дереве существует незамкнутый путь , все его вершины – незамкнутые секвенции.

Каждая формула секвенции встретится на пути и станет доступной.

Корректность и полнота QSС-исчислений

Пусть секвенция выводима, тогда для нее построено замкнутое секвенциальное дерево. Из приведенной

выше процедуры построения секвенциального дерева следует, что для каждой его вершины |––| имеем:

A|= для каждой МЯ A. Для листьев дерева это следует из определений замкнутой и unv-замкнутой секвенций. Сохранение секвенциальными формами отношения логического следствия (от посылок до заключе-ния) следует из теоремы 5. Таким образом, для построенного QSС-исчисления верна

Теорема 6 (корректности). Пусть секвенция |––| выводима. Тогда |= .

Теорема полноты QSС-исчислений опирается на теорему о существовании контрмодели для множества формул незамкнутого пути.

Теорема 7. Пусть – незамкнутый путь в секвенциальном дереве, Н – множество всех специфициро-

ванных формул секвенций этого пути. Тогда существуют МЯ A = (A, I) и VA такие:

1) |–Н А() = Т; 2) –|Н А() = F.

Пару (A, ) назовем контрмоделью секвенции , для которой построено такое секвенциальное дерево.

Множества W = {ynm(Н) | –|yН} и Un = {ynm(Н) | |–yН} назовем соответственно множеством означен-ных имен и множеством неозначенных имен множества Н.

Доказательство. Применение секвенциальных форм к секвенциям пути осуществляется до тех пор,

пока это возможно, поэтому каждая непримитивная формула, которая встречается на пути , рано или поздно будет разложена или упрощена согласно соответствующей секвенциальной форме.

Все секвенции пути незамкнуты, поэтому для них не выполняется как базовое условие замкнутости, так и условие unv-замкнутости. Поэтому для множества Н гарантировано выполняются следующие условия:

НС) Для каждой примитивной формулы невозможно одновременно |–Н и –|Н;

НСU) Не существует примитивных Un-unv-эквивалентных vxR A и u

yR A таких: |vxR A H и | .u

yR A H

НС и НСU – это условия корректности множества специфицированных формул Н.

Переходы от низшей вершины пути к высшей выполняются, следуя секвенциальным формам QSС-ис-числения. Отсюда получаем, что для Н выполняются такие условия.

НRT) Если ,| , ( ) ,z v

z xR H то | ( ) ;vxR H если ,

| , ( ) ,z vz xR H то | ( ) .v

xR H

НN) Если ,| , ( )y v

z xR H и у(), то | ( ) ;vxR H если ,

| , ( )y vz xR H у(), то | ( ) .v

xR H

НRR) Если ,| , ( ) ,u x

v yR x H то | ( ) ;uvR x H если ,

| , ( ) ,u xv yR x H то | ( ) .u

vR x H

Page 89: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

389

НRp) Если | ( ) ,xyR x H то |–хН; если | ( ) ,x

yR x H то –|хН.

НRR) Если | ( ( )) ,v wx yR R H то | ( ) ;v w

x yR H если | ( ( )) ,v wx yR R H то | ( ) .v w

x yR H

НR) Если | ( ) ,vxR H то | ( ) ;v

xR H если | ( ) ,vxR H то | ( ) .v

xR H

НR) Если | ( ) ,vxR H то | ( ) ( ) ;v v

x xR R H если | ( ) ,vxR H то | ( ) ( ) .v v

x xR R H

Н) Если |–Н, то –|Н; если –|Н, то |–Н.

Н) Если |–Н, то |–Н или |–Н; если –|Н, то –|Н и –|Н.

Н) Если |–хН, то существует уW: | ( ) ;xyR H если –|хН, то | ( )x

yR H для всех уW.

НR) Если | ( ) ,uvR x H то существует уW такое, что ,

| , ( ) ;u xv yR H

если | ( ) ,uvR x H то для всех уW имеем ,

| , ( )u xv yR H (здесь { }x u ).

Mножество специфицированных формул Н, для которого выполняются вышеуказанные условия, назовем модельным, или хинтикковским множеством.

Перейдем теперь к построению контрмодели по множеству Н. Для множества W = {ynm(Н) | –|yН} возьмем некоторое множество А такое, что |А| = |W|. Фактически такое А дублирует множество всех

означенных предметных имен, фигурирующих в Н. Возьмем некоторую инъективную VA с asn() = W.

Зададим значение базовых предикатов на и на ИМ вида ( ).vxr

Если |–yН, то yА() = Т, что и означает yasn(); если –|yН, то yА() = F, что и означает yasn().

Если |– рН, то зададим рА() = Т; если –| рН, то зададим рА() = F.

Если | ( ) ,vxR p H то зададим ( ( )) ;v

A xp r T если | ( ) ,vxR p H то зададим ( ( )) .v

A xp r F

В оставшихся случаях значения базовых предикатов задаем произвольно, учитывая ограничения несущес-

твенности: для всех d, hVA таких, что d ||-(p) = h ||-(p), необходимо рA(d) = рA(h). Это гарантирует, что

имена у(p) несущественны для рА. Итак, значения базовых предикатов определены корректно.

Далее доказываем индукцией по сложности формулы согласно условиям определения модельного мно-

жества Н. Для атомарных формул и формул вида ( )vxR p утверждения теоремы следуют из определения

значений базовых предикатов. Для примера докажем шаг индукции для пп. Н и НR.

Пусть |–Н, в силу Н тогда |–Н или |–Н. По предположению индукции А() = Т или А() = Т,

откуда ()А() = Т. Пусть –|Н, в силу Н тогда –|Н и –|Н. По предположению индукции

А() = F и А() = F, откуда ()А() = F.

Пусть | ( ) .uvR x H В силу НR существует уW такое, что ,

| , ( ) .u xv yR H По предположению индукции

,,( ( )) ( ) .u x

v y AR T Отсюда ( ( ) ( )) .A u v x y T Но (у) в силу WА и уW, поэтому для

а = (у) имеем ( ( ) ) ,A u v x a T откуда ( ) ( ( ) ,uA vx r T поэтому ( ( )) ( ) .u

v AR x T

Пусть | ( ) .uvR x H В силу НR для всех уW имеем ,

| , ( ) .u xv yR H По предположению индукции для

всех уW имеем ,,( ( )) ( ) .u x

v y AR F Отсюда ( ( ) ( ))A u v x y F для всех уW. В силу WА

имеем (у) для всех уW. Но – биекция WА, поэтому каждое bА имеет вид b = (у) для некоторого

уW. Итак, A= F для всех bА, поэтому ( ) ( ( )uA vx r F для всех bА, откуда ( ( )) ( ) .u

v AR x F

На основании теоремы 7 получаем теорему полноты для QSС-исчислений.

Page 90: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

390

Теорема 8 (полноты). Пусть |= . Тогда секвенция |––| выводима.

Доказательство. Предположим обратное: |= и |––| невыводима. Если |––| невыводима, то секвен-

циальное дерево для |––| незамкнуто. Итак, в имеется незамкнутый путь . Пусть Н – множество всех

специфицированных формул секвенций пути . Такое Н – модельное. По теореме 7 существует

контрмодель (А, ), т.е. МЯ А = (А, І) и VA такие: |–Н А() = Т и –|ΨН ΨА() = F. В силу

|––| Н тогда для всех имеем А() = Т и для всех Ψ имеем ΨА() = F. Это противоречит |= .

Заключение

В роботе исследованы новые классы программно-ориентированных логических формализмов – чистые первопорядковые композиционно-номинативные логики частичных однозначных квазиарных предикатов. Описаны языки и семантические модели таких логик, указаны основные семантические свойства, в част-ности, свойства отношения логического следствия для множеств формул. Предложены расширения логи-ки специальными 0-арными композициями – предикатами-индикаторами, которые определяют наличие значения для переменных. На этой основе для чистых первопорядковых логик частичных предикатов построены исчисления секвенциального типа, для этих исчислений доказаны теоремы корректности и полноты. Для доказательства полноты использован метод модельных множеств.

The paper is published with partial support by the project ITHEA XXI of the ITHEA ISS ( www.ithea.org ) and the ADUIS ( www.aduis.com.ua ).

Литература

[Handbook, 1994–2000] Handbook of Logic in Computer Science: In 5 vol. / [Eds. Abramsky S., Gabbay D. and Maibaum T.S.E.]. – Oxford: Clarendon Press, 1994–2000.

[Клини, 1973] Клини C. Математическая логика. – М., 1973. – 480 с.

[Никитченко, 1999] Никитченко Н.С. Композиционно-номинативный подход к уточнению понятия программы // Пробл. программирования. – 1999, № 1. – С. 16–31.

[Нікітченко, 2008] Нікітченко М.С., Шкільняк С.С. Математична логіка та теорія алгоритмів. – К.: ВПЦ Київський університет, 2008. – 528 с.

[Нікітченко, 2011] Нікітченко М.С., Шкільняк С.С. Першопорядкові композиційно-номінативні логіки // Вісник Київ. ун-ту. Сер.: фіз.-мат. науки. – 2011. – Вип. 4. – С. 176–185.

[Шкільняк, 2010] Шкильняк С.С. Логики квазиарных предикатов первого порядка // Кибернетика и сист. анализ. – 2010. – № 6. – С. 32–49.

[Шкільняк, 2012] Шкильняк С.С. Секвенційні числення композиційно-номінативних логік квазіарних предикатів // Пробл. програмування. – 2012. – № 2–3. – C. 33–43.

Информация об авторах

Н.С. Никитченко – доктор физ.-мат. наук, зав. кафедрой Киевского национального университета имени Тараса Шевченко; e-mail: [email protected] Основные области научных исследований: формальные модели программирования и методы разра-ботки программ, логика предикатов на разных уровнях абстракции, абстрактная вычислимость C.С. Шкильняк – доктор физ.-мат. наук, профессор Киевского национального университета имени Тараса Шевченко; e-mail: [email protected] Основные области научных исследований: программно-ориентированные логические формализмы, логики с нетрадиционными семантиками, исчисления секвенциального типа

Page 91: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

391

МЕТОД БАЗИСНЫХ МАТРИЦ И МАТРИЧНАЯ ИГРА В СМЕШАННЫХ СТРАТЕГИЯХ

Кудин В.И.

Аннотация. В статье проанализированы связи метода базисных матриц для решения задачи линейного программирования (анализа линейных систем) и матричной игры в смешанных стратегиях. На основе анализа основных рекуррентных соотношений, которые связывают элементы метода базисных матриц в двух смежных базисных матрицах, были установлены соотношения для анализа (и нахождения решения) матричной игры в смешанных стратегиях. Получены условия несущественности чистых стратегий игроков и единственности решений. Разработан алгоритм анализа свойств матричной игры и нахождения решения на основе метода базисных матриц.

Ключевые слова: принятие решений, теория игр, линейная система, матричная игра, смешанная стратегия, базисная матрица.

ACM Classification Keywords : H.4.2 Information Systems Applications : Types of Systems : Decision Support.

Введение

Одним из основных направлений теории принятия решений является построение моделей, как аналог конфликта, в частности, в виде игровых задач. В работах [Golshteyn, 1969], [Dantzig, 1966], [Dantzig, 1997] рассмотрены теоретические основы решения матричной игры в смешанных стратегиях, как двойственной пары задач линейного программирования. Решение этих задач определяют оптимальные стратегии заданной матричной игры. Параметры задач линейного программирования, которые отвечают заданной матричной игре, выбираются в процессе конструктивного доказательства основной теоремы теории игр. Известно, что возможно также построение матричной игры по заданной задаче линейного программирования. Введения одного из важнейших понятий теории игр - стратегии позволяет привести самые разнообразные развернутые игры к единственной стандартной форме, которая называется нормальной формой игры. Стратегия игры, согласно [Dantzig, 1966], определяется как система правил, которые однозначно определяют выбор поведения игрока на каждом ходе в зависимости от ситуации, которая сложилась в процессе игры. Игрок, который выбрал стратегию, может не участвовать в игре. За составленной им инструкцией игру может проводить нейтральное лицо. Каждая фиксированная стратегия, которую может избрать игрок, называется его чистой стратегией. Чистые стратегии не исчерпывают всех возможностей игроков. Оказывается, что есть ситуации, в которых игрокам целесообразно выбирать не чистую стратегию, а частоту, с которой следует использовать ту или другую чистую стратегию в игре. Пользуясь понятиям стратегии, можно любую игру рассматривать где : каждый игрок имеет один ход - выбор между стратегиями из некоторого множества. При этом игрок принимает решение, не имея информации о выборе другого игрока. При двух участниках игра в нормальной форме называется прямоугольной. Прямоугольная игра с конечным числом чистых стратегий называется матричной игрой.

Page 92: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

392

В работе рассмотрены свойства метода базисных матриц [Kudin, 2007], как одного из методов анализа линейных систем ( в частности, задачи линейного программирования [Golshteyn, 1963]), при решении матричной игры в смешанных стратегиях. Как оказывается, матричная игра в смешанных стратегиях, как двойственная пара задач линейного программирования с однотипными условиями имеет свои структурные особенности. Эти особенности “накладывают свой отпечаток” на элементы метода базисных матриц. Были установлены основные соотношения для элементов метода базисных матриц в двух смежных базисных матрицах при решении матричной игры со смешанными стратегиями.

Постановка задачи

Пусть первый игрок имеет m стратегий, а второй - n . При этом считается известным, что если первый

игрок выберет - i -ю стратегию, а второй - j -ю, выигрыш первого (и следовательно проигрыш второго)

равняется ija . Матрица ,

1, 1

m n

ij i jA a

называется платежной матрицей или матрицей выигрыша.

Заметим, что формирование платежной матрицы при исследовании реальных конфликтных ситуаций является сложной задачей. Принципы для построения платежной матрицы лежат, вообще говоря, вне теории игр и “‘привязываются” к определенному приложению, с которым связанная постановка задачи. Важной задачей теории игр является выработка принципов, которые определяют поведение игроков в каждой конкретной конфликтной ситуации.

Определение 1. Вектор 1 2

( , ,..., )m

U u u u , каждая компонента которого указывает относительную

частоту (вероятность), с которой соответствующая чистая стратегия используется в игре, называется

смешанной стратегией первого игрока, а набор чисел 1 2

( , ,..., )n

W w w w - смешанные стратегии

второго игрока. Ясно, что 1

0, 1, , 1m

i ii

u i m u

, 1

0, 1, , 1n

j jj

w j n w

.

Чистая стратегия определяется, как смешанная стратегия, в которой все составляющие, кроме одной, уровни нулю. В дальнейшем будем помечать чистые стратегии обоих противников в виде единичных

векторов (0,0,...,0,1,0,...,0)m

i

i

e и (0,0,...,0,1,0,...,0)

n

j

j

e соответственно [Golshteyn, 1969].

Определение 2. Оптимальная стратегия игрока - это стратегия, которая обеспечивает ему максимально возможный гарантированный средний выигрыш.

Любое изменение информации приводит к новой игре, для которой оптимальная линия поведения будет другой. Свойства оптимальных стратегий матричной игры вытекают из основных теоретических результатов линейного программирования.

Теорема 1. (Основная теорема теории игр [Golshteyn, 1969]). Каждая матричная игра с нулевой суммой имеет решение в смешанных стратегиях, то есть существуют такие стратегии и первого и второго игрока соответственно, что

0 0 0 0( , ) ( , ) ( , )M U W v M U W M U W

В процессе доказательства основной теоремы теории игр матричной игры с платежной матрицей ,

1, 1( 0)

m n

ij iji jA a a

поставлена в соответствие следующая пара двойственных задач линейного

программирования типа (1)-(3) и (4)-(6), которые приведены ниже.

Page 93: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

393

Прямая задача:

1

max ,n

j jj

c x (1)

при условиях: 11 1 12 2 1 1

21 1 22 2 2 2

1 1 2 2

... ;

... ;

... ;

n n

n n

m m mn n m

a x a x a x b

a x a x a x b

a x a x a x b

(2)

0, 1,j

x j n . (3)

Или в матричном виде введем в рассмотрение задачу [1] линейного программирования вида :

min ,Cx

TAx B ,

0x ,

где 1 2

( , ,..., )T

nx x x x ,

1 2( , ,..., )

nC c c c , ,

1 2( , ,..., )

mB b b b . Считаем, что модель вида (1)−(3)

имеет матрицу ограничений А в которой количество столбцов больше чем строк ("длинная").

Двойственная задача: 1

minm

i ii

bu , (4)

при условиях:

11 1 21 2 31 3 1 1

12 1 22 2 32 3 2 2

1 1 2 2 3 3

... ;

... ;

.....................................................

... ;

m m

m m

n n n mn m n

a u a u a u a u c

a u a u a u a u c

a u a u a u a u c

(5) 0, ( 1,i

u i m ) (6)

Двойственная к (1)−(3) может быть записана в виде:

min ,Bu

,T TA u C

0u , (1 2

( , ,..., )T

mu u u u )

где 1, 1, , 1, 1,i j

b i m c j n .

Задача (4)-(6) является двойственной к задаче (1)-(3), которую называют прямой.

Целью исследования является:

установление новых свойств матричной игры со смешанными стратегиями таких как: оптимальность решений (стратегий), состояний равновесия игры (седловых точек и их свойств), условия существенности чистых стратегий (и несущественности) на основе учета структурных особенностей прямой и двойственной задач (как матричной игры), а также элементов метода базисных матриц применительно к даной игровой задаче.

Page 94: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

394

Основные положения метода базисных матриц (МБМ)

Метод базисных матриц [Kudin, 2007] может быть применен как к задаче (1)-(3), так и к задаче (4)-(6). Без ограничения общности, при изложении положений метода будем рассматривать задачу линейного программирования в виде (4)-(6), а именно:

max ,Bu

,T TA u C

0u .

Для определенности, будем считать, что задача (1)−(3) имеет n>>m, матрица А ограничений которой “вытянута горизонтально”, ранг системы ровным m. Задача вида (4),(5) имеют n ограничений и m переменных, матрица ограничений (транспонированная) “вытянута вертикально”.

Определение 2. Подматрицу б

A матрицы TA , составленную из m линейно независимых нормалей

1 2( , ,...., )

b mJ i i i ограничений (5), будем называть базисной (БМ), а решение

0 01 02 0( , ,..., )

mu u u u

соответствующей ей системы уравнений 0б

A u C

, где 1 2

( , ,..., )T

i i imC c c c

- подвектор С базисным

(опорным) (БР). Две базисные матрицы с отличной одной строкой будем называть смежными, а соответствующие базисные решения смежными.

Пусть : , , {1,2,..., }іj

i j I m - элементы базисной матрицы б

A ; rі

e и 1( )б iА - элементы та

i -й столбец 1 ,бА обратной к

бА ;

1 2( , ,..., )

r r r rm - вектор разложения вектора нормали

1r ra u c по строкам

бA ,

0 01 02 0( , ,..., )

m вектор разложения нормали целевой функции (4) по

строкам б

A 0

T

r r ra u c - невязка r -го ограничения (5), ,

б НJ J - множества индексов,

соответственно базисных и небазисных ограничений (5). Все определенные элементы при переходе к

смежной бA , которая образуется с b

A заменой ее строки k

a на l

a , которая не входит в б

A , будем

обозначать чертой сверху, например, 1

0, , , , , ( ) .i k br riіj iL e A

Введем в рассмотрение 1 2, ,...,

i i ima a a - нормали ограничений ,T

j j бa u c j J , где

1 2{ , ,..., }

б mJ i i i -

индексы ограничений, нормали которых образовывают ,б

A , lа - вектор-нормаль,

1 2( , ,..., )

l l l lm , - вектор разложения

la по строкам

бA для

l la u c .

Лемма 1. Необходимым и достаточным условием линейной независимости набора векторов

1 2 1 1, ,..., , , ,...,

i i i l i ik k ma a a a a a

при замене вектора

ika , который является к -й строкой в

бA вектором

бA

есть 0lk

.

Теорема 2. [Kudin, 2007] Между коэффициентами разложения нормалей ограничений (5) и целевой функции (4) по строкам базисной матрицы, элементами обратных матриц, базисными решениями, невязками ограничений (5) и значениями целевой функции в двух смежных базисных решениях имеют место такие соотношения

00 ,k

k

lk

00

0,k

iі lі

lk

,rkrk

lk

,rkri

rі lі

lk

1, ;r n 1, ;i m ;і k (7)

Page 95: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

395

,rkrk

lk

ee

,rk

rirі lі

lk

ee e

1, ;r m 1, ;i m ;і k (8)

00 ,jk

j l

lk

j

eu u

1, ,j m (

1

0u A C

) (9)

,lk

lk

,rkr

r l

lk

1, ;r n r k ; (10)

00

0,

TT k

l

lk

Bu Bu

(11)

причем условием линейной независимости строк смежной базисной матрицы является 0lk

,

допустимости опорного базисного решения - 0lk

, а условием роста целевой функции - 0

0k

.

Об особенностях элементов метода базисных матриц при исследовании матричной игры в смешанных стратегиях

Утверждение 1. Компоненты вектора разложения целевой функции задачи линейного программирования (двойственной задачи матричной игры ) в ходе итераций метода базисных матриц вычисляются по формулам

0

1

, 1,m

i jij

e i m

.

Утверждение 2. Компоненты вектора решений задачи линейного программирования (двойственной задачи матричной игры ) в ходе итераций метода базисных матриц вычисляются по формулам

0

1

, 1,m

i ijj

u e i m

. (12)

Доказательство. Справедливость утверждений 1,2 следует из формул (7), (9) и соотношений

0

, (1,1,...,1)T

m

A u C C

,

1

0, (1,1,...,1)T

m

u A C C

,

0

, (1,1,...,1)m

A B B

,

1

0, (1,1,...,1)

m

B A B

(13)

Следствие 1. Суммы элементов векторов столбцов обратной матрицы совпадают со значением соответствующей компоненты вектора разложения целевой функции по строкам базисной матрицы.

Следствие 2. Суммы элементов строк обратной матрицы совпадают со значением соответствующей компоненты вектора промежуточного решения на итерациях метода базисных матриц.

Доказательство. Справедливость утверждений является следствием свойств разложений элементов метода базисных матриц по строкам базисной матрицы.

Утверждение 3. Для суммы элементов столбцов обратной матрицы в двух смежных базисных матрицах выполняются такие рекуррентные соотношения

Page 96: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

396

1

1

m

m jkj

jk

jlk

ee

, (14)

1

1 1

m

m m jkj

jrjr lі

j jlk

ee e

, 1, ;r m 1, ;i m і k . (15)

Доказательство. Согласно соотношений связывающих элементы обратной матрицы в двух смежных базисных матрицах

,rkrk

lk

ee

,rk

rirі lі

lk

ee e

1, ;r m 1, ;i m ;і k

следует, что

kk

lk

ee

, k

rr lі

lk

ee e

, 1, ;r m 1, ;i m і k .

После проведения по элементного складывания элементов столбцов получим, что

1

1

m

m jkj

jk

jlk

ee

, 1

1 1

m

m m jkj

jrjr lі

j jlk

ee e

, 1, ;r m 1, ;i m і k .

Утверждение 4. Для суммы элементов строк обратной матрицы в двух смежных базисных матрицах выполняются такие рекуррентные соотношения

1 1 1

( 1)m m m

rk

ri ri lii i i

lk

ee e

, 1, ;r m (16)

Доказательство. Согласно соотношений

,rkrk

lk

ee

,rk

rirі lі

lk

ee e

1, ;r m 1, ;i m ;і k

следует, что элементы строк обратной матрицы находятся по соотношениям для каждого r

11 1

,rkr

r l

lk

ee e

2

2 2,rk

rr l

lk

ee e

1

1 1,rk

rkrk lk

lk

ee e

rk rk rkrk

rk lk

lk lk lk

e e ee e

( 1)rk

rk lk

lk

ee

11 1

,rkrk

rk lk

lk

ee e

,rk

rmrm lm

lk

ee e

то есть для элементов вектор строки обратной матрицы можем записать 1,r m

1 2 1 1 1

( , , , 1, , , )rk

r r l l lk lk lk lm lm

lk

eE E

.

После суммирования элементов строки получим

Page 97: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

397

1 1 1,

( ( 1))m m

rk

ri ri li lki i i i k

lk

ee e

1 1

( 1)m m

rk

ri lii i

lk

ee

При построении алгоритмов МБМ для матричной игры формулы (7) и (9) существенно упрощаются, поскольку компоненты вектора разложения целевой функции по строкам базисной матрицы и компоненты текущего решения определяются по сумам столбцов и строк обратной базисной матрицы. По формулам (15),(16) находятся компоненты этих векторов на следующей итерации. Следует отметить, что для

проведения расчетов достаточно знание номера k (вывод), l (ввода) ограничений и компонент вектора

разложений 1 2 1 1

( , ,... , , , ..., , )l l l lk lk km lm

.

Выводы

Структурные свойства двойственной пары задач линейного программирования (как матричной игры в смешанных стратегиях) в схеме метода базисных матриц трансформировались в особенном содержательном смысле элементов строк и столбцов обратной к базисной матрице. Сумма элементов столбцов (их неотрицательность) указывает на свойство оптимальности решений, а суммы элементов строк указывают на компоненты вектора решения задачи. Упомянутые свойства можно учесть при построении алгоритмов на основе метода базисных матриц (рекуррентных соотношений для элементов метода). При решении двойственной пары задач линейного программирования (матричной игры в смешанных стратегиях) на основе метода базисных матриц можно установить ряд свойств, в частности, свойства оптимальных решений.

Литература

[Golshteyn, 1969] Golshteyn Е.G., Yudin D.B. New directions in linear programming. − М. − Sovetskoe radio, − 1969, − 524p. (in Russian).

[Dantzig, 1966] Dantzig G.B Linear programming and application. M.( Progress, − 1966. (in Russian).

[Dantzig, 1997] Dantzig G.B., Thapa M.N. Linear Programming 1: introduction, Springer, − 1997, − 435p.

[Golshteyn, 1963] Golshteyn Е.G., Yudin D.B. Linear programming.Theory and methods. − М. : Nauka, − 1963. - 776p. (in Russian).

[Kudin, 2007] Kudin V. I., Lyashko S.I., Khritonenko N.V., Yatsenko Yu.P. Analysis of the properties of a linear system using the method of artificial basis matrices // Kibernetika i sistemny analiz. — 2007. — N 4. -.P. 119-127 (in Ukrainian).

Авторы

Владимир И. Кудин, Киев, Киевский национальный университет имени Тараса Шевченка, факультет кибернетики, Украина, д. т. н., с. н. с., E-mail: [email protected]

Основные области научных исследований: методы оптимизации, системный анализ, компьютерный анализ вычислений.

Page 98: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

398

TABLE OF CONTENTS OF IJ ITA VOL.20, NO.:1, 2013

Preface .............................................................................................................................................................. 3

Usefulness of Scientific Contributions

Krassimir Markov, Krassimira Ivanova, Vitalii Velychko ............................................................................... 4

Risks in Using Bibliometric Indicators for Performance Evaluation of Scientists

Douhomir Minev ........................................................................................................................................... 39

Towards a Novel Design of Creative Systems

Vladimir Jotsov ............................................................................................................................................. 57

Информационные машины: некоторые категории функций и компонент

Мержвинский Анатолий Александрович ................................................................................................... 75

Theory of Non-violent Interaction

Iurii Teslia ..................................................................................................................................................... 88

TABLE OF CONTENTS OF IJ ITA VOL.20, NO.:2, 2013

Vectors and Matrixes in Grouping Information Problem 

Donchenko V. .................................................................................................................................................. 103 

Program Invariants Generation over Polynomial Ring using Iterative Methods 

Sergii Kryvyi, Oleksandr Maksymets ............................................................................................................... 113 

A Combined Exterior Penalty Function – Conjugate Gradient Algorithm for a Class of Constrained Optimal Control Quasilinear Parabolic Systems 

M. H. Farag and T. A. Talaat ........................................................................................................................... 122 

Algorithmic Decidability of Computer Program-Functions Language Properties 

Nikolay Kosovskiy ........................................................................................................................................... 131 

The Dynamic Model of the Innovation Funnel Indicators and Their Trajectories 

Anatoly Selyaninov, Natalia Frolova................................................................................................................ 137 

Matrix Feature Vectors in Speech and Gesture Recognition 

Volodymyr Donchenko, Andrew Golik ............................................................................................................. 143 

Efficient Simulation for Prolog Implementation of Image Recognition Problem 

Tatiana Kosovskaya, Maria Vlasova ............................................................................................................... 156 

Modeling of Cognitive Processes by Network Models 

Sergii Konovalenko ......................................................................................................................................... 162 

Class of Algorithms for Synthessis of Non-Conflict Schedule in Communication Nodes 

Kiril Kolchakov ................................................................................................................................................. 167 

Page 99: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

399

Remote Smart Biosensors for Precision Farming and Environment Protection 

Volodymyr Romanov, Dmytro Artemenko, Igor Galelyuka, Oleksandr Palagin, Yevgeniya Sarakhan ............ 174 

Energy Harvesting in Horizontal Drilling Processes for the Purpose of Information and Navigation Monitoring 

Marian Dimanchev and Martin P. Mintchev ..................................................................................................... 180 

Methods and Models of the Effective Distribution of Energy Between Consumers and Producers 

Kyzemin Oleksandr, Gurina Iryna ................................................................................................................... 188 

TABLE OF CONTENTS OF IJ ITA VOL.20, NO.:3, 2013

Reservoir Forecasting Neuro-Fuzzy Network and its Learning 

Yevgeniy Bodyanskiy, Oleksii Tyshchenko, Iryna Pliss .................................................................................. 203 

Prion Crystalization Model and its Application to Recognition Pattern 

Paula Cordero, Rafael Lahoz-Beltra and Juan Castellanos ............................................................................ 210 

An Architecture for Representing Biological Processes Based on Networks of Bio-Inspired Processors 

Sandra Gómez Canaval, Fernando Arroyo and José Ramón Sánchez-Couso .............................................. 218 

Self-Organizing Architectural Design Based on Morphogenetic Programming 

Nuria Gómez Blas, Luis F. de Mingo, Miguel A. Muriel ................................................................................... 225 

Technical P-Systems: Operating in the Stock Markets with Transition P-Systems 

Alberto Arteta, Angel Luis Castellanos, Nuria Gómez Blas ............................................................................. 236 

Overlapping Range Images Using Genetic Algorithms 

Fernando Ortega, Javier San Juan, Francisco Serradilla, Dionisio Cortes ..................................................... 243 

Numerical Integration by Genetic Algorithms 

Vladimir Morozenko, Irina Pleshkova .............................................................................................................. 252 

Introduction to Storing Graphs by NL-addressing 

Krassimira B. Ivanova, Koen Vanhoof, Krassimir Markov, Vitalii Velychko ..................................................... 263 

Common Building Issues of Knowledge-Based Management Information System for Supporting Personnel Motivation 

Elena Antonova, Nikita Lyalyakin .................................................................................................................... 285 

Authentication Based on Fingerprints with Steganographic Data Protection 

Narek Malkhasyan .......................................................................................................................................... 289 

Пьезооптические сканирующие коммутаторы 

Рябцов А.В. .................................................................................................................................................... 295 

Page 100: International Journal “Information Theories and Applications ...International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013 303 GENERALIZATION OF DISTRIBUTING

International Journal “Information Theories and Applications”, Vol. 20, Number 4, 2013

400

TABLE OF CONTENTS OF IJ ITA VOL.20, NO.:4, 2013

Generalization of Distributing Methods for Fuzzy Problems 

Voloshyn O., Laver V. ..................................................................................................................................... 303 

Vectors and Matrixes Least Squares Method: Foundation and Application Examples 

Vladimir S. Donchenko, Inna M. Nazaraga, Olga V. Tarasova ....................................................................... 311 

Компромисс и консенсус в теории принятия решений 

Альберт Воронин ........................................................................................................................................... 323 

Многосортная монотонная логика Флойда-Хоара 

Андрей Криволап, Николай Никитченко ...................................................................................................... 331 

О применимости оценко математического ожидания при сравнении интервальных альтернатив 

Стернин М.Ю., Шепелев Г.И. ........................................................................................................................ 342 

Аксиоматический подход к сужению множества Парето: вычислительные аспекты 

Владимир Ногин ............................................................................................................................................ 352 

Применение методов псевдообращения к задачам оптимизации структур 

Григорий Кудин .............................................................................................................................................. 360 

Модальные логики частичных предикатов и секвенциальные системы логического вывода в этих логик 

Оксана Шкильняк ........................................................................................................................................... 367 

Семантические свойства и секвенциальные исчисления чистых композиционно-номинативных логик первого порядка 

Николай Никитченко, Степан Шкильняк ...................................................................................................... 379 

Метод базисных матриц и матричная игра в смешанных стратегиях 

Кудин В.И. ...................................................................................................................................................... 391 

Table of contents of IJ ITA Vol.20, No.:1, 2013 ................................................................................................... 398

Table of contents of IJ ITA Vol.20, No.:2, 2013 ................................................................................................... 398

Table of contents of IJ ITA Vol.20, No.:3, 2013 ................................................................................................... 399

Table of contents of IJ ITA Vol.20, No.:4, 2013 ................................................................................................... 400