matlab 动态规划逆序法及应用实例

发布时间：2020-05-26 18:00:16 ，浏览量：10

文章目录

- - - 1 dpReverse函数
    - 2 应用实例
    - - 2.1 状态变量矩阵定义
      - 2.2 允许决策集合函数
      - 2.3 阶段指标函数 V(sk,uk)
      - 2.4 状态转移方程Tk(sk,uk)
      - 2.5 第k阶段直到最后阶段的指标函数
      - 2.6 程序调用
      - 2.7 计算结果

逆序法代码 1 dpReverse函数

function [opt,fval]=dpReverse(S,DecisFun,SubObjFun,TransFun,ObjFun)
%动态规划逆序法
%变量或函数名       类型    　释义
%--------------------------------------------------------------------------
% S               | 矩阵 | 状态变量，每一列代表一个阶段的状态，空缺处用NAN补齐
% DecisFun(k,s)   | 函数 | 代入阶段k及状态变量s求出允许决策集合
% TransFun(k,s,u) | 函数 | Tk(sk,uk)，其中s是阶段k的状态，u是相应的决策变量
% SubObjFun(k,s,u)| 函数 | 阶段指标函数 V(sk,uk)
% ObjFun(v,f)     | 函数 | 第k阶段直到最后阶段的指标函数
% opt             | 矩阵 | [序号,最优策略,最优轨线,指标]
% fval            | 数值 | 最优解数值


%第一阶段：变量初始化======================================================
N=sum(sum(~isnan(S)));    %节点总数量
opt_F=ones(1,N).*inf;     
opt_U=ones(N,N).*inf;
opt_V=ones(N,N).*inf;
ePnt=S(:,size(S,2));
ePnt(isnan(ePnt))=[];
opt_F(ePnt)=0;            %每一节点到达最终阶段最短距离 
opt_U(1,ePnt)=ePnt;       %每一节点对应最优下一节点集合  
opt_V(1,ePnt)=0;          %每一节点对应最优下一节点距离   

%第二阶段：动态规划逆序求解================================================
%注：程序中以大写字母开头的变量表示集合，小写字母开头变量表示元素
for k=size(S,2)-1:-1:1
    Sk=S(:,k);Sk(isnan(Sk))=[];            %Sk:第k阶段节点集合(状态变量)
    for sk=Sk'
        Uk=feval(DecisFun,k,sk);
        Uk=feval(TransFun,k,sk,Uk);        %Uk:允许决策集合
        F=ones(1,length(Uk)).*inf;         %F:指标集合
        V=ones(1,length(Uk)).*inf;         %V:阶段指标集合
        for i=1:length(Uk)
            uk=Uk(i);
            v=feval(SubObjFun,k,sk,uk);    %sk到达uk距离
            f=feval(ObjFun,v,opt_F(uk));   %sk经过uk到底最终阶段点距离
            F(i)=f;                        %记录sk通过各个uk到达最终阶段最短距离
            V(i)=v;                        %记录sk到各个uk距离
        end
        opt_pos=find(F==min(F));           %寻找最短的f所对应的uk
        opt_F(sk)=min(F);                  
        opt_U(1:length(opt_pos),sk)=Uk(opt_pos)';
        opt_V(1:length(opt_pos),sk)=V(opt_pos)';
    end
end
%第三阶段：路径还原========================================================
sPnt=S(:,1); 
sPnt(isnan(sPnt))=[];
Path=zeros(1,size(S,2)+1);
Path(1)=sPnt;                              %将路径的第一个点设置为起始点
for i=1:size(S,2)                          %经过size(S,2)个阶段 
    NewPath=zeros(1,size(S,2)+1);          
    NewPath(:,:)=[];
    for j=1:size(Path,1) 
        branch=opt_U(:,Path(j,i));         
        branch(isinf(branch))=[];          %获取当前路径最后一个节点的下一个节点
        for m=branch'                      
            tempPath=Path(j,:);            %复制之前路径
            tempPath(1,i+1)=m;             %将之前路径中下一个节点添加到路径
            NewPath=[NewPath;tempPath];    %每多一个分支多派生出一条路径 
        end
    end  
    Path=NewPath;
end
%将路径整理形状并拼成矩阵
temp_n=reshape((1:size(S,2))'*ones(1,size(Path,1)),size(S,2)*size(Path,1),1);
temp_s=reshape(Path(:,1:size(S,2))',size(S,2)*size(Path,1),1);
temp_e=reshape(Path(:,2:size(S,2)+1)',size(S,2)*size(Path,1),1);
for i=1:length(temp_n)
    coe=opt_U(:,temp_s(i))==temp_e(i);
    temp_v(i,1)=opt_V(coe,temp_s(i));
end
opt=[temp_n,temp_s,temp_e,temp_v];
fval=sum(opt(1:size(S,2),4));
end

2 应用实例

在这里插入图片描述计算由V1到达V10的最短路径。

dpReverse函数为了应对动态规划的不同实例，需要将状态变量，允许决策集合，阶段指标函数，第k阶段直到最后阶段的指标函数等部分作为参数传入dpReverse函数进行计算即： dpReverse(S,DecisFun,SubObjFun,TransFun,ObjFun)

2.1 状态变量矩阵定义

即函数中的参数S,S以矩阵形式被表示,空缺部分使用nan补齐就该图片而言，我们将其分成5个阶段，每个阶段含有的状态变量分别为{V1}，{V2，V3，V4}，{V5，V6，V7}，{V8，V9}，{V10} 转化为matlab内矩阵形式即为：在这里插入图片描述这个过程可以通过编写如下代码来实现：

S=nan.*ones(3,5);
S(1,1)=1;
S(1:3,2)=[2;3;4];
S(1:3,3)=[5;6;7];
S(1:2,4)=[8;9];
S(1,5)=10;

2.2 允许决策集合函数

代入阶段k及状态变量s求出允许决策集合函数可以简单的使用switch构造：如图中case 1,u=[2;3;4];表明节点V1的下一个节点可以为V2，V3，V4，由于该实例较为简单，这里实际上只使用的了s一个参数，k参数的引入可以刻画更加复杂的问题，这里不展开讨论。

function u=dpMinDis_DecisFun(k,s)
    switch s
        case 1,u=[2;3;4];
        case 2,u=[5;6];
        case 3,u=[5;6;7];
        case 4,u=[6;7];
        case 5,u=8;   
        case 6,u=[8;9]; 
        case 7,u=[8;9];     
        case 8,u=10;     
        case 9,u=10; 
        case 10,u=10;     
    end
end

2.3 阶段指标函数 V(sk,uk)

在该题中指的便是两点之间的路长，例如case (s==6&u =8),v=2;即为V6和V8点之间距离为2。同样由于实例较为简单并未使用参数k。

function v=dpMinDis_SubObjFun(k,s,u)
    v=inf;
    switch 1
        case (s==6&u==8),v=2;
        case (s==1&u==2)|(s==4&u==7)|(s==6&u==9)|(s==8&u==10),v=3;
        case (s==3&u==5)|(s==5&u==8)|(s==9&u==10),v=4;
        case (s==1&u==4)|(s==3&u==6)|(s==4&u==6),v=5;
        case (s==1&u==3)|(s==3&u==7)|(s==7&u==8)|(s==7&u==9),v=6;
        case (s==2&u==6),v=7;
        case (s==2&u==5),v=8;
    end
end

2.4 状态转移方程Tk(sk,uk)

S k + 1 = T k ( S k , U k ) S_{k+1}=T_k(S_k,U_k) Sk+1=Tk(Sk,Uk) 对于该题来说，实际上 S k + 1 S_{k+1} Sk+1即为 U k U_k Uk

function s=dpMinDis_TransFun(k,s,u)
    s=u;
end

2.5 第k阶段直到最后阶段的指标函数

当前问题下f没有劳损或增值等因素，故直接采用f=v+f

function f=dpMinDis_ObjFun(v,f)
    f=v+f;
end

2.6 程序调用

通过如下方式进行程序调用：

[opt,fval]=dpReverse(S,@dpMinDis_DecisFun,@dpMinDis_SubObjFun,...
                       @dpMinDis_TransFun,@dpMinDis_ObjFun)

2.7 计算结果

计算结果如下：在这里插入图片描述其中opt为最优路径，fval为最短距离，我们详细来看opt结果，opt最左列是用来区分路径的序号，它由1增长到5之后再次由1增长到5，说明最优结果包含两条路径，且都经过了五个点，

opt中第二列是每一段路的起点第三列是每一段路的终点第四列是每一段路的路长如图所示，下图第一行表示最短路首先由点1到达点2且经过距离为3，而整幅图说明最短路为： 1—>2—>6—>8—>10 且最短路长为3+7+2+3+0=15 在这里插入图片描述因此我们从计算结果opt可以看出，该题有两个最短路，分别为: 1—>2—>6—>8—>10 1—>4—>6—>8—>10 最短路长为15

关注

打赏

1688896170

查看更多评论

matlab 动态规划逆序法及应用实例

[ 申请 ]友情链接：