// $Id$ # ifndef CPPAD_MATRIX_MUL_INCLUDED # define CPPAD_MATRIX_MUL_INCLUDED /* -------------------------------------------------------------------------- CppAD: C++ Algorithmic Differentiation: Copyright (C) 2003-13 Bradley M. Bell CppAD is distributed under multiple licenses. This distribution is under the terms of the GNU General Public License Version 3. A copy of this license is included in the COPYING file of this distribution. Please visit http://www.coin-or.org/CppAD/ for information on other licenses. -------------------------------------------------------------------------- */ /* $begin atomic_matrix_mul.hpp$$ $spell $$ $section Matrix Multiply as an Atomic Operation$$ $index multiply, matrix atomic operation$$ $index atomic, matrix multiply operation$$ $index matrix, multiply atomic operation$$ $nospell $head Start Class Definition$$ $codep */ # include namespace { // Begin empty namespace using CppAD::vector; // void my_union( std::set& result , const std::set& left , const std::set& right ) { std::set temp; std::set_union( left.begin() , left.end() , right.begin() , right.end() , std::inserter(temp, temp.begin()) ); result.swap(temp); } // // matrix result = left * right class matrix_mul : public CppAD::atomic_base { /* $$ $head Constructor$$ $codep */ private: // number of rows in left operand and in the result const size_t nr_result_; // number of columns in left operand and rows in right operand const size_t n_middle_; // number of columns in right operand and in the result const size_t nc_result_; // dimension of the domain space const size_t n_; // dimension of the range space # ifndef NDEBUG const size_t m_; # endif public: // --------------------------------------------------------------------- // constructor matrix_mul(size_t nr_result, size_t n_middle, size_t nc_result) : CppAD::atomic_base("matrix_mul"), nr_result_(nr_result) , n_middle_(n_middle) , nc_result_(nc_result) , n_( nr_result * n_middle + n_middle * nc_result ) # ifndef NDEBUG , m_( n_middle * nc_result ) # endif { } private: /* $$ $head Left Operand Element Index$$ $codep */ // left matrix element index in the taylor coefficient vector tx. size_t left( size_t i , // left matrix row index size_t j , // left matrix column index size_t k , // Taylor coeffocient order size_t nk ) // number of Taylor coefficients in tx { assert( i < nr_result_ ); assert( j < n_middle_ ); return (i * n_middle_ + j) * nk + k; } /* $$ $head Right Operand Element Index$$ $codep */ // right matrix element index in the taylor coefficient vector tx. size_t right( size_t i , // right matrix row index size_t j , // right matrix column index size_t k , // Taylor coeffocient order size_t nk ) // number of Taylor coefficients in tx { assert( i < n_middle_ ); assert( j < nc_result_ ); size_t offset = nr_result_ * n_middle_; return (offset + i * nc_result_ + j) * nk + k; } /* $$ $head Result Element Index$$ $codep */ // result matrix element index in the taylor coefficient vector ty. size_t result( size_t i , // result matrix row index size_t j , // result matrix column index size_t k , // Taylor coeffocient order size_t nk ) // number of Taylor coefficients in ty { assert( i < nr_result_ ); assert( j < nc_result_ ); return (i * nc_result_ + j) * nk + k; } /* $$ $head Forward Matrix Multipliy$$ $codep */ // Forward mode multiply Taylor coefficients in tx and sum into ty // (for one pair of left and right orders) void forward_multiply( size_t k_left , // order for left coefficients size_t k_right , // order for right coefficients const vector& tx , // domain space Taylor coefficients vector& ty ) // range space Taylor coefficients { size_t nk = tx.size() / n_; assert( nk == ty.size() / m_ ); // size_t k_result = k_left + k_right; assert( k_result < nk ); // for(size_t i = 0; i < nr_result_; i++) { for(size_t j = 0; j < nc_result_; j++) { double sum = 0.0; for(size_t ell = 0; ell < n_middle_; ell++) { size_t i_left = left(i, ell, k_left, nk); size_t i_right = right(ell, j, k_right, nk); sum += tx[i_left] * tx[i_right]; } size_t i_result = result(i, j, k_result, nk); ty[i_result] += sum; } } } /* $$ $head Reverse Matrix Multipliy$$ $codep */ // Reverse mode partials of Taylor coefficients and sum into px // (for one pair of left and right orders) void reverse_multiply( size_t k_left , // order for left coefficients size_t k_right , // order for right coefficients const vector& tx , // domain space Taylor coefficients const vector& ty , // range space Taylor coefficients vector& px , // partials w.r.t. tx const vector& py ) // partials w.r.t. ty { size_t nk = tx.size() / n_; assert( nk == ty.size() / m_ ); assert( tx.size() == px.size() ); assert( ty.size() == py.size() ); // size_t k_result = k_left + k_right; assert( k_result < nk ); // for(size_t i = 0; i < nr_result_; i++) { for(size_t j = 0; j < nc_result_; j++) { size_t i_result = result(i, j, k_result, nk); for(size_t ell = 0; ell < n_middle_; ell++) { size_t i_left = left(i, ell, k_left, nk); size_t i_right = right(ell, j, k_right, nk); // sum += tx[i_left] * tx[i_right]; px[i_left] += tx[i_right] * py[i_result]; px[i_right] += tx[i_left] * py[i_result]; } } } return; } /* $$ $head forward$$ $codep */ // forward mode routine called by CppAD bool forward( size_t q , size_t p , const vector& vx , vector& vy , const vector& tx , vector& ty ) { size_t p1 = p + 1; assert( vx.size() == 0 || n_ == vx.size() ); assert( vx.size() == 0 || m_ == vy.size() ); assert( n_ * p1 == tx.size() ); assert( m_ * p1 == ty.size() ); size_t i, j, ell; // check if we are computing vy information if( vx.size() > 0 ) { size_t nk = 1; size_t k = 0; for(i = 0; i < nr_result_; i++) { for(j = 0; j < nc_result_; j++) { bool var = false; for(ell = 0; ell < n_middle_; ell++) { size_t i_left = left(i, ell, k, nk); size_t i_right = right(ell, j, k, nk); bool nz_left = vx[i_left] |(tx[i_left] != 0.); bool nz_right = vx[i_right]|(tx[i_right] != 0.); // if not multiplying by the constant zero if( nz_left & nz_right ) var |= vx[i_left] | vx[i_right]; } size_t i_result = result(i, j, k, nk); vy[i_result] = var; } } } // initialize result as zero size_t k; for(i = 0; i < nr_result_; i++) { for(j = 0; j < nc_result_; j++) { for(k = q; k <= p; k++) ty[ result(i, j, k, p1) ] = 0.0; } } for(k = q; k <= p; k++) { // sum the produces that result in order k for(ell = 0; ell <= k; ell++) forward_multiply(ell, k - ell, tx, ty); } // all orders are implented, so always return true return true; } /* $$ $head reverse$$ $codep */ // reverse mode routine called by CppAD virtual bool reverse( size_t p , const vector& tx , const vector& ty , vector& px , const vector& py ) { size_t p1 = p + 1; assert( n_ * p1 == tx.size() ); assert( m_ * p1 == ty.size() ); assert( px.size() == tx.size() ); assert( py.size() == ty.size() ); // initialize summation for(size_t i = 0; i < px.size(); i++) px[i] = 0.0; // number of orders to differentiate size_t k = p1; while(k--) { // differentiate the produces that result in order k for(size_t ell = 0; ell <= k; ell++) reverse_multiply(ell, k - ell, tx, ty, px, py); } // all orders are implented, so always return true return true; } /* $$ $head for_sparse_jac$$ $codep */ // forward Jacobian sparsity routine called by CppAD virtual bool for_sparse_jac( size_t q , const vector& r , vector& s ) { assert( n_ * q == r.size() ); assert( m_ * q == s.size() ); size_t p; // sparsity for S(x) = f'(x) * R size_t nk = 1; size_t k = 0; for(size_t i = 0; i < nr_result_; i++) { for(size_t j = 0; j < nc_result_; j++) { size_t i_result = result(i, j, k, nk); for(p = 0; p < q; p++) s[i_result * q + p] = false; for(size_t ell = 0; ell < n_middle_; ell++) { size_t i_left = left(i, ell, k, nk); size_t i_right = right(ell, j, k, nk); for(p = 0; p < q; p++) { s[i_result * q + p] |= r[i_left * q + p ]; s[i_result * q + p] |= r[i_right * q + p ]; } } } } return true; } virtual bool for_sparse_jac( size_t q , const vector< std::set >& r , vector< std::set >& s ) { assert( n_ == r.size() ); assert( m_ == s.size() ); // sparsity for S(x) = f'(x) * R size_t nk = 1; size_t k = 0; for(size_t i = 0; i < nr_result_; i++) { for(size_t j = 0; j < nc_result_; j++) { size_t i_result = result(i, j, k, nk); s[i_result].clear(); for(size_t ell = 0; ell < n_middle_; ell++) { size_t i_left = left(i, ell, k, nk); size_t i_right = right(ell, j, k, nk); // my_union( s[i_result], s[i_result], r[i_left] ); my_union( s[i_result], s[i_result], r[i_right] ); } } } return true; } /* $$ $head rev_sparse_jac$$ $codep */ // reverse Jacobian sparsity routine called by CppAD virtual bool rev_sparse_jac( size_t q , const vector& rt , vector& st ) { assert( n_ * q == st.size() ); assert( m_ * q == rt.size() ); size_t i, j, p; // initialize for(i = 0; i < n_; i++) { for(p = 0; p < q; p++) st[ i * q + p ] = false; } // sparsity for S(x)^T = f'(x)^T * R^T size_t nk = 1; size_t k = 0; for(i = 0; i < nr_result_; i++) { for(j = 0; j < nc_result_; j++) { size_t i_result = result(i, j, k, nk); for(size_t ell = 0; ell < n_middle_; ell++) { size_t i_left = left(i, ell, k, nk); size_t i_right = right(ell, j, k, nk); for(p = 0; p < q; p++) { st[i_left * q + p] |= rt[i_result * q + p]; st[i_right* q + p] |= rt[i_result * q + p]; } } } } return true; } virtual bool rev_sparse_jac( size_t q , const vector< std::set >& rt , vector< std::set >& st ) { assert( n_ == st.size() ); assert( m_ == rt.size() ); size_t i, j; // initialize for(i = 0; i < n_; i++) st[i].clear(); // sparsity for S(x)^T = f'(x)^T * R^T size_t nk = 1; size_t k = 0; for(i = 0; i < nr_result_; i++) { for(j = 0; j < nc_result_; j++) { size_t i_result = result(i, j, k, nk); for(size_t ell = 0; ell < n_middle_; ell++) { size_t i_left = left(i, ell, k, nk); size_t i_right = right(ell, j, k, nk); // my_union(st[i_left], st[i_left], rt[i_result]); my_union(st[i_right], st[i_right], rt[i_result]); } } } return true; } /* $$ $head rev_sparse_hes$$ $codep */ // reverse Hessian sparsity routine called by CppAD virtual bool rev_sparse_hes( const vector& vx, const vector& s , vector& t , size_t q , const vector< std::set >& r , const vector< std::set >& u , vector< std::set >& v ) { size_t n = vx.size(); assert( t.size() == n ); assert( r.size() == n ); assert( v.size() == n ); # ifndef NDEBUG size_t m = s.size(); assert( u.size() == m ); # endif size_t i, j; // // initilaize sparsity patterns as false for(j = 0; j < n; j++) { t[j] = false; v[j].clear(); } size_t nk = 1; size_t k = 0; for(i = 0; i < nr_result_; i++) { for(j = 0; j < nc_result_; j++) { size_t i_result = result(i, j, k, nk); for(size_t ell = 0; ell < n_middle_; ell++) { size_t i_left = left(i, ell, k, nk); size_t i_right = right(ell, j, k, nk); // // Compute sparsity for T(x) = S(x) * f'(x). // We need not use vx with f'(x) back propagation. t[i_left] |= s[i_result]; t[i_right] |= s[i_result]; // V(x) = f'(x)^T * U(x) + S(x) * f''(x) * R // U(x) = g''(y) * f'(x) * R // S(x) = g'(y) // back propagate f'(x)^T * U(x) // (no need to use vx with f'(x) propogation) my_union(v[i_left], v[i_left], u[i_result] ); my_union(v[i_right], v[i_right], u[i_result] ); // back propagate S(x) * f''(x) * R // (here is where we must check for cross terms) if( s[i_result] & vx[i_left] & vx[i_right] ) { my_union(v[i_left], v[i_left], r[i_right] ); my_union(v[i_right], v[i_right], r[i_left] ); } } } } return true; } virtual bool rev_sparse_hes( const vector& vx, const vector& s , vector& t , size_t q , const vector& r , const vector& u , vector& v ) { size_t n = vx.size(); assert( t.size() == n ); assert( r.size() == n * q ); assert( v.size() == n * q ); # ifndef NDEBUG size_t m = s.size(); assert( u.size() == m * q ); # endif size_t i, j, p; // // initilaize sparsity patterns as false for(j = 0; j < n; j++) { t[j] = false; for(p = 0; p < q; p++) v[j * q + p] = false; } size_t nk = 1; size_t k = 0; for(i = 0; i < nr_result_; i++) { for(j = 0; j < nc_result_; j++) { size_t i_result = result(i, j, k, nk); for(size_t ell = 0; ell < n_middle_; ell++) { size_t i_left = left(i, ell, k, nk); size_t i_right = right(ell, j, k, nk); // // Compute sparsity for T(x) = S(x) * f'(x). // We so not need to use vx with f'(x) propagation. t[i_left] |= s[i_result]; t[i_right] |= s[i_result]; // V(x) = f'(x)^T * U(x) + S(x) * f''(x) * R // U(x) = g''(y) * f'(x) * R // S(x) = g'(y) // back propagate f'(x)^T * U(x) // (no need to use vx with f'(x) propogation) for(p = 0; p < q; p++) { v[ i_left * q + p] |= u[ i_result * q + p]; v[ i_right * q + p] |= u[ i_result * q + p]; } // back propagate S(x) * f''(x) * R // (here is where we must check for cross terms) if( s[i_result] & vx[i_left] & vx[i_right] ) { for(p = 0; p < q; p++) { v[i_left * q + p] |= r[i_right * q + p]; v[i_right * q + p] |= r[i_left * q + p]; } } } } } return true; } /* $$ $head End Class Definition$$ $codep */ }; // End of matrix_mul class } // End empty namespace /* $$ $$ $comment end nospell$$ $end */ # endif