multi__bspline__eval__std__d_8h_source.html

//  einspline:  a library for creating and evaluating B-splines            //

//  Copyright (C) 2007 Kenneth P. Esler, Jr.                               //

//                                                                         //

//  This program is free software; you can redistribute it and/or modify   //

//  it under the terms of the GNU General Public License as published by   //

//  the Free Software Foundation; either version 2 of the License, or      //

//  (at your option) any later version.                                    //

//                                                                         //

//  This program is distributed in the hope that it will be useful,        //

//  but WITHOUT ANY WARRANTY; without even the implied warranty of         //

//  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the          //

//  GNU General Public License for more details.                           //

//                                                                         //

//  You should have received a copy of the GNU General Public License      //

//  along with this program; if not, write to the Free Software            //

//  Foundation, Inc., 51 Franklin Street, Fifth Floor,                     //

//  Boston, MA  02110-1301  USA                                            //


#ifndef MULTI_BSPLINE_EVAL_STD_D_H

#define MULTI_BSPLINE_EVAL_STD_D_H


#include <math.h>

#include <stdio.h>

#include "multi_bspline_structs.h"


extern const double* restrict   Ad;

extern const double* restrict  dAd;

extern const double* restrict d2Ad;

extern const double* restrict d3Ad;


/************************************************************/

/* 1D double-precision, real evaulation functions        */

/************************************************************/

inline void


eval_multi_UBspline_1d_d (multi_UBspline_1d_d *spline,

              double x,

              double* restrict vals)

{

  x -= spline->x_grid.start;

  double ux = x*spline->x_grid.delta_inv;

  double ipartx, tx;

  tx = modf (ux, &ipartx);  int ix = (int) ipartx;


  double tpx[4], a[4];

  tpx[0] = tx*tx*tx;  tpx[1] = tx*tx;  tpx[2] = tx;  tpx[3] = 1.0;

  double* restrict coefs = spline->coefs;


  a[0]  = (Ad[ 0]*tpx[0] + Ad[ 1]*tpx[1] + Ad[ 2]*tpx[2] + Ad[ 3]*tpx[3]);

  a[1]  = (Ad[ 4]*tpx[0] + Ad[ 5]*tpx[1] + Ad[ 6]*tpx[2] + Ad[ 7]*tpx[3]);

  a[2]  = (Ad[ 8]*tpx[0] + Ad[ 9]*tpx[1] + Ad[10]*tpx[2] + Ad[11]*tpx[3]);

  a[3]  = (Ad[12]*tpx[0] + Ad[13]*tpx[1] + Ad[14]*tpx[2] + Ad[15]*tpx[3]);


  int xs = spline->x_stride;


  for (int n=0; n<spline->num_splines; n++)

    vals[n]  = 0.0;


  for (int i=0; i<4; i++) {

    double* restrict coefs = spline->coefs + ((ix+i)*xs);

    for (int n=0; n<spline->num_splines; n++)

      vals[n]  +=   a[i] * coefs[n];

  }

}


inline void


eval_multi_UBspline_1d_d_vg (multi_UBspline_1d_d *spline,

                 double x,

                 double* restrict vals,

                 double* restrict grads)

{

  x -= spline->x_grid.start;

  double ux = x*spline->x_grid.delta_inv;

  double ipartx, tx;

  tx = modf (ux, &ipartx);  int ix = (int) ipartx;


  double tpx[4], a[4], da[4];

  tpx[0] = tx*tx*tx;  tpx[1] = tx*tx;  tpx[2] = tx;  tpx[3] = 1.0;

  double* restrict coefs = spline->coefs;


  a[0]  = (Ad[ 0]*tpx[0] + Ad[ 1]*tpx[1] + Ad[ 2]*tpx[2] + Ad[ 3]*tpx[3]);

  a[1]  = (Ad[ 4]*tpx[0] + Ad[ 5]*tpx[1] + Ad[ 6]*tpx[2] + Ad[ 7]*tpx[3]);

  a[2]  = (Ad[ 8]*tpx[0] + Ad[ 9]*tpx[1] + Ad[10]*tpx[2] + Ad[11]*tpx[3]);

  a[3]  = (Ad[12]*tpx[0] + Ad[13]*tpx[1] + Ad[14]*tpx[2] + Ad[15]*tpx[3]);

  da[0] = (dAd[ 0]*tpx[0] + dAd[ 1]*tpx[1] + dAd[ 2]*tpx[2] + dAd[ 3]*tpx[3]);

  da[1] = (dAd[ 4]*tpx[0] + dAd[ 5]*tpx[1] + dAd[ 6]*tpx[2] + dAd[ 7]*tpx[3]);

  da[2] = (dAd[ 8]*tpx[0] + dAd[ 9]*tpx[1] + dAd[10]*tpx[2] + dAd[11]*tpx[3]);

  da[3] = (dAd[12]*tpx[0] + dAd[13]*tpx[1] + dAd[14]*tpx[2] + dAd[15]*tpx[3]);


  int xs = spline->x_stride;


  for (int n=0; n<spline->num_splines; n++) {

    vals[n]  = 0.0;

    grads[n] = 0.0;

  }


  for (int i=0; i<4; i++) {

    double* restrict coefs = spline->coefs + ((ix+i)*xs);

    for (int n=0; n<spline->num_splines; n++) {

      vals[n]  +=   a[i] * coefs[n];

      grads[n] +=  da[i] * coefs[n];

    }

  }


  double dxInv = spline->x_grid.delta_inv;

  for (int n=0; n<spline->num_splines; n++)

    grads[n] *= dxInv;

}


inline void


eval_multi_UBspline_1d_d_vgl (multi_UBspline_1d_d *spline,

                  double x,

                  double* restrict vals,

                  double* restrict grads,

                  double* restrict lapl)

{

  x -= spline->x_grid.start;

  double ux = x*spline->x_grid.delta_inv;

  double ipartx, tx;

  tx = modf (ux, &ipartx);  int ix = (int) ipartx;


  double tpx[4], a[4], da[4], d2a[4];

  tpx[0] = tx*tx*tx;  tpx[1] = tx*tx;  tpx[2] = tx;  tpx[3] = 1.0;

  double* restrict coefs = spline->coefs;


  a[0]  = (Ad[ 0]*tpx[0] + Ad[ 1]*tpx[1] + Ad[ 2]*tpx[2] + Ad[ 3]*tpx[3]);

  a[1]  = (Ad[ 4]*tpx[0] + Ad[ 5]*tpx[1] + Ad[ 6]*tpx[2] + Ad[ 7]*tpx[3]);

  a[2]  = (Ad[ 8]*tpx[0] + Ad[ 9]*tpx[1] + Ad[10]*tpx[2] + Ad[11]*tpx[3]);

  a[3]  = (Ad[12]*tpx[0] + Ad[13]*tpx[1] + Ad[14]*tpx[2] + Ad[15]*tpx[3]);

  da[0] = (dAd[ 0]*tpx[0] + dAd[ 1]*tpx[1] + dAd[ 2]*tpx[2] + dAd[ 3]*tpx[3]);

  da[1] = (dAd[ 4]*tpx[0] + dAd[ 5]*tpx[1] + dAd[ 6]*tpx[2] + dAd[ 7]*tpx[3]);

  da[2] = (dAd[ 8]*tpx[0] + dAd[ 9]*tpx[1] + dAd[10]*tpx[2] + dAd[11]*tpx[3]);

  da[3] = (dAd[12]*tpx[0] + dAd[13]*tpx[1] + dAd[14]*tpx[2] + dAd[15]*tpx[3]);

  d2a[0] = (d2Ad[ 0]*tpx[0] + d2Ad[ 1]*tpx[1] + d2Ad[ 2]*tpx[2] + d2Ad[ 3]*tpx[3]);

  d2a[1] = (d2Ad[ 4]*tpx[0] + d2Ad[ 5]*tpx[1] + d2Ad[ 6]*tpx[2] + d2Ad[ 7]*tpx[3]);

  d2a[2] = (d2Ad[ 8]*tpx[0] + d2Ad[ 9]*tpx[1] + d2Ad[10]*tpx[2] + d2Ad[11]*tpx[3]);

  d2a[3] = (d2Ad[12]*tpx[0] + d2Ad[13]*tpx[1] + d2Ad[14]*tpx[2] + d2Ad[15]*tpx[3]);


  int xs = spline->x_stride;


  for (int n=0; n<spline->num_splines; n++) {

    vals[n]  = 0.0;

    grads[n] = 0.0;

    lapl[n]  = 0.0;

  }


  for (int i=0; i<4; i++) {

    double* restrict coefs = spline->coefs + ((ix+i)*xs);

    for (int n=0; n<spline->num_splines; n++) {

      vals[n]  +=   a[i] * coefs[n];

      grads[n] +=  da[i] * coefs[n];

      lapl[n]  += d2a[i] * coefs[n];

    }

  }


  double dxInv = spline->x_grid.delta_inv;

  for (int n=0; n<spline->num_splines; n++) {

    grads[n] *= dxInv;

    lapl [n] *= dxInv*dxInv;

  }

}


inline void


eval_multi_UBspline_1d_d_vgh (multi_UBspline_1d_d *spline,

                  double x,

                  double* restrict vals,

                  double* restrict grads,

                  double* restrict hess)

{

  eval_multi_UBspline_1d_d_vgl (spline, x, vals, grads, hess);

}


/************************************************************/

/* 2D double-precision, real evaulation functions        */

/************************************************************/

inline void


eval_multi_UBspline_2d_d (multi_UBspline_2d_d *spline,

              double x, double y,

              double* restrict vals)

{

  x -= spline->x_grid.start;

  y -= spline->y_grid.start;

  double ux = x*spline->x_grid.delta_inv;

  double uy = y*spline->y_grid.delta_inv;

  double ipartx, iparty, tx, ty;

  tx = modf (ux, &ipartx);  int ix = (int) ipartx;

  ty = modf (uy, &iparty);  int iy = (int) iparty;


  double tpx[4], tpy[4], a[4], b[4];

  tpx[0] = tx*tx*tx;  tpx[1] = tx*tx;  tpx[2] = tx;  tpx[3] = 1.0;

  tpy[0] = ty*ty*ty;  tpy[1] = ty*ty;  tpy[2] = ty;  tpy[3] = 1.0;

  double* restrict coefs = spline->coefs;


  a[0] = (Ad[ 0]*tpx[0] + Ad[ 1]*tpx[1] + Ad[ 2]*tpx[2] + Ad[ 3]*tpx[3]);

  a[1] = (Ad[ 4]*tpx[0] + Ad[ 5]*tpx[1] + Ad[ 6]*tpx[2] + Ad[ 7]*tpx[3]);

  a[2] = (Ad[ 8]*tpx[0] + Ad[ 9]*tpx[1] + Ad[10]*tpx[2] + Ad[11]*tpx[3]);

  a[3] = (Ad[12]*tpx[0] + Ad[13]*tpx[1] + Ad[14]*tpx[2] + Ad[15]*tpx[3]);


  b[0] = (Ad[ 0]*tpy[0] + Ad[ 1]*tpy[1] + Ad[ 2]*tpy[2] + Ad[ 3]*tpy[3]);

  b[1] = (Ad[ 4]*tpy[0] + Ad[ 5]*tpy[1] + Ad[ 6]*tpy[2] + Ad[ 7]*tpy[3]);

  b[2] = (Ad[ 8]*tpy[0] + Ad[ 9]*tpy[1] + Ad[10]*tpy[2] + Ad[11]*tpy[3]);

  b[3] = (Ad[12]*tpy[0] + Ad[13]*tpy[1] + Ad[14]*tpy[2] + Ad[15]*tpy[3]);


  int xs = spline->x_stride;

  int ys = spline->y_stride;


  for (int n=0; n<spline->num_splines; n++)

    vals[n] = 0.0;


  for (int i=0; i<4; i++)

    for (int j=0; j<4; j++) {

      double prefactor = a[i]*b[j];

      double* restrict coefs = spline->coefs + ((ix+i)*xs + (iy+j)*ys);

      for (int n=0; n<spline->num_splines; n++)

    vals[n] += prefactor*coefs[n];

    }

}


inline void


eval_multi_UBspline_2d_d_vg (multi_UBspline_2d_d *spline,

                 double x, double y,

                 double* restrict vals,

                 double* restrict grads)

{

  x -= spline->x_grid.start;

  y -= spline->y_grid.start;

  double ux = x*spline->x_grid.delta_inv;

  double uy = y*spline->y_grid.delta_inv;

  double ipartx, iparty, tx, ty;

  tx = modf (ux, &ipartx);  int ix = (int) ipartx;

  ty = modf (uy, &iparty);  int iy = (int) iparty;


  double tpx[4], tpy[4], a[4], b[4], da[4], db[4];

  tpx[0] = tx*tx*tx;  tpx[1] = tx*tx;  tpx[2] = tx;  tpx[3] = 1.0;

  tpy[0] = ty*ty*ty;  tpy[1] = ty*ty;  tpy[2] = ty;  tpy[3] = 1.0;

  double* restrict coefs = spline->coefs;


  a[0]  = (Ad[ 0]*tpx[0] + Ad[ 1]*tpx[1] + Ad[ 2]*tpx[2] + Ad[ 3]*tpx[3]);

  a[1]  = (Ad[ 4]*tpx[0] + Ad[ 5]*tpx[1] + Ad[ 6]*tpx[2] + Ad[ 7]*tpx[3]);

  a[2]  = (Ad[ 8]*tpx[0] + Ad[ 9]*tpx[1] + Ad[10]*tpx[2] + Ad[11]*tpx[3]);

  a[3]  = (Ad[12]*tpx[0] + Ad[13]*tpx[1] + Ad[14]*tpx[2] + Ad[15]*tpx[3]);

  da[0] = (dAd[ 0]*tpx[0] + dAd[ 1]*tpx[1] + dAd[ 2]*tpx[2] + dAd[ 3]*tpx[3]);

  da[1] = (dAd[ 4]*tpx[0] + dAd[ 5]*tpx[1] + dAd[ 6]*tpx[2] + dAd[ 7]*tpx[3]);

  da[2] = (dAd[ 8]*tpx[0] + dAd[ 9]*tpx[1] + dAd[10]*tpx[2] + dAd[11]*tpx[3]);

  da[3] = (dAd[12]*tpx[0] + dAd[13]*tpx[1] + dAd[14]*tpx[2] + dAd[15]*tpx[3]);


  b[0] = (Ad[ 0]*tpy[0] + Ad[ 1]*tpy[1] + Ad[ 2]*tpy[2] + Ad[ 3]*tpy[3]);

  b[1] = (Ad[ 4]*tpy[0] + Ad[ 5]*tpy[1] + Ad[ 6]*tpy[2] + Ad[ 7]*tpy[3]);

  b[2] = (Ad[ 8]*tpy[0] + Ad[ 9]*tpy[1] + Ad[10]*tpy[2] + Ad[11]*tpy[3]);

  b[3] = (Ad[12]*tpy[0] + Ad[13]*tpy[1] + Ad[14]*tpy[2] + Ad[15]*tpy[3]);

  db[0] = (dAd[ 0]*tpy[0] + dAd[ 1]*tpy[1] + dAd[ 2]*tpy[2] + dAd[ 3]*tpy[3]);

  db[1] = (dAd[ 4]*tpy[0] + dAd[ 5]*tpy[1] + dAd[ 6]*tpy[2] + dAd[ 7]*tpy[3]);

  db[2] = (dAd[ 8]*tpy[0] + dAd[ 9]*tpy[1] + dAd[10]*tpy[2] + dAd[11]*tpy[3]);

  db[3] = (dAd[12]*tpy[0] + dAd[13]*tpy[1] + dAd[14]*tpy[2] + dAd[15]*tpy[3]);


  int xs = spline->x_stride;

  int ys = spline->y_stride;


  for (int n=0; n<spline->num_splines; n++) {

    vals[n] = 0.0;

    grads[2*n+0] = grads[2*n+1] = grads[2*n+2] = 0.0;

  }


  for (int i=0; i<4; i++)

    for (int j=0; j<4; j++) {

      double ab = a[i]*b[j];

      double dab[2];

      dab[0] = da[i]* b[j];

      dab[1] =  a[i]*db[j];


      double* restrict coefs = spline->coefs + ((ix+i)*xs + (iy+j)*ys);

      for (int n=0; n<spline->num_splines; n++) {

    vals [n]     +=   ab   *coefs[n];

    grads[2*n+0] +=  dab[0]*coefs[n];

    grads[2*n+1] +=  dab[1]*coefs[n];

      }

    }


  double dxInv = spline->x_grid.delta_inv;

  double dyInv = spline->y_grid.delta_inv;

  for (int n=0; n<spline->num_splines; n++) {

    grads[2*n+0] *= dxInv;

    grads[2*n+1] *= dyInv;

  }

}


inline void


eval_multi_UBspline_2d_d_vgl (multi_UBspline_2d_d *spline,

                  double x, double y,

                  double* restrict vals,

                  double* restrict grads,

                  double* restrict lapl)

{

  x -= spline->x_grid.start;

  y -= spline->y_grid.start;

  double ux = x*spline->x_grid.delta_inv;

  double uy = y*spline->y_grid.delta_inv;

  double ipartx, iparty, tx, ty;

  tx = modf (ux, &ipartx);  int ix = (int) ipartx;

  ty = modf (uy, &iparty);  int iy = (int) iparty;


  double tpx[4], tpy[4], a[4], b[4], da[4], db[4], d2a[4], d2b[4];

  tpx[0] = tx*tx*tx;  tpx[1] = tx*tx;  tpx[2] = tx;  tpx[3] = 1.0;

  tpy[0] = ty*ty*ty;  tpy[1] = ty*ty;  tpy[2] = ty;  tpy[3] = 1.0;

  double* restrict coefs = spline->coefs;


  a[0]  = (Ad[ 0]*tpx[0] + Ad[ 1]*tpx[1] + Ad[ 2]*tpx[2] + Ad[ 3]*tpx[3]);

  a[1]  = (Ad[ 4]*tpx[0] + Ad[ 5]*tpx[1] + Ad[ 6]*tpx[2] + Ad[ 7]*tpx[3]);

  a[2]  = (Ad[ 8]*tpx[0] + Ad[ 9]*tpx[1] + Ad[10]*tpx[2] + Ad[11]*tpx[3]);

  a[3]  = (Ad[12]*tpx[0] + Ad[13]*tpx[1] + Ad[14]*tpx[2] + Ad[15]*tpx[3]);

  da[0] = (dAd[ 0]*tpx[0] + dAd[ 1]*tpx[1] + dAd[ 2]*tpx[2] + dAd[ 3]*tpx[3]);

  da[1] = (dAd[ 4]*tpx[0] + dAd[ 5]*tpx[1] + dAd[ 6]*tpx[2] + dAd[ 7]*tpx[3]);

  da[2] = (dAd[ 8]*tpx[0] + dAd[ 9]*tpx[1] + dAd[10]*tpx[2] + dAd[11]*tpx[3]);

  da[3] = (dAd[12]*tpx[0] + dAd[13]*tpx[1] + dAd[14]*tpx[2] + dAd[15]*tpx[3]);

  d2a[0] = (d2Ad[ 0]*tpx[0] + d2Ad[ 1]*tpx[1] + d2Ad[ 2]*tpx[2] + d2Ad[ 3]*tpx[3]);

  d2a[1] = (d2Ad[ 4]*tpx[0] + d2Ad[ 5]*tpx[1] + d2Ad[ 6]*tpx[2] + d2Ad[ 7]*tpx[3]);

  d2a[2] = (d2Ad[ 8]*tpx[0] + d2Ad[ 9]*tpx[1] + d2Ad[10]*tpx[2] + d2Ad[11]*tpx[3]);

  d2a[3] = (d2Ad[12]*tpx[0] + d2Ad[13]*tpx[1] + d2Ad[14]*tpx[2] + d2Ad[15]*tpx[3]);


  b[0] = (Ad[ 0]*tpy[0] + Ad[ 1]*tpy[1] + Ad[ 2]*tpy[2] + Ad[ 3]*tpy[3]);

  b[1] = (Ad[ 4]*tpy[0] + Ad[ 5]*tpy[1] + Ad[ 6]*tpy[2] + Ad[ 7]*tpy[3]);

  b[2] = (Ad[ 8]*tpy[0] + Ad[ 9]*tpy[1] + Ad[10]*tpy[2] + Ad[11]*tpy[3]);

  b[3] = (Ad[12]*tpy[0] + Ad[13]*tpy[1] + Ad[14]*tpy[2] + Ad[15]*tpy[3]);

  db[0] = (dAd[ 0]*tpy[0] + dAd[ 1]*tpy[1] + dAd[ 2]*tpy[2] + dAd[ 3]*tpy[3]);

  db[1] = (dAd[ 4]*tpy[0] + dAd[ 5]*tpy[1] + dAd[ 6]*tpy[2] + dAd[ 7]*tpy[3]);

  db[2] = (dAd[ 8]*tpy[0] + dAd[ 9]*tpy[1] + dAd[10]*tpy[2] + dAd[11]*tpy[3]);

  db[3] = (dAd[12]*tpy[0] + dAd[13]*tpy[1] + dAd[14]*tpy[2] + dAd[15]*tpy[3]);

  d2b[0] = (d2Ad[ 0]*tpy[0] + d2Ad[ 1]*tpy[1] + d2Ad[ 2]*tpy[2] + d2Ad[ 3]*tpy[3]);

  d2b[1] = (d2Ad[ 4]*tpy[0] + d2Ad[ 5]*tpy[1] + d2Ad[ 6]*tpy[2] + d2Ad[ 7]*tpy[3]);

  d2b[2] = (d2Ad[ 8]*tpy[0] + d2Ad[ 9]*tpy[1] + d2Ad[10]*tpy[2] + d2Ad[11]*tpy[3]);

  d2b[3] = (d2Ad[12]*tpy[0] + d2Ad[13]*tpy[1] + d2Ad[14]*tpy[2] + d2Ad[15]*tpy[3]);


  int xs = spline->x_stride;

  int ys = spline->y_stride;


  double lapl2[2*spline->num_splines];

  for (int n=0; n<spline->num_splines; n++) {

    vals[n] = 0.0;

    grads[2*n+0] = grads[2*n+1] = 0.0;

    lapl2[2*n+0] = lapl2[2*n+1] = 0.0;

  }


  for (int i=0; i<4; i++)

    for (int j=0; j<4; j++) {

      double ab = a[i]*b[j];

      double dab[2], d2ab[2];

      dab[0] = da[i]* b[j];

      dab[1] =  a[i]*db[j];

      d2ab[0] = d2a[i]*  b[j];

      d2ab[1] =   a[i]*d2b[j];


      double* restrict coefs = spline->coefs + ((ix+i)*xs + (iy+j)*ys);

      for (int n=0; n<spline->num_splines; n++) {

    vals[n]      +=   ab   *coefs[n];

    grads[2*n+0] +=  dab[0]*coefs[n];

    grads[2*n+1] +=  dab[1]*coefs[n];

    lapl2[2*n+0] += d2ab[0]*coefs[n];

    lapl2[2*n+1] += d2ab[1]*coefs[n];

      }

    }


  double dxInv = spline->x_grid.delta_inv;

  double dyInv = spline->y_grid.delta_inv;

  for (int n=0; n<spline->num_splines; n++) {

    grads[2*n+0] *= dxInv;

    grads[2*n+1] *= dyInv;

    lapl2[2*n+0] *= dxInv*dxInv;

    lapl2[2*n+1] *= dyInv*dyInv;

    lapl[n] = lapl2[2*n+0] + lapl2[2*n+1];

  }

}


inline void


eval_multi_UBspline_2d_d_vgh (multi_UBspline_2d_d *spline,

                  double x, double y,

                  double* restrict vals,

                  double* restrict grads,

                  double* restrict hess)

{

  x -= spline->x_grid.start;

  y -= spline->y_grid.start;

  double ux = x*spline->x_grid.delta_inv;

  double uy = y*spline->y_grid.delta_inv;

  double ipartx, iparty, tx, ty;

  tx = modf (ux, &ipartx);  int ix = (int) ipartx;

  ty = modf (uy, &iparty);  int iy = (int) iparty;


  double tpx[4], tpy[4], a[4], b[4], da[4], db[4], d2a[4], d2b[4];

  tpx[0] = tx*tx*tx;  tpx[1] = tx*tx;  tpx[2] = tx;  tpx[3] = 1.0;

  tpy[0] = ty*ty*ty;  tpy[1] = ty*ty;  tpy[2] = ty;  tpy[3] = 1.0;

  double* restrict coefs = spline->coefs;


  a[0]  = (Ad[ 0]*tpx[0] + Ad[ 1]*tpx[1] + Ad[ 2]*tpx[2] + Ad[ 3]*tpx[3]);

  a[1]  = (Ad[ 4]*tpx[0] + Ad[ 5]*tpx[1] + Ad[ 6]*tpx[2] + Ad[ 7]*tpx[3]);

  a[2]  = (Ad[ 8]*tpx[0] + Ad[ 9]*tpx[1] + Ad[10]*tpx[2] + Ad[11]*tpx[3]);

  a[3]  = (Ad[12]*tpx[0] + Ad[13]*tpx[1] + Ad[14]*tpx[2] + Ad[15]*tpx[3]);

  da[0] = (dAd[ 0]*tpx[0] + dAd[ 1]*tpx[1] + dAd[ 2]*tpx[2] + dAd[ 3]*tpx[3]);

  da[1] = (dAd[ 4]*tpx[0] + dAd[ 5]*tpx[1] + dAd[ 6]*tpx[2] + dAd[ 7]*tpx[3]);

  da[2] = (dAd[ 8]*tpx[0] + dAd[ 9]*tpx[1] + dAd[10]*tpx[2] + dAd[11]*tpx[3]);

  da[3] = (dAd[12]*tpx[0] + dAd[13]*tpx[1] + dAd[14]*tpx[2] + dAd[15]*tpx[3]);

  d2a[0] = (d2Ad[ 0]*tpx[0] + d2Ad[ 1]*tpx[1] + d2Ad[ 2]*tpx[2] + d2Ad[ 3]*tpx[3]);

  d2a[1] = (d2Ad[ 4]*tpx[0] + d2Ad[ 5]*tpx[1] + d2Ad[ 6]*tpx[2] + d2Ad[ 7]*tpx[3]);

  d2a[2] = (d2Ad[ 8]*tpx[0] + d2Ad[ 9]*tpx[1] + d2Ad[10]*tpx[2] + d2Ad[11]*tpx[3]);

  d2a[3] = (d2Ad[12]*tpx[0] + d2Ad[13]*tpx[1] + d2Ad[14]*tpx[2] + d2Ad[15]*tpx[3]);


  b[0] = (Ad[ 0]*tpy[0] + Ad[ 1]*tpy[1] + Ad[ 2]*tpy[2] + Ad[ 3]*tpy[3]);

  b[1] = (Ad[ 4]*tpy[0] + Ad[ 5]*tpy[1] + Ad[ 6]*tpy[2] + Ad[ 7]*tpy[3]);

  b[2] = (Ad[ 8]*tpy[0] + Ad[ 9]*tpy[1] + Ad[10]*tpy[2] + Ad[11]*tpy[3]);

  b[3] = (Ad[12]*tpy[0] + Ad[13]*tpy[1] + Ad[14]*tpy[2] + Ad[15]*tpy[3]);

  db[0] = (dAd[ 0]*tpy[0] + dAd[ 1]*tpy[1] + dAd[ 2]*tpy[2] + dAd[ 3]*tpy[3]);

  db[1] = (dAd[ 4]*tpy[0] + dAd[ 5]*tpy[1] + dAd[ 6]*tpy[2] + dAd[ 7]*tpy[3]);

  db[2] = (dAd[ 8]*tpy[0] + dAd[ 9]*tpy[1] + dAd[10]*tpy[2] + dAd[11]*tpy[3]);

  db[3] = (dAd[12]*tpy[0] + dAd[13]*tpy[1] + dAd[14]*tpy[2] + dAd[15]*tpy[3]);

  d2b[0] = (d2Ad[ 0]*tpy[0] + d2Ad[ 1]*tpy[1] + d2Ad[ 2]*tpy[2] + d2Ad[ 3]*tpy[3]);

  d2b[1] = (d2Ad[ 4]*tpy[0] + d2Ad[ 5]*tpy[1] + d2Ad[ 6]*tpy[2] + d2Ad[ 7]*tpy[3]);

  d2b[2] = (d2Ad[ 8]*tpy[0] + d2Ad[ 9]*tpy[1] + d2Ad[10]*tpy[2] + d2Ad[11]*tpy[3]);

  d2b[3] = (d2Ad[12]*tpy[0] + d2Ad[13]*tpy[1] + d2Ad[14]*tpy[2] + d2Ad[15]*tpy[3]);


  int xs = spline->x_stride;

  int ys = spline->y_stride;


  for (int n=0; n<spline->num_splines; n++) {

    vals[n] = 0.0;

    grads[2*n+0] = grads[2*n+1] = 0.0;

    for (int i=0; i<4; i++)

      hess[4*n+i] = 0.0;

  }


  for (int i=0; i<4; i++)

    for (int j=0; j<4; j++){

      double ab = a[i]*b[j];

      double dab[2], d2ab[3];

      dab[0] = da[i]* b[j];

      dab[1] =  a[i]*db[j];

      d2ab[0] = d2a[i] *   b[j];

      d2ab[1] =  da[i] *  db[j];

      d2ab[2] =   a[i] * d2b[j];


      double* restrict coefs = spline->coefs + ((ix+i)*xs + (iy+j)*ys);

      for (int n=0; n<spline->num_splines; n++) {

    vals[n]      +=   ab   *coefs[n];

    grads[2*n+0] +=  dab[0]*coefs[n];

    grads[2*n+1] +=  dab[1]*coefs[n];

    hess [4*n+0] += d2ab[0]*coefs[n];

    hess [4*n+1] += d2ab[1]*coefs[n];

    hess [4*n+3] += d2ab[2]*coefs[n];

      }

    }


  double dxInv = spline->x_grid.delta_inv;

  double dyInv = spline->y_grid.delta_inv;

  for (int n=0; n<spline->num_splines; n++) {

    grads[2*n+0] *= dxInv;

    grads[2*n+1] *= dyInv;

    hess[4*n+0] *= dxInv*dxInv;

    hess[4*n+1] *= dxInv*dyInv;

    hess[4*n+3] *= dyInv*dyInv;

    // Copy hessian elements into lower half of 3x3 matrix

    hess[4*n+2] = hess[4*n+1];

  }

}


/************************************************************/

/* 3D double-precision, real evaulation functions           */

/************************************************************/

inline void


eval_multi_UBspline_3d_d (multi_UBspline_3d_d *spline,

              double x, double y, double z,

              double* restrict vals)

{

  x -= spline->x_grid.start;

  y -= spline->y_grid.start;

  z -= spline->z_grid.start;

  double ux = x*spline->x_grid.delta_inv;

  double uy = y*spline->y_grid.delta_inv;

  double uz = z*spline->z_grid.delta_inv;

  double ipartx, iparty, ipartz, tx, ty, tz;

  tx = modf (ux, &ipartx);  int ix = (int) ipartx;

  ty = modf (uy, &iparty);  int iy = (int) iparty;

  tz = modf (uz, &ipartz);  int iz = (int) ipartz;


  double tpx[4], tpy[4], tpz[4], a[4], b[4], c[4];

  tpx[0] = tx*tx*tx;  tpx[1] = tx*tx;  tpx[2] = tx;  tpx[3] = 1.0;

  tpy[0] = ty*ty*ty;  tpy[1] = ty*ty;  tpy[2] = ty;  tpy[3] = 1.0;

  tpz[0] = tz*tz*tz;  tpz[1] = tz*tz;  tpz[2] = tz;  tpz[3] = 1.0;

  double* restrict coefs = spline->coefs;


  a[0] = (Ad[ 0]*tpx[0] + Ad[ 1]*tpx[1] + Ad[ 2]*tpx[2] + Ad[ 3]*tpx[3]);

  a[1] = (Ad[ 4]*tpx[0] + Ad[ 5]*tpx[1] + Ad[ 6]*tpx[2] + Ad[ 7]*tpx[3]);

  a[2] = (Ad[ 8]*tpx[0] + Ad[ 9]*tpx[1] + Ad[10]*tpx[2] + Ad[11]*tpx[3]);

  a[3] = (Ad[12]*tpx[0] + Ad[13]*tpx[1] + Ad[14]*tpx[2] + Ad[15]*tpx[3]);


  b[0] = (Ad[ 0]*tpy[0] + Ad[ 1]*tpy[1] + Ad[ 2]*tpy[2] + Ad[ 3]*tpy[3]);

  b[1] = (Ad[ 4]*tpy[0] + Ad[ 5]*tpy[1] + Ad[ 6]*tpy[2] + Ad[ 7]*tpy[3]);

  b[2] = (Ad[ 8]*tpy[0] + Ad[ 9]*tpy[1] + Ad[10]*tpy[2] + Ad[11]*tpy[3]);

  b[3] = (Ad[12]*tpy[0] + Ad[13]*tpy[1] + Ad[14]*tpy[2] + Ad[15]*tpy[3]);


  c[0] = (Ad[ 0]*tpz[0] + Ad[ 1]*tpz[1] + Ad[ 2]*tpz[2] + Ad[ 3]*tpz[3]);

  c[1] = (Ad[ 4]*tpz[0] + Ad[ 5]*tpz[1] + Ad[ 6]*tpz[2] + Ad[ 7]*tpz[3]);

  c[2] = (Ad[ 8]*tpz[0] + Ad[ 9]*tpz[1] + Ad[10]*tpz[2] + Ad[11]*tpz[3]);

  c[3] = (Ad[12]*tpz[0] + Ad[13]*tpz[1] + Ad[14]*tpz[2] + Ad[15]*tpz[3]);


  int xs = spline->x_stride;

  int ys = spline->y_stride;

  int zs = spline->z_stride;


  for (int n=0; n<spline->num_splines; n++)

    vals[n] = 0.0;


  for (int i=0; i<4; i++)

    for (int j=0; j<4; j++)

      for (int k=0; k<4; k++) {

    double prefactor = a[i]*b[j]*c[k];

    double* restrict coefs = spline->coefs + ((ix+i)*xs + (iy+j)*ys + (iz+k)*zs);

    for (int n=0; n<spline->num_splines; n++)

      vals[n] += prefactor*coefs[n];

      }

}


inline void


eval_multi_UBspline_3d_d_vg (multi_UBspline_3d_d *spline,

                 double x, double y, double z,

                 double* restrict vals,

                 double* restrict grads)

{

  x -= spline->x_grid.start;

  y -= spline->y_grid.start;

  z -= spline->z_grid.start;

  double ux = x*spline->x_grid.delta_inv;

  double uy = y*spline->y_grid.delta_inv;

  double uz = z*spline->z_grid.delta_inv;

  double ipartx, iparty, ipartz, tx, ty, tz;

  tx = modf (ux, &ipartx);  int ix = (int) ipartx;

  ty = modf (uy, &iparty);  int iy = (int) iparty;

  tz = modf (uz, &ipartz);  int iz = (int) ipartz;


  double tpx[4], tpy[4], tpz[4], a[4], b[4], c[4],

    da[4], db[4], dc[4];

  tpx[0] = tx*tx*tx;  tpx[1] = tx*tx;  tpx[2] = tx;  tpx[3] = 1.0;

  tpy[0] = ty*ty*ty;  tpy[1] = ty*ty;  tpy[2] = ty;  tpy[3] = 1.0;

  tpz[0] = tz*tz*tz;  tpz[1] = tz*tz;  tpz[2] = tz;  tpz[3] = 1.0;

  double* restrict coefs = spline->coefs;


  a[0]  = (Ad[ 0]*tpx[0] + Ad[ 1]*tpx[1] + Ad[ 2]*tpx[2] + Ad[ 3]*tpx[3]);

  a[1]  = (Ad[ 4]*tpx[0] + Ad[ 5]*tpx[1] + Ad[ 6]*tpx[2] + Ad[ 7]*tpx[3]);

  a[2]  = (Ad[ 8]*tpx[0] + Ad[ 9]*tpx[1] + Ad[10]*tpx[2] + Ad[11]*tpx[3]);

  a[3]  = (Ad[12]*tpx[0] + Ad[13]*tpx[1] + Ad[14]*tpx[2] + Ad[15]*tpx[3]);

  da[0] = (dAd[ 0]*tpx[0] + dAd[ 1]*tpx[1] + dAd[ 2]*tpx[2] + dAd[ 3]*tpx[3]);

  da[1] = (dAd[ 4]*tpx[0] + dAd[ 5]*tpx[1] + dAd[ 6]*tpx[2] + dAd[ 7]*tpx[3]);

  da[2] = (dAd[ 8]*tpx[0] + dAd[ 9]*tpx[1] + dAd[10]*tpx[2] + dAd[11]*tpx[3]);

  da[3] = (dAd[12]*tpx[0] + dAd[13]*tpx[1] + dAd[14]*tpx[2] + dAd[15]*tpx[3]);


  b[0] = (Ad[ 0]*tpy[0] + Ad[ 1]*tpy[1] + Ad[ 2]*tpy[2] + Ad[ 3]*tpy[3]);

  b[1] = (Ad[ 4]*tpy[0] + Ad[ 5]*tpy[1] + Ad[ 6]*tpy[2] + Ad[ 7]*tpy[3]);

  b[2] = (Ad[ 8]*tpy[0] + Ad[ 9]*tpy[1] + Ad[10]*tpy[2] + Ad[11]*tpy[3]);

  b[3] = (Ad[12]*tpy[0] + Ad[13]*tpy[1] + Ad[14]*tpy[2] + Ad[15]*tpy[3]);

  db[0] = (dAd[ 0]*tpy[0] + dAd[ 1]*tpy[1] + dAd[ 2]*tpy[2] + dAd[ 3]*tpy[3]);

  db[1] = (dAd[ 4]*tpy[0] + dAd[ 5]*tpy[1] + dAd[ 6]*tpy[2] + dAd[ 7]*tpy[3]);

  db[2] = (dAd[ 8]*tpy[0] + dAd[ 9]*tpy[1] + dAd[10]*tpy[2] + dAd[11]*tpy[3]);

  db[3] = (dAd[12]*tpy[0] + dAd[13]*tpy[1] + dAd[14]*tpy[2] + dAd[15]*tpy[3]);


  c[0] = (Ad[ 0]*tpz[0] + Ad[ 1]*tpz[1] + Ad[ 2]*tpz[2] + Ad[ 3]*tpz[3]);

  c[1] = (Ad[ 4]*tpz[0] + Ad[ 5]*tpz[1] + Ad[ 6]*tpz[2] + Ad[ 7]*tpz[3]);

  c[2] = (Ad[ 8]*tpz[0] + Ad[ 9]*tpz[1] + Ad[10]*tpz[2] + Ad[11]*tpz[3]);

  c[3] = (Ad[12]*tpz[0] + Ad[13]*tpz[1] + Ad[14]*tpz[2] + Ad[15]*tpz[3]);

  dc[0] = (dAd[ 0]*tpz[0] + dAd[ 1]*tpz[1] + dAd[ 2]*tpz[2] + dAd[ 3]*tpz[3]);

  dc[1] = (dAd[ 4]*tpz[0] + dAd[ 5]*tpz[1] + dAd[ 6]*tpz[2] + dAd[ 7]*tpz[3]);

  dc[2] = (dAd[ 8]*tpz[0] + dAd[ 9]*tpz[1] + dAd[10]*tpz[2] + dAd[11]*tpz[3]);

  dc[3] = (dAd[12]*tpz[0] + dAd[13]*tpz[1] + dAd[14]*tpz[2] + dAd[15]*tpz[3]);


  int xs = spline->x_stride;

  int ys = spline->y_stride;

  int zs = spline->z_stride;


  for (int n=0; n<spline->num_splines; n++) {

    vals[n] = 0.0;

    grads[3*n+0] = grads[3*n+1] = grads[3*n+2] = 0.0;

  }


  for (int i=0; i<4; i++)

    for (int j=0; j<4; j++)

      for (int k=0; k<4; k++) {

    double abc = a[i]*b[j]*c[k];

    double dabc[3];

    dabc[0] = da[i]* b[j]* c[k];

    dabc[1] =  a[i]*db[j]* c[k];

    dabc[2] =  a[i]* b[j]*dc[k];


    double* restrict coefs = spline->coefs + ((ix+i)*xs + (iy+j)*ys + (iz+k)*zs);

    for (int n=0; n<spline->num_splines; n++) {

      vals[n]      +=   abc   *coefs[n];

      grads[3*n+0] +=  dabc[0]*coefs[n];

      grads[3*n+1] +=  dabc[1]*coefs[n];

      grads[3*n+2] +=  dabc[2]*coefs[n];

    }

      }


  double dxInv = spline->x_grid.delta_inv;

  double dyInv = spline->y_grid.delta_inv;

  double dzInv = spline->z_grid.delta_inv;

  for (int n=0; n<spline->num_splines; n++) {

    grads[3*n+0] *= dxInv;

    grads[3*n+1] *= dyInv;

    grads[3*n+2] *= dzInv;

  }

}


inline void


eval_multi_UBspline_3d_d_vgl (multi_UBspline_3d_d *spline,

                  double x, double y, double z,

                  double* restrict vals,

                  double* restrict grads,

                  double* restrict lapl)

{

  x -= spline->x_grid.start;

  y -= spline->y_grid.start;

  z -= spline->z_grid.start;

  double ux = x*spline->x_grid.delta_inv;

  double uy = y*spline->y_grid.delta_inv;

  double uz = z*spline->z_grid.delta_inv;

  double ipartx, iparty, ipartz, tx, ty, tz;

  tx = modf (ux, &ipartx);  int ix = (int) ipartx;

  ty = modf (uy, &iparty);  int iy = (int) iparty;

  tz = modf (uz, &ipartz);  int iz = (int) ipartz;


  double tpx[4], tpy[4], tpz[4], a[4], b[4], c[4],

    da[4], db[4], dc[4], d2a[4], d2b[4], d2c[4];

  tpx[0] = tx*tx*tx;  tpx[1] = tx*tx;  tpx[2] = tx;  tpx[3] = 1.0;

  tpy[0] = ty*ty*ty;  tpy[1] = ty*ty;  tpy[2] = ty;  tpy[3] = 1.0;

  tpz[0] = tz*tz*tz;  tpz[1] = tz*tz;  tpz[2] = tz;  tpz[3] = 1.0;

  double* restrict coefs = spline->coefs;


  a[0]  = (Ad[ 0]*tpx[0] + Ad[ 1]*tpx[1] + Ad[ 2]*tpx[2] + Ad[ 3]*tpx[3]);

  a[1]  = (Ad[ 4]*tpx[0] + Ad[ 5]*tpx[1] + Ad[ 6]*tpx[2] + Ad[ 7]*tpx[3]);

  a[2]  = (Ad[ 8]*tpx[0] + Ad[ 9]*tpx[1] + Ad[10]*tpx[2] + Ad[11]*tpx[3]);

  a[3]  = (Ad[12]*tpx[0] + Ad[13]*tpx[1] + Ad[14]*tpx[2] + Ad[15]*tpx[3]);

  da[0] = (dAd[ 0]*tpx[0] + dAd[ 1]*tpx[1] + dAd[ 2]*tpx[2] + dAd[ 3]*tpx[3]);

  da[1] = (dAd[ 4]*tpx[0] + dAd[ 5]*tpx[1] + dAd[ 6]*tpx[2] + dAd[ 7]*tpx[3]);

  da[2] = (dAd[ 8]*tpx[0] + dAd[ 9]*tpx[1] + dAd[10]*tpx[2] + dAd[11]*tpx[3]);

  da[3] = (dAd[12]*tpx[0] + dAd[13]*tpx[1] + dAd[14]*tpx[2] + dAd[15]*tpx[3]);

  d2a[0] = (d2Ad[ 0]*tpx[0] + d2Ad[ 1]*tpx[1] + d2Ad[ 2]*tpx[2] + d2Ad[ 3]*tpx[3]);

  d2a[1] = (d2Ad[ 4]*tpx[0] + d2Ad[ 5]*tpx[1] + d2Ad[ 6]*tpx[2] + d2Ad[ 7]*tpx[3]);

  d2a[2] = (d2Ad[ 8]*tpx[0] + d2Ad[ 9]*tpx[1] + d2Ad[10]*tpx[2] + d2Ad[11]*tpx[3]);

  d2a[3] = (d2Ad[12]*tpx[0] + d2Ad[13]*tpx[1] + d2Ad[14]*tpx[2] + d2Ad[15]*tpx[3]);


  b[0] = (Ad[ 0]*tpy[0] + Ad[ 1]*tpy[1] + Ad[ 2]*tpy[2] + Ad[ 3]*tpy[3]);

  b[1] = (Ad[ 4]*tpy[0] + Ad[ 5]*tpy[1] + Ad[ 6]*tpy[2] + Ad[ 7]*tpy[3]);

  b[2] = (Ad[ 8]*tpy[0] + Ad[ 9]*tpy[1] + Ad[10]*tpy[2] + Ad[11]*tpy[3]);

  b[3] = (Ad[12]*tpy[0] + Ad[13]*tpy[1] + Ad[14]*tpy[2] + Ad[15]*tpy[3]);

  db[0] = (dAd[ 0]*tpy[0] + dAd[ 1]*tpy[1] + dAd[ 2]*tpy[2] + dAd[ 3]*tpy[3]);

  db[1] = (dAd[ 4]*tpy[0] + dAd[ 5]*tpy[1] + dAd[ 6]*tpy[2] + dAd[ 7]*tpy[3]);

  db[2] = (dAd[ 8]*tpy[0] + dAd[ 9]*tpy[1] + dAd[10]*tpy[2] + dAd[11]*tpy[3]);

  db[3] = (dAd[12]*tpy[0] + dAd[13]*tpy[1] + dAd[14]*tpy[2] + dAd[15]*tpy[3]);

  d2b[0] = (d2Ad[ 0]*tpy[0] + d2Ad[ 1]*tpy[1] + d2Ad[ 2]*tpy[2] + d2Ad[ 3]*tpy[3]);

  d2b[1] = (d2Ad[ 4]*tpy[0] + d2Ad[ 5]*tpy[1] + d2Ad[ 6]*tpy[2] + d2Ad[ 7]*tpy[3]);

  d2b[2] = (d2Ad[ 8]*tpy[0] + d2Ad[ 9]*tpy[1] + d2Ad[10]*tpy[2] + d2Ad[11]*tpy[3]);

  d2b[3] = (d2Ad[12]*tpy[0] + d2Ad[13]*tpy[1] + d2Ad[14]*tpy[2] + d2Ad[15]*tpy[3]);


  c[0] = (Ad[ 0]*tpz[0] + Ad[ 1]*tpz[1] + Ad[ 2]*tpz[2] + Ad[ 3]*tpz[3]);

  c[1] = (Ad[ 4]*tpz[0] + Ad[ 5]*tpz[1] + Ad[ 6]*tpz[2] + Ad[ 7]*tpz[3]);

  c[2] = (Ad[ 8]*tpz[0] + Ad[ 9]*tpz[1] + Ad[10]*tpz[2] + Ad[11]*tpz[3]);

  c[3] = (Ad[12]*tpz[0] + Ad[13]*tpz[1] + Ad[14]*tpz[2] + Ad[15]*tpz[3]);

  dc[0] = (dAd[ 0]*tpz[0] + dAd[ 1]*tpz[1] + dAd[ 2]*tpz[2] + dAd[ 3]*tpz[3]);

  dc[1] = (dAd[ 4]*tpz[0] + dAd[ 5]*tpz[1] + dAd[ 6]*tpz[2] + dAd[ 7]*tpz[3]);

  dc[2] = (dAd[ 8]*tpz[0] + dAd[ 9]*tpz[1] + dAd[10]*tpz[2] + dAd[11]*tpz[3]);

  dc[3] = (dAd[12]*tpz[0] + dAd[13]*tpz[1] + dAd[14]*tpz[2] + dAd[15]*tpz[3]);

  d2c[0] = (d2Ad[ 0]*tpz[0] + d2Ad[ 1]*tpz[1] + d2Ad[ 2]*tpz[2] + d2Ad[ 3]*tpz[3]);

  d2c[1] = (d2Ad[ 4]*tpz[0] + d2Ad[ 5]*tpz[1] + d2Ad[ 6]*tpz[2] + d2Ad[ 7]*tpz[3]);

  d2c[2] = (d2Ad[ 8]*tpz[0] + d2Ad[ 9]*tpz[1] + d2Ad[10]*tpz[2] + d2Ad[11]*tpz[3]);

  d2c[3] = (d2Ad[12]*tpz[0] + d2Ad[13]*tpz[1] + d2Ad[14]*tpz[2] + d2Ad[15]*tpz[3]);


  int xs = spline->x_stride;

  int ys = spline->y_stride;

  int zs = spline->z_stride;


  double lapl3[3*spline->num_splines];

  for (int n=0; n<spline->num_splines; n++) {

    vals[n] = 0.0;

    grads[3*n+0] = grads[3*n+1] = grads[3*n+2] = 0.0;

    lapl3[3*n+0] = lapl3[3*n+1] = lapl3[3*n+2] = 0.0;

  }


  for (int i=0; i<4; i++)

    for (int j=0; j<4; j++)

      for (int k=0; k<4; k++) {

    double abc = a[i]*b[j]*c[k];

    double dabc[3], d2abc[3];

    dabc[0] = da[i]* b[j]* c[k];

    dabc[1] =  a[i]*db[j]* c[k];

    dabc[2] =  a[i]* b[j]*dc[k];

    d2abc[0] = d2a[i]*  b[j]*  c[k];

    d2abc[1] =   a[i]*d2b[j]*  c[k];

    d2abc[2] =   a[i]*  b[j]*d2c[k];


    double* restrict coefs = spline->coefs + ((ix+i)*xs + (iy+j)*ys + (iz+k)*zs);

    for (int n=0; n<spline->num_splines; n++) {

      vals[n]      +=   abc   *coefs[n];

      grads[3*n+0] +=  dabc[0]*coefs[n];

      grads[3*n+1] +=  dabc[1]*coefs[n];

      grads[3*n+2] +=  dabc[2]*coefs[n];

      lapl3[3*n+0] += d2abc[0]*coefs[n];

      lapl3[3*n+1] += d2abc[1]*coefs[n];

      lapl3[3*n+2] += d2abc[2]*coefs[n];

    }

      }


  double dxInv = spline->x_grid.delta_inv;

  double dyInv = spline->y_grid.delta_inv;

  double dzInv = spline->z_grid.delta_inv;

  for (int n=0; n<spline->num_splines; n++) {

    grads[3*n+0] *= dxInv;

    grads[3*n+1] *= dyInv;

    grads[3*n+2] *= dzInv;

    lapl3[3*n+0] *= dxInv*dxInv;

    lapl3[3*n+1] *= dyInv*dyInv;

    lapl3[3*n+2] *= dzInv*dzInv;

    lapl[n] = lapl3[3*n+0] + lapl3[3*n+1] + lapl3[3*n+2];

  }

}


inline void


eval_multi_UBspline_3d_d_vgh (multi_UBspline_3d_d *spline,

                  double x, double y, double z,

                  double* restrict vals,

                  double* restrict grads,

                  double* restrict hess)

{

  x -= spline->x_grid.start;

  y -= spline->y_grid.start;

  z -= spline->z_grid.start;

  double ux = x*spline->x_grid.delta_inv;

  double uy = y*spline->y_grid.delta_inv;

  double uz = z*spline->z_grid.delta_inv;

  double ipartx, iparty, ipartz, tx, ty, tz;

  tx = modf (ux, &ipartx);  int ix = (int) ipartx;

  ty = modf (uy, &iparty);  int iy = (int) iparty;

  tz = modf (uz, &ipartz);  int iz = (int) ipartz;


  double tpx[4], tpy[4], tpz[4], a[4], b[4], c[4],

    da[4], db[4], dc[4], d2a[4], d2b[4], d2c[4];

  tpx[0] = tx*tx*tx;  tpx[1] = tx*tx;  tpx[2] = tx;  tpx[3] = 1.0;

  tpy[0] = ty*ty*ty;  tpy[1] = ty*ty;  tpy[2] = ty;  tpy[3] = 1.0;

  tpz[0] = tz*tz*tz;  tpz[1] = tz*tz;  tpz[2] = tz;  tpz[3] = 1.0;

  double* restrict coefs = spline->coefs;


  a[0]  = (Ad[ 0]*tpx[0] + Ad[ 1]*tpx[1] + Ad[ 2]*tpx[2] + Ad[ 3]*tpx[3]);

  a[1]  = (Ad[ 4]*tpx[0] + Ad[ 5]*tpx[1] + Ad[ 6]*tpx[2] + Ad[ 7]*tpx[3]);

  a[2]  = (Ad[ 8]*tpx[0] + Ad[ 9]*tpx[1] + Ad[10]*tpx[2] + Ad[11]*tpx[3]);

  a[3]  = (Ad[12]*tpx[0] + Ad[13]*tpx[1] + Ad[14]*tpx[2] + Ad[15]*tpx[3]);

  da[0] = (dAd[ 0]*tpx[0] + dAd[ 1]*tpx[1] + dAd[ 2]*tpx[2] + dAd[ 3]*tpx[3]);

  da[1] = (dAd[ 4]*tpx[0] + dAd[ 5]*tpx[1] + dAd[ 6]*tpx[2] + dAd[ 7]*tpx[3]);

  da[2] = (dAd[ 8]*tpx[0] + dAd[ 9]*tpx[1] + dAd[10]*tpx[2] + dAd[11]*tpx[3]);

  da[3] = (dAd[12]*tpx[0] + dAd[13]*tpx[1] + dAd[14]*tpx[2] + dAd[15]*tpx[3]);

  d2a[0] = (d2Ad[ 0]*tpx[0] + d2Ad[ 1]*tpx[1] + d2Ad[ 2]*tpx[2] + d2Ad[ 3]*tpx[3]);

  d2a[1] = (d2Ad[ 4]*tpx[0] + d2Ad[ 5]*tpx[1] + d2Ad[ 6]*tpx[2] + d2Ad[ 7]*tpx[3]);

  d2a[2] = (d2Ad[ 8]*tpx[0] + d2Ad[ 9]*tpx[1] + d2Ad[10]*tpx[2] + d2Ad[11]*tpx[3]);

  d2a[3] = (d2Ad[12]*tpx[0] + d2Ad[13]*tpx[1] + d2Ad[14]*tpx[2] + d2Ad[15]*tpx[3]);


  b[0] = (Ad[ 0]*tpy[0] + Ad[ 1]*tpy[1] + Ad[ 2]*tpy[2] + Ad[ 3]*tpy[3]);

  b[1] = (Ad[ 4]*tpy[0] + Ad[ 5]*tpy[1] + Ad[ 6]*tpy[2] + Ad[ 7]*tpy[3]);

  b[2] = (Ad[ 8]*tpy[0] + Ad[ 9]*tpy[1] + Ad[10]*tpy[2] + Ad[11]*tpy[3]);

  b[3] = (Ad[12]*tpy[0] + Ad[13]*tpy[1] + Ad[14]*tpy[2] + Ad[15]*tpy[3]);

  db[0] = (dAd[ 0]*tpy[0] + dAd[ 1]*tpy[1] + dAd[ 2]*tpy[2] + dAd[ 3]*tpy[3]);

  db[1] = (dAd[ 4]*tpy[0] + dAd[ 5]*tpy[1] + dAd[ 6]*tpy[2] + dAd[ 7]*tpy[3]);

  db[2] = (dAd[ 8]*tpy[0] + dAd[ 9]*tpy[1] + dAd[10]*tpy[2] + dAd[11]*tpy[3]);

  db[3] = (dAd[12]*tpy[0] + dAd[13]*tpy[1] + dAd[14]*tpy[2] + dAd[15]*tpy[3]);

  d2b[0] = (d2Ad[ 0]*tpy[0] + d2Ad[ 1]*tpy[1] + d2Ad[ 2]*tpy[2] + d2Ad[ 3]*tpy[3]);

  d2b[1] = (d2Ad[ 4]*tpy[0] + d2Ad[ 5]*tpy[1] + d2Ad[ 6]*tpy[2] + d2Ad[ 7]*tpy[3]);

  d2b[2] = (d2Ad[ 8]*tpy[0] + d2Ad[ 9]*tpy[1] + d2Ad[10]*tpy[2] + d2Ad[11]*tpy[3]);

  d2b[3] = (d2Ad[12]*tpy[0] + d2Ad[13]*tpy[1] + d2Ad[14]*tpy[2] + d2Ad[15]*tpy[3]);


  c[0] = (Ad[ 0]*tpz[0] + Ad[ 1]*tpz[1] + Ad[ 2]*tpz[2] + Ad[ 3]*tpz[3]);

  c[1] = (Ad[ 4]*tpz[0] + Ad[ 5]*tpz[1] + Ad[ 6]*tpz[2] + Ad[ 7]*tpz[3]);

  c[2] = (Ad[ 8]*tpz[0] + Ad[ 9]*tpz[1] + Ad[10]*tpz[2] + Ad[11]*tpz[3]);

  c[3] = (Ad[12]*tpz[0] + Ad[13]*tpz[1] + Ad[14]*tpz[2] + Ad[15]*tpz[3]);

  dc[0] = (dAd[ 0]*tpz[0] + dAd[ 1]*tpz[1] + dAd[ 2]*tpz[2] + dAd[ 3]*tpz[3]);

  dc[1] = (dAd[ 4]*tpz[0] + dAd[ 5]*tpz[1] + dAd[ 6]*tpz[2] + dAd[ 7]*tpz[3]);

  dc[2] = (dAd[ 8]*tpz[0] + dAd[ 9]*tpz[1] + dAd[10]*tpz[2] + dAd[11]*tpz[3]);

  dc[3] = (dAd[12]*tpz[0] + dAd[13]*tpz[1] + dAd[14]*tpz[2] + dAd[15]*tpz[3]);

  d2c[0] = (d2Ad[ 0]*tpz[0] + d2Ad[ 1]*tpz[1] + d2Ad[ 2]*tpz[2] + d2Ad[ 3]*tpz[3]);

  d2c[1] = (d2Ad[ 4]*tpz[0] + d2Ad[ 5]*tpz[1] + d2Ad[ 6]*tpz[2] + d2Ad[ 7]*tpz[3]);

  d2c[2] = (d2Ad[ 8]*tpz[0] + d2Ad[ 9]*tpz[1] + d2Ad[10]*tpz[2] + d2Ad[11]*tpz[3]);

  d2c[3] = (d2Ad[12]*tpz[0] + d2Ad[13]*tpz[1] + d2Ad[14]*tpz[2] + d2Ad[15]*tpz[3]);


  int xs = spline->x_stride;

  int ys = spline->y_stride;

  int zs = spline->z_stride;


  for (int n=0; n<spline->num_splines; n++) {

    vals[n] = 0.0;

    grads[3*n+0] = grads[3*n+1] = grads[3*n+2] = 0.0;

    for (int i=0; i<9; i++)

      hess[9*n+i] = 0.0;

  }


  for (int i=0; i<4; i++)

    for (int j=0; j<4; j++)

      for (int k=0; k<4; k++) {

    double abc = a[i]*b[j]*c[k];

    double dabc[3], d2abc[6];

    dabc[0] = da[i]* b[j]* c[k];

    dabc[1] =  a[i]*db[j]* c[k];

    dabc[2] =  a[i]* b[j]*dc[k];

    d2abc[0] = d2a[i]*  b[j]*  c[k];

    d2abc[1] =  da[i]* db[j]*  c[k];

    d2abc[2] =  da[i]*  b[j]* dc[k];

    d2abc[3] =   a[i]*d2b[j]*  c[k];

    d2abc[4] =   a[i]* db[j]* dc[k];

    d2abc[5] =   a[i]*  b[j]*d2c[k];


    double* restrict coefs = spline->coefs + ((ix+i)*xs + (iy+j)*ys + (iz+k)*zs);

    for (int n=0; n<spline->num_splines; n++) {

      vals[n]      +=   abc   *coefs[n];

      grads[3*n+0] +=  dabc[0]*coefs[n];

      grads[3*n+1] +=  dabc[1]*coefs[n];

      grads[3*n+2] +=  dabc[2]*coefs[n];

      hess [9*n+0] += d2abc[0]*coefs[n];

      hess [9*n+1] += d2abc[1]*coefs[n];

      hess [9*n+2] += d2abc[2]*coefs[n];

      hess [9*n+4] += d2abc[3]*coefs[n];

      hess [9*n+5] += d2abc[4]*coefs[n];

      hess [9*n+8] += d2abc[5]*coefs[n];

    }

      }


  double dxInv = spline->x_grid.delta_inv;

  double dyInv = spline->y_grid.delta_inv;

  double dzInv = spline->z_grid.delta_inv;

  for (int n=0; n<spline->num_splines; n++) {

    grads[3*n+0] *= dxInv;

    grads[3*n+1] *= dyInv;

    grads[3*n+2] *= dzInv;

    hess [9*n+0] *= dxInv*dxInv;

    hess [9*n+4] *= dyInv*dyInv;

    hess [9*n+8] *= dzInv*dzInv;

    hess [9*n+1] *= dxInv*dyInv;

    hess [9*n+2] *= dxInv*dzInv;

    hess [9*n+5] *= dyInv*dzInv;

    // Copy hessian elements into lower half of 3x3 matrix

    hess [9*n+3] = hess[9*n+1];

    hess [9*n+6] = hess[9*n+2];

    hess [9*n+7] = hess[9*n+5];

  }

}


inline void


eval_multi_UBspline_3d_d_vghgh (multi_UBspline_3d_d *spline,

               double x, double y, double z,

               double* restrict vals,

               double* restrict grads,

               double* restrict hess,

               double* restrict gradhess)

{

  x -= spline->x_grid.start;

  y -= spline->y_grid.start;

  z -= spline->z_grid.start;

  double ux = x*spline->x_grid.delta_inv;

  double uy = y*spline->y_grid.delta_inv;

  double uz = z*spline->z_grid.delta_inv;

  double ipartx, iparty, ipartz, tx, ty, tz;

  tx = modf (ux, &ipartx);  int ix = (int) ipartx;

  ty = modf (uy, &iparty);  int iy = (int) iparty;

  tz = modf (uz, &ipartz);  int iz = (int) ipartz;


  double tpx[4], tpy[4], tpz[4], a[4], b[4], c[4],

    da[4], db[4], dc[4], d2a[4], d2b[4], d2c[4],

    d3a[4], d3b[4], d3c[4];

  tpx[0] = tx*tx*tx;  tpx[1] = tx*tx;  tpx[2] = tx;  tpx[3] = 1.0;

  tpy[0] = ty*ty*ty;  tpy[1] = ty*ty;  tpy[2] = ty;  tpy[3] = 1.0;

  tpz[0] = tz*tz*tz;  tpz[1] = tz*tz;  tpz[2] = tz;  tpz[3] = 1.0;

  double* restrict coefs = spline->coefs;


  a[0]  = (Ad[ 0]*tpx[0] + Ad[ 1]*tpx[1] + Ad[ 2]*tpx[2] + Ad[ 3]*tpx[3]);

  a[1]  = (Ad[ 4]*tpx[0] + Ad[ 5]*tpx[1] + Ad[ 6]*tpx[2] + Ad[ 7]*tpx[3]);

  a[2]  = (Ad[ 8]*tpx[0] + Ad[ 9]*tpx[1] + Ad[10]*tpx[2] + Ad[11]*tpx[3]);

  a[3]  = (Ad[12]*tpx[0] + Ad[13]*tpx[1] + Ad[14]*tpx[2] + Ad[15]*tpx[3]);

  da[0] = (dAd[ 0]*tpx[0] + dAd[ 1]*tpx[1] + dAd[ 2]*tpx[2] + dAd[ 3]*tpx[3]);

  da[1] = (dAd[ 4]*tpx[0] + dAd[ 5]*tpx[1] + dAd[ 6]*tpx[2] + dAd[ 7]*tpx[3]);

  da[2] = (dAd[ 8]*tpx[0] + dAd[ 9]*tpx[1] + dAd[10]*tpx[2] + dAd[11]*tpx[3]);

  da[3] = (dAd[12]*tpx[0] + dAd[13]*tpx[1] + dAd[14]*tpx[2] + dAd[15]*tpx[3]);

  d2a[0] = (d2Ad[ 0]*tpx[0] + d2Ad[ 1]*tpx[1] + d2Ad[ 2]*tpx[2] + d2Ad[ 3]*tpx[3]);

  d2a[1] = (d2Ad[ 4]*tpx[0] + d2Ad[ 5]*tpx[1] + d2Ad[ 6]*tpx[2] + d2Ad[ 7]*tpx[3]);

  d2a[2] = (d2Ad[ 8]*tpx[0] + d2Ad[ 9]*tpx[1] + d2Ad[10]*tpx[2] + d2Ad[11]*tpx[3]);

  d2a[3] = (d2Ad[12]*tpx[0] + d2Ad[13]*tpx[1] + d2Ad[14]*tpx[2] + d2Ad[15]*tpx[3]);

  d3a[0] = (/*d2Ad[ 0]*tpx[0] + d2Ad[ 1]*tpx[1] + d2Ad[ 2]*tpx[2] +*/ d3Ad[ 3]*tpx[3]);

  d3a[1] = (/*d2Ad[ 4]*tpx[0] + d2Ad[ 5]*tpx[1] + d2Ad[ 6]*tpx[2] +*/ d3Ad[ 7]*tpx[3]);

  d3a[2] = (/*d2Ad[ 8]*tpx[0] + d2Ad[ 9]*tpx[1] + d2Ad[10]*tpx[2] +*/ d3Ad[11]*tpx[3]);

  d3a[3] = (/*d2Ad[12]*tpx[0] + d2Ad[13]*tpx[1] + d2Ad[14]*tpx[2] +*/ d3Ad[15]*tpx[3]);


  b[0] = (Ad[ 0]*tpy[0] + Ad[ 1]*tpy[1] + Ad[ 2]*tpy[2] + Ad[ 3]*tpy[3]);

  b[1] = (Ad[ 4]*tpy[0] + Ad[ 5]*tpy[1] + Ad[ 6]*tpy[2] + Ad[ 7]*tpy[3]);

  b[2] = (Ad[ 8]*tpy[0] + Ad[ 9]*tpy[1] + Ad[10]*tpy[2] + Ad[11]*tpy[3]);

  b[3] = (Ad[12]*tpy[0] + Ad[13]*tpy[1] + Ad[14]*tpy[2] + Ad[15]*tpy[3]);

  db[0] = (dAd[ 0]*tpy[0] + dAd[ 1]*tpy[1] + dAd[ 2]*tpy[2] + dAd[ 3]*tpy[3]);

  db[1] = (dAd[ 4]*tpy[0] + dAd[ 5]*tpy[1] + dAd[ 6]*tpy[2] + dAd[ 7]*tpy[3]);

  db[2] = (dAd[ 8]*tpy[0] + dAd[ 9]*tpy[1] + dAd[10]*tpy[2] + dAd[11]*tpy[3]);

  db[3] = (dAd[12]*tpy[0] + dAd[13]*tpy[1] + dAd[14]*tpy[2] + dAd[15]*tpy[3]);

  d2b[0] = (d2Ad[ 0]*tpy[0] + d2Ad[ 1]*tpy[1] + d2Ad[ 2]*tpy[2] + d2Ad[ 3]*tpy[3]);

  d2b[1] = (d2Ad[ 4]*tpy[0] + d2Ad[ 5]*tpy[1] + d2Ad[ 6]*tpy[2] + d2Ad[ 7]*tpy[3]);

  d2b[2] = (d2Ad[ 8]*tpy[0] + d2Ad[ 9]*tpy[1] + d2Ad[10]*tpy[2] + d2Ad[11]*tpy[3]);

  d2b[3] = (d2Ad[12]*tpy[0] + d2Ad[13]*tpy[1] + d2Ad[14]*tpy[2] + d2Ad[15]*tpy[3]);

  d3b[0] = (/*d2Ad[ 0]*tpx[0] + d2Ad[ 1]*tpx[1] + d2Ad[ 2]*tpx[2] +*/ d3Ad[ 3]*tpy[3]);

  d3b[1] = (/*d2Ad[ 4]*tpx[0] + d2Ad[ 5]*tpx[1] + d2Ad[ 6]*tpx[2] +*/ d3Ad[ 7]*tpy[3]);

  d3b[2] = (/*d2Ad[ 8]*tpx[0] + d2Ad[ 9]*tpx[1] + d2Ad[10]*tpx[2] +*/ d3Ad[11]*tpy[3]);

  d3b[3] = (/*d2Ad[12]*tpx[0] + d2Ad[13]*tpx[1] + d2Ad[14]*tpx[2] +*/ d3Ad[15]*tpy[3]);


  c[0] = (Ad[ 0]*tpz[0] + Ad[ 1]*tpz[1] + Ad[ 2]*tpz[2] + Ad[ 3]*tpz[3]);

  c[1] = (Ad[ 4]*tpz[0] + Ad[ 5]*tpz[1] + Ad[ 6]*tpz[2] + Ad[ 7]*tpz[3]);

  c[2] = (Ad[ 8]*tpz[0] + Ad[ 9]*tpz[1] + Ad[10]*tpz[2] + Ad[11]*tpz[3]);

  c[3] = (Ad[12]*tpz[0] + Ad[13]*tpz[1] + Ad[14]*tpz[2] + Ad[15]*tpz[3]);

  dc[0] = (dAd[ 0]*tpz[0] + dAd[ 1]*tpz[1] + dAd[ 2]*tpz[2] + dAd[ 3]*tpz[3]);

  dc[1] = (dAd[ 4]*tpz[0] + dAd[ 5]*tpz[1] + dAd[ 6]*tpz[2] + dAd[ 7]*tpz[3]);

  dc[2] = (dAd[ 8]*tpz[0] + dAd[ 9]*tpz[1] + dAd[10]*tpz[2] + dAd[11]*tpz[3]);

  dc[3] = (dAd[12]*tpz[0] + dAd[13]*tpz[1] + dAd[14]*tpz[2] + dAd[15]*tpz[3]);

  d2c[0] = (d2Ad[ 0]*tpz[0] + d2Ad[ 1]*tpz[1] + d2Ad[ 2]*tpz[2] + d2Ad[ 3]*tpz[3]);

  d2c[1] = (d2Ad[ 4]*tpz[0] + d2Ad[ 5]*tpz[1] + d2Ad[ 6]*tpz[2] + d2Ad[ 7]*tpz[3]);

  d2c[2] = (d2Ad[ 8]*tpz[0] + d2Ad[ 9]*tpz[1] + d2Ad[10]*tpz[2] + d2Ad[11]*tpz[3]);

  d2c[3] = (d2Ad[12]*tpz[0] + d2Ad[13]*tpz[1] + d2Ad[14]*tpz[2] + d2Ad[15]*tpz[3]);

  d3c[0] = (/*d2Ad[ 0]*tpx[0] + d2Ad[ 1]*tpx[1] + d2Ad[ 2]*tpx[2] +*/ d3Ad[ 3]*tpz[3]);

  d3c[1] = (/*d2Ad[ 4]*tpx[0] + d2Ad[ 5]*tpx[1] + d2Ad[ 6]*tpx[2] +*/ d3Ad[ 7]*tpz[3]);

  d3c[2] = (/*d2Ad[ 8]*tpx[0] + d2Ad[ 9]*tpx[1] + d2Ad[10]*tpx[2] +*/ d3Ad[11]*tpz[3]);

  d3c[3] = (/*d2Ad[12]*tpx[0] + d2Ad[13]*tpx[1] + d2Ad[14]*tpx[2] +*/ d3Ad[15]*tpz[3]);


  int xs = spline->x_stride;

  int ys = spline->y_stride;

  int zs = spline->z_stride;


  for (int n=0; n<spline->num_splines; n++) {

    vals[n] = 0.0;

    grads[3*n+0] = grads[3*n+1] = grads[3*n+2] = 0.0;

    for (int i=0; i<9; i++)

      hess[9*n+i] = 0.0;

    for (int i=0; i<27; i++)

      gradhess[27*n+i] = 0.0;

  }


  for (int i=0; i<4; i++)

    for (int j=0; j<4; j++)

      for (int k=0; k<4; k++) {

   double abc = a[i]*b[j]*c[k];

   double dabc[3], d2abc[6], d3abc[10];

   dabc[0] = da[i]* b[j]* c[k];

   dabc[1] =  a[i]*db[j]* c[k];

   dabc[2] =  a[i]* b[j]*dc[k];

   d2abc[0] = d2a[i]*  b[j]*  c[k];

   d2abc[1] =  da[i]* db[j]*  c[k];

   d2abc[2] =  da[i]*  b[j]* dc[k];

   d2abc[3] =   a[i]*d2b[j]*  c[k];

   d2abc[4] =   a[i]* db[j]* dc[k];

   d2abc[5] =   a[i]*  b[j]*d2c[k];


   d3abc[0] = d3a[i]*  b[j]*  c[k];

   d3abc[1] = d2a[i]* db[j]*  c[k];

   d3abc[2] = d2a[i]*  b[j]* dc[k];

   d3abc[3] =  da[i]*d2b[j]*  c[k];

   d3abc[4] =  da[i]* db[j]* dc[k];

   d3abc[5] =  da[i]*  b[j]*d2c[k];

   d3abc[6] =   a[i]*d3b[j]*  c[k];

   d3abc[7] =   a[i]*d2b[j]* dc[k];

   d3abc[8] =   a[i]* db[j]*d2c[k];

   d3abc[9] =   a[i]*  b[j]*d3c[k];


   double* restrict coefs = spline->coefs + ((ix+i)*xs + (iy+j)*ys + (iz+k)*zs);

   for (int n=0; n<spline->num_splines; n++) {

     vals[n]      +=   abc   *coefs[n];

     grads[3*n+0] +=  dabc[0]*coefs[n];

     grads[3*n+1] +=  dabc[1]*coefs[n];

     grads[3*n+2] +=  dabc[2]*coefs[n];

     hess [9*n+0] += d2abc[0]*coefs[n];

     hess [9*n+1] += d2abc[1]*coefs[n];

     hess [9*n+2] += d2abc[2]*coefs[n];

     hess [9*n+4] += d2abc[3]*coefs[n];

     hess [9*n+5] += d2abc[4]*coefs[n];

     hess [9*n+8] += d2abc[5]*coefs[n];


     gradhess [27*n+0 ] += d3abc[0]*coefs[n];

     gradhess [27*n+1 ] += d3abc[1]*coefs[n];

     gradhess [27*n+2 ] += d3abc[2]*coefs[n];

     gradhess [27*n+4 ] += d3abc[3]*coefs[n];

     gradhess [27*n+5 ] += d3abc[4]*coefs[n];

     gradhess [27*n+8 ] += d3abc[5]*coefs[n];

     gradhess [27*n+13] += d3abc[6]*coefs[n];

     gradhess [27*n+14] += d3abc[7]*coefs[n];

     gradhess [27*n+17] += d3abc[8]*coefs[n];

     gradhess [27*n+26] += d3abc[9]*coefs[n];

   }

      }


  double dxInv = spline->x_grid.delta_inv;

  double dyInv = spline->y_grid.delta_inv;

  double dzInv = spline->z_grid.delta_inv;

  for (int n=0; n<spline->num_splines; n++) {

    grads[3*n+0] *= dxInv;

    grads[3*n+1] *= dyInv;

    grads[3*n+2] *= dzInv;

    hess [9*n+0] *= dxInv*dxInv;

    hess [9*n+4] *= dyInv*dyInv;

    hess [9*n+8] *= dzInv*dzInv;

    hess [9*n+1] *= dxInv*dyInv;

    hess [9*n+2] *= dxInv*dzInv;

    hess [9*n+5] *= dyInv*dzInv;

    // Copy hessian elements into lower half of 3x3 matrix

    hess [9*n+3] = hess[9*n+1];

    hess [9*n+6] = hess[9*n+2];

    hess [9*n+7] = hess[9*n+5];


    gradhess [27*n+0 ] *= dxInv*dxInv*dxInv;

    gradhess [27*n+1 ] *= dxInv*dxInv*dyInv;

    gradhess [27*n+2 ] *= dxInv*dxInv*dzInv;

    gradhess [27*n+4 ] *= dxInv*dyInv*dyInv;

    gradhess [27*n+5 ] *= dxInv*dyInv*dzInv;

    gradhess [27*n+8 ] *= dxInv*dzInv*dzInv;

    gradhess [27*n+13] *= dyInv*dyInv*dyInv;

    gradhess [27*n+14] *= dyInv*dyInv*dzInv;

    gradhess [27*n+17] *= dyInv*dzInv*dzInv;

    gradhess [27*n+26] *= dzInv*dzInv*dzInv;


    // Copy gradhess elements into rest of tensor

    gradhess [27*n+9  ] = gradhess [27*n+3  ] = gradhess [27*n+1 ];

    gradhess [27*n+18 ] = gradhess [27*n+6  ] = gradhess [27*n+2 ];

    gradhess [27*n+22 ] = gradhess [27*n+16 ] = gradhess [27*n+14];

    gradhess [27*n+12 ] = gradhess [27*n+10 ] = gradhess [27*n+4 ];

    gradhess [27*n+24 ] = gradhess [27*n+20 ] = gradhess [27*n+8 ];

    gradhess [27*n+25 ] = gradhess [27*n+23 ] = gradhess [27*n+17];

    gradhess [27*n+21 ] = gradhess [27*n+19 ] = gradhess [27*n+15] = gradhess [27*n+11 ] = gradhess [27*n+7 ] = gradhess [27*n+5];


  }

}


#endif

restrict
#define restrict
Definition local_definitions.h:4

Ad
const double *restrict Ad
Definition bspline_data.cpp:181

d2Ad
const double *restrict d2Ad
Definition bspline_data.cpp:195

eval_multi_UBspline_2d_d_vgl
void eval_multi_UBspline_2d_d_vgl(multi_UBspline_2d_d *spline, double x, double y, double *restrict vals, double *restrict grads, double *restrict lapl)
Definition multi_bspline_eval_std_d.h:296

eval_multi_UBspline_3d_d_vgh
void eval_multi_UBspline_3d_d_vgh(multi_UBspline_3d_d *spline, double x, double y, double z, double *restrict vals, double *restrict grads, double *restrict hess)
Definition multi_bspline_eval_std_d.h:741

eval_multi_UBspline_3d_d
void eval_multi_UBspline_3d_d(multi_UBspline_3d_d *spline, double x, double y, double z, double *restrict vals)
Definition multi_bspline_eval_std_d.h:481

eval_multi_UBspline_1d_d_vgh
void eval_multi_UBspline_1d_d_vgh(multi_UBspline_1d_d *spline, double x, double *restrict vals, double *restrict grads, double *restrict hess)
Definition multi_bspline_eval_std_d.h:169

eval_multi_UBspline_1d_d_vgl
void eval_multi_UBspline_1d_d_vgl(multi_UBspline_1d_d *spline, double x, double *restrict vals, double *restrict grads, double *restrict lapl)
Definition multi_bspline_eval_std_d.h:115

eval_multi_UBspline_2d_d_vg
void eval_multi_UBspline_2d_d_vg(multi_UBspline_2d_d *spline, double x, double y, double *restrict vals, double *restrict grads)
Definition multi_bspline_eval_std_d.h:228

eval_multi_UBspline_2d_d
void eval_multi_UBspline_2d_d(multi_UBspline_2d_d *spline, double x, double y, double *restrict vals)
Definition multi_bspline_eval_std_d.h:184

dAd
const double *restrict dAd
Definition bspline_data.cpp:188

eval_multi_UBspline_3d_d_vgl
void eval_multi_UBspline_3d_d_vgl(multi_UBspline_3d_d *spline, double x, double y, double z, double *restrict vals, double *restrict grads, double *restrict lapl)
Definition multi_bspline_eval_std_d.h:626

eval_multi_UBspline_1d_d
void eval_multi_UBspline_1d_d(multi_UBspline_1d_d *spline, double x, double *restrict vals)
Definition multi_bspline_eval_std_d.h:37

d3Ad
const double *restrict d3Ad
Definition bspline_data.cpp:202

eval_multi_UBspline_2d_d_vgh
void eval_multi_UBspline_2d_d_vgh(multi_UBspline_2d_d *spline, double x, double y, double *restrict vals, double *restrict grads, double *restrict hess)
Definition multi_bspline_eval_std_d.h:385

eval_multi_UBspline_3d_d_vg
void eval_multi_UBspline_3d_d_vg(multi_UBspline_3d_d *spline, double x, double y, double z, double *restrict vals, double *restrict grads)
Definition multi_bspline_eval_std_d.h:536

eval_multi_UBspline_3d_d_vghgh
void eval_multi_UBspline_3d_d_vghgh(multi_UBspline_3d_d *spline, double x, double y, double z, double *restrict vals, double *restrict grads, double *restrict hess, double *restrict gradhess)
Definition multi_bspline_eval_std_d.h:866

eval_multi_UBspline_1d_d_vg
void eval_multi_UBspline_1d_d_vg(multi_UBspline_1d_d *spline, double x, double *restrict vals, double *restrict grads)
Definition multi_bspline_eval_std_d.h:70

multi_bspline_structs.h

Ugrid::start
double start
Definition bspline_base.h:85

Ugrid::delta_inv
double delta_inv
Definition bspline_base.h:89

multi_UBspline_1d_d
Definition multi_bspline_structs.h:66

multi_UBspline_1d_d::coefs
double *restrict coefs
Definition multi_bspline_structs.h:69

multi_UBspline_1d_d::num_splines
int num_splines
Definition multi_bspline_structs.h:73

multi_UBspline_1d_d::x_grid
Ugrid x_grid
Definition multi_bspline_structs.h:71

multi_UBspline_1d_d::x_stride
intptr_t x_stride
Definition multi_bspline_structs.h:70

multi_UBspline_2d_d
Definition multi_bspline_structs.h:77

multi_UBspline_2d_d::x_stride
intptr_t x_stride
Definition multi_bspline_structs.h:81

multi_UBspline_2d_d::y_stride
intptr_t y_stride
Definition multi_bspline_structs.h:81

multi_UBspline_2d_d::coefs
double *restrict coefs
Definition multi_bspline_structs.h:80

multi_UBspline_2d_d::x_grid
Ugrid x_grid
Definition multi_bspline_structs.h:82

multi_UBspline_2d_d::y_grid
Ugrid y_grid
Definition multi_bspline_structs.h:82

multi_UBspline_2d_d::num_splines
int num_splines
Definition multi_bspline_structs.h:84

multi_UBspline_3d_d
Definition multi_bspline_structs.h:88

multi_UBspline_3d_d::z_grid
Ugrid z_grid
Definition multi_bspline_structs.h:93

multi_UBspline_3d_d::x_grid
Ugrid x_grid
Definition multi_bspline_structs.h:93

multi_UBspline_3d_d::num_splines
int num_splines
Definition multi_bspline_structs.h:95

multi_UBspline_3d_d::y_stride
intptr_t y_stride
Definition multi_bspline_structs.h:92

multi_UBspline_3d_d::z_stride
intptr_t z_stride
Definition multi_bspline_structs.h:92

multi_UBspline_3d_d::y_grid
Ugrid y_grid
Definition multi_bspline_structs.h:93

multi_UBspline_3d_d::coefs
double *restrict coefs
Definition multi_bspline_structs.h:91

multi_UBspline_3d_d::x_stride
intptr_t x_stride
Definition multi_bspline_structs.h:92