d3/d79/fir_8cu_source.html

 #include <stdio.h>
 #include <stdlib.h>
 #include <string.h>
 #include <assert.h>
 #include <math.h>

 #include <cuda_runtime.h>
 #include <cublas_v2.h>

 #include "fir.hpp"

 #define checkcublas(X) assert( ( X ) == CUBLAS_STATUS_SUCCESS )

  FIR::FIR(cublasHandle_t handle, cudaStream_t stream, float2 *hcoeff, int M, int f, int nt) :
     _handle(handle),_stream(stream),_M(M),_f(f)
 {
     _ntap = M * f;
     _nb = nt / M;
     assert(nt % M == 0);
     _nout = nt + f - 1;
     _nt = nt;

     cudaMalloc(&_dout,_nout*sizeof(float2));
     assert(_dout != NULL);
     cudaMemset(&_dout,0,_nout*sizeof(float2));

     cudaMalloc(&_dcoeff,_ntap*sizeof(float2));
     assert(_dcoeff != NULL);
     cudaMemcpy(_dcoeff,hcoeff,_ntap*sizeof(float2),cudaMemcpyHostToDevice);

     cudaMalloc(&_dtrapz,_nb*_f*sizeof(float2));
     assert(_dtrapz != NULL);
 }

 FIR::~FIR()
 {
     cudaFree(_dout);
     cudaFree(_dtrapz);
     cudaFree(_dcoeff);
     memset(this,0,sizeof(*this));
 }

 void FIR::fir_apply(const float2 *din)
 {
     float2 alpha = {1.0f,0.0f};
     float2 beta = {0.0f,0.0f};
     checkcublas(cublasCgemm(_handle,CUBLAS_OP_T,CUBLAS_OP_N,
                 _nb,_f,_M,
                 &alpha,
                 din,_M,
                 _dcoeff,_M,
                 &beta,
                 _dtrapz,_nb));

     for(int i=0;i<_f;i++) {
         checkcublas(cublasCaxpy(_handle,_nb,
                     &alpha,
                     &_dtrapz[i*_nb],1,
                     &_dout[_f-i-1],1));
     }
 }

 void FIR::fir_shift()
 {
     int rem = _f - 1;
     cudaMemcpyAsync(_dout,&_dout[_nb],rem*sizeof(float2),cudaMemcpyDeviceToDevice,_stream);
     cudaMemsetAsync(&_dout[rem],0,_nb*sizeof(float2),_stream);
 }

 void FIR::fir_to_host(float2 *hout)
 {
     cudaMemcpyAsync(hout,_dout,_nb*sizeof(float2),cudaMemcpyDeviceToHost,_stream);  // M is the decimation factor

 }

 // To be refined
 void FIR::fir_to_dev(float2 *dout)
 {
   cudaMemcpyAsync(dout,_dout,_nb*sizeof(float2),cudaMemcpyDeviceToDevice,_stream);  // M is the decimation factor
 }
 void FIR::run_fir(const float2 *din, float2 *hout)
 {
     fir_apply(din);
     fir_to_dev(hout);
     fir_shift();
 }
FIR::FIR
FIR(cublasHandle_t handle, cudaStream_t stream, float2 *hcoeff, int M, int f, int nt)
Definition: fir.cu:15

FIR::_dout
float2 * _dout
Definition: fir.hpp:26

FIR::~FIR
~FIR()
Definition: fir.cu:36

FIR::_dtrapz
float2 * _dtrapz
Definition: fir.hpp:28

FIR::fir_shift
void fir_shift()
Definition: fir.cu:64

FIR::_ntap
int _ntap
Definition: fir.hpp:21

FIR::_dcoeff
float2 * _dcoeff
Definition: fir.hpp:25

FIR::_nb
int _nb
Definition: fir.hpp:22

FIR::_M
int _M
Definition: fir.hpp:19

checkcublas
#define checkcublas(X)
Definition: fir.cu:13

FIR::_nout
int _nout
Definition: fir.hpp:24

FIR::_nt
int _nt
Definition: fir.hpp:23

FIR::_handle
cublasHandle_t _handle
Definition: fir.hpp:17

FIR::fir_apply
void fir_apply(const float2 *din)
Definition: fir.cu:44

FIR::fir_to_dev
void fir_to_dev(float2 *dout)
Definition: fir.cu:79

fir.hpp

FIR::_f
int _f
Definition: fir.hpp:20

FIR::_stream
cudaStream_t _stream
Definition: fir.hpp:18

FIR::fir_to_host
void fir_to_host(float2 *hout)
Definition: fir.cu:71

FIR::run_fir
void run_fir(const float2 *din, float2 *hout)
Definition: fir.cu:83