da/d3b/scorer_8h_source.html

#ifndef SCORER_H

#define SCORER_H


#include "metrics.h"

#include "../util/error.h"

#include "../types.h"


// code to evaluate GP programs.

namespace Brush{


using namespace Pop;


namespace Eval{


template <ProgramType P>


class Scorer

{


using RetType =

        typename std::conditional_t<P == PT::Regressor, ArrayXf,

                    std::conditional_t<P == PT::Representer, ArrayXXf, ArrayXf

        >>;


typedef float (*funcPointer)(const VectorXf&,

                             const VectorXf&,

                             VectorXf&,

                             const vector<float>&);

public:

    // map the string into a function to be called when calculating the score

    std::map<string, funcPointer> score_hash;

    string scorer;


    // TODO: add more scores, include them here, add to score_hash


    Scorer(string scorer="mse") {

        score_hash["mse"] = &mse;


        this->set_scorer(scorer);

    };


    void set_scorer(string scorer){ this->scorer = scorer; };

    string get_scorer(){return this->scorer; };


    /* void set_scorer(string scorer); */


    float score(const VectorXf& y_true, const VectorXf& y_pred,

                VectorXf& loss, const vector<float>& w)

    {

        // loss is an array passed by reference to store each prediction (used in lexicase)

        // weights are used to give more or less importance for a given sample.

        // Every scorer must have the same function signature, but arent required to use all info


        if ( score_hash.find(this->scorer) == score_hash.end() )

        {

            HANDLE_ERROR_THROW("Scoring function '" + this->scorer + "' not defined");

            return 0.0;

        }

        else

        {

            return score_hash.at(this->scorer)(y_true, y_pred, loss, w);

        }

    };


    float score(Individual<P>& ind, Dataset& data,

                VectorXf& loss, const Parameters& params)

    {

        RetType y_pred = ind.predict(data);

        return score(data.y, y_pred, loss, params.class_weights);

    }


};


// TODO: improve this so we dont have a lot of different declarations

template <ProgramType P>

    requires( P == PT::BinaryClassifier)


class Scorer<P>

{


using RetType = ArrayXf;


typedef float (*funcPointer)(const VectorXf&,

                             const VectorXf&,

                             VectorXf&,

                             const vector<float>&);

public:

    // map the string into a function to be called when calculating the score

    std::map<string, funcPointer> score_hash;

    string scorer;


    Scorer(string scorer="log") {

        score_hash["log"] = &mean_log_loss;

        score_hash["average_precision_score"] = &average_precision_score;

        score_hash["accuracy"] = &zero_one_loss;

        score_hash["balanced_accuracy"] = &bal_zero_one_loss;


        this->set_scorer(scorer);

    };


    void set_scorer(string scorer){ this->scorer = scorer; };

    string get_scorer(){return this->scorer; };


    /* void set_scorer(string scorer); */


    float score(const VectorXf& y_true, const VectorXf& y_pred,

                VectorXf& loss, const vector<float>& w)

    {

        if ( score_hash.find(this->scorer) == score_hash.end() )

        {

            // not found

            HANDLE_ERROR_THROW("Scoring function '" + this->scorer

                    + "' not defined");

            return 0.0;

        }

        else

        {

            // found

            return score_hash.at(this->scorer)(y_true, y_pred, loss, w);

        }

    };


    float score(Individual<P>& ind, Dataset& data,

                VectorXf& loss, const Parameters& params)

    {

        RetType y_pred = ind.predict_proba(data); // .template cast<float>();


        auto class_weights = params.class_weights;


        // calculate class weights based on data instead of using a predetermined value

        if (!class_weights.empty())

        {

            class_weights.resize(params.n_classes);

            for (unsigned i = 0; i < params.n_classes; ++i){

                class_weights.at(i) = float((data.y.cast<int>().array() == i).count())/data.y.size();

                class_weights.at(i) = (1.0 - class_weights.at(i));

            }

        }


        return score(data.y, y_pred, loss, class_weights);

    }


};


template <ProgramType P>

    requires(P == PT::MulticlassClassifier)

class Scorer<P>

{


using RetType = ArrayXXf;


typedef float (*funcPointer)(const VectorXf&,

                             const ArrayXXf&,

                             VectorXf&,

                             const vector<float>&);

public:

    // map the string into a function to be called when calculating the score

    std::map<string, funcPointer> score_hash;

    string scorer;


    // TODO: I actually need to test this stuff


    Scorer(string scorer="multi_log") {

        score_hash["multi_log"] = &mean_multi_log_loss;

        score_hash["accuracy"] = &multi_zero_one_loss;


        this->set_scorer(scorer);

    };


    void set_scorer(string scorer){ this->scorer = scorer; };

    string get_scorer(){return this->scorer; };


    /* void set_scorer(string scorer); */


    float score(const VectorXf& y_true, const ArrayXXf& y_pred,

                VectorXf& loss, const vector<float>& w)

    {

        // loss is an array passed by reference to store each prediction (used in lexicase)

        // weights are used to give more or less importance for a given sample.

        // Every scorer must have the same function signature, but arent required to use all info


        if ( score_hash.find(this->scorer) == score_hash.end() )

        {

            // not found

            HANDLE_ERROR_THROW("Scoring function '" + this->scorer

                    + "' not defined");

            return 0.0;

        }

        else

        {

            // found

            return score_hash.at(this->scorer)(y_true, y_pred, loss, w);

        }

    };


    float score(Individual<P>& ind, Dataset& data,

                VectorXf& loss, const Parameters& params)

    {

        RetType y_pred = ind.predict_proba(data); // .template cast<float>();


        auto class_weights = params.class_weights;


        // calculate class weights based on data instead of using a predetermined value

        if (!class_weights.empty())

        {

            class_weights.resize(params.n_classes);

            for (unsigned i = 0; i < params.n_classes; ++i){

                class_weights.at(i) = float((data.y.cast<int>().array() == i).count())/data.y.size();

                class_weights.at(i) = (1.0 - class_weights.at(i));

            }

        }


        return score(data.y, y_pred, loss, class_weights);

    }


};


}

}

#endif

Brush::Eval::Scorer< P >::get_scorer
string get_scorer()
Definition scorer.h:99

Brush::Eval::Scorer< P >::set_scorer
void set_scorer(string scorer)
Definition scorer.h:98

Brush::Eval::Scorer< P >::score
float score(Individual< P > &ind, Dataset &data, VectorXf &loss, const Parameters &params)
Definition scorer.h:119

Brush::Eval::Scorer< P >::score
float score(const VectorXf &y_true, const ArrayXXf &y_pred, VectorXf &loss, const vector< float > &w)
Definition scorer.h:168

Brush::Eval::Scorer< P >::RetType
ArrayXf RetType
Definition scorer.h:78

Brush::Eval::Scorer< P >::Scorer
Scorer(string scorer="multi_log")
Definition scorer.h:157

Brush::Eval::Scorer< P >::Scorer
Scorer(string scorer="log")
Definition scorer.h:89

Brush::Eval::Scorer< P >::scorer
string scorer
Definition scorer.h:87

Brush::Eval::Scorer< P >::score_hash
std::map< string, funcPointer > score_hash
Definition scorer.h:86

Brush::Eval::Scorer< P >::score
float score(const VectorXf &y_true, const VectorXf &y_pred, VectorXf &loss, const vector< float > &w)
Definition scorer.h:102

Brush::Eval::Scorer< P >::funcPointer
float(* funcPointer)(const VectorXf &, const VectorXf &, VectorXf &, const vector< float > &)
Definition scorer.h:80

Brush::Eval::Scorer
Definition scorer.h:18

Brush::Eval::Scorer::get_scorer
string get_scorer()
Definition scorer.h:42

Brush::Eval::Scorer::set_scorer
void set_scorer(string scorer)
Definition scorer.h:41

Brush::Eval::Scorer::score
float score(Individual< P > &ind, Dataset &data, VectorXf &loss, const Parameters &params)
Definition scorer.h:63

Brush::Eval::Scorer::RetType
typename std::conditional_t< P==PT::Regressor, ArrayXf, std::conditional_t< P==PT::Representer, ArrayXXf, ArrayXf > > RetType
Definition scorer.h:20

Brush::Eval::Scorer::scorer
string scorer
Definition scorer.h:32

Brush::Eval::Scorer::Scorer
Scorer(string scorer="mse")
Definition scorer.h:35

Brush::Eval::Scorer::score_hash
std::map< string, funcPointer > score_hash
Definition scorer.h:31

Brush::Eval::Scorer::score
float score(const VectorXf &y_true, const VectorXf &y_pred, VectorXf &loss, const vector< float > &w)
Definition scorer.h:45

Brush::Eval::Scorer::funcPointer
float(* funcPointer)(const VectorXf &, const VectorXf &, VectorXf &, const vector< float > &)
Definition scorer.h:25

Brush::Pop::Individual
Definition individual.h:15

Brush::Pop::Individual::predict
auto predict(const Dataset &data)
Definition individual.h:79

Brush::Pop::Individual::predict_proba
auto predict_proba(const Dataset &d)
Definition individual.h:88

Dataset
holds variable type data.
Definition data.h:51

Dataset::y
ArrayXf y
length N array, the target label
Definition data.h:80

error.h

HANDLE_ERROR_THROW
#define HANDLE_ERROR_THROW(err)
Definition error.h:27

metrics.h

Brush::Eval
Definition evaluation.cpp:4

Brush::Eval::multi_zero_one_loss
float multi_zero_one_loss(const VectorXf &y, const ArrayXXf &predict_proba, VectorXf &loss, const vector< float > &class_weights)
Accuracy for multi-classification.
Definition metrics.cpp:264

Brush::Eval::zero_one_loss
float zero_one_loss(const VectorXf &y, const VectorXf &predict_proba, VectorXf &loss, const vector< float > &class_weights)
Accuracy for binary classification.
Definition metrics.cpp:71

Brush::Eval::mean_log_loss
float mean_log_loss(const VectorXf &y, const VectorXf &predict_proba, VectorXf &loss, const vector< float > &class_weights)
log loss
Definition metrics.cpp:43

Brush::Eval::mean_multi_log_loss
float mean_multi_log_loss(const VectorXf &y, const ArrayXXf &predict_proba, VectorXf &loss, const vector< float > &class_weights)
Calculates the mean multinomial log loss between the predicted probabilities and the true labels.
Definition metrics.cpp:253

Brush::Eval::average_precision_score
float average_precision_score(const VectorXf &y, const VectorXf &predict_proba, VectorXf &loss, const vector< float > &class_weights)
Calculates the average precision score between the predicted probabilities and the true labels.
Definition metrics.cpp:124

Brush::Eval::mse
float mse(const VectorXf &y, const VectorXf &yhat, VectorXf &loss, const vector< float > &class_weights)
mean squared error
Definition metrics.cpp:9

Brush::Eval::bal_zero_one_loss
float bal_zero_one_loss(const VectorXf &y, const VectorXf &predict_proba, VectorXf &loss, const vector< float > &class_weights)
Balanced accuracy for binary classification.
Definition metrics.cpp:92

Brush::Pop
Definition individual.cpp:4

Brush
< nsga2 selection operator for getting the front
Definition bandit.cpp:4

Brush::ProgramType::BinaryClassifier
@ BinaryClassifier
Definition types.h:72

Brush::ProgramType::Regressor
@ Regressor
Definition types.h:71

Brush::ProgramType::MulticlassClassifier
@ MulticlassClassifier
Definition types.h:73

Brush::ProgramType::Representer
@ Representer
Definition types.h:74

Brush::Parameters
Definition params.h:20

Brush::Parameters::class_weights
vector< float > class_weights
weights for each class
Definition params.h:72

Brush::Parameters::n_classes
unsigned int n_classes
Definition params.h:78

types.h