rune-caster/spell__factory_8hpp_source.html

#pragma once


#include "spell_core.hpp"

#include "spell_filter.hpp"

#include "spell_composition.hpp"

#include "unicode.hpp"

#include "spell_token.hpp"


namespace rune_caster {

namespace spell {


namespace factory {


// === Whitespace normalization factories ===


inline auto whitespace() {

    return core::WhitespaceNormalizer{};

}


inline auto whitespace(bool collapse_multiple, bool trim_edges = true) {

    return core::WhitespaceNormalizer{collapse_multiple, trim_edges};

}


// === Case conversion factories ===


inline auto lowercase() {

    return core::CaseConverter{core::CaseConverter::CaseType::Lower};

}


inline auto uppercase() {

    return core::CaseConverter{core::CaseConverter::CaseType::Upper};

}


inline auto titlecase() {

    return core::CaseConverter{core::CaseConverter::CaseType::Title};

}


// === Unicode normalization factories ===


inline auto unicode_nfc() {

    return core::UnicodeNormalizer{unicode::NormalizationForm::NFC};

}


inline auto unicode_nfd() {

    return core::UnicodeNormalizer{unicode::NormalizationForm::NFD};

}


inline auto unicode_nfkc() {

    return core::UnicodeNormalizer{unicode::NormalizationForm::NFKC};

}


inline auto unicode_nfkd() {

    return core::UnicodeNormalizer{unicode::NormalizationForm::NFKD};

}


// === Punctuation filter factories ===


inline auto punctuation(bool remove = true) {

    return filter::PunctuationFilter{remove};

}


// === Combined operation factories ===


template<typename CaseType = void>


auto text_normalizer(CaseType case_type = {}) {

    if constexpr (std::is_void_v<CaseType>) {

        return compose(whitespace(), unicode_nfc());

    } else {

        return compose(

            compose(whitespace(), unicode_nfc()),

            core::CaseConverter{case_type}

        );

    }

}


inline auto search_preprocessor() {

    return compose(

        compose(whitespace(), unicode_nfc()),

        lowercase()

    );

}


inline auto display_formatter() {

    return compose(

        compose(whitespace(), unicode_nfc()),

        titlecase()

    );

}


template<bool RemovePunctuation = true>


inline auto text_normalizer_with_punctuation() {

    if constexpr (RemovePunctuation) {

        return compose(compose(whitespace(), unicode_nfc()), punctuation(true));

    } else {

        return compose(whitespace(), unicode_nfc());

    }

}


// === Trim factory ===

inline auto trim() { return core::TrimEdges{}; }


// === Tokenizer factory ===

inline auto tokenizer_whitespace() { return core::WhitespaceTokenizer{}; }


} // namespace factory


// Import factory functions into the main spell namespace for convenience

using namespace factory;


} // namespace spell

} // namespace rune_caster

rune_caster::spell::core::CaseConverter
Case conversion spell using C++20 concepts.
Definition spell_core.hpp:68

rune_caster::spell::core::CaseConverter::CaseType::Upper
@ Upper
Convert to uppercase.
Definition spell_core.hpp:72

rune_caster::spell::core::CaseConverter::CaseType::Lower
@ Lower
Convert to lowercase.
Definition spell_core.hpp:71

rune_caster::spell::core::CaseConverter::CaseType::Title
@ Title
Convert to titlecase (first letter of each word)
Definition spell_core.hpp:73

rune_caster::spell::core::TrimEdges
Trim leading and trailing whitespace.
Definition spell_core.hpp:103

rune_caster::spell::core::UnicodeNormalizer
Unicode normalization spell using C++20 concepts.
Definition spell_core.hpp:43

rune_caster::spell::core::WhitespaceNormalizer
Normalize whitespace characters using C++20 concepts.
Definition spell_core.hpp:17

rune_caster::spell::core::WhitespaceTokenizer
Simple whitespace tokenizer Splits input RuneSequence into tokens separated by Unicode whitespace.
Definition spell_token.hpp:15

rune_caster::spell::filter::PunctuationFilter
Remove punctuation characters using C++20 concepts.
Definition spell_filter.hpp:101

rune_caster::spell::factory
Definition spell_factory.hpp:11

rune_caster::spell::factory::uppercase
auto uppercase()
Create an uppercase converter.
Definition spell_factory.hpp:60

rune_caster::spell::factory::titlecase
auto titlecase()
Create a titlecase converter.
Definition spell_factory.hpp:68

rune_caster::spell::factory::tokenizer_whitespace
auto tokenizer_whitespace()
Definition spell_factory.hpp:191

rune_caster::spell::factory::display_formatter
auto display_formatter()
Create a display-optimized text formatter.
Definition spell_factory.hpp:166

rune_caster::spell::factory::search_preprocessor
auto search_preprocessor()
Create a search-optimized text preprocessor.
Definition spell_factory.hpp:149

rune_caster::spell::factory::whitespace
auto whitespace()
Factory functions for creating commonly used spells.
Definition spell_factory.hpp:31

rune_caster::spell::factory::lowercase
auto lowercase()
Create a lowercase converter.
Definition spell_factory.hpp:52

rune_caster::spell::factory::punctuation
auto punctuation(bool remove=true)
Create a punctuation filter.
Definition spell_factory.hpp:112

rune_caster::spell::factory::unicode_nfc
auto unicode_nfc()
Create an NFC (Canonical Decomposition followed by Canonical Composition) normalizer.
Definition spell_factory.hpp:78

rune_caster::spell::factory::unicode_nfd
auto unicode_nfd()
Create an NFD (Canonical Decomposition) normalizer.
Definition spell_factory.hpp:86

rune_caster::spell::factory::text_normalizer
auto text_normalizer(CaseType case_type={})
Create a text normalizer that applies common normalizations.
Definition spell_factory.hpp:128

rune_caster::spell::factory::trim
auto trim()
Definition spell_factory.hpp:188

rune_caster::spell::factory::text_normalizer_with_punctuation
auto text_normalizer_with_punctuation()
Text normalizer with optional punctuation removal.
Definition spell_factory.hpp:179

rune_caster::spell::factory::unicode_nfkd
auto unicode_nfkd()
Create an NFKD (Compatibility Decomposition) normalizer.
Definition spell_factory.hpp:102

rune_caster::spell::factory::unicode_nfkc
auto unicode_nfkc()
Create an NFKC (Compatibility Decomposition followed by Canonical Composition) normalizer.
Definition spell_factory.hpp:94

rune_caster::spell
Definition spell.hpp:40

rune_caster::spell::compose
auto compose(FirstSpell &&first, SecondSpell &&second)
Compose two spells into a single spell pipeline.
Definition spell_composition.hpp:94

rune_caster::unicode::NormalizationForm::NFKC
@ NFKC
Definition unicode.hpp:38

rune_caster::unicode::NormalizationForm::NFKD
@ NFKD
Definition unicode.hpp:39

rune_caster::unicode::NormalizationForm::NFD
@ NFD
Definition unicode.hpp:37

rune_caster::unicode::NormalizationForm::NFC
@ NFC
Definition unicode.hpp:36

rune_caster
Definition caster.hpp:9

spell_composition.hpp

spell_core.hpp

spell_filter.hpp

spell_token.hpp

unicode.hpp