PODCASTS

NEWSLETTER

En avant, mars 2026 : [Notre newsletter IT fait son grand retour !]🎉

1Qu'est-ce que la recherche en plein texte ?

2Installation et configuration

3Recherche en plein texte sur plusieurs colonnes

3.1Création d'un index GIN :

3.2Recherche en plein texte :

4Pondération des termes

4.1Exemple :

5Recherche phonétique avec Soundex

5.1Exemple :

6Optimisation des requêtes

7La recherche full texte, un outil puissant

Accueil

Blog

Article

18+

années
d'expérience

60+

experts
techniques

150K

écoutes de notre podcast

La recherche Full Text dans PostegreSQL : guide complet

La recherche en plein texte est une fonctionnalité puissante qui permet d'effectuer des recherches avancées dans des bases de données en analysant le contenu textuel. Contrairement aux recherches simples par mot-clé, elle prend en compte la structure linguistique et permet de fournir des résultats plus pertinents. PostgreSQLMoteur de gestion de base de données libre de droit., l'un des systèmes de gestion de bases de données les plus populaires, inclut nativement des outils robustes pour la recherche en plein texte. Dans cet article, nous allons explorer les bases de la recherche en plein texte dans PostgreSQL. Nous couvrirons l'installation, la recherche sur plusieurs colonnes, la pondération des termes et l'utilisation de Soundex pour la recherche phonétique.

Nathan ARMANET

Développeur fullstack, j'adore relever des défis techniques ! Mis à jour le 4 Mars 2025

Qu'est-ce que la recherche en plein texte ?

La recherche en plein texte dans PostgreSQL est une fonctionnalité permettant d'analyser et de rechercher des données textuelles à l'aide de types de données spécifiques comme tsvector (texte préparé pour la recherche) et tsquery (requête textuelle). Elle utilise des algorithmes avancés pour le traitement linguistique, tels que la tokenisation et le stemming, afin de comprendre les mots-clés et leur contexte dans le texte.

Installation et configuration

Avant de commencer, assurez-vous que votre instance PostgreSQL est configurée pour utiliser les fonctionnalités de recherche en plein texte. À partir de sa version 12, PostgreSQLMoteur de gestion de base de données libre de droit. inclut ces outils par défaut, mais vous pourriez avoir besoin de créer un environnement de test pour vos essais.

Dans la suite de cet article, nous travaillerons avec la table suivante dans nos exemples :


CREATE TABLE articles (
    id SERIAL PRIMARY KEY,
    titre TEXT,
    contenu TEXT
);

INSERT INTO articles (titre, contenu)
VALUES ('Introduction à PostgreSQL', 'PostgreSQL est une base de données relationnelle.'),
       ('Recherche en plein texte', 'La recherche en plein texte permet des recherches avancées.'),
       ('PostgreSQL et Soundex', 'Soundex est utile pour les recherches phonétiques.');

Recherche en plein texte sur plusieurs colonnes

Pour effectuer une recherche en plein texte dans PostgreSQL, il est courant de combiner plusieurs colonnes pour générer un index de recherche. Voici comment procéder :

Création d'un index GIN :

Un index GIN (Generalized Inverted Index) est idéal pour accélérer les recherches en plein texte.


CREATE INDEX idx_articles_fts ON articles USING GIN (
    to_tsvector('french', titre || ' ' || contenu)
);

Recherche en plein texte :

Utilisez la fonction to_tsvector pour transformer le texte en format plein texte et to_tsquery pour formuler une requête.


SELECT * FROM articles

WHERE to_tsvector('french', titre || ' ' || contenu) @@ to_tsquery('texte & PostgreSQL');

Dans cet exemple :

@@ est l'opérateur qui compare le texte et la requête.
& est l'opérateur logique pour dire "et".

Pondération des termes

La pondération permet de donner plus d'importance à certains termes ou à certaines colonnes dans la recherche. Par exemple, un mot-clé dans le titre peut être plus important que dans le contenu.

Exemple :

Ajoutez des pondérations :

SELECT *,
       ts_rank(
           setweight(to_tsvector('french', titre), 'A') ||
           setweight(to_tsvector('french', contenu), 'B'),
           to_tsquery('PostgreSQL')
       ) AS rank
FROM articles
WHERE to_tsvector('french', titre || ' ' || contenu) @@ to_tsquery('PostgreSQL')
ORDER BY rank DESC;

Dans cet exemple :
- setweight applique une pondération ('A' étant le poids le plus élevé, 'D' le plus faible).
- Les résultats sont triés par pertinence.

Recherche phonétique avec Soundex

Soundex est une méthode permettant de chercher des mots qui "sonnent" de manière similaire, utile pour des noms mal orthographiés ou des recherches approximatives. Cela nécéssite d'importer la librairie fuzzystrmatch et de développer 2 méthodes pour pouvoir utiliser Soundex avec la recherche plein texte :

Exemple :

Activez l'extension fuzzystrmatch :
```
CREATE EXTENSION fuzzystrmatch;
```
Création de nos méthodes d'intégration , Pour utiliser Soundex avec la recherche en plein texte, nous devons procéder aux opérations suivantes :

Conversion de chaque mot en son code Soundex.
Concaténation des codes Soundex en tsvector ou tsquery.


CREATE FUNCTION soundex_tsvector(v_name text) RETURNS tsvector

AS
$$
BEGIN
    RETURN to_tsvector('simple',
                       coalesce(string_agg(soundex(coalesce(n, '')), ' '), ''))
        FROM regexp_split_to_table(coalesce(v_name, ''), '\s+') AS n;
END
$$ LANGUAGE plpgsql IMMUTABLE;

CREATE FUNCTION soundex_tsquery(v_name text) RETURNS tsquery

AS
$$
BEGIN
    RETURN to_tsquery('simple',
                      coalesce(string_agg(soundex(coalesce(n, '')), ' | '), ''))
        FROM regexp_split_to_table(v_name, '\s+') AS n;
END
$$ LANGUAGE plpgsql IMMUTABLE;

Rechercher :


SELECT * FROM articles

WHERE soundex_tsvector(titre) @@ soundex_tsquery('PostgreSQL');

Optimisation des requêtes

Dans les exemples précédents, nous formons les tsvector directement dans les conditions de la requête. Pour des tables qui contiennent beaucoup d'éléments et/ou des requêtes qui peuvent être exécutées fréquemment, il est recommandé d'intégrer la valeur du tsvector directement dans une colonne de la table :


CREATE TABLE articles (
    id SERIAL PRIMARY KEY,
    titre TEXT,
    contenu TEXT,

    vector                  tsvector GENERATED ALWAYS AS (
        to_tsvector('simple', titre) ||
        to_tsvector('simple', contenu)
        ) STORED,

    vector_weighted         tsvector GENERATED ALWAYS AS (
        setweight(to_tsvector('simple', titre), 'A') ||
        setweight(to_tsvector('simple', contenu), 'D')
        ) STORED
);

CREATE INDEX idx_articles_vector ON articles USING GIN (vector);
CREATE INDEX idx_articles_vector_weighted ON articles USING GIN (vector_weighted);

La recherche full texte, un outil puissant

PostgreSQL offre un éventail d'outils puissants pour la recherche en plein texte, permettant de créer des fonctionnalités de recherche avancées, rapides et pertinentes. Que ce soit pour la recherche sur plusieurs colonnes, la pondération des termes ou l'utilisation de Soundex, ces techniques peuvent améliorer significativement l'expérience utilisateur.

Expérimentez avec ces outils pour découvrir tout leur potentiel et optimiser vos applications. Pour un audit de base de donnée, n'hésitez pas à nous contacter !

data

Nos podcasts en lien

Database : le noSql est-il une mode ou le futur des bases de données ?

Écouter le podcast

Vers une approche horizontale de la data

Écouter le podcast

Pour aller plus loin

Comment optimiser vos images Docker ?

On vous explique différentes méthodes pour optimiser vos images Docker : temps de build, taille de l'image et bonnes pratiques pour éviter les effets de bords.

5 convictions pour le développement d'application web

Au fil du temps, on a testé pas mal de choses, avec plus ou moins de succès on doit bien l’avouer… Entre réussite de projet et tests ratés, on a pu bâtir et faire évoluer nos convictions dans le domaine du développement d’application web.

La mise en prod

Découvrez la planche #10 !

Envie de devenir un(e) membre de la AXOTeam ?

Découvrez notre univers tech et nos offres d'emplois !

Je postule

Nous suivre, nous écouter

Notre équipe de techs à Lyon vous aide à faire évoluer votre SI, en développant des applications utiles et durables !

18+

ans d'experience

60+

experts techniques

150K

écoutes de notre podcast

contact@axopen.com

04 82 53 26 44

La société

Qui sommes-nous?

Nos convictions techniques

Notre histoire

Vivre Axopen

Nos jobs

Nos engagements RSE

Digital factory

Nos ressources

Expertises

Web

Mobile

DevOps

Cloud

Architecture

Intégration IA & LLM

Secteurs d'activités

Assurances

Industrie

Santé

Energie

Métiers

Audit et Expertise

Centre de services informatique

Développement sur mesure

Pilotage & Gestion de projets

Maintenance & Evolutions

Mentions légales

La recherche Full Text dans PostegreSQL : guide complet

Qu'est-ce que la recherche en plein texte ?

Installation et configuration

Recherche en plein texte sur plusieurs colonnes

Création d'un index GIN :

Recherche en plein texte :

Pondération des termes

Exemple :

Recherche phonétique avec Soundex

Exemple :

Optimisation des requêtes

La recherche full texte, un outil puissant

Nos podcasts en lien

Pour aller plus loin

Comment optimiser vos images Docker ?

5 convictions pour le développement d'application web

La mise en prod

Envie de devenir un(e) membre de la AXOTeam ?

La société

Expertises

Secteurs d'activités

Métiers

Réalisations

Jobs

Nos ressources

La News AXO

Le Podcast AXOPEN