lundi 24 février 2025

Fonctions arithmétiques et logiques générales

Des choix sont faits sur la nature des fonctions arithmétiques et logiques générales des ensembles matériels et logiciels. Elles ont pour finalité la création d'informations nouvelles, ou la transformation d'informations existantes, pour des informations générales telles que des chaînes de bits, des informations textuelles, des images, des sons, des ensembles de données… 

Traitements effectués au niveau des bits

Les fonctions arithmétiques et logiques élémentaires exécutées sur des ensembles de bits sont des opérations arithmétiques de base, des fonctions booléennes.

Des fonctions de compression/décompression des bits, de chiffrement/déchiffrement, des contrôles d’intégrité sont souvent prévues.

Les contrôles d'intégrité des informations numériques sont effectués à partir de sommes de contrôle, de bits de parité, de techniques de hachage… Les contrôles sont parfois autocorrecteurs.

Les informations sont compressées et décompressées si nécessaire pour la communication, le stockage des informations.

Calcul, fonctions associées

Des choix sont faits sur la nature des formules utilisables pour réaliser des calculs sur des nombres, sur les types de graphiques, de tableaux proposés pour présenter les résultats obtenus.

Traitement de texte

Les textes sont des ensembles de caractères (lettres, chiffres, ponctuation…), correspondant à un langage, structurés en mots, en phrases, en paragraphes, selon un format, et ayant un sens. Les fonctions arithmétiques et logiques de traitement de texte visent à les créer, les modifier, les contrôler, les afficher, les mettre en page… : édition, contrôles (orthographique, syntaxique…), commande des impressions…

Des langages de balisage permettent d'enrichir les textes, de définir leur type, de donner des instructions aux programmes qui vont les lire.

Des analyses des textes sont possibles : comptage des caractères, des mots, comparaison de versions, reconnaissance de textes, mesure de similarité, analyse des données textuelles...

Les choix relatifs à ces fonctions répondent à plusieurs objectifs, parfois contradictoires : simplicité d’utilisation, puissance des fonctions…

1) Les images et les sons numériques sont enregistrés à partir de la photographie numérique, de la numérisation des sons, ou sont créés artificiellement. Des choix sont à faire sur la nature des fonctions arithmétiques et logiques permettant la création d'images, de sons de synthèse, leur transformation :

– dessin assisté par ordinateur (DAO), création musicale ;

– superposition d’éléments virtuels à la réalité (fonctions de réalité augmentée) ;

– modification de la taille, des couleurs, du dessin d'une image numérique, application de filtres, ajout d'éléments... ;

– amélioration de la qualité des images, des sons par l'atténuation des bruits, le traitement du flou… ;

– montage de vidéos, de films, d'enregistrements sonores (assemblage des plans, des séquences...).

Des IA génératives permettent de créer des images, des morceaux de musique… Les fonctions correspondantes sont entraînées par apprentissage automatique à partir d’ensembles d’images, de sons numériques.

2) L'analyse, la reconnaissance des images, des sons numérisés, la vision artificielle, visent à en extraire des informations, à les comparer, identifier leur contenu, les classer, rechercher des éléments. Des choix sont à faire sur la nature de ces fonctions.

Elles portent par exemple sur la comparaison avec d’autres images, pour la recherche de défauts d’objets, d’anomalies biologiques, l’identification des personnes, la mise en évidence des évolutions significatives entre des images relatives à un même objet, un même être vivant, un même environnement à différentes dates, la reconnaissance de l'écriture manuscrite, de la parole, des émotions des personnes, la construction ou le contrôle de cartes géographiques à partir d'images satellites, la « compréhension » des images, la proposition ou la prise de décision… .

L’imagerie numérique médicale doit permettre la visualisation des images de façon qu'elles soient plus facilement exploitables par un professionnel de santé.

Des choix sont à faire sur la nature des fonctions relevant du traitement du langage naturel : recherche d'informations dans les textes en langage naturel (text mining), classification de ces textes, analyse sémantique, dialogue automatique (agents conversationnels – chatbots), traduction automatique, génération automatique de textes, synthèse de la parole, orientation des documents vers leur destinataire en fonction de l'analyse de leur contenu…

Les difficultés d’interprétation sont susceptibles d’être signalées à l’utilisateur.

Des IA génératives, fondées sur de grands modèles de langage, permettent de créer des textes en langage naturel. Les fonctions de création sont entraînées par apprentissage automatique à partir d’ensembles de textes numériques. Elles permettent par exemple de résumer des textes complexes, des conversations, de fournir une assistance aux conseillers téléphoniques (conseiller augmenté).

1) La science des données vise à décrire de grands ensembles de données, les présenter, les résumer, les modéliser, définir leurs propriétés. Les principales fonctions numériques relevant de ce domaine sont le « nettoyage » des données, leur transformation, leur regroupement, leur segmentation, leur modélisation mathématique, la production de rapports et de visualisations. 

Les données sont des mots, des codes, des nombres, des textes, des images, des sons...

Des choix sont à faire sur le contenu de ces fonctions.

2) Les fonctions de « nettoyage » (correction des erreurs), de transformation des données, visent à préparer les fonctions ultérieures. Elles sont analogues aux fonctions de contrôle, de transformation des informations en entrée, stockées. Elles sont spécifiques à chaque domaine.

Des données dites synthétiques sont parfois générées par des modèles d’IA sur la base de données existantes. Elles permettent de fiabiliser, diversifier et sécuriser les données d’entraînement.

3) Des fonctions établissent, ou aident à établir, des modèles mathématiques relatifs à des phénomènes, des objets, des environnements, des activités… Les modèles recherchés sont souvent destinés à être exploités de façon opérationnelle par des fonctions numériques. L’objectif est de trouver des modèles susceptibles de fournir des résultats pertinents dans le délai imparti, avec les machines prévues pour exécuter ces fonctions.

Les modèles sont souvent établis à partir de l’exploitation de variables explicatives relatives aux données étudiées.

La modélisation porte sur une population, une nature d’événements… Elle est souvent effectuée sur un échantillon (analyse inférentielle).

Les fonctions pour la modélisation portent sur la réalisation de calculs statistiques, l’aide au choix des méthodes statistiques les plus appropriées, des paramètres du modèle, la définition des paramètres. Elles permettent des essais pour différents types de modèles : polynômes de degré 1, 2, 3, réseaux de neurones artificiels… 

Des fonctions d’apprentissage automatique sont utilisées. Des paramètres sont déterminés à partir d’un certain nombre de données d’apprentissage (entraînement), et validés sur des données de validation. Une fois entraînée, la machine détermine des résultats opérationnels sur la base du modèle calculé.

Les résultats sont fournis avec ou sans hypothèse statistique préalable. Certaines fonctions construisent elles-mêmes les hypothèses au fur et à mesure que s'accumulent les données.

Des caractéristiques spécifiques sont identifiées pour ces fonctions : fournir des explications sur les résultats, évaluer et qualifier les erreurs, intégrer le "raisonnement de sens commun", diminuer la charge de supervision de l'apprentissage. Des arbitrages sont à faire entre explicabilité et performance (mieux vaut parfois un modèle plus explicable et moins performant).

Des fonctions de détection de biais sont parfois attendues.

Les modèles obtenus (et validés) sont ensuite utilisés de façon opérationnelle, par exemple pour l’aide à la décision, la prévision, la simulation, le pilotage automatique, la génération de textes, d’images, de programmes, de molécules…

4) Des fonctions fournissent une information statistique décrivant de façon plus succincte les principales informations contenues dans les données, classent les éléments (personnes, événements, objets…) en sous-groupes aussi homogènes que possible.

Les résultats obtenus sont constitués de données (moyenne, écart type, prédiction...), de textes, de visualisations graphiques des données, de fonctions, de paramètres de fonctions... La visualisation graphique se fait en deux ou trois dimensions.

Les représentations graphiques permettent de faire apparaître des tendances, des valeurs inhabituelles, des propriétés, du sens. Il est possible par exemple de représenter un nuage de points à n dimensions dans un plan ou dans un espace à trois dimensions, sans trop de pertes.

5) La génération de textes, d’images, de programmes, de molécules… (IA générative) est effectuée en réponse à des « invites », exprimées en langage naturel. Elle s’appuie sur des modèles obtenus en appliquant un apprentissage automatique non supervisé ou auto-supervisé à un ensemble de données.

Les modèles de langage utilisés sont des LLM (modèles généraux) ou des SLM (modèles spécialisés). Les ensembles de données nécessaires aux LLM sont gigantesques.

La génération augmentée de récupération (RAG - Retrieval Augmentation Generation) permet d’associer des modèles d’IA générative aux bases de données de l’entreprise, ou à des données externes.

Optimisation

Des fonctions numériques permettent ou facilitent l’optimisation, comme par exemple pour le choix du plus court chemin.

Raisonnement automatisé

1) Des fonctions de raisonnement automatisé sont exécutées par les assistants de preuve, la démonstration automatique de théorèmes, la vérification de preuve.

2) Les systèmes experts proposent des solutions à des problèmes à partir d’un raisonnement automatisé s’appuyant sur une base de règles, une base defaits, qui contient les faits relatifs au problème à résoudre, et un moteur dinférence.

Les « règles » sont des règles logiques, des dictionnaires, des grammaires, des formules mathématiques, des règles de gestion… Les règles utilisées,dites règles de production, sexpriment sous la forme « Si condition(s), alors conclusion(s )». Ces règles sont aussi des informations, utilisées pour construire les systèmes ou enregistrées pour être exploitées si nécessaire.

Les systèmes experts aident à la résolution de problèmes dans un domaine. Le moteur d'inférence s'appuie sur les faits et les règles pour produire de nouveaux faits, et arriver au final à la résolution du problème posé.

Les connaissances (faits et règles) doivent pouvoir être formalisées, enrichies en permanence, notamment à partir de l’expérience du traitement lui-même. Elles ne sont pas obligatoirement complètes et cohérentes.

Ces fonctions sont utilisables par exemple pour l'aide au diagnostic.

Elles se caractérisent par la pertinence des réponses, le nombre d’erreurs de raisonnement…

Aucun commentaire:

Enregistrer un commentaire