Hello!

bon slrpnk.net a l’air d’être dans les choux alors je lance ce post avec mon compte de secours jlai.lu

Alors je lance cet AMA car ça fait un moment que je bouffe du machine learning à temps plein et pour suivre les news technique, je passe le plus clair de mon temps à lire de l’anglais. Et je trouve qu’en français, ben y a pas grand chose. C’est presque uniquement du discours dystopique mal informé.

Rien sur la recherche sur l’alignement, rien sur les modèles open source (condition sine qua non pour que ça se passe bien), rien sur les évolutions sociales positives que ça peut amener.

On parle juste de OpenAI, Google et Musk qui ne sont que quelques arbres malades d’une forêt bien plus grande.

Perso ça va faire 5 ans que je fais du deep learning professionnellement. J’ai travaillé pour Skymind, qui développait deeplearning4j. Ça vous dira rien, c’est un projet plus ou moins mort, mais c’était une tentative de faire un framework alternatif avant que tout le monde passe à pytorch. Puis je suis devenu principalement utilisateur des gros modèles entraînés par d’autres.

J’ai travaillé sur les modèles de vision au départ et maintenant presque exclusivement sur des modèles de langage. J’ai réussi à passer au 4/5e l’année dernière pour me consacrer aussi avec le fablab local à de la robotique open hardware (où bien sur j’utilise des modèles de deep learning pour la vision).

Ça fait plus de 20 ans que j’ai réalisé que l’IA a le potentiel de changer le monde pour le mieux, c’est pas par hasard que j’ai essayé de m’orienter le plus possible là dedans et ça me fait mal au cœur de voir tant de gens croire que notre seul but est d’aider Sam Altman à se faire quelques milliards de plus, qui ne voient pas les capacités de transformation de cette tech.

J’ai déjà donné quelques avis en anglais pour éviter le “doomism” dans des romans de SF (https://slrpnk.net/post/6100538) mais le faire dans ma langue natale ferait du bien!

Et, si, le titre est correct, ça me fait 6/5 de boulot, mais quand on aime on ne compte pas!

Voila, je préférerais qu’on reste sur ces thèmes mais AMA anyway!

  • @keepthepace_OP
    link
    Français
    32 months ago

    Ce qui t’intéresse le plus! Tu peux assembler un petit classifier et l’entrainer from scratch, fine-tuner un petit modèle existant ou bien juste utiliser des modèles.

    MNIST, un classifieur d’images 24x24 de chiffres écrits à la main, est un bon exercice de départ.

    Charger un modèle pré-entrainé et aller examiner ses représentations latentes est aussi rigolo.

    • @pseudo
      link
      Français
      22 months ago

      J’aime bien la théorie mathématique mais je n’ai jamais réussit à trouver dans la construction ou l’utilisation d’un modèle un plaisir autre que celui de voir enfin marcher ce sur quoi on se casse les dents depuis un moment. Mais je n’ai peut-être simplement pas trouvé l’application de l’IA qui fera battre mon cœur.

      • @keepthepace_OP
        link
        Français
        22 months ago

        Est ce qu’il y a un domaine qui fait battre ton coeur sur lequel on peut récupérer des données facilement?

        Note qu’aujourd’hui avec des LLMs, même des données textuelles sont relativement faciles à analyser.

        • @pseudo
          link
          Français
          22 months ago

          Je crois que ONISR a pas mal de données sur la sécurité routière. Il a peut-être un truc pour me motiver là-dedans.