• bouh@lemmy.world
    link
    fedilink
    arrow-up
    5
    ·
    1 year ago

    J’ai hâte de voir ce que ça va donner avec le rgpd. Ils ont exploité le travail de tous les utilisateurs pour entraîner leur IA et maintenant ils ferment les vannes pour toucher le jackpot. C’est très douteux comme méthode de conception et développement, et très flou vis à vis des droits d’auteur et des données personnelles.

    Alors, leur stratégie est de concentrer les richesses. Mais l’enjeu est si grand que j’ai du mal à croire que ça va juste se passer comme ça.

    • Enoril
      link
      fedilink
      arrow-up
      4
      ·
      edit-2
      1 year ago

      Le CAPTCHA de Google où l’on nous demande de montrer un pont, une voiture, un feux de circulation (et au tout début de son existence: la position des plaques portant le numéros d’une maison ou le nom d’une rue)…

      Hé ben tout ça est en soi une exploitation de tout le monde pour enrichir leur base de données, qu’ils ont utilisé plus tard comme fondation pour entraîner leur modèle et vendre leur services. Et je ne parle même pas de Google translate qui utilise sûrement d’autre données tel que le contenu de nos emails, bouquins (libre ou pas, je me souviens qu’ils ont scanné gratuitement un paquet de livres dans certaines librairies au nom de la sauvegarde du patrimoine) pour entraîner en toute légalité leur modèles.

      Actuellement google utilise les données des robots ménager Irobot (qu’ils ont racheté) pour cartographier votre maison et proposer de futurs services tel qu’un drone de télésurveillance qui tourne dans votre maison. J’ai hâte de lire un article où la nouvelle fonction d’Alexa sera qu’elle peut nous proposer un remplacement de notre mobilier défraîchi!

      Bref l’exploitation du travail et des données de tout ces utilisateurs, auteurs, etc - de manière consciente ou pas - existe depuis un paquet d’années et c’est même le cœur de métier de certains.

      Et comme ensuite le résultat de cette assimilation de données est un modèle mathématique qui n’a plus rien à voir avec la données originales, agrégation d’une multitude de source de données, toutes de provenance plus ou moins obscure (et propriété de celui qui l’exploite car on a tous cliqué sur “J’accepte” à un moment donné), je vois pas trop ce que la RGPD pourra bien trouver à y redire vu l’inertie du bousin et les efforts monstrueux des entreprises pour exploiter le filon. Faut bien comprendre que certains acteurs voit dans tout ça, une nouvelle course au trésor et un filon d’or (cf les données Reddit et la fermeture des Api)

      Toute cette technologie est bien trop récente, de niche (les spécialistes bossent dans les boîtes qui la développe, donc pas pour un organisme gouvernemental qui reste de fait moins bien informé) et évolue bien trop vite pour que la RGPD puisse suivre.

      Il faudra sûrement une bonne dizaine d’années avant de voir quelque chose de réaliste et d’applicable être promulgué.

      Pour l’instant, c’est le far west…

    • just_chill
      link
      fedilink
      Français
      arrow-up
      2
      ·
      1 year ago

      C’est pas trop du ressort du rgpd si, comme ils l’indiquent, l’IA ne ressort aucun contenu tel quel. Par contre les droits d’auteurs, si ! Il faut faire évoluer le système de droits d’auteur mais je préfèrerais que ce soit pas à la demande de google, si possible. (je suis pas trop optimiste là dessus)