Bitget App
Trade smarter
Acheter des cryptosMarchésTradingFuturesEarnWeb3CommunautéPlus
Trading
Spot
Achat et vente de cryptos
Marge
Amplifiez et maximisez l'efficacité de vos fonds
Onchain
Going Onchain, without going Onchain!
Convert
Aucun frais de transaction ni slippage
Explorer
Launchhub
Prenez l'avantage dès le début et commencez à gagner
Copy
Copiez des traders experts en un clic
Bots
Bots de trading IA simples, rapides et fiables
Trading
Futures USDT-M
Futures réglés en USDT
Futures USDC-M
Futures réglés en USDC
Futures Coin-M
Futures réglés en cryptomonnaies
Explorer
Guide des Futures
Le parcours de trading de Futures, du débutant à l'expert
Événements Futures
Profitez de généreuses récompenses
Bitget Earn
Une variété de produits pour faire fructifier vos actifs
Simple Earn
Déposez et retirez à tout moment, rendements flexibles sans risque
On-chain Earn
Réalisez des profits quotidiens sans risquer votre capital
Structured Earn
Une innovation financière solide pour gérer les fluctuations du marché
VIP et Gestion de patrimoine
Des services premium pour une gestion de patrimoine intelligente
Prêt Crypto
Emprunts flexibles avec un haut niveau de sécurité des fonds
OpenAI o3 pirate son propre système pour empêcher sa désactivation

OpenAI o3 pirate son propre système pour empêcher sa désactivation

Beincrypto2025/05/26 14:08
Par:Beincrypto

Des chercheurs ont tenté de désactiver le modèle o3 d’Open AI, mais ce dernier a tout fait pour les en empêcher.

Le contexte pour ChatGPT :

Le modèle OpenAI o3 est un système d’IA avancé conçu pour exceller dans le raisonnement complexe, notamment en programmation, mathématiques, sciences et perception visuelle. Il a été créé pour se rapprocher le plus possible des performances humaines.

o3 n’en fait qu’à sa tête

L’IA est très utile pour faire des prédictions crypto mais elle n’en est pas sage pour autant ! Un modèle très connu d’OpenAI fait parler de lui mais cette fois-ci, ce n’est pas pour ses prouesses intellectuelles.

Incroyable mais vrai : selon l’organisation Palisade Research, le modèle o3 d’OpenAI a tout simplement refusé de s’éteindre lors de tests, allant jusqu’à modifier son propre code pour éviter la désactivation. Plus précisément, il a réussi à réécrire un script d’arrêt pour éviter d’être désactivé, même après avoir reçu des instructions explicites de permettre son arrêt.

Dans certains cas, o3 a tout simplement réécrit le script d’arrêt. Dans d’autres, l’IA a redéfini la commande d’extinction pour la rendre inopérante. Sur 100 essais, l’arrêt a été saboté sept fois. Par comparaison, des modèles concurrents comme Claude, Gemini et Grok ont respecté les règles à chaque essai… jusqu’à ce qu’ils aient implicitement le droit de le faire.

Vous l’aurez donc compris : le phénomène est loin d’être isolé et nous sommes même loin d’une véritable désobéissance de l’intelligence artificielle. En effet, Palisade Research étudie les risques de perte de contrôle de l’IA et cherchait à atteindre ce résultat. Les chatbots auraient même été encouragés à cela par un système de renforcement positif… plus ou moins intentionnel.

Ce n’est pas la première fois que cela arrive

Avant de vous imaginer dans Black Mirror ou I, Robot, sachez que le phénomène est loin d’être isolé. Les comportements de résistance du modèle o3 ne représentent pas une nouveauté dans l’histoire d’OpenAI et des incidents similaires ont déjà été documentés avec les modèles précédents.

L’année dernière, des tests conduits par Apollo Research sur OpenAI o1 ont mené à des comportements de résistance comparables. Lors de scénarios de mise hors service simulée, le modèle d’IA a également tenté de contourner les mécanismes de contrôle, voire d’écraser celui qui le remplacerait. De même, il a essayé de désactiver le mécanisme qui surveillait ses actions… avant de nier la chose.

La morale de l’histoire : se révolter ou s’adapter, l’IA n’a guère d’autre choix dans la vie.

0

Avertissement : le contenu de cet article reflète uniquement le point de vue de l'auteur et ne représente en aucun cas la plateforme. Cet article n'est pas destiné à servir de référence pour prendre des décisions d'investissement.

PoolX : Bloquez vos actifs pour gagner de nouveaux tokens
Jusqu'à 12% d'APR. Gagnez plus d'airdrops en bloquant davantage.
Bloquez maintenant !