L’IA Mythos d’Anthropic : une percée scientifique en résolvant 30 % de problèmes insolubles par les experts

L’IA Mythos d’Anthropic : Une Révolution dans le Domaine de la Bio-informatique

Claude, une IA développée par Anthropic, a récemment été mise à l’épreuve dans le cadre d’une étude sur les capacités de ses modèles, notamment Claude Mythos et Claude Opus, en bio-informatique. Les résultats sont non seulement impressionnants, mais ils soulignent également le potentiel révolutionnaire de l'intelligence artificielle dans la science.

Des Résultats Étonnants

Les performances de Claude Mythos sont remarquables, car cette IA a réussi à résoudre des problèmes que même des experts humains n’avaient pas pu élucider. Dans le contexte de la cybersécurité, les compétences de Mythos suscitent à la fois des craintes et un certain optimisme. Cependant, il est crucial de noter que Mythos, tout comme d’autres modèles d’IA d’Anthropic, est une IA générative à usage général, capable de générer des solutions dans divers domaines, y compris la science.

OpenAI veut remplacer « l'humain médian » par l’IA générale : une ...

La nouvelle IA résout des problèmes d’ingénierie complexes plus ...

Une Évaluation Rigoureuse : Le BioMysteryBench

Pour évaluer les compétences de ses modèles d’IA, Anthropic a mis en place un nouvel outil de référence nommé BioMysteryBench. Ce benchmark se compose de 99 questions complexes destinées à tester la capacité de l’IA à résoudre des problèmes de bio-informatique. Ces questions sont souvent si difficiles qu’elles semblent insolubles, même si les réponses peuvent être vérifiées.

Exemple de question : “De quelle espèce virale le patient humain est-il infecté, d’après les données de séquençage d’ARN (RNA-seq) ?”

Pour résoudre ces problèmes, l'IA doit utiliser des données et des outils variés, ce qui complique encore plus la tâche. Cependant, les réponses correctes sont facilement vérifiables par des tests PCR. Parmi les 99 questions, les experts humains ont pu répondre à 73 d'entre elles.

Article Connexe Des scientifiques découvrent une molécule mystérieuse sur Pluton et la lune Titan de Saturne : 'Nous ne pouvons pas dire ce que c'est'

Les Performances de Claude Mythos et Claude Opus

Claude Mythos a réussi à fournir des réponses correctes à 82,6 % des problèmes qui avaient été résolus par des humains. En comparaison, Claude Opus 4.7, déjà accessible au grand public, a obtenu un taux de 78,9 %. Fait encore plus marquant, Mythos a également réussi à répondre à certaines des 23 questions que les experts n'ont pas pu résoudre, atteignant un taux de réussite de 29,6 %. Claude Opus 4.7, quant à lui, a obtenu un taux de 27 %.

Une Source de Connaissance Inégalée

Selon les recherches d’Anthropic, la capacité de Claude à résoudre ces problèmes insolubles est en partie due à sa vaste base de connaissances. Celle-ci comprend des informations sur la biologie structurale, les profils moléculaires et les méta-analyses tirées de centaines de milliers d’articles scientifiques. En revanche, les experts humains doivent souvent combiner plusieurs bases de données ou mener des méta-analyses pour parvenir à des conclusions.

De plus, Claude a développé de nouvelles techniques pour aborder des problèmes complexes, offrant ainsi aux scientifiques des pistes d’inspiration. Lorsqu’il n’est pas certain d’une réponse, Claude combine différentes méthodes et élabore une conclusion en faisant appel à des éléments de preuve issus de ces méthodes.

Des Risques à la Cybersécurité

Actuellement, la sortie de Claude Mythos est restreinte, sauf pour quelques organisations, en raison des préoccupations liées à la cybersécurité. Les compétences de cette IA pourraient potentiellement être mal utilisées pour découvrir de nouvelles vulnérabilités et les exploiter plutôt que de les signaler. Par exemple, en utilisant Mythos, Mozilla a réussi à identifier 271 failles de sécurité dans Firefox, qu’il a ensuite corrigées par le biais d’une mise à jour du navigateur.

Article Connexe SpaceX prévoit un lancement décisif du vol Starship Flight 13 le 23 juillet après un report

Malgré ces préoccupations, cette étude met en lumière les capacités impressionnantes de Mythos dans d'autres domaines scientifiques, suggérant qu’une fois les risques en matière de cybersécurité maîtrisés, cette IA pourrait contribuer de manière significative à l'avancement de la science.

Perspectives d’Avenir

Anthropic a déjà démontré certaines des compétences de Mythos en matière de codage, de raisonnement et de raisonnement visuel, en publiant une série d’évaluations lors du lancement de Claude Opus 4.7. L’entreprise envisage de lancer Claude Mythos, ou un modèle équivalent, lorsqu'elle aura réussi à atténuer les risques associés à la cybersécurité. Les mesures de sécurité envisagées pour Claude Mythos sont actuellement testées sur Claude Opus 4.7.

Alors que les compétences de Mythos en cybersécurité ont fait la une des médias, les résultats de cette étude redéfinissent le débat. Ils montrent que ce modèle d’intelligence artificielle a un immense potentiel d’application dans divers domaines, pouvant conduire à des découvertes scientifiques majeures.

Article Connexe Google développe une nouvelle puce IA pour optimiser Gemini

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

🍋 Abonnez-vous pour recevoir chaque matin un résumé de l’actualité tech.

J'ai lu et j'accepte les termes et conditions.

L’IA Mythos d’Anthropic : une percée scientifique en résolvant 30 % de problèmes insolubles par les experts

L’IA Mythos d’Anthropic : Une Révolution dans le Domaine de la Bio-informatique

Des Résultats Étonnants

Une Évaluation Rigoureuse : Le BioMysteryBench

Les Performances de Claude Mythos et Claude Opus

Une Source de Connaissance Inégalée

Des Risques à la Cybersécurité

Perspectives d’Avenir

Newsletter

ARTICLES SIMILAIRES

Des scientifiques découvrent une molécule mystérieuse sur Pluton et la lune Titan de Saturne : 'Nous ne pouvons pas dire ce que c'est'

SpaceX prévoit un lancement décisif du vol Starship Flight 13 le 23 juillet après un report

Google développe une nouvelle puce IA pour optimiser Gemini

Samsung Electronics lance une division dédiée à la robotique, un ancien dirigeant de Hyundai à la tête de la stratégie