Anthropic, la empresa desarrolladora de inteligencia artificial creada por ex empleados de OpenAI, ha sorprendido a todo el sector digital con el anuncio de dos versiones nuevas de sus modelos de IA: Claude 3.5 Sonnet, el modelo que lanzó en el pasado mes de junio, y Claude 3.5 Haiku, así como con la llegada de una nueva capacidad experimental que está en beta: el control de los ordenadores de sus usuarios.
Una de las mayores innovaciones es que el nuevo Claude 3.5 Sonnet puede usar un ordenador como lo haría una persona. Esto significa que puede mover el cursor, hacer clic en botones, escribir texto y navegar por pantallas. Esta capacidad está disponible en beta pública para que los desarrolladores la prueben y ofrezcan su feedback, ya que aún es un poco experimental y puede cometer errores en tareas sencillas como arrastrar y hacer zoom.
Como puedes ver en este vídeo, la IA toma directamente el control del ordenador del usuario, siendo capaz de reconocer campos en una hoja de cálculo, buscar información sobre ellos en la red, rellenar un formulario y enviarlo. Todo ello sin que el usuario tenga que intervenir para nada.
Imagina la cantidad de cosas que puede automatizar esta tecnología, buscando información, realizando cálculos, creando y publicando contenido o interactuando con aplicaciones. Aunque aún está en desarrollo, esta capacidad puede revolucionar la forma en que interactuamos con las herramientas tecnológicas, simplificando procesos largos y repetitivos. En cualquier caso, Anthropic asegura que herramientas tan populares como Asana, Canva y Cognition, entre otras, ya han comenzado a explorar estas posibilidades y han llevado a cabo tareas que requieren decenas, y a veces incluso cientos, de pasos para completarse.
Tal y como ha explicado la empresa,“Si bien esperamos que esta capacidad mejore rápidamente en los próximos meses, la capacidad actual de Claude para usar computadoras es imperfecta. Algunas acciones que las personas realizan sin esfuerzo (desplazarse, arrastrar, hacer zoom) actualmente presentan desafíos para Claude y alentamos a los desarrolladores a comenzar a explorar con tareas de bajo riesgo. Debido a que el uso de la computadora puede proporcionar un nuevo vector para amenazas más conocidas, como correo no deseado, desinformación o fraude, estamos adoptando un enfoque proactivo para promover su implementación segura. Hemos desarrollado nuevos clasificadores que pueden identificar cuándo se está utilizando la computadora y si se está produciendo algún daño”.
Claude 3.5 Sonnet: una mejora significativa en programación
Al marge de esta función, lo que destaca en este lanzamiento es que esta versión mejorada de Claude 3.5 Sonnet avanza especialmente en tareas de programación. Tal y como ha explicado la compañía en un comunicado, este modelo no solo ha mejorado en general, sino que ha hecho avances importantes en lo que llaman agentic coding, es decir, la capacidad de tomar decisiones y realizar tareas complejas con poca intervención humana.
Según los benchmarks de la industria, Claude 3.5 Sonnet ha pasado de una nota de un 33.4% a un 49% en la prueba SWE-bench Verified, lo que lo coloca como el mejor modelo disponible públicamente para la resolución de problemas de ingeniería de software. Esta prueba se enfoca en ver cómo los modelos pueden gestionar problemas de programación del mundo real. Empresas como GitLab ya lo están usando para mejorar procesos como DevSecOps (seguridad en el desarrollo de software) y destacan que no solo ha aumentado la precisión en las decisiones que toma, sino que no ha afectado la velocidad.
El otro gran lanzamiento es Claude 3.5 Haiku, que también trae muchas mejoras. Este modelo es una versión más rápida y asequible que ofrece resultados muy competitivos. De hecho, en algunas evaluaciones, supera a versiones anteriores más grandes como Claude 3 Opus, pero mantiene los mismos costos y velocidad.
Claude 3.5 Haiku es perfecto para tareas que requieren velocidad y precisión, como la generación de experiencias personalizadas a partir de grandes volúmenes de datos. Esto lo hace ideal para su uso en aplicaciones que gestionan información como historiales de compras o registros de inventario. Además, más adelante también admitirá entrada de imágenes, lo que abre más posibilidades para su uso en diferentes sectores.
Lo que viene
La introducción de estas mejoras no solo pone a Claude a la cabeza entre las IAs en materia de programación y manejo de datos, sino que también marca el comienzo de una nueva era para el uso de IA en ordenadores. Aunque la capacidad de usar un ordenador está en una etapa temprana y aún necesita mejorar, está claro que su potencial es enorme. En cuanto al uso seguro de estas herramientas, Anthropic ha buscado tomar precauciones para anticipar uno de los principales miedos que generaría en los usuarios, garantizando que no se utilice con fines malintencionados, como la propagación de spam o información errónea.
Imagen: Flux Schnell
Sotelo, R. (2024, 23 octubre). La IA de Claude podrá controlar tu ordenador (si le dejas, claro). Marketing4eCommerce México. https://marketing4ecommerce.mx/ia-claude-controlar-ordenador/