Category: Inteligencia Artificial

  • OmniHuman: la nueva IA de ByteDance crea vídeos realistas a partir de una sola foto

    OmniHuman: la nueva IA de ByteDance crea vídeos realistas a partir de una sola foto

    Los investigadores de ByteDance han desarrollado un sistema de inteligencia artificial que transforma fotografías individuales en vídeos realistas de personas hablando, cantando y moviéndose de forma natural: un avance que podría transformar el entretenimiento y las comunicaciones digitales.

    El nuevo sistema, llamado OmniHuman , genera videos de cuerpo completo que muestran a las personas gesticulando y moviéndose de maneras que coinciden con su habla, superando los modelos de IA anteriores que solo podían animar caras o partes superiores del cuerpo.

    Cómo OmniHuman utiliza 18.700 horas de datos de entrenamiento para crear movimientos realistas

    “La animación humana de extremo a extremo ha experimentado avances notables en los últimos años”, escribieron los investigadores de ByteDance en un artículo publicado en arXiv . “Sin embargo, los métodos existentes aún tienen dificultades para escalarse como modelos generales de generación de videos a gran escala, lo que limita su potencial en aplicaciones reales”.

    El equipo entrenó a OmniHuman con más de 18.700 horas de datos de video humanos utilizando un enfoque novedoso que combina múltiples tipos de entradas: texto, audio y movimientos corporales. Esta estrategia de entrenamiento de “omnicondiciones” permite que la IA aprenda de conjuntos de datos mucho más grandes y diversos que los métodos anteriores.

    Un avance en la generación de videos con inteligencia artificial muestra movimientos de cuerpo completo y gestos naturales

    “Nuestro descubrimiento clave es que incorporar múltiples señales de condicionamiento, como texto, audio y pose, durante el entrenamiento puede reducir significativamente el desperdicio de datos”, explicó el equipo de investigación.

    La tecnología marca un avance significativo en los medios generados por IA , y demuestra capacidades que van desde la creación de videos de personas pronunciando discursos hasta la representación de sujetos tocando instrumentos musicales. En las pruebas, OmniHuman superó a los sistemas existentes en múltiples parámetros de calidad.

    Gigantes tecnológicos compiten por desarrollar sistemas de IA de video de próxima generación

    El desarrollo surge en medio de una competencia cada vez más intensa en la generación de videos con inteligencia artificial, con empresas como Google , Meta y Microsoft que buscan tecnologías similares. El avance de ByteDance podría darle a su empresa matriz TikTok una ventaja en este campo en rápida evolución.

    Los expertos del sector afirman que esta tecnología podría transformar la producción de entretenimiento, la creación de contenidos educativos y las comunicaciones digitales. Sin embargo, también plantea inquietudes sobre su posible uso indebido en la creación de medios sintéticos con fines engañosos .

    Los investigadores presentarán sus hallazgos en una próxima conferencia sobre visión por computadora, aunque todavía no han especificado cuándo ni en cuál.

     

    Fuente.

    VentureBeat (2025, 04 de febrero). OmniHuman: la nueva IA de ByteDance crea vídeos realistas a partir de una sola foto. Recuperado el 06 de febrero de 2025, de: https://venturebeat.com/ai/omnihuman-bytedances-new-ai-creates-realistic-videos-from-a-single-photo/

  • Cinco predicciones sobre robótica para 2025: la IA está haciendo posible lo imposible

    Cinco predicciones sobre robótica para 2025: la IA está haciendo posible lo imposible

    La industria de la robótica está a punto de transformarse por completo. En los últimos dos años, la inteligencia artificial (IA) ha cambiado nuestra forma de entender las capacidades tecnológicas y ha pasado de ser una tendencia a convertirse en un componente clave para el funcionamiento de las empresas en el futuro. En 2025, el foco estará en llevar estas innovaciones a aplicaciones prácticas que revolucionarán las industrias de todo el mundo.

    En el campo de la robótica, la IA está ampliando los límites de lo posible. Los robots, antes limitados a tareas repetitivas en entornos controlados, ahora pueden comprender y realizar tareas complejas de forma autónoma como nunca antes. Esta evolución está cambiando el funcionamiento de diversos sectores y redefiniendo rápidamente el futuro de nuestro trabajo.

    Estas son sus cinco predicciones para la robótica en 2025:

    1. La madurez de la IA

    El año 2025 será clave para la inteligencia artificial, marcando su transición de una tendencia mediática a una herramienta de uso práctico. En los últimos años, han surgido muchas startups de IA a un ritmo acelerado, pero este año veremos una etapa de consolidación e integración. Aunque seguirán apareciendo nuevas ideas y propuestas interesantes, también veremos soluciones más refinadas y maduras.

    La IA también pasará a integrarse de manera natural en los sistemas existentes, dejando de ser percibida como una tecnología independiente. Durante la etapa de mayor entusiasmo por la IA, muchas soluciones se promocionaban específicamente como impulsadas por esta tecnología. Sin embargo, ahora y en los próximos años, veremos a la IA actuar como un facilitador discreto: una herramienta poderosa que opera en segundo plano para optimizar la funcionalidad. Un ejemplo de ello es la solución de logística de cobots de Ocado, que no se presenta como ‘una solución de IA’, sino como un sistema de pick and place que utiliza IA.

    La siguiente fase de la IA también tendrá un componente físico, es decir, la IA será capaz de comprender las leyes de la física, adaptarse a situaciones imprevistas y operar en entornos dinámicos y reales. En 2025, la integración de esta IA en la robótica permitirá la creación de sistemas que interactúan de manera significativa con el mundo físico, transformando diversas industrias y abriendo el camino para la segunda predicción.

    2. Robots baristas y chefs

    Durante décadas, los robots solo se usaban en entornos industriales, pero ahora están comenzando a integrarse en la sociedad. Aunque los robots humanoides son los más conocidos, aún están lejos de ser viables comercialmente. Los robots colaborativos (o cobots) están ganando terreno en diversas industrias. Por ejemplo, en la producción de cine y televisión, es probable que para finales de este año ya hayas visto alguna película, programa o anuncio en el que los cobots controlaron las cámaras. Un buen ejemplo de esto es MRMC, que produce soluciones de cámaras basadas en cobots.

    En la industria alimentaria, los cobots también están empezando a destacar, especialmente en Estados Unidos y Asia. Para finales de 2025, es posible que disfrutes de un café o una comida que un robot haya ayudado a preparar. Los cobots diseñados para la preparación higiénica de alimentos pueden mantener la consistencia y la velocidad durante los momentos de mayor demanda en los negocios. Un ejemplo es la cadena de comida rápida estadounidense Chipotle, que ya utiliza cobots en sus restaurantes. Al igual que en otras industrias, los cobots no están reemplazando a los trabajadores, sino que están mejorando tanto la productividad como el ambiente laboral.

    Más allá de cocinas y producciones cinematográficas, los cobots comenzarán a ser más comunes en industrias como la construcción. Empresas como Canvas ya los están utilizando para tareas como el acabado de paneles de yeso, demostrando cómo estas máquinas pueden ayudar a superar la escasez de mano de obra especializada en sectores con alta variabilidad. Otro ejemplo es Raise Robotics, que utiliza cobots para tareas como la instalación de fijaciones para paneles de fachada en edificios de gran altura, una tarea que es peligrosa y repetitiva.

    3. El auge de la automatización en India

    Aunque históricamente hemos visto a potencias asiáticas como China, Japón y Corea del Sur dominar el mercado global de robots, en los próximos 12 meses se producirán cambios importantes en la dinámica de este mercado, con India jugando un papel clave. El país está invirtiendo significativamente en automatización, con el apoyo de iniciativas gubernamentales proactivas. Un ejemplo de esto es el esquema de Incentivos Vinculados a la Producción (PLI), que ofrece subsidios a las empresas que generan capacidad de producción en India en sectores clave como la automoción, el metal, la industria farmacéutica y el procesamiento de alimentos.

    El potencial de automatización de India se ve aún más impulsado por tres poderosas fuerzas que lideran la producción a nivel mundial. En primer lugar, India cuenta con una población joven, con una edad media de 29 años, en comparación con los 45 años de Alemania, lo que ofrece una fuerza laboral dinámica y adaptable. En segundo lugar, la próspera industria tecnológica del país, valorada en 115.000 millones de dólares en TI y gestión de procesos de negocios, proporciona una base sólida para la innovación. Y por último, las inversiones estratégicas del gobierno en digitalización, automatización industrial y desarrollo de habilidades están creando un entorno propicio para el crecimiento.

    Estos esfuerzos, junto con la iniciativa ‘Make in India’, resaltan el enorme potencial de la nación. En tan solo un año, India ha pasado del puesto 10 al 7 a nivel global en instalaciones de robots, lo que representa un aumento del 59%. Este crecimiento tan rápido resalta el surgimiento de este país como un epicentro clave para la automatización y la innovación, respaldado por políticas estratégicas y una economía robusta.

    4. Un nuevo enfoque para la seguridad

    La seguridad ha sido siempre una característica clave en los cobots, pero a medida que se integran en entornos más dinámicos y menos controlados, será necesario un enfoque distinto. Las medidas de seguridad varían según la aplicación y el caso de uso, y aunque los cobots están diseñados para trabajar de cerca con las personas, aún se necesitan funciones adicionales de seguridad si, por ejemplo, el cobot va a trabajar a alta velocidad o manejar objetos afilados. En las fábricas, la seguridad se gestiona a menudo mediante vallado y protocolos estrictos. Sin embargo, estos métodos no son prácticos en situaciones donde cobots y humanos trabajan juntos en entornos impredecibles.

    El futuro de la seguridad se centrará en tecnologías adaptativas que puedan ajustarse a las variaciones. Por ejemplo, los cobots podrán usar datos de sensores en tiempo real y algoritmos avanzados para detectar y reaccionar instantáneamente a los movimientos humanos, garantizando la seguridad sin afectar la eficiencia. Este avance representa un paso importante para hacer que la robótica colaborativa sea viable en una amplia variedad de aplicaciones.

    5. Soluciones llave en mano estandarizadas

    Aunque no es un concepto nuevo, la importancia de las soluciones llave en mano estandarizadas cobrará más relevancia este año. Estas soluciones, que simplifican el proceso de automatización al ofrecer sistemas preconfigurados, se volverán fundamentales para las empresas que buscan integrar cobots de manera rápida y eficiente.

    Lo atractivo de estas soluciones es que eliminan la complejidad que normalmente se asocia con la automatización, como la necesidad de personalizar en exceso y los largos tiempos de instalación. Esta facilidad de implementación hará que los cobots sean más accesibles para pequeñas y medianas empresas, permitiéndoles competir a mayor escala sin tener que afrontar costes elevados.

    Mi predicción es que, para finales de 2025, más de un tercio de los cobots estarán incluidos en estas soluciones estandarizadas. Gracias a su escalabilidad y coste reducido, estas soluciones impulsarán su adopción en una amplia variedad de industrias, desde la manufactura hasta la logística. A medida que las empresas busquen formas prácticas y económicas de aumentar su eficiencia, las soluciones estandarizadas serán clave para la próxima etapa de la automatización.

     

    Fuente.
    Interempresas (2025, 29 de enero). Cinco predicciones sobre robótica para 2025: la IA está haciendo posible lo imposible. Recuperado el 30 de enero de 2025, de: https://www.interempresas.net/Robotica/Articulos/586006-Cinco-predicciones-sobre-robotica-para-2025-la-IA-esta-haciendo-posible-lo-imposible.html

  • Inteligencia artificial para crear mensajes hiperpersonalizados

    Inteligencia artificial para crear mensajes hiperpersonalizados

    Las ventajas de este tipo de reclamos pasan por una precisa estrategia de recolección de datos

    Un CEO que envía un correo electrónico para felicitar el nuevo año a sus empleados es algo relativamente normal. Lo que no es tan habitual es que lo haga con un vídeo personalizado hasta el punto que se dirija a ellos usando su nombre, incluso su lengua, y haciendo referencia a sus gustos o aficiones. Y que esto se personalice para cada uno de los 100.000 empleados. Esto es lo que hizo, a principios de 2024, Arthur Sadoun, CEO de Publicis Groupe, una de las empresas de publicidad más potentes del mundo. Su intención, aparte del obvio golpe de efecto, era señalar la importancia que tienen y tendrán tecnologías como la inteligencia artificial (IA), el análisis de datos o la publicidad hiperpersonalizada en el mundo del marketing.

    “La publicidad hiperespecializada utiliza datos muy avanzados para segmentar audiencias de forma cada vez más precisa. Así, se puede adaptar el mensaje publicitario a intereses, comportamientos o incluso momentos específicos del consumidor”, señala José Antonio Cortés Quesada, profesor de Publicidad y Marketing de la Universidad Internacional de La Rioja (UNIR), que añade un ejemplo: “Una marca de cosmética que muestra anuncios diferentes teniendo en cuenta el tipo de piel, edad o incluso el clima local de cada usuario”.

    De esta manera, se crea en el consumidor una percepción de cercanía y entendimiento con la marca que facilita el impacto en un momento en el que la saturación publicitaria es elevada y, por tanto, es mucho más fácil que los mensajes se pierdan. “La publicidad hiperespecializada transforma lo que podría ser una interrupción en una experiencia valiosa. En lugar de anuncios irrelevantes [los consumidores] reciben contenido que responde a sus necesidades e intereses, mejorando su experiencia online y guiándolos hacia soluciones que quizás no habían considerado”, explica Fernando del Rey, director de Incubeta South Europe, agencia que en su informe anual bautizaba 2024 como “un año de datos”, y que este para 2025 señala cómo la IA y el machine learning (análisis predictivo mediante aprendizaje automático) ya están cambiando el panorama del mundo empresarial y la necesidad de unificar los datos para aprovechar al máximo estas tecnologías.

    Conocer bien al usuario

    El beneficio de este tipo de publicidad para las marcas es evidente. “Consiguen mayor fidelidad, aumentan sus tasas de conversión y optimizan sus recursos. Al centrar el esfuerzo en audiencias verdaderamente receptivas, se reducen los costes de adquisición y se maximiza el retorno de la inversión publicitaria”, apunta Flor de Esteban, socia responsable de Deloitte Digital. Sin embargo, para que esto funcione es imprescindible no solo contar con los datos necesarios, sino también ser capaz de analizarlos correctamente.

    “El análisis de datos es el núcleo de la publicidad hiperespecializada. Sin datos precisos y organizados, las marcas no pueden conocer ni anticipar los comportamientos de los consumidores. En este contexto, herramientas como las customer data platforms son esenciales, ya que permiten consolidar información de diversas fuentes en un solo sistema”, señala Del Rey. Estas plataformas de datos de clientes permiten recopilarlos de distintas fuentes y unificarlos para crear perfiles personalizados y así obtener una única visión acorde con lo que se busca. Además, este compendio ha de hacerse de manera continua y con constante retroalimentación. “Activados en tiempo real, los datos permiten ajustar las campañas según su rendimiento. Por ejemplo, si una campaña muestra un CTR más alto en dispositivos móviles, se puede redirigir el presupuesto hacia ese canal de manera inmediata, maximizando los resultados”, puntualiza Del Rey. El CTR (click through rate, según sus siglas en inglés) o porcentaje de clics mide la frecuencia con la que quienes han visto una publicidad pinchan en ella.

    Los desafíos para estas estrategias empiezan muy pronto; el primero, “la identificación de los datos necesarios a obtener y, en base a ellos, montar una correcta estructura y estrategia de captación”, explica Jorge Núñez, CEO de Adquiver, una tecnológica especializada en la gestión de datos aplicada al sector del turismo. “Otro reto puede estar en la capacidad de obtenerlos de las fuentes disponibles, que pueden requerir un procesamiento adicional. Por último, la capacidad para procesarlos, así como la velocidad con la que se haga, para que la información obtenida pueda trasladarse al negocio, aportando una rentabilidad económica”, concluye Núñez.

     

    Fuente.

    El País (2025, 24 de enero). Inteligencia artificial para crear mensajes hiperpersonalizados. Recuperado el 27 de enero de 2025, de: https://elpais.com/extra/publicidad/2025-01-25/inteligencia-artificial-para-crear-mensajes-hiperpersonalizados.html

  • Trump elimina regulación de Inteligencia Artificial en Estados Unidos

    Trump elimina regulación de Inteligencia Artificial en Estados Unidos

    Como ya lo había prometido durante su campaña, Donald Trump, recién elegido el presidente número 47 de los Estados Unidos, firmó una orden ejecutiva para rescindir múltiples mandatos y regulaciones emitidas por la administración anterior de Joe Biden, bajo el pretexto de regresar el “sentido común” al gobierno federal. Entre las regulaciones eliminadas se encuentra la orden ejecutiva para el desarrollo seguro y confiable de laInteligencia Artificial (IA).

    En su primer día como presidente, Trump emitió una orden ejecutiva que revoca al menos otras 78 órdenes ejecutivas emitidas por su antecesor Biden, lo que incluye múltiples temas polémicos como políticas de género y cambio climático, diplomacia externa de los Estados Unidos y normas sobre la operación del gobierno federal.

    Entre todas estas órdenes destacan algunas que impactan al sector tecnológico, tales como la orden para implementar la Ley de Infraestructura y Empleo, votada por el Congreso a finales de 2021, y que incluía medidas y presupuesto para ampliar los servicios de banda ancha en el país, así como la orden ejecutiva firmada por Biden en octubre de 2023 para impulsar el Desarrollo y uso seguros y fiables de la Inteligencia Artificial.

    Muchas de estas normas podrían actualizarse con la nueva regulación emitida por la administración de Donald Trump. Por ahora, la orden ejecutiva firmada por Trump simplemente establece un plazo de 45 días para que los directores de la política doméstica y la economía nacional presenten una lista de órdenes adicionales para rescisión o reemplazo de las órdenes ejecutivas revocadas.

    “Para iniciar las políticas que harán que nuestra nación vuelva a ser unida, justa, segura y próspera, es política de los Estados Unidos restaurar el sentido común en el gobierno federal y liberar el potencial del ciudadano estadounidense. Las revocaciones incluidas en esta orden serán el primero de muchos pasos que el gobierno federal de los Estados Unidos dará para reparar nuestras instituciones y nuestra economía”, señala el documento.

    Trump había prometido durante su campaña que favorecería un enfoque de desregulación alrededor de temas como la IA, con la intención de impulsar la innovación, lo que implicaría revocar la orden ejecutiva firmada por Biden. Previo a asumir la presidencia, había criticado esta orden al señalar que “obstaculiza la innovación en IA” e impone lo que considera “ideas radicales de izquierdas”.

    Entre las medidas implementadas por la orden ejecutiva de Biden, ahora revocada, se incluían exigir a desarrolladores de sistemas de IA resultados de sus pruebas de seguridad; el desarrollo de herramientas y pruebas para ayudar a garantizar que sean seguros y confiables; y proteger a los estadounidenses del fraude y el engaño habilitados por la IA, entre otros. También solicitaba al Congreso emitir una ley de privacidad, además de ofrecer guías para la adquisición de soluciones de IA en el gobierno federal.

    A lo largo de la campaña de Trump, múltiples compañías del segmento de IA, como Microsoft, Nvidia y OpenAI, hicieron público su posicionamiento con una clara preferencia por un enfoque de autorregulación, al señalar que esto permitiría acelerar los desarrollos de IA, garantizar el acceso a infraestructura y fortalecer su posición frente al avance de naciones como China.

    Microsoft y Nvidia coincidieron, cada una por separado, que la llegada de Trump por un segundo mandato le permitirá construir sobre el enfoque ya establecido en 2019, cuando emitió una orden ejecutiva que establecía ciertas normas para el uso de la IA en el gobierno federal, con la intención de agilizar los trámites o eliminar aquellos que se consideraran innecesarios.

    Este punto será relevante, ya que Trump creó una oficina de eficiencia a cargo del polémico empresario Elon Musk, quien buscará recortes al gasto federal, similar al enfoque argentino del presidenteJavier Milei. La IA podría ser la herramienta preferida por esta nueva oficina para reducir la burocracia del gobierno de los Estados Unidos.

    Nvidia fue particularmente crítica de las últimas órdenes emitidas por Joe Biden para limitar la exportación de chips para IA a naciones adversarias, y reconoció las medidas impulsadas durante el primer mandato de Trump como las que “sentaron las bases de la fortaleza y el éxito actuales de Estados Unidos en IA”.

     

    Fuente:

    DPL News (2025, 21 de enero). Trump elimina regulación de Inteligencia Artificial en Estados Unidos. Recuperado el 22 de enero de 2025 de: https://dplnews.com/trump-elimina-regulacion-de-inteligencia-artificial/

  • Tras dos años del boom de la IA, la industria creativa se adapta

    Tras dos años del boom de la IA, la industria creativa se adapta

    Aunque los creativos han encontrado nuevas formas de utilizar la tecnología, aceptan que todavía no hay certezas en torno a regulaciones en el mundo.

    Hace un par de años, cuando irrumpió la Inteligencia Artificial generativa en el panorama tecnológico, la posible sustitución de los trabajos creativos fue uno de los temas más comunes en las conversaciones sobre el impacto de esta tecnología. Sin embargo, se ha convertido en una herramienta de creación y de comunicación para estas personas.

    De acuerdo con el productor musical Will.I.am, quienes están en mayor riesgo en la industria musical frente a esta tecnología son las personas con trabajos de oficina, como los asistentes, las personas de finanzas o los abogados.

    “Los artistas tienen la capacidad de siempre crear algo nuevo. Los compositores somos soñadores que crean nuevos tipos de composiciones, incluso en sus sueños”, comentó el vocalista de los Black Eyed Peas.

    Cabe resaltar que durante la edición 2025 del CES, el músico presentó una nueva línea de bocinas LG, las cuales realizan análisis de IA sobre el contenido que se reproduce para ajustar automáticamente el sonido para acentuar la melodía, el ritmo o la voz.

    Asimismo, el año pasado el también empresario e inversor tecnológico lanzó RADiO.FYI, un conjunto de estaciones de radio interactivas temáticas sobre temas como el deporte, la cultura pop y la política. Cada estación es interactiva y tiene un presentador de IA que permite la comunicación bidireccional, es decir, en cualquier momento se le puede interrumpir para conversar.

    Esta herramienta está disponible a través de la plataforma FYI, (Focus Your Ideas, en inglés), una aplicación fundada en 2020, donde hay diferentes estaciones, donde todos los segmentos del conductor de IA se cargan como un “megaprompt” a partir del cual la herramienta, impulsada por modelos de lenguaje grandes de terceros, puede crear una conversación. Además, cuenta con capacidades limitadas de navegación web y pueden extraer información de fuentes de noticias confiables.

    Según los escenarios de Will.I.am esta herramienta se puede utilizar más allá de una estación de radio. “Podría ser un aprendizaje para tutores y profesores. Podrían ser libros para autores. Podrían ser segmentos de podcasts”, comentó para la revista Time.

    Sin embargo, también es consciente de que uno de los principales problemas que siguen existiendo alrededor de la IA es la falta de regulación. Eso ha creado un panorama donde los “creativos no están seguros”, afirmó durante una sesión con medios en el CES 2025.

    La necesidad de regular la IA

    De acuerdo con datos de la investigación, DemocracIA: Percepciones sobre inteligencia artificial y democracia, elaborada por la empresa Luminate, el 37% de las personas encuestadas coinciden en que la IA podría agravar las disparidades en sus países, mientras que la proporción se eleva al 44% entre quienes declaran conocer bien la herramienta.

    Fernanda Zistecatl, especialista en derechos humanos y tecnología, la falta de regulación afecta a las personas de grupos históricamente vulnerados y poblaciones marginalizadas, pues impacta en ellas de forma diferencial, especialmente aquellas relacionadas con la generación de contenido engañoso o desinformativo.

    La investigación reveló que las desigualdades sociales también afectan la forma en que la ciudadanía de América Latina se relaciona con la IA y percibe sus riesgos. En general, los hombres con un 62%, las personas con altos ingresos con un 69%, y con mayor educación con un 67% son quienes expresan mayores niveles de conocimiento.

    Esos mismos grupos de personas también sintieron una mayor comodidad con la adopción de la IA en sus rutinas (hombres con un 52%, personas con altos ingresos con un 57%, y con mayor educación con un 55%), así como son quienes más identificaron amenazas a las elecciones y a la lucha contra las desigualdades.

    Si bien el músico y productor estadounidense señaló que los abogados son de los trabajos susceptibles a sufrir importantes cambios en el futuro la gente no está conforme en que se utilice esta tecnología en cuestiones legales.

    En general, según el documento, la ciudadanía prefirió el juicio y la sensibilidad humana a la hora de tomar decisiones con impacto directo en la vida de las personas. El 54% de la muestra global se opuso al uso de Inteligencia Artificial para la toma de decisiones en los tribunales.

     

    Fuente.

    Expansión (2025, 13 de enero). Tras dos años del boom de la IA, la industria creativa se adapta. Recuperado el 21 de enero de 2025, de: https://expansion.mx/tecnologia/2025/01/13/la-industria-creativa-se-adapta-ia

  • Microsoft acaba de crear una IA que diseña materiales para el futuro: así funciona

    Microsoft acaba de crear una IA que diseña materiales para el futuro: así funciona

    Microsoft Research ha presentado hoy un nuevo y potente sistema de inteligencia artificial que genera nuevos materiales con propiedades específicas deseadas, acelerando potencialmente el desarrollo de mejores baterías, células solares más eficientes y otras tecnologías críticas.

    El sistema, llamado MatterGen , representa un cambio fundamental en la forma en que los científicos descubren nuevos materiales. En lugar de analizar millones de compuestos existentes (el enfoque tradicional que puede llevar años), MatterGen genera directamente materiales nuevos en función de las características deseadas, de manera similar a cómo los generadores de imágenes de IA crean imágenes a partir de descripciones de texto.

    “ Los modelos generativos ofrecen un nuevo paradigma para el diseño de materiales al generar directamente materiales completamente nuevos en función de las restricciones de propiedades deseadas”, afirmó Tian Xie, director de investigación principal de Microsoft Research y autor principal del estudio publicado hoy en Nature . “Esto representa un avance importante hacia la creación de un modelo generativo universal para el diseño de materiales”.

    Cómo el motor de inteligencia artificial de Microsoft funciona de manera diferente a los métodos tradicionales

    MatterGen utiliza un tipo especializado de inteligencia artificial llamado modelo de difusión (similar a los que se utilizan en generadores de imágenes como DALL-E ), pero adaptado para trabajar con estructuras cristalinas tridimensionales. Refina gradualmente la disposición aleatoria de átomos para convertirlos en materiales estables y útiles que cumplen con criterios específicos.

    Los resultados superan a los enfoques anteriores. Según el artículo de investigación, los materiales producidos por MatterGen tienen “más del doble de probabilidades de ser novedosos y estables, y están más de 15 veces más cerca del mínimo de energía local” en comparación con los enfoques de IA anteriores. Esto significa que los materiales generados tienen más probabilidades de ser útiles y de ser físicamente posibles de crear.

    En una demostración sorprendente, el equipo colaboró ​​con científicos de los Institutos de Tecnología Avanzada de Shenzhen, China, para sintetizar un nuevo material, TaCr2O6 , que MatterGen había diseñado. El material del mundo real coincidió estrechamente con las predicciones de la IA, lo que validó la utilidad práctica del sistema.

    Las aplicaciones del mundo real podrían transformar el almacenamiento de energía y la computación

    El sistema es particularmente notable por su flexibilidad. Puede “ajustarse” para generar materiales con propiedades específicas, desde estructuras cristalinas particulares hasta características electrónicas o magnéticas deseadas. Esto podría resultar invaluable para diseñar materiales para aplicaciones industriales específicas.

    Las consecuencias podrían ser de gran alcance. Los nuevos materiales son cruciales para el avance de las tecnologías de almacenamiento de energía, diseño de semiconductores y captura de carbono. Por ejemplo, mejores materiales para baterías podrían acelerar la transición a vehículos eléctricos, mientras que materiales más eficientes para celdas solares podrían hacer que la energía renovable sea más rentable.

    “Desde una perspectiva industrial, el potencial aquí es enorme”, explicó Xie. “La civilización humana siempre ha dependido de las innovaciones materiales. Si podemos usar la IA generativa para hacer que el diseño de materiales sea más eficiente, podríamos acelerar el progreso en industrias como la energía, la atención médica y más allá”.

    La estrategia de código abierto de Microsoft tiene como objetivo acelerar el descubrimiento científico

    Microsoft ha publicado el código fuente de MatterGen bajo una licencia de código abierto, lo que permite a los investigadores de todo el mundo desarrollar la tecnología. Esta medida podría acelerar el impacto del sistema en varios campos científicos.

    El desarrollo de MatterGen forma parte de la iniciativa más amplia AI for Science de Microsoft , cuyo objetivo es acelerar los descubrimientos científicos mediante IA. El proyecto se integra con la plataforma Azure Quantum Elements de Microsoft , lo que potencialmente hace que la tecnología sea accesible para empresas e investigadores a través de servicios de computación en la nube.

    Sin embargo, los expertos advierten que, si bien MatterGen representa un avance significativo, el camino desde los materiales diseñados computacionalmente hasta las aplicaciones prácticas aún requiere pruebas y refinamientos exhaustivos. Las predicciones del sistema, si bien son prometedoras, necesitan validación experimental antes de su implementación industrial.

    Sin embargo, la tecnología representa un avance significativo en el uso de la IA para acelerar los descubrimientos científicos. Como señaló Daniel Zügner, investigador principal del proyecto: “Estamos profundamente comprometidos con la investigación que puede tener un impacto positivo en el mundo real, y esto es solo el comienzo”.

     

    Fuente.

    VentureBeat (2025, 16 de enero). Microsoft just built an AI that designs materials for the future: Here´s how it works. Recuperado el 17 de enero de 2025 de:  https://venturebeat.com/ai/microsoft-mattergen-ai-system-generates-materials-that-could-change-industries-forever/

  • Meta desarrolla un traductor de voz simultáneo con IA generativa para un centenar de idiomas

    Meta desarrolla un traductor de voz simultáneo con IA generativa para un centenar de idiomas

    Meta diseña el modelo avanzado de traductor multimodal con inteligencia artificial (IA) generativa, SeamlessM4T, con reconocimiento automático de voz y capaz de traducir de forma instantánea conversaciones de voz a voz en un centenar de idiomas. La revista Nature publica este importante avance tecnológico que puede ser el precursor de traducciones simultáneas para cualquier idioma.

    El modelo de inteligencia artificial (IA) generativa liderado por la compañía Meta,SeamlessM4T, puede traducir y transcribir voz y texto de forma automática en 101 idiomas de origen y hasta 36 idiomas de destino: genera texto traducido a 96 idiomas, pero solo puede producir una traducción hablada en 35.

    Este sistema de traducción multilingüe es un avance significativo en sistemas de traducción más rápidos, fiables y transfronterizos. La compañía dirigida por Mark Zuckerberg ya publicó una demo junto con una primera versión del estudio en agosto de 2023.

    La aplicación incorpora aspectos fonológicos y fonéticos poco explorados hasta ahora que mejoran el ritmo, los matices y la emoción del habla, lo que proporciona traducciones más auténticas y expresivas y una latencia en el proceso de apenas dos segundos. En términos de rendimiento, este modelo traductor supera a los mejores sistemas anteriores en diversas métricas, con una mejora de más del 20%.

    El modelo agrupa tecnologías anteriormente desarrolladas en I+D en IA (SeamlessExpressive, SeamlessStreaming y Seamless) e integra capacidades combinadas de modelos de traducción de habla a habla (S2ST), habla a texto (S2TT),texto a habla (T2ST) y texto a texto (T2TT).

    Para mejorar el rendimiento y reducir los errores y retrasos en los procesos de traducción, aprovecha lo conseguido en otros modelos de la marca con No Language Left Behind (NLLB) –Ningún idioma se queda atrás- del proyecto de inteligencia artificial de Meta.

    Los impulsores de este avance científico que se publica en la revista científica Nature afirman que los recursos empleados para desarrollarse se pondrán a disposición del público para uso no comercial. Se considera el modelo como un posible primer paso para que las aplicaciones de traducción simultánea automática se conviertan en pocos años en algo cotidiano.

    “Es un estudio muy interesante, y aunque ya no tan reciente”, la investigación incorpora varias innovaciones destacables”, explica Andreas Kaltenbrunner, investigador líder del grupo AI and Data for Society de la Universitat Oberta de Catalunya (UOC), en la plataforma Science Media Centre España.

    “En primer lugar, es un sistema unificado que gestiona todos los aspectos de la traducción (voz y texto) en un solo entorno, en lugar de depender de varios sistemas independientes”.

    “Otro aspecto relevante es la amplia cantidad de idiomas que soporta: más de 100 idiomas de entrada y docenas de idiomas de salida. Además, destaca por su robustez frente a desafíos del mundo real, como el manejo de ruido y la comprensión de diferentes acentos, aspectos que suelen causar dificultades a otros sistemas”.

    Maite Martín, catedrática del departamento de Informática de la Universidad de Jaén e investigadora del grupo de investigación SINAI (Sistemas Inteligentes de Acceso a la Información), apunta que “el artículo presenta un modelo unificado de traducción automática multimodal y multilingüe llamado SemalessM4T, desarrollado para superar las limitaciones actuales en la traducción de texto y habla, incluyendo traducciones entre lenguajes de pocos recursos”.

    “Uno de los aspectos más destacados del modelo es su enfoque en estudiar e incorporar idiomas con pocos recursos, como el maltés y el suajili, que han sido históricamente excluidos de los avances tecnológicos en traducción automática”, apunta esta experta.

    “Estos idiomas, al carecer de grandes volúmenes de datos etiquetados y recursos específicos, suelen quedar rezagados en el desarrollo de herramientas lingüísticas avanzadas”, prosigue. “El trabajo realizado aborda esta brecha mediante la creación de un corpus masivo de datos de habla y texto alineados. Combina datos etiquetados manualmente con recursos generados automáticamente, lo que permite ampliar significativamente el alcance y la precisión del modelo en lenguas menos representadas, un avance en la inclusión lingüística”.

    Raquel Fernández, catedrática de Lingüística Computacional y Sistemas de Diálogo y y vicedirectora de Investigación del Instituto de Lógica, Lenguaje y Computación (ILLC) de la Universidad de Ámsterdam, agrega que “los sistemas de traducción automática tienden a funcionar razonablemente bien para idiomas que están bien representados en internet (inglés, chino o español, por ejemplo), pero no tanto para idiomas con menos hablantes o menos datos digitales disponibles (como maltés, suajili o urdu)”.

    “Además, la traducción automática se ha limitado principalmente al texto escrito. El modelo presentado en este artículo supone un avance substancial al incluir la capacidad de traducir hacia y desde el habla (además del texto) y al hacerlo para una gran cantidad de idiomas diferentes”.

    Para Martín es relevante que se haya decidido poner estos datos y herramientas a disposición de la comunidad científica para uso no comercial, un enfoque que fomenta la investigación colaborativa al permitir que otros desarrolladores e investigadores utilicen estos recursos para seguir avanzando en la traducción automática, especialmente en contextos multilingües y multimodales.

    “La publicación de estos recursos no solo consolida el modelo como un referente en innovación tecnológica, sino que también impulsa el desarrollo de soluciones más inclusivas y equitativas, sentando las bases para un ecosistema de investigación más abierto y dinámico”.

    Víctor Etxebarria, catedrático de Ingeniería de Sistemas y Automática en la Universidad del País Vasco (UPV/EHU), agrega que el traductor, sobre todo en su versión de traducción directa de voz a voz, puede resultar muy útil, intentando imitar el servicio efectuado por las personas dedicadas a la traducción simultánea en el contexto internacional.

    “SeamlessM4T logra una mayor precisión y robustez que los sistemas de traducción tradicionales. Las métricas reportadas indican que el modelo es resistente al ruido y a variaciones en los hablantes”, añade por su parte Pablo Haya Coll, investigador del Laboratorio de Lingüística Informática de la Universidad Autónoma de Madrid (UAM) y director del área de Business & Language Analytics (BLA) del Instituto de Ingeniería del Conocimiento (IIC).

    “Es interesante destacar que el modelo incorpora estrategias para mitigar sesgos de género y toxicidad, garantizando traducciones más inclusivas y seguras. Representa un paso adelante en la construcción de sistemas inclusivos y accesibles, ofreciendo un puente efectivo entre culturas y lenguajes para su aplicación en contextos tanto digitales como presenciales”.

    Limitaciones al estudio

    El modelo, sin embargo, también enfrenta limitaciones importantes. “Aunque supone un avance significativo, todavía queda trabajo por hacer para optimizar su implementación en escenarios prácticos”, apunta Martín. Fundamentalmente, la aplicación no tiene en cuenta las inflexiones vocales ni otros componentes emocionales del habla viva que pueden dejar imprecisa la traducción final y dar lugar a malentendidos.

    “Aunque mejora la precisión en la traducción de lenguajes con pocos recursos, los resultados aún son inferiores a los obtenidos con idiomas de alta disponibilidad. Y siguen siendo desafíos la interacción en tiempo real, la expresividad de la voz traducida o sesgos de género, señala.

    Para Etxevarría, el traductor es “un producto tecnológico avanzado y probablemente muy útil, pero cerrado a los principios de la ciencia abierta”.

    “El modelo tampoco evita por ahora los retrasos ni los errores de traducción ni su enmienda en tiempo real que sí realizan las personas traductoras”.

    Asimismo, lamenta que los especialistas independientes no tienen permiso de reproducibilidad, comprobación o mejora de las bases tecnológicas, y solo tienen acceso a conectarse al traductor para efectuar ejemplos superficiales de traducciones. “Junto a sus múltiples limitaciones tecnológicas y legales”, prosigue este experto, “otra desventaja es que solo puede utilizarse a través de la API (Application Programming Interface) remoto por internet impuesto por Meta”.

    “El software no cumple los principios de la IA en código abierto tal y como lo define la Open Source Initiative: usar, estudiar, modificar y compartir para cualquier propósito”, por lo que “no contribuye al avance científico” y “no es coherente con los principios de la ciencia abierta”.

    Kaltenbrunner, por su parte, ve por su parte que es digno de elogio que el estudio incluya un análisis sobre si las traducciones incrementan la toxicidad de los textos o cómo abordan posibles sesgos de género pese a que Meta, recientemente, “parece haber decidido abandonar los esfuerzos en este sentido con su nueva política de moderación de contenidos”.

    Rodolfo Zevallos, investigador del grupo de Tecnologías del Lenguaje del BSC (Barcelona Supercomputing Center), apunta por su parte que sería interesante “profundizar en el proceso de tokenización (segmentación de palabras), particularmente para lenguas morfológicamente complejas, donde una representación adecuada es crucial para mejorar la calidad de las traducciones”.

    ¿Hay que seguir estudiando idiomas?

    Aunque es un avance significativo, tiene algunas limitaciones reseñables, añade Haya Coll. Recuerda que SeamlessM4T fue publicado en abierto por Meta en agosto de 2023. “El artículo que se publica ahora en Nature no parece que difiera de lo que ya explicó Meta en su día y puso en abierto en su repositorio de github donde se puede probar esta tecnología”.

    La calidad de las traducciones que realiza la aplicación varían según el idioma, explica, “especialmente en lenguas de bajos recursos, y según el género, acento y demografía. Puede enfrentar dificultades al traducir nombres propios, jerga y expresiones coloquiales”.

    “Hay que tener en cuenta que el habla no se limita a ser texto hablado; incorpora una variedad de componentes prosódicos, como el ritmo, el énfasis, la entonación y el tono, así como elementos emocionales que requieren una investigación más exhaustiva. Para desarrollar sistemas S2ST que resulten orgánicos y naturales, es fundamental centrar los esfuerzos en que el audio generado preserve la expresividad del lenguaje”.

    Además, “para aumentar la adopción de estos sistemas es preciso mayor investigación en sistemas que permitan traducción en streaming, es decir, traducir de forma incremental una oración a medida que se pronuncia”.

    Fernández reconoce que este modelo “representa un progreso sustancial en la traducción hablada, ya que traducir a voz sigue siendo más complejo que generar una traducción escrita: Además, el habla producida automáticamente puede no siempre ser expresiva y natural. De manera similar, al traducir de voz a texto, el modelo puede tener problemas para procesar el habla en función de factores como el género, el acento o el idioma”.

    Y “si bien tiene el potencial de mejorar la comunicación multilingüe en muchos escenarios cotidianos, aún no permite la traducción en tiempo real o simultánea, es decir, la traducción de una oración a medida que se produce”.

    Los propios autores destacan en el estudio que estas aplicaciones deben entenderse como herramientas de apoyo diseñadas para asistir en la traducción, en lugar de reemplazar la necesidad de aprender idiomas o contar con intérpretes humanos: especialmente crucial en contextos como la toma de decisiones legales o médicas.

    El inglés, origen y meta

    “La traducción automática ha evolucionado desde sistemas basados en reglas y cálculos estadísticos hasta los actuales grandes modelos lingüísticos o LLMs, gracias al poder computacional. Dentro de este contexto, la publicación presenta un avance en sistemas de traducción más rápidos, fiables y universales”, explica en SMC Rocío Romero Zaliz, profesora titular del departamento de Ciencias de la Computación e Inteligencia Artificial de la Universidad de Granada.

    “Destaca la capacidad de realizar traducciones de voz a voz directamente, sin pasos intermedios (voz-texto, traducción texto-texto, texto-voz), acelerando el proceso. Además, soporta múltiples idiomas, acercándonos cada vez más a la utopía de un traductor automático universal”. Las mejoras no se basan en una mayor cantidad de parámetros del modelo al ser entrenado, sino en un preprocesamiento más inteligente de la información disponible, incorporando incluso nuevas fuentes de información adicionales para mejorar las traducciones”.

    Hasta ahora, “la mayoría de los traductores automáticos traducen de un idioma X a Y usando el inglés como intermediario. Sin embargo, esta publicación propone traducciones directas de un idioma X a otro idioma Y, eliminando así errores acumulados. Esto se consigue gracias al uso de un espacio de representación común donde oraciones con significados similares están próximas, independientemente del idioma”.

    Sin embargo, “el entrenamiento utilizado sigue basándose en gran medida en traducciones desde o hacia el inglés”. Es más, todas las pruebas y test mostrados en el texto principal de la publicación se han realizado entre un idioma X y el inglés o viceversa. Será entonces necesario revisar el material complementario de la publicación y probar el sistema propuesto una vez disponible entre parejas de idiomas que no incluyan el inglés o algún otro idioma mayoritario, lo cual sigue siendo un desafío”.

    Fuente.

    Expansión (2025, 15 de enero). Meta desarrolla un traductor de voz simultáneo con IA generativa para un centenar de idiomas. Recuperado el 16 de enero de 2025, de: https://www.expansion.com/directivos/estilo-vida/salud/2025/01/14/67850c59468aebe35c8b4599.html

  • Reino Unido presenta plan de acción para potenciar la Inteligencia Artificial.

    Reino Unido presenta plan de acción para potenciar la Inteligencia Artificial.

    El plan establece tres pilares clave para garantizar el desarrollo y liderazgo del país: fomentar el crecimiento de la IA, impulsar su adopción en sectores públicos y privados, y mantener al Reino Unido como referente internacional en tecnología.

    El gobierno del Reino Unido presentó un Plan de Acción de Oportunidades de Inteligencia Artificial (IA), diseñado para posicionar a la nación como líder global en IA y transformar sus servicios públicos y económicos en los próximos 10 años.

    El primer ministro del Reino Unido, Keir Starmer, anunció que el plan incluye la adopción de 50 recomendaciones formuladas por Matt Clifford, asesor en tecnología avanzada.

    “Nuestro plan convertirá a Gran Bretaña en el líder mundial, le dará a la industria la base que necesita y potenciará el Plan para el Cambio, lo que significa más empleo e inversión en el Reino Unido, más dinero en los bolsillos de la gente y servicios públicos transformados”, dijo Starmer.

    El plan establece tres pilares clave para garantizar el desarrollo y liderazgo del país: fomentar el crecimiento de la IA, impulsar su adopción en sectores públicos y privados, y mantener al Reino Unido como referente internacional en tecnología.

    Se pondrán en marcha iniciativas como la creación de Zonas de crecimiento de IA, diseñadas para agilizar permisos de planificación para la construcción de centros de datos, con el fin de mejorar el acceso a la red eléctrica y atraer inversiones globales.

    Se construirá una supercomputadora capaz de ejecutar medio millón de partidas de ajedrez por segundo, como parte de su estrategia para multiplicar por 20 la capacidad de cómputo de Inteligencia Artificial para 2030.

    Se formará un nuevo equipo dedicado para aprovechar las oportunidades que ofrece la IA y potenciar las capacidades del Reino Unido. Además, se establecerá una Biblioteca Nacional de Datos para garantizar un uso seguro y eficiente de los datos públicos, fomentando el desarrollo de la IA. También se creará un Consejo de Energía especializado en Inteligencia Artificial, liderado por los secretarios de Ciencia y Energía, que colaborará con empresas del sector energético para abordar las demandas y desafíos energéticos necesarios para impulsar el avance tecnológico.

    “Con este plan, nos convertimos en agentes del cambio. Consolidaremos nuestro estatus como el tercer mercado de Inteligencia Artificial más grande del mundo”, explicó Peter Kyle, secretario de Ciencia, Innovación y Tecnología.

    De acuerdo con el Fondo Monetario Internacional (FMI), la adopción plena de la IA podría aumentar la productividad anual del Reino Unido en 1.5 puntos porcentuales, generando hasta 47 mil millones de libras esterlinas al año durante una década.

    Por otra parte, las empresas tecnológicas Vantage Data Centres, Nscaley Kyndryl invertirán 14 millones de libras esterlinas en el Reino Unido para construir la infraestructura de IA que el país necesita para aprovechar el potencial de esta tecnología y generar 13 mil 250 puestos de trabajo en todo el país.

    Este Plan de Acción es un elemento central de la Estrategia Industrial del gobierno y constituye el primer pilar del próximo Plan del Sector Digital y Tecnológico, cuya publicación está prevista en los próximos meses.

    Fuente: DPL News (2025, 14 de enero). Reino Unido presenta plan de acción para potenciar la Inteligencia Artificial. Recuperado el 15 de enero de 2025 de:  https://dplnews.com/reino-unido-plan-de-accion-para-potenciar-la-ia/

  • Una IA que promete revolucionar leyendo la mente: ¿Cómo funciona Omi?

    Una IA que promete revolucionar leyendo la mente: ¿Cómo funciona Omi?

    El CES 2025 ha sido testigo de innovaciones fascinantes, pero pocas han generado tanto interés como Omi, una inteligencia artificial portátil que promete “leer la mente”.

    Este dispositivo, diseñado por Based Hardware, combina funciones de productividad con un enfoque futurista, aunque no está exento de dudas sobre privacidad y expectativas.

    ¿Qué es Omi y cómo funciona?

    Omi es un dispositivo compacto, del tamaño de un botón, que se utiliza adherido a la sien mediante una cinta médica o como un accesorio colgante. Actúa como un asistente virtual avanzado, activado por voz con el comando “hey, Omi”. Utilizando el modelo GPT-4o de OpenAI, ofrece funciones como responder preguntas, agendar reuniones, generar resúmenes y compartir consejos.

    Aunque se promociona como una IA que “lee la mente”, esto es parcialmente exagerado. Actualmente, Omi escucha conversaciones de manera constante para optimizar la interacción con el usuario. Based Hardware planea que en el futuro interprete ondas cerebrales para activar comandos sin necesidad de hablar, una funcionalidad que podría llegar en dos años.

    ¿Privacidad en riesgo?

    La capacidad de Omi para “escuchar todo” ha generado preocupaciones sobre la privacidad. Para mitigar estas dudas, el dispositivo opera sobre una plataforma de código abierto, permitiendo a los usuarios verificar el destino de sus datos o almacenarlos localmente. Según el fundador de Based Hardware, Nik Shevchenko, esta transparencia es clave para ganar la confianza de los consumidores.

    Promesas y dudas en torno a Omi

    El entusiasmo en torno a Omi recuerda a otros productos con propuestas similares que no lograron consolidarse. En CES 2024, dispositivos como Rabbit R1 y Ai Pin también prometieron integrar IA en la vida diaria, pero terminaron catalogados como fracasos. El éxito de Omi dependerá de si logra cumplir sus promesas y ganar aceptación entre los usuarios.

    Precio y disponibilidad

    Omi estará disponible en el segundo trimestre de este año a un precio de 89 dólares. Queda por ver si este dispositivo revolucionará la interacción con la IA o si será otro ejemplo de tecnología prometedora que no alcanza las expectativas.

    Fuente:

    GIZMODO( 2025. 11 de enero). Una IA que promete revolucionar leyendo la mente: ¿Cómo funciona Omi?. Recuperado el 14 de enero de 2025 de: https://es.gizmodo.com/una-ia-que-promete-revolucionar-leyendo-la-mente-como-funciona-omi-2000143293

  • Google presenta el asistente de codificación con inteligencia artificial ‘Jules’, que promete correcciones de errores autónomas y ciclos de desarrollo más rápidos

    Google presenta el asistente de codificación con inteligencia artificial ‘Jules’, que promete correcciones de errores autónomas y ciclos de desarrollo más rápidos

    Google presentó el miércoles ” Jules “, un asistente de codificación de inteligencia artificial que puede corregir errores de software de forma autónoma y preparar cambios de código mientras los desarrolladores duermen, lo que marca un avance significativo en el esfuerzo de la compañía por automatizar las tareas centrales de programación.

    El agente de código experimental impulsado por IA, construido sobre la plataforma Gemini 2.0 recientemente anunciada por Google , se integra directamente con el sistema de flujo de trabajo de GitHub y puede analizar bases de código complejas, implementar correcciones en múltiples archivos y preparar solicitudes de extracción detalladas sin supervisión humana constante.

    El momento del lanzamiento de Jules es estratégico. A medida que la industria del desarrollo de software se enfrenta a una escasez persistente de talento y una creciente deuda técnica , los asistentes de codificación automatizados se han vuelto cada vez más cruciales. La firma de investigación de mercado Gartner estima que para 2028, la codificación asistida por IA estará involucrada en el 75% del desarrollo de nuevas aplicaciones.

    Cómo funciona realmente Jules: un vistazo al interior de la herramienta de inteligencia artificial para desarrolladores de Google

    A diferencia de los asistentes de codificación tradicionales que simplemente sugieren soluciones, Jules funciona como un agente autónomo dentro del ecosistema de GitHub. Analiza bases de código, crea planes de reparación integrales y ejecuta correcciones en varios archivos simultáneamente. Lo más importante es que se integra perfectamente con los flujos de trabajo de los desarrolladores existentes.

    Durante una conferencia de prensa, Jaclyn Konzelmann, directora de gestión de productos de Google Labs, destacó las características de seguridad del sistema. “Los desarrolladores tienen el control durante todo el proceso”, explicó. “Jules presenta un plan sugerido antes de tomar medidas y los usuarios pueden monitorear su progreso mientras escriben el código”. El sistema requiere una aprobación explícita antes de fusionar cualquier cambio, lo que mantiene la supervisión humana del proceso de desarrollo.

    El auge de los agentes de IA: cómo encaja Jules en el plan maestro de Google

    Jules representa más que un simple asistente de codificación; es parte de la visión más amplia de Google para agentes de IA que pueden operar de manera autónoma mientras permanecen bajo supervisión humana. El sistema está impulsado por Gemini 2.0, el último modelo de lenguaje de gran tamaño de Google, que aporta mejoras significativas en la comprensión y generación de códigos.

    “Estamos en una fase inicial de comprensión de las capacidades completas de los agentes de IA para el uso informático”, reconoció Konzelmann durante la conferencia de prensa. Este enfoque cauteloso refleja las preocupaciones más amplias de la industria sobre la seguridad y la fiabilidad de la IA, en particular en sistemas críticos.

    El factor humano: qué significa Jules para los trabajos de los desarrolladores

    Para muchos desarrolladores, Jules plantea importantes preguntas sobre el futuro de su profesión. Sin embargo, las primeras pruebas sugieren que es más probable que mejore a los desarrolladores humanos en lugar de reemplazarlos. En el Laboratorio Nacional Lawrence Berkeley , los investigadores que utilizan Jules y herramientas de inteligencia artificial de Google relacionadas redujeron ciertas tareas de análisis de una semana a minutos, lo que les permitió centrarse en desafíos más complejos.

    Las implicaciones financieras de Jules podrían ser sustanciales. Los proyectos de desarrollo de software suelen correr riesgos significativos de sobrecostos, ya que los grandes proyectos de TI superan en un 45 % el presupuesto y generan un 56 % menos de valor de lo previsto, según McKinsey . Al automatizar las tareas rutinarias de mantenimiento y corrección de errores, Jules podría reducir significativamente estos costos y, al mismo tiempo, acelerar los ciclos de desarrollo.

    La estrategia de Google también lo posiciona en una posición competitiva frente a GitHub Copilot de Microsoft y CodeWhisperer de Amazon . La integración con el flujo de trabajo de GitHub le otorga a Google una sólida posición en el mercado de herramientas para desarrolladores, que se estima que alcanzará los 937 mil millones de dólares en 2027.

    ¿Qué sigue para el desarrollo impulsado por IA?

    Jules estará disponible inicialmente para un grupo selecto de evaluadores confiables, y se prevé un acceso más amplio para principios de 2025. Google ya ha anunciado planes para integrar capacidades similares en todo su ecosistema de desarrollo, incluidos Android Studio y Chrome DevTools .

    La verdadera prueba de Jules será su capacidad para manejar desafíos de programación cada vez más complejos y, al mismo tiempo, mantener la calidad y la seguridad del código. Como señaló un desarrollador senior de una importante empresa tecnológica: “La promesa no es solo corregir errores más rápido, sino cambiar fundamentalmente la forma en que abordamos el desarrollo de software”.

    En una industria en la que el costo de la mala calidad del código alcanza los 2,84 billones de dólares anuales según CISQ, Jules podría representar más que una herramienta más en el arsenal del desarrollador. Podría marcar el comienzo de una nueva era en la que la IA y los desarrolladores humanos trabajen en una verdadera asociación, lo que podría transformar el futuro del desarrollo de software.

    Fuente:

    VentureBeat (2024, diciembre 11) Google unveeils AI coding assistant ‘Jules’, promising autonomous bug fixes and faster development cycles. Recuperado el 12 de diciembre de 2024 de: https://venturebeat.com/ai/google-unveils-ai-coding-assistant-jules-promising-autonomous-bug-fixes-and-faster-development-cycles/