Category: Inteligencia Artificial

  • Google desarrolla un compañero de inteligencia artificial para investigadores científicos

    Google desarrolla un compañero de inteligencia artificial para investigadores científicos

    La nueva herramienta, probada por científicos de la Universidad de Stanford y el Imperial College de Londres, usa razonamiento avanzado para ayudar a sintetizar grandes cantidades de literatura.

    Google informó el miércoles que ha desarrollado una herramienta de inteligencia artificial (IA) para que actúe como colaborador virtual de científicos biomédicos.

    La nueva herramienta, probada por científicos de la Universidad de Stanford en Estados Unidos y el Imperial College de Londres, usa razonamiento avanzado para ayudar a sintetizar grandes cantidades de literatura y generar hipótesis novedosas, según la empresa.

    Tras el éxito de ChatGPT y otros modelos similares el año pasado, la inteligencia artificial se usa cada vez más en el lugar de trabajo, desde la atención telefónica a la investigación jurídica.

    La unidad de IA de Google, DeepMind, ha hecho de la ciencia una prioridad, y el jefe de DeepMind, Demis Hassabis, recibió el año pasado el Premio Nobel de Química por una tecnología desarrollada en la unidad de IA.

    En un experimento sobre la fibrosis hepática, Google afirmó que todos los enfoques sugeridos por su nueva inteligencia artificial científica mostraron una actividad prometedora para inhibir las causas de la enfermedad.

    Google añadió que se demostró la capacidad de mejorar las soluciones generadas por los expertos.

    “Aunque se trata de un hallazgo preliminar que requiere una mayor validación, sugiere una vía prometedora para que los sistemas de IA capaces (…) aumenten y aceleren el trabajo de los científicos expertos”, dijo.

    Los científicos que trabajaron en el proyecto afirmaron que complementaría a los investigadores en lugar de sustituirlos.

    “Esperamos que la colaboración científica aumente, en lugar de disminuir”, dijo Vivek Natarajan, científico de Google.

     

    Fuente.

    El Economista (2025,  19 de febrero). Google desarrolla un compañero de inteligencia artificial para investigadores científicos. Recuperado el 26 de febrero de 2025, de: https://www.eleconomista.com.mx/tecnologia/google-desarrolla-companero-inteligencia-artificial-investigadores-cientificos-20250219-747062.html

  • Hume lanza el nuevo modelo de texto a voz Octave que genera voces de IA personalizadas con emociones ajustables

    Hume lanza el nuevo modelo de texto a voz Octave que genera voces de IA personalizadas con emociones ajustables

    La startup neoyorquina Hume AI surgió de la clandestinidad hace dos años y desde entonces ha recaudado millones de dólares en financiación gracias a su tecnología que crea voces emotivas de inteligencia artificial para su uso en aplicaciones empresariales.

    Hoy, está llevando su oferta un paso más allá con un nuevo modelo de lenguaje y voz de gran tamaño llamado “motor de texto y voz omnicapaz”, u Octave para abreviar, diseñado para producir un habla realista y con matices emocionales para su uso en diferentes formas de contenido, desde audiolibros hasta diálogos de personajes de videojuegos pregrabados y películas/TV/video.

    Hume afirma que Octave es el primer sistema de texto a voz impulsado por un gran modelo de lenguaje (LLM) entrenado no solo en texto sino también en tokens de habla y emoción, lo que le permite comprender palabras en contexto y ajustar el tono, el ritmo y la cadencia en consecuencia, y que el usuario puede ajustar a nivel de oración con indicaciones de texto.

    “Estamos lanzando el primer LLM para texto a voz, un modelo que entiende las palabras en contexto, predice las emociones, el ritmo, la cadencia y el énfasis correctos, haciendo que el habla suene más humana que nunca”, dijo Alan Cowen, cofundador y director ejecutivo de Hume AI, en una entrevista por videollamada con VentureBeat.

    Las capacidades de Octave van más allá de la generación básica de voces. Puede interpretar los rasgos y el estilo de los personajes a partir de un guión, ajustando las inflexiones vocales para que coincidan con las emociones implícitas. Un comentario sarcástico se pronunciará con sarcasmo, una frase provocada por el pánico sonará urgente y un secreto susurrado se silenciará, todo ello sin necesidad de una dirección explícita.

    Además, si al usuario no le gusta la voz generada o quiere ajustarla, puede hacerlo de forma granular a través del lenguaje natural simplemente escribiendo una instrucción de texto en Octave, como “más feliz, más triste, más frustrado, más enojado, más sarcástico, más sincero”, etc.

    “Puedes describir un personaje, como un campesino medieval sarcástico, y el modelo creará instantáneamente esa voz, ajustando emociones como la ira, la tristeza o la felicidad según tus instrucciones”, agregó Cowen. “La modulación de voz funciona a nivel de oración, pero también puedes ajustar partes de una oración, instruyendo al modelo para que transmita emociones matizadas como una ligera frustración mezclada con humor o exasperación”.

    El modelo también tiene en cuenta el contexto más allá de las oraciones individuales. “A diferencia de los modelos tradicionales que procesan el texto palabra por palabra, nuestro modelo tiene en cuenta párrafos enteros y captura el contexto para ofrecer un discurso más natural y emocionalmente preciso”, explicó.

    Si bien la versión actual se centra en el habla en inglés, Octave también admite español y se espera que amplíe sus capacidades lingüísticas en el futuro cercano.

    Diseñado para la creación de contenidos

    Octave está diseñado para creadores de contenido y producción de medios, y ofrece aplicaciones en audiolibros, podcasts, personajes de videojuegos y voces en off de videos.

    “Este nuevo modelo está diseñado para la conversión de texto a voz sin conexión, perfecto para audiolibros, podcasts, voces en off de videos y personajes de videojuegos, donde los creadores necesitan voces realistas y específicas de los personajes”, explicó Cowen.

    Sin embargo, el usuario debe acceder a él a través del sitio web de Hume, ya sea en su página de Proyectos o a través de una interfaz de programación de aplicaciones (API). El componente “sin conexión” se refiere al hecho de que este modelo está diseñado para producir archivos de audio discretos que se pueden agregar a proyectos como videos o audiolibros. No está diseñado para mantener conversaciones en tiempo real, aunque en teoría eso podría permitirse mediante la canalización de consultas de texto al sitio web.

    La API de Hume permite a los desarrolladores realizar hasta 50 solicitudes del nuevo modelo Octave por minuto, con una longitud máxima de texto de 5000 caracteres y descripciones limitadas a 1000 caracteres. Cada solicitud puede generar hasta cinco salidas y los formatos de audio admitidos incluyen MP3, WAV y PCM.

    La serie de modelos EVI anterior de Hume permite interacciones en tiempo real, de ida y vuelta, y sigue estando disponible y seguirá desarrollándose.

    Hume AI ofrece un modelo de precios basado en suscripción con niveles que van desde una opción gratuita hasta los planes Creator, Creator Pro y Enterprise.

    A continuación se presenta un resumen conciso de las ofertas:

    • Gratis ($0/mes) : 10,000 caracteres de texto a voz por mes (~10 minutos) con voces personalizadas ilimitadas.
    • Starter ($3/mes) : 30 000 caracteres (aproximadamente 30 minutos) más soporte para hasta 20 proyectos.
    • Creador ($10/mes) : 100,000 caracteres (~100 minutos), precio basado en el uso para caracteres adicionales ($0.20/1,000) y soporte para hasta 1,000 proyectos.
    • Pro ($50/mes) : 500,000 caracteres (~500 minutos), precio más bajo basado en el uso ($0,15/1,000) y soporte para hasta 3,000 proyectos.
    • Escala ($150/mes) : 2,000,000 de caracteres (~2,000 minutos), precios basados ​​en el uso aún más reducidos ($0.13/1,000) y soporte para hasta 10,000 proyectos.
    • Empresas ($900/mes) : 10 000 000 de caracteres (~10 000 minutos), precios basados ​​en el uso aún más bajos ($0,10/1000) y soporte para hasta 20 000 proyectos.
    • Empresa (precio personalizado) : uso ilimitado, términos legales personalizados, garantías de seguridad, precios por volumen con importantes descuentos y soporte prioritario.

    En total, Hume enfatizó que el precio de Octave TTS es aproximadamente la mitad del costo de la startup competidora de creación de voz con IA ElevenLabs , lo que demuestra la creciente competencia en el espacio de texto a voz.

    Además, Hume AI realizó un estudio comparativo a ciegas con 180 evaluadores humanos para comparar Octave con ElevenLabs. Los resultados mostraron que Octave era el preferido en términos de calidad de audio (71,6 % de los ensayos), naturalidad (51,7 % de los ensayos) y qué tan bien coincidía el habla con las descripciones de la voz deseada (57,7 % de los ensayos), en 120 indicaciones diferentes.

    Para evaluar más a fondo su rendimiento, Hume AI también lanzó Expressive TTS Arena, un punto de referencia público diseñado para probar qué tan bien los modelos de IA manejan un discurso más largo y expresivo, un área que los puntos de referencia TTS anteriores han pasado por alto en gran medida.

    Decenas de billones de tokens de lenguaje

    A diferencia de los sistemas tradicionales de conversión de texto a voz que se basan en conjuntos de datos de voz limitados, Octave TTS está construido sobre un LLM entrenado en decenas de billones de tokens de idioma.

    “Los modelos tradicionales de texto a voz se entrenan con datos de voz limitados, pero el nuestro está construido sobre un LLM entrenado con decenas de billones de tokens, lo que le permite razonar, pensar e inferir emociones a partir del texto”, dijo Cowen.

    El modelo se entrenó utilizando millones de horas de datos públicos de habla extensa y conjuntos de datos patentados de Hume AI de nuevas voces grabadas por los participantes de la encuesta.

    “Recopilamos datos de personas que se grababan a sí mismas a través de cámaras web, reaccionaban naturalmente a los videos, contaban historias y hablaban con otros, incluidos amigos y familiares, para capturar una amplia gama de expresiones emocionales”, dijo Cowen.

    Este entrenamiento extenso permite al modelo inferir el contexto emocional y seguir instrucciones detalladas, creando voces que coinciden con las descripciones y atributos específicos de los personajes.

    Voces de personajes consistentes y limitaciones.

    Octave TTS mantiene voces de personajes consistentes en contenidos de larga duración.

    “Con nuestra plataforma, puedes generar voces únicas para cada personaje de un audiolibro (como un orco de mediana edad) y mantener la voz de ese personaje a lo largo de la historia”, dijo Cowen.

    Esta capacidad está respaldada por la página “Proyectos” de Hume AI, que maneja contenido de formato largo, como audiolibros, fragmentando automáticamente el texto mientras preserva la consistencia de los caracteres y el contexto en todos los capítulos.

    Hume tiene barreras técnicas integradas en su sitio web y API que prohíben la creación de voces infantiles realistas e imitaciones de individuos específicos, pero más allá de eso, está abierto para su uso en una amplia gama de contenidos y temas, incluidas escenas potencialmente no seguras para el trabajo, como las de las novelas románticas populares.

    “Damos libertad a los desarrolladores, permitiendo contenidos en una amplia gama de experiencias humanas, aunque restringimos la creación de voces infantiles realistas e imitaciones de individuos específicos”, explicó Cowen.

    Además, Cowen dijo que la compañía podría ajustar estas barreras de protección para clientes específicos a pedido, como por ejemplo un editor de libros infantiles que busca crear voces para audiolibros infantiles.

    Hume AI está trabajando en una función de clonación de voz que estará disponible próximamente y que permitirá a los usuarios replicar una voz a partir de tan solo cinco segundos de audio. La empresa está desarrollando medidas de seguridad para garantizar un uso ético antes de lanzar la función al público.

    Con su combinación de conciencia contextual, expresión emocional y personalización de personajes, Octave TTS tiene como objetivo brindar a los creadores de contenido más control y flexibilidad, ofreciendo voces que suenan realistas y emocionalmente atractivas.

     

    Fuente.

    VentureBeat (2025, 26 de febrero). Hume lanza el nuevo modelo de texto a voz Octave que genera voces de IA personalizadas con emociones ajustables. Recuperado el 26 de febrero de 2025, de: https://venturebeat.com/ai/hume-launches-text-to-speech-model-octave/

  • Elon Musk acaba de lanzar una IA que es más inteligente que ChatGPT: aquí explicamos por qué es importante

    Elon Musk acaba de lanzar una IA que es más inteligente que ChatGPT: aquí explicamos por qué es importante

    La startup de inteligencia artificial xAI de Elon Musk ha presentado Grok 3 , su último modelo de IA que, según la empresa, supera a sus principales competidores en los principales parámetros técnicos. El anuncio marca una escalada significativa en la carrera por desarrollar sistemas de IA más potentes.

    El lanzamiento se produce apenas unos días después de la fallida oferta de 97.400 millones de dólares de Musk para adquirir OpenAI , la empresa que cofundó con Sam Altman en 2015. Durante una demostración transmitida en vivo en X, Musk caracterizó a Grok 3 como “un orden de magnitud más capaz que Grok 2” y enfatizó su capacidad para razonar sobre problemas complejos.

    Las primeras pruebas parecen respaldar algunas de las afirmaciones de xAI. El modelo encabezó la influyente clasificación de Chatbot Arena , con una puntuación superior a la de GPT-4o de OpenAI, Gemini de Google y el modelo V3 de DeepSeek en pruebas de usuarios a ciegas. Los puntos de referencia publicados muestran que Grok 3 logra puntuaciones superiores en matemáticas (AIME ’24), razonamiento científico (GPQA) y tareas de codificación.

    Dentro de la enorme infraestructura informática de Grok 3: 200.000 GPU y un nuevo centro de datos

    “Grok 3 claramente tiene capacidades de pensamiento de última generación”, escribió el ex investigador de OpenAI Andrej Karpathy en una publicación de X después de las pruebas de acceso anticipado. “Pocos modelos logran esto de manera confiable. Los mejores modelos de pensamiento de OpenAI también lo logran, pero todos los DeepSeek-R1, Gemini 2.0 Flash Thinking y Claude no lo logran”.

    El desarrollo del modelo requirió recursos computacionales masivos. xAI duplicó su clúster de GPU a 200.000 chips Nvidia para entrenamiento, alojados en un nuevo centro de datos en Memphis. Esta inversión en infraestructura pone de relieve las crecientes demandas computacionales del desarrollo de IA avanzada, a medida que las empresas compiten por construir sistemas más capaces.

    DeepSearch y razonamiento avanzado: cómo Grok 3 pretende ser más inteligente que ChatGPT y Google Gemini

    Una innovación clave es la función “DeepSearch” de Grok 3, que combina la búsqueda en la web con capacidades de razonamiento para analizar información de múltiples fuentes. El sistema también incluye modos especializados para la resolución de problemas complejos, incluida una función “Think” que muestra su proceso de razonamiento y un modo “Big Brain” que asigna potencia computacional adicional a tareas difíciles.

    “Lo que realmente hay que tener en cuenta en la IA es la velocidad de aprendizaje. Y @xai aprende mucho más rápido que cualquier otro”, publicó el veterano de la industria tecnológica Robert Scoble , citando una conversación con el cofundador de Siri de Apple, Tom Gruber.

    Sin embargo, durante las pruebas surgieron algunas limitaciones. Karpathy señaló que el modelo a veces inventa citas y tiene dificultades con ciertos tipos de humor y tareas de razonamiento ético. Estos desafíos son comunes en los sistemas de IA actuales y ponen de relieve las dificultades actuales para desarrollar una inteligencia artificial verdaderamente similar a la humana.

    El director ejecutivo de Scale.ai, Alexandr Wang , elogió el lanzamiento y tuiteó: “¡Grok 3 es el nuevo mejor modelo del mundo del equipo @xai!”. Destacó su rendimiento superior en varios puntos de referencia y expresó su entusiasmo por una colaboración futura.

    La competencia en la industria de la IA se intensifica: qué significa el lanzamiento de Grok 3 para OpenAI, DeepSeek y el futuro de la inteligencia artificial

    El modelo estará disponible a través de la suscripción Premium+ de X ($40/mes) y un nuevo servicio independiente “ SuperGrok ” ($30/mes). El acceso a la API empresarial está previsto para las próximas semanas.

    Este lanzamiento intensifica la competencia en la industria de la IA, en particular porque la startup china DeepSeek demostró recientemente un rendimiento comparable con requisitos computacionales supuestamente más bajos. El desarrollo también plantea interrogantes sobre la sostenibilidad de la carrera armamentista computacional en la IA, ya que las empresas invierten miles de millones en infraestructura de hardware cada vez más potente.

    Musk enfatizó que Grok 3 sigue en fase beta y se esperan mejoras “ casi todos los días ”. La compañía planea agregar capacidades de interacción por voz en unas semanas y abrirá el código fuente de su modelo anterior, Grok 2, una vez que la nueva versión se estabilice.

    Sin embargo, tal vez el aspecto más revelador del debut de Grok 3 no sean sus especificaciones técnicas o sus resultados de referencia, sino lo que representa: la creciente tensión entre Musk y sus antiguos colegas de OpenAI . Apenas unos días después de su fallida oferta de 97.400 millones de dólares para adquirir OpenAI, Musk ha presentado un modelo que desafía su supremacía, lo que sugiere que en la carrera de alto riesgo por el dominio de la IA, incluso un pretendiente rechazado puede convertirse en un rival formidable.

    Fuente.

    VentureBeat (2025, 18 de febrero). Elon Musk acaba de lanzar una IA que es más inteligente que ChatGPT: aquí explicamos por qué es importante. Recuperado el 25 de febrero de 2025, de: https://venturebeat.com/ai/elon-musk-just-released-an-ai-thats-smarter-than-chatgpt-heres-why-that-matters/

  • ChatGPT de OpenAI alcanza los 400 millones de usuarios semanales y GPT-5 está en camino

    ChatGPT de OpenAI alcanza los 400 millones de usuarios semanales y GPT-5 está en camino

    ChatGPT de OpenAI ha superado los 400 millones de usuarios activos semanales , un hito que subraya el creciente alcance de la compañía en los mercados de consumo y empresariales, según una publicación de X del director de operaciones, Brad Lightcap, el jueves.

    La rápida expansión se produce en un momento en que OpenAI se enfrenta a una competencia cada vez más intensa por parte de rivales como xAI de Elon Musk y DeepSeek de China , que han lanzado recientemente modelos de alto rendimiento destinados a interrumpir el dominio de OpenAI. A pesar de esto, OpenAI ha experimentado un impulso significativo en el sector empresarial, con más de dos millones de usuarios empresariales que utilizan ChatGPT en el trabajo, cifra que se duplicará a partir de septiembre de 2024.

    “ChatGPT recientemente superó los 400 millones de WAU, nos sentimos muy afortunados de brindar servicio al 5 % del mundo cada semana”, escribió Lightcap. También señaló que el uso de la API del modelo de razonamiento de OpenAI se ha quintuplicado desde el lanzamiento de su modelo o3 Mini , que está diseñado para mejorar la inferencia lógica y las capacidades de resolución de problemas estructurados.

    La IA está transformando el lugar de trabajo: 2 millones de empresas ahora confían en ChatGPT

    El aumento de la adopción por parte de las empresas representa una validación crucial de la estrategia de OpenAI de posicionar a ChatGPT no solo como un chatbot para consultas casuales, sino como una herramienta de productividad seria para las empresas. Empresas como Morgan Stanley , Uber y T-Mobile han integrado los modelos de OpenAI en sus flujos de trabajo, utilizando la IA para generar informes, automatizar el servicio al cliente y agilizar la toma de decisiones.

    Cabe destacar que el progreso de OpenAI se produce en medio de un mayor escrutinio sobre el papel de la IA generativa en aplicaciones críticas para las empresas. La empresa recientemente consiguió su primer cliente de una agencia federal, USAID , que está implementando ChatGPT Enterprise para reducir las cargas administrativas y agilizar las asociaciones, según FedScoop . La expansión a los contratos gubernamentales sugiere que OpenAI está teniendo éxito en la navegación de los obstáculos regulatorios que han ralentizado la adopción de la IA en las instituciones del sector público.

    Al mismo tiempo, OpenAI está profundizando su presencia en Japón a través de una empresa conjunta con SoftBank, denominada SB OpenAI Japan . La asociación, que implica una inversión anual de 3.000 millones de dólares por parte de SoftBank, tiene como objetivo integrar la tecnología de OpenAI en las principales empresas japonesas, con implementaciones iniciales dentro del propio ecosistema de SoftBank, incluida su filial de semiconductores Arm y la plataforma de pagos digitales PayPay .

    GPT-5 ya está aquí: el próximo salto de OpenAI en inteligencia artificial

    Lightcap también reveló que OpenAI se está preparando para lanzar GPT-4.5 y GPT-5, este último destinado a fusionar los modelos GPT y o-series de la compañía en un solo sistema más potente.

    “Pronto incorporaremos GPT-4.5 y GPT-5 al chat y a la API, con GPT-5 ilimitado para usuarios gratuitos (además, los usuarios podrán ejecutarlo con una inteligencia aún mayor)”, escribió.

    Esta medida señala la ambición de OpenAI de consolidar sus ofertas de IA en un modelo unificado que pueda manejar tanto tareas generales de IA conversacional como aplicaciones más especializadas basadas en el razonamiento.

    Al integrar las capacidades de sus modelos insignia GPT con la resolución estructurada de problemas de la serie o, OpenAI apuesta a que un enfoque de un modelo para gobernarlos a todos le dará una ventaja competitiva sobre sus rivales que todavía están segmentando sus ofertas de IA.

    El momento del lanzamiento de GPT-5 es particularmente crítico. xAI de Musk presentó recientemente Grok 3 , un modelo que, según la compañía, supera a GPT-4o de OpenAI en ciertos puntos de referencia, incluidos matemáticas, ciencias y codificación. Mientras tanto, el rápido ascenso de DeepSeek en China ha aumentado la presión sobre OpenAI para mantener su liderazgo en sofisticación y accesibilidad de la IA.

    Las guerras de la IA: OpenAI, xAI y DeepSeek luchan por el dominio global

    La expansión de OpenAI llega en un momento de feroz competencia en el sector de la IA, con empresas rivales compitiendo por asegurar participación de mercado tanto en aplicaciones de consumo como empresariales.

    Musk, que cofundó OpenAI antes de irse en 2018 , ha expresado abiertamente sus preocupaciones sobre el cambio de la empresa hacia un modelo con fines de lucro. El multimillonario lanzó recientemente una oferta no solicitada de 97.000 millones de dólares para tomar el control de OpenAI, una medida que fue rápidamente rechazada por la junta directiva de la empresa. Desde entonces, OpenAI se ha posicionado como líder en implementaciones de IA empresarial, con el respaldo de Microsoft que proporciona estabilidad financiera e infraestructura en la nube.

    Mientras tanto, DeepSeek ha revolucionado el mercado con modelos de IA de código abierto y bajo costo que han ganado popularidad, particularmente entre los desarrolladores que desconfían del modelo de precios de OpenAI. La firma china ha afirmado que entrenó su último modelo por menos de 6 millones de dólares, un orden de magnitud menor a lo que OpenAI y xAI están gastando en sistemas comparables.

    ¿Qué le espera a OpenAI? El futuro de la IA en las empresas y más allá

    Las últimas métricas de usuarios de OpenAI sugieren que la empresa sigue expandiéndose a un ritmo rápido a pesar de la creciente competencia. El salto de 300 millones a 400 millones de usuarios activos semanales en solo tres meses indica que la demanda de herramientas impulsadas por IA sigue creciendo y las empresas las integran cada vez más en sus operaciones diarias.

    El lanzamiento de GPT -5 será una prueba crucial de la capacidad de OpenAI para mantener su liderazgo en IA. Si el modelo cumple con las promesas de mayor capacidad de razonamiento, mejor personalización y mayor eficiencia, podría consolidar la posición de OpenAI como proveedor de referencia para aplicaciones de IA para consumidores y empresas.

    Sin embargo, con los modelos xAI de Musk , DeepSeek y Gemini de Google compitiendo por el dominio, OpenAI no puede darse el lujo de perder el ritmo. Los próximos 12 meses probablemente determinarán si sigue siendo el líder indiscutible en IA generativa o si un nuevo actor alterará el equilibrio de poder en la inteligencia artificial.

     

    Fuente.

    VentureBeat (2025, 20 de febrero). ChatGPT de OpenAI alcanza los 400 millones de usuarios semanales y GPT-5 está en camino. Recuperado el 25 de febrero de 2025, de: https://venturebeat.com/ai/openai-chatgpt-explodes-to-400m-weekly-users-with-gpt-5-on-the-way/

  • Deepseek compartirá parte de sus modelos de IA, redoblando su apuesta por código abierto

    Deepseek compartirá parte de sus modelos de IA, redoblando su apuesta por código abierto

    DeepSeek sacudió la industria mundial de la IA el mes pasado cuando publicó su modelo de razonamiento R1 de código abierto, que rivalizaba en rendimiento con los sistemas occidentales a la vez que se desarrollaba a un costo menor.

    La china DeepSeek hará público el código de sus modelos, anunció el viernes la empresa emergente, redoblando así su compromiso con la inteligencia artificial de código abierto. La compañía dijo en una publicación en la plataforma de redes sociales X que abrirá 5 repositorios de código fuente la próxima semana, describiendo el movimiento como “pequeño pero sincero progreso” que compartirá “con total transparencia”.

    “Estos humildes bloques de construcción de nuestro servicio en línea han sido documentados, desplegados y probados en combate en producción”, dice la publicación.

    DeepSeek sacudió la industria mundial de la IA el mes pasado cuando publicó su modelo de razonamiento R1 de código abierto, que rivalizaba en rendimiento con los sistemas occidentales a la vez que se desarrollaba a un costo menor.

    El compromiso de la empresa con el código abierto la ha distinguido de la mayoría de las empresas chinas de IA, que al igual que sus rivales estadounidenses se inclinan por modelos de código cerrado. El discreto fundador de DeepSeek, Liang Wenfeng, dijo en una entrevista con un medio de comunicación chino el pasado mes de julio que la empresa no daba prioridad a la comercialización de sus modelos de IA y que el código abierto tenía un poder blando.

    DeepSeek se inclina por algo diferente

    “Que otros sigan tu innovación da una gran sensación de logro”, dijo Liang en julio. “De hecho, el código abierto es más un comportamiento cultural que comercial, y contribuir a él nos hace ganar respeto”, añadió.

    El nuevo código fuente abierto proporcionará la infraestructura de apoyo a los modelos de IA que DeepSeek ya ha compartido públicamente, basándose en los marcos de modelos de código abierto existentes.

    El anuncio se produjo después de que DeepSeek lanzó el martes un nuevo algoritmo llamado Native Sparse Attention (NSA), diseñado para hacer más eficientes el entrenamiento y la inferencia en contextos largos.

    La base de usuarios de DeepSeek se disparó el mes pasado. En China, es el servicio de chatbot más popular, con 22.2 millones de usuarios activos diarios a 11 de enero, superando los 16.95 millones de Douban, según Aicpb.com, un sitio web chino que rastrea productos de IA.

    Fuente.

    Forbes México (2025, 21 de febrero). Deepseek compartirá parte de sus modelos de IA, redoblando su apuesta por código abierto. Recuperado el 21 de febrero de 2025, de:  https://forbes.com.mx/deepseek-compartira-parte-de-sus-modelos-de-ia-redoblando-su-apuesta-por-codigo-abierto/

  • Aomni acaba de recaudar 4 millones de dólares para demostrar que la IA puede aumentar las ventas sin reemplazar a los humanos

    Aomni acaba de recaudar 4 millones de dólares para demostrar que la IA puede aumentar las ventas sin reemplazar a los humanos

    Aomni , una plataforma de inteligencia artificial que ayuda a los equipos de ventas a realizar investigaciones exhaustivas sobre clientes potenciales, ha recaudado 4 millones de dólares en financiación inicial liderada por Decibel, con la participación de Sancus Ventures y Ride Home Fund. La empresa está adoptando un enfoque claramente centrado en el ser humano en un mercado saturado de herramientas de inteligencia artificial centradas en la automatización de funciones de ventas.

    Fundada por David Zhang , cuyo viaje desde un pequeño pueblo chino hasta el lanzamiento de satélites al espacio refleja el ambicioso alcance de su última empresa, Aomni utiliza agentes de IA para transformar la forma en que los equipos de ventas empresariales investigan e interactúan con los clientes potenciales.

    “Si nos fijamos en un representante de ventas típico, solo pasa entre el 30 y el 40 % de su tiempo frente a los clientes”, dijo Zhang a VentureBeat en una entrevista exclusiva. “El 60 o 70 % restante se dedica al tedioso trabajo de conocimiento: completar sistemas CRM, buscar prospectos y realizar investigaciones de cuentas. Nuestro objetivo es hacer que todo ese trabajo tedioso desaparezca”.

    Agentes de IA que investigan en tiempo real, lo que brinda una ventaja a los equipos de ventas

    A diferencia de las plataformas de inteligencia de ventas tradicionales que dependen de bases de datos estáticas y datos firmográficos básicos, Aomni implementa agentes de IA que realizan investigaciones web en tiempo real en docenas de fuentes de datos. Al investigar un prospecto, el sistema activa varios navegadores Chrome para explorar activamente anuncios recientes de la empresa, publicaciones en redes sociales, lanzamientos de productos y otra información pública.

    “Los productos de investigación de ventas actuales se basan más en una base de datos estática”, dijo Zhang a VentureBeat. “Son excelentes si desea encontrar empresas que hayan recaudado más de 10 millones de dólares o que tengan 200 empleados, pero eso es un nivel muy alto. Debido a que realizamos investigaciones de agenda con navegación web en tiempo real, puede hacer preguntas muy específicas”.

    Entre los primeros clientes se incluyen importantes empresas tecnológicas como Nvidia y AMD, que utilizan Aomni para navegar en el mercado de chips de inteligencia artificial en rápida evolución. La plataforma ha ayudado a los equipos de ventas a mejorar las tasas de cierre hasta en un 40 % al permitir conversaciones con los clientes más específicas e informadas.

    Por qué los inversores apuestan fuerte por una IA que apoye (y no sustituya) a los equipos de ventas

    Jessica Leao, socia de Decibel, dijo que la empresa se sintió atraída por la visión centrada en el ser humano de Aomni en un mercado dominado por la automatización. “Muchas herramientas de ventas de IA se centran en reemplazar a los representantes, pero las ventas siempre estarán impulsadas por el ser humano en los niveles más altos”, explicó. “Lo que me encanta de Aomni es que el equipo tiene una combinación única de profunda experiencia técnica y una visión convincente para el futuro que es claramente un equipo humano”.

    La tecnología se basa en los avances recientes en modelos de lenguaje de gran tamaño y agentes de IA, pero Zhang enfatiza que la innovación clave está en la capa de orquestación, más que en los modelos subyacentes. Aomni combina múltiples proveedores de IA, incluidos OpenAI, Anthropic y AI21 Labs, con sistemas propietarios para analizar información específica de la empresa.

    El enfoque de Zhang parece profético dada la reciente explosión de interés en los agentes de IA. Una versión de código abierto del sistema de investigación de Aomni , lanzada poco después de la función similar Deep Research de OpenAI, obtuvo más de 8000 estrellas en GitHub en cuestión de días.

    El futuro de la IA en ventas: más inteligente, más rápida y más centrada en el ser humano

    De cara al futuro, Zhang planea ampliar las capacidades de Aomni con funciones multimodales que permitirán a los equipos de ventas interactuar con la IA a través de voz e imágenes. La empresa apuesta fuertemente por las mejoras continuas en el rendimiento del modelo de IA y la reducción de los costos de computación.

    “Nuestra filosofía de desarrollo es: no hay que apostar contra el modelo”, dijo Zhang. “Muchas empresas dedican tiempo a la optimización, a las medidas de seguridad y al ahorro de costes. Y luego, en dos meses, aparece un nuevo modelo que cuesta la mitad y todo ese trabajo se vuelve inútil”.

    La financiación ayudará a Aomni a cumplir su visión de convertir a cada representante de ventas en un profesional de alto rendimiento mediante la mejora de la inteligencia artificial en lugar de reemplazarla. En un campo tan orientado a las relaciones como las ventas empresariales, Zhang cree que el futuro pertenece a las soluciones que mejoran las capacidades humanas en lugar de automatizarlas.

    “En última instancia, las ventas siguen consistiendo en resolver los problemas de los clientes y construir relaciones”, afirmó Zhang. “Eso no va a cambiar en 10 años. Puedes añadir tanta automatización como quieras, pero esos principios básicos siguen siendo los mismos”.

     

    Fuente.

    VentureBeat (2025, 18 de febrero). Aomni acaba de recaudar 4 millones de dólares para demostrar que la IA puede aumentar las ventas sin reemplazar a los humanos. Recuperado el 20 de febrero de 2025, de: https://venturebeat.com/ai/aomni-thinks-sales-reps-should-spend-more-time-selling-not-stuck-in-spreadsheets/

  • Glápagos, la plataforma de IA que potencia el valor de las industrias de América Latina

    Glápagos, la plataforma de IA que potencia el valor de las industrias de América Latina

    GenIA Latinoamérica presentó la versión beta de Glápagos, una plataforma avanzada de Inteligencia Artificial (IA) diseñada para transformar profundamente las operaciones industriales y empresariales en América Latina.

    Glápagos incorpora algoritmos de Aprendizaje Automático (ML) diseñados para integrar modelos locales de IA, con el fin de reducir costos operativos y de desarrollo, lo que representa un hito significativo en el avance y el desarrollo de esta tecnología en América Latina y el Caribe.

    “Nuestra plataforma no sólo facilita a desarrolladores Open Source generar ingresos mediante colaboraciones estratégicas transfronterizas en cada industria, sino que también optimiza el procesamiento de datos con nuestro nuevo instrumento regional de Aprendizaje Automático, mejorando la competitividad en sectores clave”, afirmó Felipe Castro, CEO de GenIA.

    Glápagos optimiza los procesos comerciales, mejora la toma de decisiones estratégicas, fortalece la atención al cliente y potencia el crecimiento en sectores cruciales para la región como el comercio internacional, los procesos aduaneros y el monitoreo industrial.

    “En Glápagos estamos comprometidos a potenciar el crecimiento de las empresas latinoamericanas, desde la agricultura hasta la manufactura, para que puedan competir en la nueva economía global”, agregó Castro, en conversación con DPL News.

    La plataforma adapta la capacidad de análisis de datos a una arquitectura que facilita la interoperabilidad y está diseñada para tener una integración más fluida y eficiente con diversos sistemas y tecnologías. Este avance es, para sus creadores, “la preparación del escenario para un futuro económico más eficiente y competitivo en América Latina y el Caribe”, detalló el ejecutivo.

    La versión beta está enfocada en fortalecer la autonomía empresarial a través de datos estructurados para potenciar los modelos de IA industriales, facilitar una integración sin fisuras con sistemas escalables, ofreciendo soporte continuo para el desarrollo de soluciones personalizadas y promoviendo la innovación representativa desde México hasta el Caribe y varios países de Sudamérica.

    “Trabajamos desde 2018 en esta estrategia regional de Inteligencia Artificial y surgió como una respuesta a las infinitas oportunidades que tiene América Latina en la materia. Es importante que todas las industrias participen. Lo que queremos ahora es capacitar a la región para que produzca aún más en temas de tecnología e IA”, aseguró el ejecutivo de GenIA.

     

    Fuente.

    DPL News (2025, 18 de febrero). Glápagos, la plataforma de IA que potencia el valor de las industrias de América Latina. Recuperado el 19 de febrero de 2025, de: https://dplnews.com/glapagos-plataforma-de-ia-industrias-america-latina/

  • Latam GPT, el modelo de IA latinoamericano, se lanzará en junio

    Latam GPT, el modelo de IA latinoamericano, se lanzará en junio

    Su desarrollo será liderado por Chile, que alojará y analizará datos entregados por los países en Tarapacá.

    Se presentó Latam GPT, un proyecto de modelo de lenguaje de Inteligencia Artificial (IA) latinoamericano liderado por Chile. Se lanzará formalmente en junio de este año. Será un modelo abierto, en el que los datos de distintos países serán alojados y analizados en el Centro de Supercómputo de la Universidad de Tarapacá, al norte del país.

    El objetivo es desarrollar un modelo de lenguaje que “refleje la riqueza cultural, social y lingüística de la región”. Los responsables son muy claros en que “los modelos de lenguaje actuales, generados principalmente en el hemisferio norte, se construyen a base de entrenamientos que no necesariamente reflejan la cultura, el lenguaje y la historia de América Latina”.

    La iniciativa es el resultado de una colaboración entre 27 instituciones y más de 60 profesionales de América Latina. Será liderada por el Centro Nacional de Inteligencia Artificial (Cenia), con el apoyo del Ministerio de Ciencia, Tecnología, Conocimiento e Innovación de Chile.

    El plan es entregar un paquete de datos entrenados para crear aplicaciones adaptadas a necesidades de cada país, con usos potenciales en sectores como la educación, la generación de políticas públicas, la preservación de lenguas no hegemónicas, entre otros. El gobierno de Chile destacó que de esta forma se podrá “fortalecer la soberanía tecnológica de la región y promover la colaboración científica entre sus países”.

    La ministra de Ciencia, Tecnología, Conocimiento e Innovación de Chile, Aisén Etcheverry, valoró la iniciativa. “Los modelos de lenguaje son los cerebros que hay detrás de la IA. Por eso, contar con modelos de lenguaje que han sido entrenados con la sintaxis, con la cultura y también con el idioma de nuestros países, permite que la Inteligencia Artificial también responda de acuerdo a nuestras culturas, de acuerdo a nuestra forma de ver el mundo”, consideró.

     

    Fuente.

    DPLNews (2025, 17 de febrero). Latam GPT, el modelo de IA latinoamericano, se lanzará en junio. Recuperado el 18 de febrero de 2025, de:  https://dplnews.com/latam-gpt-el-modelo-de-ia-latinoamericano-se-lanzara-en-junio/

  • La IA conductual es nuestra mejor esperanza para combatir las amenazas de la ingeniería social

    La IA conductual es nuestra mejor esperanza para combatir las amenazas de la ingeniería social

    Mientras los líderes empresariales y los expertos dedican tiempo y tinta a debatir sobre la IA en el ciclo de moda, los cibercriminales han estado ocupados lanzando ataques devastadores basados ​​en IA. Los ataques de ingeniería social generados por IA, en particular, incluidos el phishing y la vulneración del correo electrónico empresarial, han aumentado drásticamente, y herramientas de código abierto como ChatGPT (y sus contrapartes maliciosas GhostGPT, FraudGPT y WormGPT) ofrecen a los estafadores sin experiencia tecnológica un nuevo campo de juego para crear ataques. Están ideando sofisticados ataques de correo electrónico increíblemente creíbles a gran escala y apuntando al vector de seguridad más vulnerable de cualquier empresa: los humanos en todos los niveles de una organización.

    “Los seres humanos son los puntos finales más vulnerables y valiosos de la organización”, afirma Evan Reiser, director ejecutivo de Abnormal Security. “La seguridad convencional se centra en proteger la infraestructura, pero mientras haya seres humanos interactuando entre sí en la empresa (especialmente cuando se trata de información confidencial), esos seres humanos seguirán siendo puntos vulnerables que los atacantes pueden intentar explotar. Y ahora es mucho más fácil hacerlo con las herramientas de inteligencia artificial”.

    Para ganar contra el futuro de los ataques generados por IA, el mundo necesita algunas cosas, dice Reiser: primero, una comprensión profunda de los tipos de ataques de ingeniería social que están sucediendo ahora y en el futuro, desde correos electrónicos de phishing personalizados y perfectamente escritos hasta sofisticados deep fakes que pueden imitar la interacción humana casi a la perfección. Segundo, un nuevo enfoque conductual para detener estas amenazas, porque la generación actual de herramientas de detección simplemente no está diseñada para detectar ataques de correo electrónico altamente convincentes y aparentemente realistas. Y tercero, requiere soluciones que funcionen a la velocidad de las máquinas para detectar y defender, lo que es cada vez más importante en una era en la que la brecha laboral en talento de seguridad crece cada día.

    La IA maliciosa y el crecimiento de la ingeniería social

    Los principales delitos cibernéticos actuales apuntan al canal de correo electrónico: el phishing es la principal causa de infracciones y la ingeniería social es la principal causa de pérdidas financieras, dice Reiser.

    “Si quieres ser ingeniero social o estafador, la IA es la mejor herramienta que te ha pasado nunca”, explica. “ChatGPT puede redactar el mensaje perfecto porque entiende cómo funcionan las empresas, puede hacer conjeturas muy precisas sobre, por ejemplo, el lenguaje que utilizan los departamentos de cuentas por pagar para desviar los pagos y puede personalizar fácilmente esa comunicación para cada objetivo”.

    Además, los tipos de ataques que antes llevaban horas de preparación ahora se realizan en segundos. La riqueza y sofisticación de estos ataques de ingeniería social es mayor que nunca, ahora que se generan mediante grandes modelos de lenguaje (LLM) entrenados en el superconjunto de información humana disponible en Internet. Estas herramientas brindan una enorme cantidad de contexto crítico sobre cómo trabaja la gente, cómo respondería alguien en un puesto de trabajo particular en una industria particular en una amplia gama de situaciones, y más.

    “Estas herramientas de inteligencia artificial tienen protecciones integradas: por ejemplo, no te dirán cómo robar dinero de un banco”, dice Reiser. “Pero si dices: ‘Soy un empleado que está en el extranjero y necesito cambiar urgentemente mi información de nómina’, ChatGPT te ayudará a escribir un mensaje convincente que luego se puede utilizar con fines maliciosos”.

    En el pasado, los delincuentes dedicaban mucho tiempo a investigar y perfilar manualmente a los objetivos más valiosos y vulnerables; ahora, la IA ofrece esa capacidad a gran escala. Con la proliferación de las redes sociales, hoy en día todo lo que se necesita es simplemente conectar un perfil de LinkedIn a un modelo de IA y lo que se obtiene es una instantánea del rol, los intereses, los contactos y más de una persona, todo lo cual ayuda a los delincuentes a planificar y ejecutar ataques de manera más efectiva. 

    Mantener la vulnerabilidad humana al frente de la estrategia de seguridad

    Las herramientas de inteligencia artificial más utilizadas que la mayoría de nosotros conocemos hoy en día son los LLM, que generan texto, por lo que no sorprende que los correos electrónicos y mensajes de texto fraudulentos estén aumentando rápidamente. Pero otras formas de generación de medios maliciosos están en el horizonte, incluidas las falsificaciones profundas. Estamos a la vuelta de la esquina de un mundo en el que los avatares de falsificaciones profundas impulsados ​​por IA podrían unirse a las reuniones de Zoom y simular ser un ejecutivo de confianza.

    Además, la generación de imágenes mejora día a día y estamos cerca de un punto en el que parte de este contenido, ya sea texto, imágenes o vídeo, no podrá ser distinguido por los humanos, dice Reiser. El vídeo está casi ahí, volviéndose cada vez más en tiempo real y más interactivo. Si bien todo esto es genial para los “buenos”, debemos recordar que todos los avances en la tecnología conllevan cierto riesgo de que los actores maliciosos los exploten.

    Con el tiempo, cualquier tipo de medio de información que utilicen los seres humanos se convertirá en un vehículo potencial para que los atacantes lo exploten. Las estrategias de ataque actuales están cambiando, ya que los cibercriminales se centran menos en atravesar cortafuegos y más en usar tácticas de engaño para engañar a las personas. En el futuro, los cibercriminales dedicarán mucho menos tiempo a centrarse en la infraestructura y más tiempo a atacar el comportamiento humano mediante ingeniería social, con la ayuda de herramientas como la inteligencia artificial.

    Por supuesto, esto tiene importantes implicaciones para la seguridad, ya que los enfoques tradicionales centrados en el perímetro ya no funcionarán. Claro, puedes bloquear una dirección IP, pero no puedes bloquear el uso del correo electrónico, las llamadas telefónicas o las reuniones de Zoom y esperar operar un negocio eficaz.

    “Los humanos son inherentemente accesibles, pero también inherentemente engañables”, dice Reiser. “Hay una razón por la que todavía necesitamos que los humanos hagan gran parte del trabajo de conocimiento actual porque, a diferencia de los robots, los humanos pueden tomar decisiones y emitir juicios matizados. Desafortunadamente, ese juicio también puede verse influenciado y aprovechado por técnicas de ingeniería social. Y aunque se pueden aplicar parches a los cortafuegos y a los servidores, no se pueden aplicar parches a los humanos”.

    La explosión de la IA está impulsando una nueva ola de delitos cibernéticos, pero también ofrece una oportunidad única para los defensores. En la batalla contra la IA maliciosa, las organizaciones deben aprovechar la IA de calidad para contraatacar y proteger mejor su vulnerabilidad humana.

    Detección de anomalías de comportamiento a gran escala

    La tecnología de los deepfakes todavía está en desarrollo y, en la actualidad, muchos de nosotros podemos distinguir a un ser humano real de un deepfake mediante indicios físicos. Por ejemplo, es posible que puedas distinguir un deepfake de Zoom de tu compañero de trabajo porque conoces sus patrones de habla, tono y gestos generales. Pero, a medida que los deepfakes se vuelvan más sofisticados, detectar estos indicios será cada vez más difícil. Ya nos estamos acercando a ese punto.

    Lo que esto significa para la defensa es que vamos a tener que buscar otras anomalías más sutiles en su comportamiento, como si nuestro “compañero de trabajo” aparece en Zoom en un momento en el que normalmente estaría en línea, o si es un participante habitual en ese tipo de reuniones.

    “Hoy estamos adoptando el mismo enfoque para los ataques por correo electrónico”, añade Reiser. “Si llega un correo electrónico con un indicador conocido de riesgo (como una dirección IP incorrecta o un archivo adjunto o URL malicioso), las herramientas tecnológicas tradicionales pueden detectarlo y filtrarlo automáticamente. Pero la IA maliciosa cambia el guión y permite a los adversarios crear correos electrónicos específicos que omiten por completo estos indicadores y pasan desapercibidos”.

    Esto exige un nuevo tipo de solución que pueda leer señales de comportamiento en lugar de señales de amenaza, y compararlas con una línea de base de comportamiento creada para cada contacto conocido dentro y fuera de la organización. Aquí es donde una buena IA tiene un papel importante que desempeñar, ya que actúa como motor para detectar y analizar con precisión las anomalías de comportamiento, deteniendo los ataques antes de que tengan la oportunidad de alcanzar su objetivo.

    Este enfoque, que protege a las personas mediante el uso de IA para la detección de anomalías de comportamiento, ha demostrado ser muy eficaz para combatir sofisticados ataques por correo electrónico, tanto generados por humanos como por IA. Y el correo electrónico es solo el comienzo: existe un potencial sin explotar para ampliar la seguridad de la IA del comportamiento a un conjunto mucho más amplio de casos de uso de seguridad, a una escala que los analistas de seguridad humanos no pueden igualar por sí solos.

    Si bien los humanos son buenos en el reconocimiento de patrones, trabajan con una cantidad relativamente pequeña de datos. En una empresa con 100.000 empleados, ningún profesional de seguridad podría conocer a cada una de esas personas, qué hacen, cómo trabajan o con quién interactúan, pero la IA sí puede. Puede aplicar ese mismo nivel de intuición y reconocimiento de patrones que los humanos usan, a escala de big data, para tomar decisiones a la velocidad de las máquinas.

    “Es un enfoque extremadamente eficaz y hemos tenido éxito en la seguridad del correo electrónico, así como en otras áreas adyacentes”, afirma Reiser. “Por eso, aunque parezca que hay pesimismo en torno al lado oscuro de la IA, tengo una actitud positiva respecto de su potencial a largo plazo para el bien y de cómo podría transformar la forma en que nosotros, como civilización, luchamos contra el cibercrimen”.

    Cómo llenar el vacío del mercado laboral con seguridad nativa de IA

    Estas nuevas herramientas de inteligencia artificial conductual no solo reducen el riesgo para su personal, sino que también se hacen cargo de gran parte del trabajo tedioso que antes se delegaba en los humanos, como buscar en archivos de registro y procesar datos, lo que en última instancia libera una gran cantidad de tiempo para los equipos de operaciones de seguridad. Eso es importante para la industria de la ciberseguridad en general en este momento, dice Reiser. En un mundo donde millones de puestos de trabajo de seguridad están vacantes, todo mientras los ciberataques se vuelven más avanzados, necesitamos tecnología para llenar el vacío y ayudarnos a avanzar hacia un mundo que sea seguro para todos.

    “Para lograrlo, necesitamos que todas las empresas sean seguras, no solo una o dos empresas que puedan desembolsar más dinero en soluciones de seguridad”, afirma Reiser. “La IA es fundamental no solo para detener nuevos ataques, sino también para ayudarnos a realizar la transición a un paradigma más sostenible en cuanto a cómo nos ocupamos de la seguridad a nivel de civilización”.

     

    Fuente.

    VentureBeat (2025, 4 de febrero). La IA conductual es nuestra mejor esperanza para combatir las amenazas de la ingeniería social. Recuperado el 17 de febrero de 2025, de: https://venturebeat.com/security/behavioral-ai-is-our-best-hope-for-fighting-social-engineering-threats/

  • Se estrena al generador de video con IA Adobe Firefly: ¿la herramienta de IA más “segura en términos de IP” hasta la fecha?

    Se estrena al generador de video con IA Adobe Firefly: ¿la herramienta de IA más “segura en términos de IP” hasta la fecha?

    Adobe está ampliando sus capacidades de inteligencia artificial generativa con el lanzamiento de un nuevo modelo de generación de videos, lo que marca un paso significativo en el esfuerzo de la compañía por brindar a los creadores profesionales herramientas de inteligencia artificial que puedan usar de manera segura en proyectos comerciales.

    La compañía anunció hoy que su modelo de video Firefly está entrando en versión beta pública, ofreciendo herramientas de generación de video impulsadas por IA que, según Adobe, están capacitadas solo en contenido con licencia, un diferenciador clave en el mercado de generación de video con IA cada vez más concurrido.

    “Somos la solución más útil porque somos un modelo compatible con IP y comercialmente seguro”, dijo Alexandru Costin, quien lidera las iniciativas de IA de Adobe , en una entrevista con VentureBeat. “Puedes usar nuestro modelo. No hay riesgo de violación de la propiedad intelectual. Más que nadie, nos apasiona resolver las necesidades de los videógrafos profesionales”.

    Cómo la nueva estrategia de precios de Adobe hace que la generación de videos con IA sea más accesible

    El lanzamiento se produce cuando Adobe informa que su familia de modelos de IA Firefly ha generado más de 18 mil millones de activos a nivel mundial desde su lanzamiento inicial en marzo de 2023. Esta rápida adopción sugiere una fuerte demanda de herramientas de IA que los profesionales creativos puedan usar con confianza en el trabajo comercial.

    Las nuevas funciones de video estarán disponibles a través de la aplicación web Firefly rediseñada de Adobe e integradas en Premiere Pro , el software de edición de video profesional de Adobe. El sistema puede generar videoclips de 1080P a partir de indicaciones de texto o imágenes, con funciones como control del ángulo de la cámara y generación de efectos atmosféricos.

    “Recién saliendo del laboratorio de investigación, esta mañana me estaban mostrando algunas de las increíbles capacidades de generación que están por venir, como aumentar la resolución, hacer superposiciones de video transparentes… hacer video en tiempo real”, reveló Costin, indicando la hoja de ruta de Adobe para la tecnología.

    Adobe está introduciendo planes de precios escalonados a partir de $9,99 mensuales para el plan Estándar, que incluye 2000 créditos de video/audio, suficientes para aproximadamente 20 generaciones de video de 1080p de cinco segundos. Un plan Pro de $29,99 ofrece 7000 créditos.

    Dentro de la estrategia de Adobe para dominar la creación de videos profesionales con inteligencia artificial

    La integración con las herramientas creativas existentes de Adobe parece ser una ventaja estratégica clave. Kylee Pena, gerente senior de marketing de productos de Adobe, demostró cómo los editores pueden usar la tecnología para llenar espacios vacíos en las líneas de tiempo de los videos o generar efectos atmosféricos como la nieve y luego ajustar los resultados sin problemas utilizando las herramientas profesionales de Premiere Pro.

    “Como estoy en Premiere Pro, también tengo muchas herramientas adicionales de nivel profesional, incluidas herramientas de IA que hemos tenido durante un tiempo, como la combinación de colores”, explicó Pena durante una demostración.

    El lanzamiento se produce en un momento en que la competencia se intensifica en el espacio de generación de video con inteligencia artificial, con productos recientes como Sora de OpenAI que generan una atención significativa. Adobe apuesta a que su enfoque en la seguridad comercial y la integración del flujo de trabajo profesional lo ayudarán a destacar en un mercado cada vez más concurrido.

    Para garantizar la transparencia, Adobe incluirá Content Credentials , un tipo de certificación digital, en todo el contenido de video generado por IA. Esto se alinea con el liderazgo de la empresa en la Content Authenticity Initiative , que tiene como objetivo proporcionar herramientas de verificación para el contenido digital.

    Marcas globales como Dentsu , Gatorade y Stagwell ya están probando la tecnología en versión beta, lo que sugiere una posible adopción por parte de empresas. Adobe planea introducir un plan Premium diseñado para usuarios profesionales de alto volumen en un futuro cercano.

    Este avance es una muestra del enfoque estratégico de Adobe en mantener su posición como proveedor de referencia de herramientas creativas para profesionales, al tiempo que se adapta a la revolución de la inteligencia artificial que está transformando la industria creativa. Con el 85 % de los proyectos en el reciente Festival de Cine de Sundance utilizando Adobe Creative Cloud, la empresa parece estar bien posicionada para cerrar la brecha entre los flujos de trabajo creativos tradicionales y las capacidades emergentes de la inteligencia artificial.

     

    Fuente.

    VentureBeat (2025, 12 de febrero). Se estrena el generador de video con IA Adobe Firefly: ¿la herramienta de IA más “segura en términos de IP” hasta la fecha? Recuperado el 17 de febrero de 2025, de: https://venturebeat.com/ai/adobe-firefly-ai-video-generator-debuts-the-most-ip-safe-ai-tool-yet/