El martes, Adobe lanzó un asistente de IA en sus aplicaciones Reader y Acrobat que puede ofrecer una visión general de los PDF y otros documentos y responder a preguntas sobre ellos. El asistente de IA, que aún está en fase beta, ya está disponible en Acrobat. "En los próximos días o semanas...
SmolVLM es un pequeño modelo multimodal con 2.000 millones de parámetros que puede aceptar cualquier combinación de imagen y texto de entrada y generar texto de salida. Tras lanzar en julio el modelo de lenguaje ligero SmolLM, la plataforma de desarrollo de apps de IA Hugging Face...
Perplexity ha anunciado hoy (14 de febrero) el lanzamiento de Deep Research, una función diseñada para ayudar a los usuarios a ahorrar mucho tiempo y realizar investigaciones y análisis en profundidad en su nombre. Cuando un usuario realiza una consulta Deep Research, Perpl...
Google podría actualizar y renombrar Bard a Gemini la próxima semana para coincidir con su estrategia de simplificación y las nuevas integraciones de modelos de IA. Recientes filtraciones sugieren que Google podría estar a punto de realizar una importante actualización de su herramienta de IA Bard tan pronto como la próxima semana. Aunque no se ha confirmado oficialmente, la...
30 de enero de 2025 - Microsoft afirma que el modelo R1 de DeepSeek ya está disponible en su plataforma de computación en la nube Azure y en las herramientas de GitHub para desarrolladores en general. Microsoft también dijo que los clientes pronto podrán utilizar los modelos R1 de DeepSeek en sus Copi...
Nuevos modelos de DeepSeek: V3 y R1 frente a Claude 3.5 Sonnet, ¿quién es mejor? DeepSeek ha lanzado recientemente dos nuevos modelos en la plataforma Cursor: DeepSeek V3 y ...
Claude.ai ha lanzado recientemente una nueva herramienta de análisis diseñada para mejorar sus capacidades de procesamiento y análisis de datos. La introducción de esta herramienta marca la transformación de Claude como asistente de analítica de datos, permitiéndole escribir y ejecutar código JavaScript que permite...
¡Gracias por vuestra paciencia! Nos complace anunciar que la versión de escritorio de ComfyUI, anteriormente conocida como V1, ¡ya está disponible para los usuarios beta! Descargar ComfyUI Desktop - Windows Descargar ComfyUI Desktop - Mac Acerca de la instalación...
La tecnología OCR es capaz de convertir la información textual de una imagen en datos de texto editables y procesables. En pocas palabras, reconoce y extrae texto de las imágenes. A continuación, repasaremos los 10 proyectos de código abierto de OCR con mayor número de estrellas en GitHub para ofrecerte una visión en profundidad de...
Hoy ampliamos las últimas tecnologías de Bard -incluido Gemini Pro en Bard- a más idiomas y regiones. Además, hemos añadido nuevas funciones de generación de imágenes para dar aún más vida a su creatividad. Disponible en todos los idiomas y localidades compatibles para...
Recientemente, Google Search lanzó una función experimental en su experiencia generativa (SGE) llamada "Modo IA" (AI Mode), que está impulsada por el Big Model Gemini 2.0, capaz de manejar consultas complejas y con potentes capacidades de razonamiento, directamente...
¡Por fin está aquí! ~ Copiloto en Excel con Python Análisis Avanzado Python Análisis Avanzado de Datos en Excel está finalmente disponible. Llevaba esperando este botón desde hace una semana, y la semana pasada Microsoft...
La competencia en el campo de la tecnología es cada vez mayor. Recientemente, el equipo de la startup china de IA DeepSeek actualizó su modelo base V3 de forma discreta y sin publicidad a gran escala, y la nueva versión, DeepSeek-V3-0324, se ha lanzado silenciosamente en H...
Una creciente tendencia de la IA en la industria del entretenimiento para adultos de Estados Unidos está atrayendo mucha atención. Esta vez está protagonizada por una estrella que lleva años luchando en la industria.Chloe Amour, de 33 años, ha decidido ceder parte de su trabajo a una doble virtual vendiendo su imagen a una empresa de IA. Esta...
Deep Research es una función para miembros de Gemini, tras la sincronización 2.0, que actualmente no está disponible para usuarios nacionales. Como creador de contenidos que a menudo necesita investigar y redactar informes, hace poco probé la nueva Gemini de Google....
OpenAI ha lanzado recientemente una versión beta de la aplicación de escritorio ChatGPT Windows para que los usuarios de ChatGPT Plus, Enterprise, Team y Education puedan probarla. Esta nueva aplicación está diseñada para ofrecer una experiencia más sencilla y eficiente a los usuarios para...
JetBrains, proveedor de herramientas de desarrollo de software, acaba de anunciar que ha puesto en código abierto la versión base de Mellum, su modelo de lenguaje diseñado específicamente para la finalización de código, y la ha hecho disponible en la plataforma Hugging Face. El objetivo es impulsar la transparencia de la IA en el desarrollo de software...
Si estás buscando herramientas de Inteligencia Artificial (IA) asequibles que te ayuden a comenzar el viaje de hacer IA todos los días, desde el correo electrónico a la producción de vídeo, es fácil hacerlo. Esta guía de inicio rápido presenta 10 asombrosos servicios y plataformas de IA que te evitarán gastar tus...
Recientemente, Satya Nadella, CEO de Microsoft, fue entrevistado en el podcast de Dwarkesh Patel para hablar de los últimos avances de Microsoft en Inteligencia Artificial (IA) y Computación Cuántica, así como de sus ideas sobre el futuro de la industria....
La herramienta de Google para tomar notas con IA, NotebookLM, ha recibido recientemente una actualización, y su camino es cada vez más claro a medida que avanza para convertirse en una importante herramienta de gestión del conocimiento y productividad personal. Las últimas novedades incluyen la compatibilidad con la transmisión de audio en varios idiomas, incluido el chino, y el próximo lanzamiento de...
OpenAI ha puesto sus miras esta vez en las ciencias de la vida, asociándose con Retro Biosciences, una empresa dedicada a prolongar la vida útil, para lanzar un nuevo modelo de IA, el GPT-4b Micro. Esta innovadora tecnología podría remodelar las reglas del diseño de proteínas, con el objetivo de...
Si ha utilizado Conch APP, es posible que haya utilizado su clonación de voz, el efecto es muy bueno, pero sólo se puede utilizar como un asistente de voz en la APP. Esta vez, Conch AI video versión internacional sitio web oficial, nuevo canal de "Audio", usted puede fácilmente clonar su propia voz. Volver a la interfaz principal de texto a voz ...
Múltiples organizaciones de ciberamenazas patrocinadas por el Estado han empezado a escribir correos electrónicos de phishing utilizando ChatGPT. Un informe publicado por Microsoft junto con OpenAI afirma que los hackers están utilizando modelos lingüísticos a gran escala (LLM) como ChatGPT para mejorar sus estrategias de ciberataque. Según el estudio,...
El repentino anuncio por parte de OpenAI de una reorganización de la empresa este viernes por la tarde nos pilló un poco desprevenidos no sólo a Musk, sino también a nosotros. Según el último comunicado de OpenAI, la nueva ronda de reestructuración organizativa gira en torno al conflicto entre las organizaciones con y sin ánimo de lucro. En el lanzamiento de ChatGPT...
La nueva versión de Copilot es, en serio, bastante difícil de usar. Es extravagante y no tiene sentido. Los resultados de la consulta es también ninguna página de referencia pertinente. Y el signo "+" aquí para cargar sólo subir imágenes, que para muchos que quieren usar copiloto para hacer preguntas acerca de los archivos PDF, simplemente...
Dirección de tubo, visible tras la ciencia ... AInfinite.TV es el primer canal que ofrece contenidos generados por Inteligencia Artificial 24/7, presentando una fiesta audiovisual sin fin, navegando por las fronteras de la creatividad de la IA y explorando la revolución del entretenimiento digital.
Introducción general Transformers.js es una biblioteca JavaScript proporcionada por Hugging Face diseñada para ejecutar modelos de aprendizaje automático de última generación directamente en el navegador, sin soporte de servidor. La librería funciona conjuntamente con la plataforma Hugging Fa...
5 de mayo de 2025 OpenAI, líder en inteligencia artificial, ha confirmado un notable acuerdo: la adquisición de la startup de herramientas de codificación de IA Windsurf por unos 3.000 millones de dólares. No solo es el mayor acuerdo de OpenAI hasta la fecha...
Perplexity AI, una empresa de investigación en inteligencia artificial, acaba de anunciar que ha puesto oficialmente en código abierto su última obra maestra, el modelo de gran lenguaje R1-1776. El modelo se basa en la optimización profunda de DeepSeek-R1 y pretende corregir el sesgo del modelo original a la hora de tratar temas delicados....
La función copilot pages es muy potente y es lo más destacado del lanzamiento de Microsoft este año: hasta ahora, solo estaba disponible para los usuarios con una suscripción a copilot para Microsoft 365. Hoy, la función copilot pages está oficialmente...
Observaciones recientes sugieren que la inteligencia artificial (IA) generativa se está colando en la vida cotidiana de las personas, con escenarios de aplicación que van mucho más allá de lo que inicialmente se pensaba comúnmente como asistencia laboral. Kunal Shah, fundador de la empresa fintech india CRED, mencionó en una cumbre celebrada en abril que hasta cinco a...
Si cree que utilizar las últimas herramientas de Inteligencia Artificial (IA) le va a salir caro, le alegrará saber que existen varias herramientas de IA totalmente gratuitas. Muchas de ellas ofrecen pruebas gratuitas continuas, lo que le permite probar las capacidades de estas herramientas de IA antes de gastar el dinero que tanto le ha costado ganar...
Z Destacados La intuición funciona en aproximadamente la mitad de los trabajos. Por ejemplo, cuando hay una dirección de producto clara y sólo se están haciendo los últimos ajustes, tratando de entender a los usuarios objetivo y el problema exacto que hay que resolver, la intuición es útil porque la situación se acerca más al proceso tradicional de lanzamiento de un producto. Pero en el caso del artículo...
Mem0 ha publicado un informe de investigación en el que afirma que sus productos han alcanzado niveles líderes del sector (SOTA) en tecnología de memoria corporal inteligente de IA y han superado a puntos de referencia específicos, incluido Zep, en...
Recientemente, Amazon ha estado haciendo muchos movimientos en el espacio de la IA, no solo actualizando su asistente de voz para consumidores Alexa, sino también creando un nuevo equipo centrado en agentes de IA dentro de AWS. Esta serie de movimientos demuestra que Amazon está preparando activamente el campo de los agentes de IA...
Con el rápido desarrollo de la tecnología del cuerpo inteligente (Agente), el protocolo MCP (Model Communication Protocol) se ha convertido gradualmente en el estándar de comunicación principal en el ecosistema del cuerpo inteligente debido a su facilidad de uso y eficiencia. Cada vez son más los editores de código de IA...
Introducción completa Xorbits Inference (o Xinference para abreviar) es una biblioteca potente y versátil centrada en proporcionar despliegue y servicios distribuidos para modelos lingüísticos, modelos de reconocimiento del habla y modelos multimodales. Con Xorbits Inference...
En el campo de la Inteligencia Artificial (IA), los Grandes Modelos Lingüísticos (LLM) están evolucionando rápidamente, demostrando capacidades asombrosas en la generación de textos e interacciones conversacionales. Sin embargo, ¿cómo integrar el poder de la IA en escenarios de aplicación del mundo real, de modo que no se trate solo de "conversar", sino...
Muchos de ustedes habrán oído bromas sobre robots que se apoderan del mundo. En su día, estos chistes se basaban en una realidad aparentemente inalcanzable, pero hoy se esconden tras ellos verdaderos temores. La inteligencia artificial (IA) ya no es un concepto de ciencia ficción, sino una tecnología real y cada vez más poderosa. A pesar de que...
PRINCIPIOS DE DISEÑO DEL SISTEMA Los objetivos de optimización del servicio de razonamiento DeepSeek-V3/R1 son: mayor rendimiento y menor latencia. Para optimizar estos dos objetivos, DeepSeek emplea la solución de paralelismo experto entre nodos (EP). En primer lugar, el EP escala significativamente ...
Tras el lanzamiento el mes pasado de Gemma 3, un modelo abierto de nueva generación, Google ha ampliado recientemente su ecosistema de modelos con el lanzamiento de una nueva versión optimizada para Quantization-Aware Training (QAT). Gemma...
Recientemente, Liang Lei, responsable del motor de conocimiento de Ant Group, compartió en la Conferencia Bund los avances del trabajo del equipo en los últimos seis meses en la investigación de la fusión del grafo de conocimiento y el modelo de lenguaje a gran escala, y lanzó KAG, el primer marco de servicios de mejora del conocimiento para dominios profesionales en China, que ayuda a construir un cuerpo de inteligencia profesional con la mejora del conocimiento....
Introducción general NVIDIA AI Blueprint: PDF to Podcast es un proyecto de código abierto desarrollado por NVIDIA para convertir documentos PDF en atractivos contenidos de audio. El proyecto aprovecha NVIDIA NIM (NVID...
OpenAI acaba de anunciar el lanzamiento de su API de modelos de audio de nueva generación, cuyo objetivo es capacitar a los desarrolladores para crear asistentes de voz más potentes e inteligentes. Esta iniciativa se considera un gran avance en el campo de la tecnología de interacción por voz, y señala que la interacción por voz entre humanos y ordenadores dará paso a una nueva fase más natural y eficiente. El lanzamiento del paquete...