ChatGPT lanza su modo de voz avanzado con visión en tiempo real

Esta nueva capacidad permite grabar vídeos en vivo o compartir tu pantalla con la IA para interactuar con ella o realizar preguntas.
Sobre un fondo degradado azul se ven dos móviles que muestran el funcionamiento del modo de voz avanzado con visión de ChatGPT
13 de diciembre de 2024
Copiar enlace

Durante 12 días, OpenAI está llevando a cabo su propia versión del calendario de adviento en el que las sorpresas son noticias relacionadas con sus productos. La última de estas ha sido la presentación de la integración de capacidades de visión en el modo de voz avanzado de ChatGPT.

Por el momento, esta capacidad solo estará disponible en la aplicación de ChatGPT y ya ha comenzado a desplegarse para usuarios y usuarias de los planes Plus, Team o Pro. Por su parte, las personas suscritas a los planes Enterprise o Edu deberán esperar hasta enero para disfrutar de el modo de voz avanzado con visión.

Sin embargo, en lo que respecta a la integración de esta función en territorios como la Unión Europea, Suiza, Islandia, Noruega o Liechtenstein, OpenAI ha declarado que lo harán “lo antes posible”. Seguramente este retraso esté relacionado con la obligación de asegurar el cumplimiento de la normativa europea antes de lanzar un producto como este al mercado.

Visión en tiempo real para una mejor interacción

Las nuevas capacidades de visión permitirán que puedas compartir vídeo grabado en directo o una grabación de pantalla en directo con el chatbot de la app de ChatGPT. La IA será capaz de comprender el entorno y elementos que estás enfocando y responder a preguntas o ejecutar acciones en función de estos datos visuales.

Representantes de OpenAI realizaron una demostración en directo durante la retransmisión del anuncio de esta novedad. Por ejemplo, se le pidió a ChatGPT que guiase a Rowan, un investigador de OpenAI, indicándole los pasos a seguir para que preparase café en directo.

Cómo usar el modo de voz avanzado con visión de ChatGPT

Para utilizar la visión en el modo de voz avanzado se deben seguir los siguientes pasos:

  1. Abre la app de ChatGPT y abre una conversación.
  2. Clica en el botón del “modo de voz” situado en la parte inferior derecha de la ventana de mensajes de ChatGPT.
  3. Una vez dentro de la vista del modo de voz puedes:
    1. Seleccionar el icono de la cámara de vídeo y comenzar a hablar con ChatGPT como si estuvieses realizando una videollamada en directo
    2. Seleccionar el menú desplegable de tres puntos y clicar en “share screen” para compartir tu pantalla en directo. También puedes marcar “upload foto” o “take photo”.

ChatGPT celebra la Navidad con su “modo de voz Papá Noel”

La integración de la visión en el modo de voz avanzado fue una sorpresa que no llegó sola, ya que OpenAI aprovechó ese mismo día para presentar una novedad de lo más navideña: el “modo Papá Noel”. Esta función permite seleccionar la voz de Papá Noel al usar el modo de voz, de forma que puedas interactuar con este afable personaje.

Para utilizar el “modo de voz Papá Noel” solo hay que clicar en el icono de copo de nieve que aparece junto a la barra de mensajes en la esquina inferior derecha. Otras opciones son acceder a la configuración de ChatGPT o, desde dentro del propio modo de voz, usar el selector de voces ubicado en la esquina superior derecha.

Foto: OpenAI

Otros artículos de

Publicado por

Content Manager en Marketing4eCommerce
"Content Manager" en Marketing4eCommerce, que traducido quiere decir: redactora, revisora, y fan absoluta de generar imágenes con IA.

Suscríbete a M4C

Únete a nuestro canal de Telegram

¡Todo lo que necesitas saber!

Apúntate a nuestra newsletter y recibe gratis en tu correo nuestros mejores artículos sobre eCommerce y marketing digital.