Page 19 - E-Book Articulos
P. 19
impresionante, pero si la voz no está sincronizada con
manipulaciones visuales difíciles de detectar, lo que los labios o el sonido ambiente no coincide con las
exigirá el desarrollo de herramientas de verificación, acciones mostradas, el espectador percibe la
el futuro de los videos generados por inteligencia artificialidad de inmediato.
artificial no solo apunta a una mejora en la calidad
técnica, sino a una redefinición completa del concepto Por ello, los sistemas más modernos combinan
de creación audiovisual. generación visual con inteligencia artificial aplicada al
audio, integrando música, diálogos y efectos sonoros
El límite entre creador y espectador tenderá a de forma coherente con la escena. Esta fusión entre
desaparecer, dando paso a una era donde la narrativa imagen y sonido eleva la experiencia inmersiva y
será colaborativa, interactiva y moldeada por la acerca aún más la producción artificial al estándar
inteligencia artificial. Si las tendencias actuales cinematográfico.
continúan, hacia finales de esta década los videos
generados por IA serán una parte cotidiana del Las tecnologías que han permitido alcanzar este nivel
entretenimiento, la comunicación y la educación, de realismo incluyen los modelos de difusión, que
transformando la manera en que la humanidad crea, mediante procesos de eliminación de ruido generan
cuenta y experimenta historias [7]. imágenes y videos con un nivel de detalle sin
precedentes. También destacan las redes generativas
1.2 Realismo y Calidad adversarias, que desde su creación entrenan sistemas
El realismo y la calidad en los videos generados por capaces de producir imágenes que “engañan” a un
inteligencia artificial representan uno de los mayores discriminador entrenado para detectar falsificaciones,
avances en la revolución audiovisual impulsada por la perfeccionando así su realismo.
tecnología [8]. El concepto de realismo se refiere a la Por su parte, los modelos multimodales integran texto,
capacidad de los sistemas de IA para crear imágenes imagen y video, de modo que una simple descripción
en movimiento que resulten creíbles, naturales y en lenguaje natural puede transformarse en un clip
coherentes con las leyes físicas y la percepción visual altamente realista. Finalmente, técnicas como
humana.
los campos de radiancia neuronal o NeRF han
mejorado la representación tridimensional de escenas,
No se trata únicamente de reproducir escenas con alto
detalle visual, sino también de mantener la coherencia aportando profundidad, movimiento de cámara fluido
temporal entre los fotogramas, la naturalidad de los y reflejos realistas.
movimientos, la sincronización del sonido y las El impacto de este realismo en la industria es profundo.
expresiones humanas, así como la fidelidad de los En la producción cinematográfica se utilizan videos
entornos. Según [9]. En los últimos años, los progresos generados por IA para crear efectos visuales, doblajes
en modelos de difusión, redes generativas adversarias o incluso escenas completas sin necesidad de rodaje
y arquitecturas multimodales han permitido alcanzar físico, reduciendo costos y tiempos. En publicidad, las
niveles de calidad visual que rivalizan con los de la marcas aprovechan esta tecnología para generar
producción cinematográfica profesional.
anuncios hiperrealistas con modelos virtuales o
escenarios imposibles [11].
El realismo visual depende de varios factores
interrelacionados. La resolución y el nivel de detalle En educación y capacitación, los videos creados por IA
son esenciales, ya que los sistemas más avanzados permiten presentar contenido con instructores digitales
pueden generar videos en alta definición con texturas, capaces de hablar en múltiples idiomas y mostrar
luces y sombras que imitan fielmente la realidad. La expresiones humanas convincentes. También en los
coherencia temporal es igualmente fundamental, pues videojuegos y entornos de realidad virtual, el realismo
garantiza que cada fotograma mantenga continuidad generado por IA ha permitido la creación de mundos
con el siguiente, evitando distorsiones o parpadeos que inmersivos donde los personajes actúan con gestos y
rompan la ilusión de movimiento natural [10].
emociones casi humanos. A pesar de los avances,
Además, la física simulada por la IA desempeña un persisten limitaciones técnicas.
papel clave, ya que la forma en que un objeto cae, Los modelos todavía pueden fallar en la representación
rebota o proyecta su sombra determina en gran medida precisa de interacciones físicas complejas o en la
la percepción de verosimilitud. En el caso de los seres consistencia narrativa en videos largos. También
humanos o avatares digitales, el desafío se amplifica: suelen aparecer errores en detalles finos como el
la inteligencia artificial debe reproducir expresiones movimiento de las manos, los ojos o las transiciones
faciales, microgestos y movimientos corporales que entre expresiones. Además, la generación de video de
transmitan emociones y naturalidad.
alta calidad requiere una enorme capacidad
Modelos como los de Synthesia o DeepFaceLab han computacional y consumo energético.
logrado avances notables en este ámbito, generando Sin embargo, la tendencia actual apunta a que, en
rostros y voces que, a simple vista, pueden confundirse pocos años, los videos generados por IA serán
con los de una persona real. La calidad de los videos prácticamente indistinguibles de los reales, no solo en
generados por IA también depende de la integración
audiovisual. Un video puede ser visualmente
19

