Curated by: Luigi Canali De Rossi
 


30 April 2010

Los Metadatos De Vídeo Y Su Importancia Como Estrategia Principal Para Los Editores De Vídeos Online - Parte 2

Los metadatos de vídeo pueden hacer que tengas éxito en tu trabajo con vídeos online. Mediante la comprensión de cómo son los metadatos de vídeo y cómo deben ser utilizados, puedes afectar significativamente la manera en que tu contenido de vídeo es administrado, distribuido y encontrado online.

metadatos_de_videos.jpg
Crédito de la foto: badboo

Pero, ¿deben los metadatos ser escritos por las personas, al igual que la mayor parte del proceso de producción de vídeo, o deben ser automatizados? ¿Cuáles son los costos involucrados en esto?

Aquí está la segunda parte de este informe (Parte 1)

Intro por Daniele Bazzano

 

 

La Moneda Del Vídeo En Internet - Parte 2



La Ciencia - y el Arte - de la Creación de Metadatos

Video_metadata_key_strategic_importance_for_online_video_publishers_id614608.jpg

Dada la importancia de los metadatos para el video por Internet, una consideración cuidadosa debe darse a lo que constituye un buen metadato.

Mientras que para permitir la búsqueda de vídeo y la interactividad necesaria para experiencias de calidad en Internet, los metadatos necesitan no sólo mantener la intención original del video, sino también mejorar la experiencia de una manera no posible con la distribución de vídeo tradicional. Más allá de eso, los metadatos pueden mejorar la experiencia de video por Internet de forma aún no concebida.

<Los metadatos de autoría es un tema en sí mismo y el tema de muchos documentos técnicos e iniciativas de la industria que están fuera del alcance de este documento.

Con el fin de transmitir la esencia de lo que constituye metadatos de cualidad, vamos a confiar en un simple ejemplo ilustrativo que se ocupa de una consideración común en la autoría de metadatos - deben los metadatos ser escritos por la gente, al igual que la mayor parte del proceso de producción de vídeo, o ser automatizados.

 

Ejemplo - Metadatos Manuales y Automatizados

Video_metadata_key_strategic_importance_for_online_video_publishers_figure_4.gif
Figura 4

Consideremos una búsqueda por una aparición cameo de Brad Pitt en un episodio de la comedia ' Friends", de NBC. Suponiendo que un número de fanáticos de Friends no hayan gastado su valioso tiempo publicándolo YouTube, esto requiere un par de cosas. Requiere de metadatos para el episodio en el que Brad Pitt aparece.

Dada su fama, lo más probable es que Brad Pitt aparezca en los metadatos de la descripción del contenido creado durante la producción. Estos datos han sido proporcionados por alguien del equipo de producción.

A partir de entonces, es posible que un usuario que busque este episodio pueda verlo entero, y así los metadatos habrán cumplido con su trabajo. Lo más probable es que el usuario pueda ver sólo las escenas donde Brad Pitt aparece en el episodio. Dado que el vídeo final envasado no tiene el código de tiempo original que los editores utilizaron para editar el vídeo, esta información se pierde y debe ser recreada.

Con el fin de buscar Brad Pitt en el episodio, un avanzado software de reconocimiento facial puede ser entrenado para reconocer Brad Pitt. Suponiendo que pueda hacer el trabajo, identificará el primer cuadro y los cuadros subsiguientes en que Brad Pitt aparece. Un software para detección de cambios de escena podrá ser utilizado para detectar un cambio de escena antes del primer cuadro con Brad Pitt y que marca el inicio del clip . Se puede detectar el cambio de escena siguiente para marcar el final del clip.

En teoría, este parece ser el trabajo - siempre que la tecnología funcione correctamente. Las obras más desarrolladas de esas tecnologías - discurso al texto, son casi 100% fiables (generalmente se considera que un 95% en el mejor de los casos, aunque se dice que el 50% en escala aún mayor), así que la primera preocupación sería si la tecnología ha funcionado en la identificación de Brad Pitt. Puesto que él es una cara conocida, asumamos que el sistema puede ser rigurosamente entrenado en este caso ejemplar, pero sigue siendo una posibilidad menos que perfecta. Por otra parte, entrenar a los sistemas para el reconocimiento de la voz, la cara y de objetos lleva mucho tiempo, la inversión inicial requiere enorme cantidad de tiempo y recursos.

La segunda preocupación es si el clip o clips resultantes se dejen ver desde un punto de vista de la experiencia cinematográfica:

  1. ¿Son los cambios de escena correctos, además de precisos?
  2. ¿Los límites de la escena han interrumpido el diálogo?
  3. ¿Conocemos el contexto en el que Brad Pitt se introduce en el espectáculo

Estas son sólo algunas de las consideraciones.

Es concebible que un mejor lugar para iniciar el clip sea el escenario previo, o tal vez más adelante en la escena. Una persona puede tomar esta decisión muy rápida e intuitiva, mientras que la automatización puede llevar no sólo a un resultado no muy óptimo, sino que también puede ser de una burda inexactitud. Por último, una persona tendría que revisar y posiblemente modificar el trabajo de una máquina.

Para hacer un punto mejor en la creación de metadatos automatizados frente a los manuales, considera lo siguiente:

  1. Estábamos tratando de localizar a Ted Danson en su ropa de Hellboy o Danny DeVito en su ropa de Pingüino, es probable que el reconocimiento facial estaría irremediablemente perdido, ya que incluso los seres humanos a veces no pueden reconocer los rostros detrás de los trajes. Sin embargo, un ser humano se adapta mejor a esta tarea.
  2. Más contrastes dramáticos entre los metadatos manuales y automatizados pueden ser demostrados en la programación deportiva. Transmitir a los deportes es combinar planos, largos ángulos de cámara, con movimientos rápidos y transiciones rápidas de la cámara. La combinación de esto junto con el hecho de que los jugadores no están siempre frente a la cámara hace que sea imposible aplicar las tecnologías de reconocimiento facial para crear clips de forma automática. Crear clips de los tiros de tres puntos de Lebron James o de los touchdowns de Tom Brady sólo pueden ser hechos por una persona.

En cualquier caso, dada la precisión de menos de 100% de los sistemas automatizados, ya se trate de reconocimiento de voz, imagen o reconocimiento facial, detección de cambio de escena y tal, los resultados finales de calidad se derivan a través de la autoría humana durante el uso de la automatización para facilitar el proceso.

Una segunda consideración importante en la autoría de los metadatos de video por Internet se discute a continuación es sin embargo, imposible de automatizar.

 

El Video Es Más Que la Suma de Sus Partes

Video_metadata_key_strategic_importance_for_online_video_publishers_id231224.jpg

Más allá del obvio reconocimiento del objeto, de la cara y de la voz, ya sea manual o automático, el video es un medio de comunicación complejo.

La combinación creativa de imágenes, sonidos, habla, emociones y narrativa inherentes a cualquier de vídeo lo hace así. Deducir el atractivo intrínseco de un programa de vídeo en Internet para diferentes usuarios sólo puede ser hecho por la gente.

En el ejemplo anterior "del sereno paisaje marino", imagina que la música sea la de Tiburón, pero el video un comentario cómico en audio que satiriza el miedo (irracional) de los tiburones.

La emoción asociada con el video es el humor, en comparación con el miedo. El comentario podría ser educativo acerca de los tiburones, la intención es la de informar a diferencia de la emocionar. La gente puede establecer de inmediato esa intención y capturarlo en los metadatos para sus audiencias.

Entre las implementaciones exitosas de metadatos mencionadas anteriormente, los sistemas de navegación alternativos - que incluyen el desplazamiento a través de archivos de vídeo diferentes - es uno donde se puede aplicar la imaginación humana para crear nuevas experiencias duraderas para el usuario, que no sean posibles con esquemas de metadatos automatizados .

Considera la posibilidad de programas con varios episodios, como la serie Lost, o reality shows con muchos participantes y eventos como, American Idol y Survivor, o eventos deportivos - donde los usuarios pueden aspirar a recuperar la experiencia del programa original de muchas maneras diferentes.

Consideremos los siguientes ejemplos:

  • Lost: Sawyer + Kate + Escenas románticas: crea una lista de reproducción de todos los episodios de escenas en las que Sawyer y Kate están juntos de modo romántico
  • American Idol: Temporadas 01/09 + Ganadores Finales: crea una lista de reproducción de los resultados de todos los ganadores de American Idol
  • Deportes: Tom Brady + pases de touchdown: crea una lista de reproducción de todos los touchdowns de Tom Brady en los partidos de NFL.

Si bien los ejemplos anteriores sean hipotéticos, los metadatos permiten fácilmente a que los usuarios apliquen esencialmente el "álgebra de Boole" (similar a lo que los usuarios hacen en las búsquedas en la web) para generar adjuntos a través de nuevas experiencias. En ausencia de esos metadatos, los programadores necesitan editar y recodificar clips individuales, lo que es una tarea formidable, si no imposible. También es imposible crear tales listas de reproducción dinámicas y de esquemas alternos de navegación con éxito utilizando clips individualmente codificados.

La imaginación humana se mantiene por delante de la tecnología.

Elegir los metadatos por lo que permiten las tecnologías automatizadas es inherentemente más limitante que generar los metadatos de forma manual, donde en el vídeo se pueden etiquetar de muchas maneras diferentes, y los campos de metadatos pueden ser creados y gestionados de cualquier manera que un operador humano conciba necesaria, intuitivo, probable o incluso imaginario.

 

Los Metadatos Tienen El Menor Costo Entre Todos Los Elementos Del Vídeo

Video_metadata_key_strategic_importance_for_online_video_publishers_id119932.jpg

Una de las cuestiones de fondo es el costo de la creación de los metadatos y si un método es más costo efectivo que otro. Esto se reduce a la cuestión de la calidad versus la cantidad.

Si la precisión y la experiencia del usuario final es secundaria al tratamiento de grandes volúmenes de video para un índice de búsqueda básica, a continuación, la automatización es probable que ayude a resolver el problema mejor que un ser humano.

La automatización, como el cambio de la escena y el reconocimiento del habla son muy útiles en la fase de producción de vídeo. Esto es porque hay un montón de imágenes en bruto y las personas que manipulan el video son profesionales. Su tarea es administrar la producción de video, no consumir o monetizar el video.

En el caso de los investigadores que buscan escanear bibliotecas de video, el mismo argumento se aplica - la experiencia de video es secundaria al objetivo de localizar un vídeo o un clip dentro de un vídeo.

A riesgo de ser redundante, vamos a (re) visitar algunas de las aplicaciones comerciales de vídeo:

  • Buscar sólo un archivo o escena
  • Crear, visualizar y compartir clips virtuales y listas de reproducción
  • Insertar puntos para publicidad y lógica de publicidad
  • Generar reastreo detallado del uso y notificación de datos

La creación automatizada de metadatos para cada una de estas aplicaciones ejemplares requiere procesos dispares en su mayoría, en contraste con la creación humana que permite a todos los metadatos necesarios sean creados en una sola pasada. El costo de los metadatos de autoría humana, por lo tanto, no es sólo inferior a los metadatos automatizadas, sino que también es insignificante en comparación con los costes de producción globales del vídeo.

Los metadatos de autoría humana normalmente pueden ser logrados en mucho menos tiempo que la duración del vídeo.

La gente no tiene que ser entrenada para reconocer el lenguaje o imágenes como lo hacen las máquinas, lo que reduce la inversión inicial de tiempo y recursos.

Por último, los metadatos de autoría humana permiten una mayor creatividad y razonamiento humanos que deben aplicarse a la programación de vídeo, aportando nuevos elementos de creatividad a un proceso ya creativo con insignificantes costos incrementales.

 

Conclusiones

Video_metadata_key_strategic_importance_for_online_video_publishers_id814226.jpg

Los metadatos son un elemento crítico para el éxito del vídeo en Internet. Los editores necesitan abordar la creación de metadatos como parte esencial del proceso de producción de vídeo.

  • El vídeo como medio complejo requiere metadatos de autoría humana para aportar lo vernacular de las experiencias de Internet al vídeo en Internet.
  • Los metadatos de cualidad para crear la fidelización de la audiencia y monetización deben ser escrito con objetivos distintos de la creación de tales experiencias de Internet para el video.
  • Estos metadatos son mejores escritos por personas que utilizan sistemas de autoría que permiten

    1. que los metadatos flexibles y precisos se apliquen a los activos de vídeo, y
    2. que la expresión creativa se acerque al medio del video en Internet.

Los editores necesitan incorporar sistemas que hagan la autoría y manejen a los metadatos en dirección a estos objetivos como tratan de crear audiencias y publicidad con sus estrategias de vídeo por Internet.



Fíjate en la primera parte de este informe: Los Metadatos De Vídeo Y Su Importancia Como Estrategia Principal Para Los Editores De Vídeos Online - Parte 1

Nota: Los ejemplos de aplicaciones descritos anteriormente en este documento se basan en el sistema de gestión de autoría de metadatos de Gotuit. Estos representan uno de los usos más avanzados de metadatos e implementaciones de vídeo por Internet. Los metadatos en cada caso tuvieron autoría humana tanto por Gotuit como por sus clientes.



Fuentes




Sobre el autor
Gotuit_logo.gif

Gotuit es un desarrollador de tecnología de metadatos de vídeo. Fundada en 2000, Gotuit es una empresa privada y financiada por Highland Capital Partners, Atlas Venture , Motorola, y empresas privadas.La empresa permite a los usuarios añadir metadatos a las secciones de videos que se suben a su sitio. Las competencias de Gotuit se esparcen entre las principales marcas como Lifetime, Fox , Sports Illustrated, Major League Soccer y mucho más.




Crédito de las fotos:
La Ciencia - y el Arte - de la Creación de Metadatos - dragerphot
Ejemplo - Metadatos Manuales y Automatizados - Gotuit
El Video Es Más Que la Suma de Sus Partes - Kuzma
Los Metadatos Tienen El Menor Costo Entre Todos Los Elementos Del Vídeo - Aleksey Poprugin
Conclusiones - maxxyustas

La traducción al español ha sido hecha por Letícia Castro.

Gotuit Team -
Referencia: Gotuit [ Seguir leyendo ]
Si te gustó la nota puedes recibir actualizaciones suscribiéndote via RSS o via email.

O compartirla:
 
 
 
 
Comentar    
blog comments powered by Disqus
 


 

 

 

 

Creative Commons License
This work is licensed under a Creative Commons License.

 

15827


Curated by

Publisher MasterNewMedia.org - New media explorer - Communication designer
Web Analytics