Curated by: Luigi Canali De Rossi
 


Transcripción De Audio Para Podcast: JC Humano vs. CastingWords.com

CastingWords es un excelente nuevo servicio online que permite que cualquiera que lo desee pueda enviar un podcast de audio para su inmediata transcripción a texto.

microphone_classic_350.jpg
Photo credit: Kryptos

Las innovaciones claves que trae este muy accesible nuevo servicio (ver más abajo mi comparación con un transcriptor tradicional establecido) son el proceso de envío automatizado, sencillo y eficiente, el proceso integrado de estimación de costos y la función de notificación de flujo de trabajo basada en e-mail y RSS.

Los podcasters solamente necesitan tener el URL de su alimentador RSS de podcast y una cuenta PayPal para pagar la tarifa de transcripción.

Dicha transcripción se realiza en un lapso muy breve y el servicio lo notifica tan pronto como el proceso terminó y le envía su transcripción en tres formatos diferentes.

CastingWords.com no emplea tecnología automatizada de traducción para transcribir podcast sino que utiliza una red humana de editores.

Lo que no puede parecer tan excitante para el editor online consciente y ético es que, bajo su prometedora superficie, CastingWords es también un motor de búsqueda beta de podcast, el cual puede eventualmente obtener sus fortalezas claves del servicio que provee por un pago.

Esto es: CastingWords me pide dinero para transcribir mi podcast, pero entonces utiliza esa transcripción de texto como el índice central de la base de datos del motor de búsqueda de sus podcast, el cual está solventado por publicidad.

Si en el futuro cercano el motor de búsqueda de CastingWords será gratuito para todos los usuarios, y será compartido con podcasters, los cuales han pagado por transcripciones, algo de posibles futuras ganancias por publicidad, entonces es un estupendo abordaje para hacer que el contenido de audio extienda su alcance y permita que más podcasters hagan un mejor trabajo en la publicación de contenidos. Pero si CastingWords quiere hacer dinero extra aprovechando el contenido-pago-por-el-usuario para crear un motor de búsqueda basado en publicidad, entonces quizás alguien debería levantarse y decirles algo a esos muchachos.

Por ahora, es difícil juzgar, ya que la función de búsqueda de CastingWords ni siquiera fue capaz de encontrar mi propio contenido de podcast cuando busqué Roma e Italia, dos bellas únicas palabras que siempre utilizo al comienzo y al final de mis entrevistas de audio.

Para ayudar a que todos tengan una idea de lo útil que puede ser este servicio, cuando es comparado con la utilización de un editor tradicional para transcribir sus podcast de audio, me tomé el tiempo para testear y comparar CastingWords.com
con el recurso establecido de transcripción humana, un transcriptor profesional de transmisión de TV.

Sin decirle a ninguno de los dos que estaba haciendo una revisión comparativa, le envíe a ambos una entrevista de audio de 30 minutos con Eric Goldstein de Clipmarks que había publicado recientemente.

Esto es lo que yo, con la ayuda del editor asistente Matthew Guschwan, he sido capaz de descubrir:

 

another_waveform_sibaudio.jpg
Photo credit: Jake Levin

Comparación de Transcripción

JG Humano vs. CW CastingWords

Este resumen de la evaluación de comparación está basada en unas pocas áreas de comparación:

Editorial

1) Formateo básico

2) Uso de puntuación

3) Errores ortográficos

4) Fidelidad a la grabación original

Técnica

5) Formatos de salida

6) Costos

7) Tiempos de entrega


1) Formateo básico

CastingWords indicó claramente el cambio de la persona que habla en la entrevista utilizando "encabezados" que contienen el nombre de la persona, de esta manera:
Robin Good:
Eric Goldstein:

JC indicó un cambio en el hablante simplemente comenzando un nuevo párrafo.

El uso adicional de encabezados claramente etiquetados nos ahorró tiempo al tener la transcripción online.



2) Uso de Puntuación

Hubo grandes diferencias en la puntuación entre los dos servicios testeados.

Para la lista de items, CastingWords utilizo comas (padre, madre, nodriza, niñera) para separar la palabra mientras que JG empleó una serie de barras (padre/madre/ nodriza/niñera).

Para nuestros propósitos, preferimos el uso más tradicional de puntuación, el cual para nosotros es la coma.

Por otro lado CastingWords no utilizo comas tan a menudo como lo hizo JG. Al transcribir palabras habladas, las comas son muy importantes para tratar de recrear la conversación, y para clarificar puntos. En éste aspecto, la transcripción de JG fue claramente superior.



3) Errores ortográficos

Ambos servicios cometieron algunos errores ortográficos. Debe decirse, sin embargo, que los podcast de audio a menudo no son de la calidad más alta posible, y muchos de mis entrevistados, como también yo, no son hablantes nativos de inglés y por lo tanto nuestra pronunciación de ciertas palabras puede confundir al transcriptor. También, es raro que los transcriptores estén familiarizados con los temas y las tecnologías que usted podría estar cubriendo, provocando una multitud de malas interpretaciones que en ocasiones, pueden ser muy difíciles de detectar. Una que las explica a todas es "creative comments" (comentarios creativos) transcrita en lugar de Creative Commons. Es evidente que un editor que no conozca los CC puede caer fácilmente en este tipo de trampa.

CW en particular dejó pasar una palabra (maticion) que debería haber sido fácilmente detectada en cualquier corrector ortográfico inglés.

Hubo también momentos en ambas transcripciones donde las palabras fueron mal utilizadas, o escritas de manera inconsistente.

Por ejemplo, la escritura de homepage como 'home page' o bookmark como 'book mark' no va a alertar a un corrector ortográfico básico y por lo tanto el elemento humano se hace más importante.

Estos tipos de errores insidiosos puede ser más difíciles de detectar. Como ya se mencionó, no es común tener un editor que esté actualizado con los nuevos medios y el cual sepa cómo escribir apropiadamente del.icio.us, o como en el caso de CW, el cual no escribió con mayúsculas "Flash."

Otra diferencias fueron que CW utilizó "bookmark" de principio a fin, a pesar de que empleó los términos "book marking" por "bookmarking" dos veces y "book marked" por "bookmarked" una vez. JG utilizó "bookmarking" y "bookmarked" en todo el texto.



4) Fidelidad a la grabación original

Hay diferencias sutiles entre las transcripciones tales como un cambio fraseo y o un ligero cambio en el orden de las palabras. Estos cambios no son malos si preservan el significado de las afirmaciones, pueden incluso ser útiles si esos cambios mejoran el flujo o la claridad del mensaje hablado original.

No es el mismo caso cuando una o dos palabras son omitidas sin justificación, como aquí, donde JG escribió "Clipmarks se trata de permitir guardar fácilmente la información específica" mientras que CW omitió "fácilmente" de esta oración.

Al escribir instrucciones, es útil tener dicha instrucción entre comillas. Por ejemplo: "haga clic aquí" vs. haga clic aquí. JG siempre incluyó comillas mientras que CW no lo hizo.

Un error más serio es cuando la transcripción es demasiado fiel a la grabación, y expresiones de duda o repeticiones realizadas por el orador original no son borradas automáticamente.

Otras instancias mostraron transcripciones bastante diferentes de los mismos breves párrafos:
CW "Tú has estado continuamente tú has estado agregando en las últimas semanas"
JG "¿Tú has estado agregando continuamente en la última semana?
O donde el significado esencial de la frase cambia bruscamente debido a la ubicación incorrecta de un verbo o adjetivo. Este es un ejemplo donde el uso incorrecto de una partícula afirmativa en vez de una negativa crea un serio problema en la transcripción final.

JG escribió: "Si tú no quieres que tus clip marks sean vistos por otras personas, tú simplemente no marcas la casilla..."

CW escribió: "Si tú no quieres que tus Clipmarks sean vistos por otras personas tú simplemente marcas la casilla...."



5) Formatos de salida

JC me proporcionó un producto final de sólo-texto la cual fue enviada a un espacio de trabajo wiki privado donde ambos tenemos acceso.

CastingWords automáticamente provee un producto final en tres formatos diferentes los cuales son accesibles online vía URL estándar:
1) RTF
2) HTML
3) Texto sin formato



6) Costos

CastingWords cuesta 42 centavos el minuto. Punto.

JC, mi traductor completamente humano me cobra $20 por cualquier cosa de menos de una hora. No importa si son 25 minutos o 55, ella me cobra $20 por cada uno.

Por lo tanto la diferencia de costos para este artículo específico fue la siguiente:
CastingWords: $14.28
JC: $20.00

Ambos aceptan pagos electrónicos directos via PayPal.



7) Tiempos de entrega

En términos de los plazos de entrega del trabajo realizado, CastingWords tiene una clara ventaja. Este test fue a propósito corrido durante el fin de semana de Navidad y CastingWords reaccionó en un tiempo récord haciendo que la transcripción completa estuviera lista menos de 48 horas después de haber sido enviada.

La solución completamente humana con JC, tomó su tiempo normal el cual, a menos de que usted requiera algo urgente por escrito, es generalmente de tres a cinco días (excluyendo los fines de semana).



Resumen de la evaluación

En general, hubo errores tanto del automatizado CastingWords como del totalmente humano JG. De hecho, CastingWords también es esencialmente un servicio de traducción humana, únicamente con el agregado de un conjunto de funciones automatizadas las cuales amplían enormemente la velocidad y transparencia de todo proceso de traducción.

Siendo la traducción bastante aceptable, JC nos pareció que tiene una ventaja sobre CastingWords. Es decir, desde un punto de vista de escritura, JG fue mejor que CastingWords por un mejor uso general de puntuación y por una mejor construcción de algunas frases.

Ambos servicios cometieron algunos molestos errores ortográficos, y ambas transcripciones tuvieron que ser chequeadas con detenimiento para el uso correcto de términos técnicos y nombres propios. Tampoco ninguno proporcionó una transcripción que se podía haber publicado tal como estaba.



¿Cuál es el mejor?

Eso dependerá seguramente lo que usted necesite hacer, cuál es su rango de tiempo, cuál es el tema del contenido de su audio, y qué tan importante es para usted precisión y calidad de la transcripción versus resultado más rápidos y más inmediatamente presentables.



Transcripciones de referencia

Aquí están los enlaces a las dos transcripciones tal como las recibí. Este es el formato de sólo texto, el cual usted puede descargar y chequear para ver lo que podría llegar a obtener.

CastingWords: transcripción de sólo texto de la entrevista de Robin Good con Eric Goldstein (no sé por cuánto tiempo estará disponible online)

JC: transcripción de sólo texto de la entrevista de Robin Good con Eric Goldstein guardada en formato RTF para mantener el espaciado de párrafos original proporcionado por el transcriptor humano.
Audio MP3 de la entrevista original


Para un recorrido totalmente ilustrado del servicio de transcripción de CastingWords por favor vea:
Walking Through the Casting Words Store

Transcripción De Audio Para Podcast: JC Humano vs. CastingWords.com

 

Originalmente escrito por y publicado por primera vez en MasterNewMedia.

 

Robin Good y Matthew Guschwan -
Si te gustó la nota puedes recibir actualizaciones suscribiéndote via RSS o via email.

O compartirla:
 
 
 
 
 


 

 

 

 

Creative Commons License
This work is licensed under a Creative Commons License.

 

4899


Curated by

Publisher MasterNewMedia.org - New media explorer - Communication designer
Web Analytics