Una inmersión profunda en las curvas de Harman: el camino largo (Parte 1)

Presentamos el concepto de esta serie Harman Curve de 3 partes, explicamos la localización del sonido humano y su relación con la respuesta de frecuencia.

Este es el primer artículo de una serie de tres partes que tiene como objetivo situar la curva de Harman en contexto, como la última entrega de una curiosa tradición que ha existido en gran medida al margen de la audiofilia.

Los auriculares son mejores parlantes que parlantes; los altavoces son mejores auriculares que auriculares.

Este no es un acertijo zen, sino la forma más sucintamente provocativa de resumir dos hilos paralelos de investigación de audio que han persistido silenciosamente durante aproximadamente medio siglo.

Además, ambos hilos prometen mejoras basadas en la evidencia tanto para la reproducción tonal como espacial del sonido. Parece que ambas afirmaciones no pueden ser simultáneamente correctas. Hasta donde sabemos, esta es la primera serie de artículos dirigida al profano en identificarla, explicarla y reconciliarla.

Comprender las premisas y los hitos de esta curiosa tradición de investigación es importante porque proporciona una lente poderosa para comprender su producto más famoso en los últimos tiempos: la curva de Harman .

enlaces rápidos
Haz clic y salta a la sección

Índice
  1. Un resumen rápido de cómo se divide la serie
  2. Parte 1 - Estás aquí
  3. Parte 2
  4. Parte 3
  5. ¿Qué es la curva de Harman?
  6. Esbozando la localización del sonido en los seres humanos
  7. Cada oído tiene su propio HRTF
  8. HRTF cambia cuando cambia la dirección
  9. ILD se vuelve más predominante que ITD a 1kHZ y más
  10. Las funciones amplias de HRTF pueden predecir tendencias generales
  11. ¿Qué sucede si el HRTF no coincide?
  12. Cómo obtiene Sennheiser su aclamado "escenario sonoro"
  13. Conclusión
  14. Pin esta imagen para guardar este artículo

Un resumen rápido de cómo se divide la serie

Parte 1 - Estás aquí

La primera parte de esta serie explicará primero los principios fundamentales compartidos de la audición humana de los que se derivan todos estos enfoques.

Parte 2

  • Ir a la Parte 2

La segunda entrega examina varias tecnologías que se han desarrollado en respuesta a estos conocimientos tanto para altavoces como para altavoces. Rastrear el linaje del que desciende la curva de Harman ayuda a aclarar su posición relativa en este panorama tecnológico.

Por lo tanto, podemos comparar las curvas de Harman (porque se desarrollaron y refinaron varias variantes para diferentes aplicaciones) con curvas de escucha alternativas y técnicas de procesamiento en la tercera parte.

Las curvas cubiertas incluyen la muy abstractadifusoycampo librecurves y más derivados de nicho de ambos de Sonarworks, Waves NX, Etymotic, Siegfried Linkwitz y David Griesinger.

Hablaremos sobre la comparación con técnicas alternativas de procesamiento de reproducción que incluyen:

  • cancelación de diafonía
  • Síntesis de la función de transferencia relacionada con la cabeza (HRTF)
  • alimentación cruzada

Parte 3

  • Ir a la Parte 3

Esta tercera parte también nos permitirá distinguir lo que queda más allá de la curva objetivo de Harman para auriculares y monitores en el oído (que cada uno tiene sus propias curvas respectivas).

Para usar una frase popular, igualar a una curva de calibración podría estar al borde de los rendimientos decrecientes.

La elección del procesamiento correctivo depende en gran medida de:

  • técnicas de grabación y masterización (como la colocación del micrófono y la panorámica),
  • el tipo de auricular utilizado
  • la anatomía del individuo.

Además, las longitudes de onda de las altas frecuencias involucradas en la síntesis y corrección de HRTF son muy pequeñas.

Relacionado:Una inmersión profunda en las curvas de Harman: el camino largo (parte 2)Una inmersión profunda en las curvas de Harman: el camino largo (parte 2)

Esto implica una sensibilidad significativa a las variaciones en la ubicación de los auriculares con cada uso, e incluso dentro de la misma sesión de escucha cuando la posición cambia sutilmente. Es un problema complejo y dinámico. Cualquier mejora adicional es inconveniente y produce una recompensa incierta.

Es probable que se necesite mucha más transparencia por parte de los estudios y los ingenieros de sonido para sus elecciones, así como una minuciosa experimentación del oyente. Con suerte, un mayor conocimiento de estos problemas aumenta la presión de los consumidores sobre los fabricantes para abordar estos problemas y escalar sus soluciones para mejorar la experiencia auditiva, especialmente en auriculares.

¿Qué es la curva de Harman?

Hay varias variantes de las curvas objetivo de Harman, debido principalmente a las diferencias en la preferencia del oyente (dentro de un rango limitado), así como al sello entre diferentes formatos (circumaural, versus monitor de oído, por ejemplo). (De: Harman)

Nombrado en honor al fabricante del equipo de audio, Harman , a la que estaban afiliados la mayoría de sus principales investigadores, la curva entró en el centro de atención en 2013, después de que el (ahora retirado) gurú de los auriculares tyll hertsens de Fidelidad Interior publicado un artículo completo resumiendo los artículos clave publicados sobre el tema.

La curva de Harman es esencialmente una respuesta de frecuencia objetivo de lo que debe mostrar un par de auriculares "buenos" cuando se mide con un equipo especializado.

La curva es, de hecho, un cuidadoso equilibrio entre la individualización y una cierta concepción del atractivo masivo, fundada en los mismos principios psicoacústicos que sustentan ambas líneas de investigación. Pero, ¿cómo se logró este equilibrio, por qué se logró, qué compromete y con qué sinergiza?

Abordar estas preguntas requiere una mirada a las curvas de Harman, el camino largo (pero gratificante). Complementa los excelentes artículos que explicanquéLas curvas de Harman son - a aproximación gruesa de tonalidad ampliamente agradable que no tiene en cuenta la individualización precisa del audio espacial y la tonalidad precisa (que son problemas interrelacionados) .

Esbozando la localización del sonido en los seres humanos

El primer paso para comprender las curvas de Harman es comprender la relación entre la respuesta de frecuencia (que es el objetivo de las curvas de Harman) y la localización del sonido humano.

Anillos y Wikipedia profundizar en el tema con más detalle, aunque aún accesible, al igual que esto página por la Universidad de Southampton.

Relacionado: ¿Cómo escuchamos? El mecanismo de la audición humana explicado

En aras de la simplicidad, aquí está el resumen. Hay cuatro tipos de señales que dominan la localización direccional:

  1. función de transferencia relacionada con la cabeza (HRTF)
  2. diferencia horaria interaural (ITD)
  3. diferencia de fase interaural (IPD)
  4. diferencia de nivel interaural (ILD)

Cada oído tiene su propio HRTF

Cada oreja tiene su propia función de transferencia relacionada con la cabeza (HRTF) : cambios en la respuesta de frecuencia de fuentes de sonido externas a las que contribuyen acumulativamente nuestros hombros, torso, cabeza y oídos (tanto el pabellón auricular externo como el canal interno) a medida que el sonido de una fuente de campo libre rebota en ellos.

HRTF cambia cuando cambia la dirección

La HRTF cambia a medida que cambia la dirección. Asignamos estos cambios a una dirección específica en nuestro cerebro cuando el sonido alterado golpea nuestros tímpanos. Nos hemos adaptado a estos cambios.

Las señales interaurales (entre dos oídos) ayudan a las señales HRTF. Como los dos oídos están separados por la cabeza, hay una diferencia en el tiempo que alcanza el sonido, debido a la diferente distancia desde la fuente, agravada por la forma diferente en que el sonido se "envuelve" alrededor de la cabeza dependiendo de las frecuencias excitadas por la fuente. sonido. Por lo tanto, también hay una diferencia en el nivel de volumen.

ILD se vuelve más predominante que ITD a 1kHZ y más

El punto de equilibrio entre cuyas señales se vuelven predominantes se estima actualmente en alrededor de 1kHz , con señales ITD que se vuelven menos consistentes y precisas con la colocación a altas frecuencias. Esto se debe a la longitud de onda correspondiente de alrededor de 17-18 cm a 1 kHz, que es el diámetro aproximado de la cabeza humana.

A medida que la frecuencia aumenta y la longitud de onda se reduce en relación con la cabeza, son menos capaces de "envolverse" alrededor de ella, lo que da lugar a una diferencia de nivel significativa. Por lo tanto, ILD se convierte en una señal más predominante por encima de alrededor de 1 kHz, mientras que ITD lo es menos debido a su relativa inestabilidad. Esencialmente, triangulamos el sonido a través deldiferenciasen volumen, fase y sincronización entre cada oído también.

Las funciones amplias de HRTF pueden predecir tendencias generales

A pesar de la variación evidente en la morfología de la cabeza, existen algunas características generales de HRTF que nos permiten determinar tendencias generales. Este concepto es crucial para la curva de Harman.

Relacionado:Una inmersión profunda en las curvas de Harman: el camino largo (parte 3)Una inmersión profunda en las curvas de Harman: el camino largo (parte 3)

El canal auditivo y el canal del pabellón auditivo suenan de una manera que lo amplifica en algunas frecuencias. Las resonancias ocurren en el canal auditivo, que se asemeja a un tubo con una columna de aire dentro. El sonido en ciertas frecuencias excita esta columna de aire más que en otras frecuencias .

Por ejemplo, una resonancia del canal auditivo de alto nivel aparece constantemente alrededor de 3kHz , aunque la frecuencia central exacta, la intensidad y Q (término técnico para "nitidez" o "estrechez" de la resonancia) y la forma de la resonancia pueden diferir. Es uno de los rasgos más característicos de la HRTF .

La precisión en el dominio de la frecuencia es necesaria pero insuficientecomponente de la audición espacial.

Tonalidad y espacio están relacionados, aunque no son sinónimos. En cualquier caso, un requisito previo para una reproducción espacial precisa es la individualización de la respuesta de frecuencia, para compensar las diferencias individuales en los cambios inducidos por la HRTF cuando el sonido llega al tímpano.

¿Qué sucede si el HRTF no coincide?

¿Qué implica subjetivamente un HRTF no coincidente? etiqueta de audiófilo Chesky registros lanzó un muy bien recibido álbum binaural por la cantautora Amber Rubarth (“Sesiones del 17 el Pabellón") . una de las canciones era “Luna Llena en París” .

Este autor escuchó la aclamada espacialidad de la grabación como una masa de sonido indistinto que entraba y salía de la superficie de su cabeza. A pesar de que la grabación se realizó con una cabeza ficticia binaural, que debería generar señales interaurales plausibles, el sonido se sintió como un halo borroso que se adhería a su cuero cabelludo.

Sin embargo, la localización externa frontal con auriculares se quedó muy corta, incluso con una configuración de altavoz Stax de alto rendimiento.

Este combo de altavoces Stax fue utilizado por el autor para probar los resultados de las grabaciones de audiófilos de Chesky Records. (De: Stax)

Ex científico jefe de Harman (sin relación con los proyectos de investigación de la curva de Harman) y ahora investigador independiente, David Griesinger , ofrece esto explicación :

Las demostraciones binaurales a menudo son efectivas, especialmente con sonidos que están al costado o en la parte posterior de la cabeza. Las señales de azimut derivadas del retraso de tiempo entre los dos oídos y la sombra de la cabeza de la cabeza son efectivas incluso cuando el timbre es muy incorrecto. Cuando una fuente de sonido se mueve rápidamente, el cerebro tiende a ignorar las señales de elevación incorrectas si entran en conflicto con la trayectoria esperada.

Si una señal visual está presente al mismo tiempo, casi siempre dominará las señales auditivas. Con un buen talento para el espectáculo y un sujeto que esté dispuesto a ser convencido, estas demostraciones pueden ser bastante convincentes. Pero con una escucha escéptica rara vez se logra la localización frontal de fuentes fijas.

Sin embargo, incluso la explicación de Griesinger parecía demasiado caritativa para lo que experimentó este autor. Esto probablemente se deba a que este autor era descendiente de asiáticos orientales y su morfología difería lo suficiente como para que los HRTF divergir aún más significativamente que los oyentes caucásicos de la HRTF de la cabeza ficticia utilizada.

Este es un simulador de cabeza y torso estándar de la industria, un equipo especializado destinado a lograr el

Esto significó que no se logró la externalización frontal del sonido, y mucho menos el posicionamiento frontal preciso de las fuentes de sonido. Afortunadamente, se ha trabajado para inventar una cabeza ficticia estandarizada eso se parece más a las tendencias generales en la morfología de la cabeza de los asiáticos orientales, lo que con suerte cerraría la brecha un poco.

Los investigadores chinos identificaron un subconjunto distinto de rasgos y estructuras faciales para los asiáticos orientales, especialmente los de ascendencia china. Este es BHead210, la cabeza ficticia resultante. Es claramente diferente del GRAS que se ha representado arriba. (De: Ling Tang, Zhong-Hua Fu y Lei Xie)Un HRTF lo suficientemente bueno también se puede adaptar con suficiente exposición, entrenamiento y estímulos visuales complementarios - similar a adaptarse a anteojos que invierten las imágenes que normalmente vemos .

Cómo obtiene Sennheiser su aclamado "escenario sonoro"

Los controladores de auriculares en ángulo del Sennheiser HD800 y su variante S producen un HRTF más realista que se asemeja al sonido que viene del frente. También proporciona una base para la corrección de HRTF y otras técnicas correctivas porque los conductores sin ángulo generan un HRTF que no se puede corregir fácilmente. (De: Sennheiser)

El diseño de los auriculares también puede ayudar a superar parcialmente este problema. El Sennheiser HD800(S) es un destacado exponente de este enfoque. Gran parte de su aclamado "escenario sonoro" se puede atribuir a los controladores en ángulo. Al inclinar los controladores, se genera una HRTF aproximada que se asemeja más a una HRTF frontal, en lugar de una HRTF lateral perpendicular a los oídos generada por la reproducción de auriculares sin corregir.

Relacionado:[2023] Los 20 videos de ASMR más populares que te ayudarán a dormir como un bebé[2023] Los 20 videos de ASMR más populares que te ayudarán a dormir como un bebé

Este gráfico muestra cómo cambia la HRTF entre 30 grados (en ángulo como un altavoz estéreo) y 90 grados (perpendicular como un auricular). (De: Intechopen.com)

¿Cuánto difiere el HRTF allí? Los gráficos de arriba, de una excelente capítulo de acceso abierto sobre el tema son ilustrativos. Esta es la HRTF de una configuración de simulador de cabeza y torso estándar de la industria, la KEMAR .

La curva superior es la HRTF medida en el oído derecho desde una fuente colocada como si fuera el canal derecho de un altavoz estéreo (así como lo que se mide en el oído izquierdo desde dicha fuente).

La segunda curva desde abajo es lo que se midió en el oído derecho desde una fuente perpendicular a él (como un controlador de auriculares sin ángulo). La muesca en HRTF para la fuente perpendicular es mucho más ancha y profunda, abarcando de 8 a 10 kHz y unos 20 dB.

La medida de 30 grados, que refleja cómo se percibiría un altavoz o un controlador de auriculares inclinado de esa manera, tiene una muesca mucho más estrecha (que abarca de 8 a 9 kHz). Aunque la muesca es igual de profunda, la tendencia general de la curva es mucho más suave que en el caso perpendicular.

Según Griesinger, sus experimentos también demostraron que los auriculares que carecen de controladores en ángulo (generando así este HRTF perpendicular) generan un sonido poco natural y hacen que sea imposible realizar más correcciones. Esto se debe a que una fuente de sonido perpendicular interactúa de una manera específica con el oído, produciendo una respuesta HRTF que es más audible (como se muestra arriba), pero “Es imposible igualar fuera” .

Las muescas en las respuestas de frecuencia generalmente son imposibles de igualar porque son causadas por múltiples señales de sonido que se cancelan entre sí. Impulsar la muesca simplemente aumenta ambos señales que se anulan entre sí. Aunque los HRTF en otros ángulos diferirán, los ángulos frontales claramente tienen una muesca mucho menos prominente.

Independientemente, debido a la "iluminación" relativamente antinatural de todo el pabellón auricular por el frente de onda radiado (y, por lo tanto, la baja fidelidad a los HRTF que generarían un paisaje sonoro frontal natural), la reproducción de auriculares (especialmente de grabaciones estéreo pero incluso binaurales) está intrínsecamente comprometida.

Eso es lo de RTing Mediciones PRTF medida para: la iluminación completa y uniforme del área del pabellón auricular como si fuera una fuente de campo libre. Incluso el HD800(S) está lejos de ser perfecto en comparación con los altavoces. El frente de onda de los altavoces en campo libre permite una iluminación completa del pabellón auricular (el área sobre la que se extienden los pabellón auricular es pequeña en relación con el área sobre la que la radiación del altavoz es esencialmente uniforme).

Otra forma más complicada de superar parcialmente el HRTF no coincidente es mediante el uso de señales dinámicas, alterar la HRTF no coincidente con el movimiento de la cabeza (seguimiento de la cabeza del oyente a través de tecnologías de seguimiento de movimiento como Kinect). Sin embargo, el problema de raíz de la inexactitud tonal en relación con los oídos del sujeto aún se conserva.

Para resumir:

“Si un sistema de reproducción de sonido puede generar las mismas presiones de sonido en los tímpanos del oyente que las que habría producido allí una fuente de sonido real, entonces el oyente no debería ser capaz de distinguir la diferencia entre la imagen virtual y la fuente de sonido real”. – fuente

Conclusión

Esta descripción básica del complejo fenómeno que es la audición humana nos permite comprender cómo la tecnología ha formulado técnicas correctivas que abordan las distorsiones excesivas que se interponen entre nuestros oídos y la grabación. En Parte 2 , describiremos estas tecnologías correctivas que se han desarrollado, tanto populares como oscuras.

Pin esta imagen para guardar este artículo

Relacionado:¿Puede ASMR funcionar sin auriculares?¿Puede ASMR funcionar sin auriculares?

También te puede interesar:

Subir

Utilizamos cookies para asegurar que le ofrecemos la mejor experiencia en nuestro sitio web. Si continúa utilizando este sitio, asumiremos que está satisfecho con él. Mas información