If music be the food of love, sing on, sing on, sing on ... (Shakespeare)
La audición tiene lugar en la cabeza. Después de ser percibido por el oído, un evento sonoro es sometido a numerosos procesos de compresión y procesamiento en el oído interno y el cerebro. Básicamente, se procesan las tres características de calidad: las características del sonido, la posición espacial de la fuente de sonido y el comportamiento de resonancia de la sala:
Las propiedades del sonido, es decir, el espectro de frecuencias y las relaciones de volumen de los rangos de frecuencia de un evento sonoro, proporcionan información sobre la fuente del sonido. El sentido del oído humano desarrolla aquí, en el ámbito de la voz y del habla humanas, una diferenciación que, sin duda, está más allá de la precisión de la medición técnica. De esta manera no sólo se puede reconocer a una persona por su voz, sino que también se pueden percibir sus estados psicológicos y físicos.
Esto tiene un impacto particular en la percepción musical y en las preferencias tonales, que se extienden más allá de los aspectos puramente individuales y también tienen validez general. Los instrumentos de cuerda, especialmente el violín, ocupan una posición especial por sus características de frecuencia más similares a la voz humana. Los instrumentos “buenos” y “malos” difieren en su percepción del sonido, al igual que las personas “sanas” o “congestionadas”. La fabricación de violines ha optimizado empíricamente su habilidad en este aspecto, y el virtuoso utiliza intuitivamente esta asociación de voz y estado de ánimo para representar estados de ánimo exagerando o suprimiendo selectivamente ciertos rangos de frecuencia.
Un evento sonoro se evalúa estereoacústicamente con respecto a su posición en el espacio basándose en la diferencia de tiempo, la diferencia de volumen y los espectros de frecuencia específicos de la situación en el oído derecho e izquierdo. El pabellón auricular y la cóclea influyen de forma característica en la calidad de los parámetros individuales y refinan significativamente el resultado perceptivo al difundir realmente el contenido de información.
También aquí el sentido del oído humano consigue una resolución sorprendente gracias al procesamiento sincrónico de una amplia variedad de parámetros. Es posible localizar fuentes de sonido a distancia con un solo brazo de distancia, y se pueden percibir incluso los cambios más pequeños de posición, dirección o movimiento.
Las diferencias de tiempo y volumen son responsables de la localización horizontal en la audición binaural. El espectro de armónicos abre el plano espacial vertical y la diferencia espectral derecha/izquierda a su vez expande el horizontal y completa la percepción tridimensional a través de efectos de enfoque.
Otro factor crucial en el posicionamiento espacial, que juega un papel crucial especialmente en el sector multimedia de la realidad virtual, es la posición relativa o el movimiento de la cabeza con respecto a una fuente de sonido. La posición y el cambio de dirección de la cabeza se detectan mediante el sentido del equilibrio y la rotación del oído interno y por los receptores de posición en las articulaciones y luego se agregan con la información auditiva a un nivel superior de percepción. La precisión es tan alta que los ojos se enfocan adecuadamente ya durante el giro reflexivo hacia la fuente de sonido.
El sentido del oído humano es capaz de localizar simultáneamente diferentes fuentes de sonido (incluso en movimiento) y procesarlas por separado. La selectividad aquí es notable. De manera similar al ojo, esto se logra mediante la supresión o amplificación fisiológica y “computacional” en los límites de los eventos vecinos. Al mismo tiempo, el número de eventos acústicos que se pueden procesar es casi arbitrario (faltan estudios más detallados). Esto se logra priorizando selectivamente los cambios de calidad entre los mecanismos de procesamiento similares a, por ejemplo, P.ej. procesamiento de subprocesos o tiempo compartido en tecnología informática.
Precisamente así surge la percepción del espacio circundante. Cada eco, cada reflejo es un evento acústico separado. Cada espacio tiene por tanto sus propias características únicas con una expresión muy específica para cada punto de ese espacio. Se trata por tanto de una estructura acústica muy compleja con dependencias complicadas. El oyente procesa esta impresión espacial según los procesos descritos y, a través de la suma de sus experiencias auditivas, llega a una experiencia auditiva.
La calidad de la acústica de una sala sigue, en última instancia, una regla sencilla: la acústica se percibe como “buena” si favorece los procesos perceptivos descritos anteriormente, aliviando así el sentido del oído de una parte del trabajo. Lo importante aquí no es sólo una buena separabilidad, sino también el equilibrio del comportamiento de reflexión. El sonido directo debe permanecer siempre dominante respecto al sonido de la sala, no deben existir efectos de chapoteo acústico y sobre todo la reverberación debe tener una transición suave. Los grandes espacios de las iglesias, por ejemplo, son problemáticos en este sentido, especialmente en la estación fría, cuando se producen saltos térmicos o rayas de calor sobre las salidas de calefacción. El oído entrenado puede ciertamente percibir estas influencias y encontrarlas perturbadoras.
La percepción individual y subjetiva de un evento acústico es una interacción de componentes fisiológicos, como se describió anteriormente, y experiencias personales intersensoriales adquiridas a lo largo de la vida.
La audición, al igual que la vista, debe aprenderse primero en el desarrollo de la primera infancia. Estos dos sentidos de orientación se desarrollan juntos en dependencia directa. Sólo la asociación de eventos visuales y acústicos unicausales entre sí hace posible la orientación en el espacio. Más tarde, la experiencia es suficiente para completar asociativamente y mentalmente un evento: por ejemplo, identifico y localizo un instrumento sin tener que verlo, o anticipo el golpe del tambor al ver caer el mazo.
Sin embargo, es inmediatamente evidente que estos valores empíricos sólo se refieren a la disposición real de los órganos sensoriales. Si, por ejemplo, se graba un acontecimiento sonoro con micrófonos estéreo muy separados, el resultado ya no puede conciliarse con la propia experiencia; Surge una situación perceptiva difusa. De la misma manera, los micrófonos con características direccionales cambian la experiencia auditiva de modo que parece como si hubieras colocado tu mano contra tu oído a modo de embudo de sonido. En comparación con los animales con aurículas móviles, la fisiología sensorial de los humanos es comparativamente simple en este aspecto.
Resulta que la autenticidad del sonido solo se puede lograr si las características y la posición de los micrófonos reflejan la transición del “mundo exterior” al “mundo interior” de una persona.
La transición fisiológica del “mundo exterior” acústico al “mundo interior” perceptivo es el tímpano. Aquí es donde se reúne toda la información del sonido. En cierto sentido, se centran en esta membrana de aproximadamente 55 mm2. En sentido figurado y técnico, esto significa compresión de datos, la reducción de una enorme cantidad de datos a una estructura de transmisión físicamente muy simple. La unidad fisicotécnica del oído medio/oído interno, a su vez, difunde la información sin pérdidas de forma mecánica para la propia recepción sensorio-fisiológica, donde luego tiene lugar la descompresión, amplificación y contrastación final de los “datos”.
De lo dicho se puede deducir directamente que existe una alternativa sorprendentemente sencilla a la actual práctica altamente técnica de grabación de sonido con todos sus procesos de mezcla y posprocesamiento: el evento acústico se captura con todas sus dimensiones espaciales y toda su compleja riqueza de datos exactamente donde es física y técnicamente más simple, en la posición del tímpano. La grabación se reproducirá más tarde exactamente en este punto. Esto se hace con un buen par de auriculares estándar. El oído humano se encarga entonces del resto del procesamiento; Está especializado en esto: ningún proceso, por muy sofisticado que sea técnicamente, podría acercarse a lo que el órgano sensorial puede hacer.
Este principio de grabación y reproducción auténtica del sonido y la acústica se denomina “estereofonia de cabeza artificial” desde 1969. Sin embargo, los orígenes de la idea se remontan a 1886, cuando se mostraron experimentos correspondientes en la primera Exposición Mundial de París. En la década de 1970, los radiodifusores, en particular, experimentaron ampliamente con la cabeza artificial en el ámbito de las obras de radio y la música. Este método finalmente no logró ser aceptado en ese momento, principalmente debido a las limitadas capacidades de reproducción de los auriculares.
Desde entonces, la tecnología de cabezas artificiales se ha desarrollado aún más, principalmente en el campo de la medición y análisis del ruido físico, y se ha consolidado en la industria. Dado que ahora es posible mejorar considerablemente la reproducibilidad del sonido envolvente auténtico incluso a través de altavoces mediante la llamada compensación de diafonía, la cabeza artificial se utiliza cada vez más también en la producción musical. Así pues, la estereofonia cerebral artificial podría desencadenar en el futuro un nuevo movimiento de escucha consciente.