Si mil personas susurran de forma inaudible, ¿será audible el sonido resultante?

Si mil personas susurran de forma inaudible, ¿será audible el sonido resultante? (... suponiendo que estén susurrando juntos.)

Creo que la respuesta es "sí" porque las amplitudes simplemente se sumarían y, por lo tanto, alcanzarían un umbral audible. ¿Es esto correcto?

si es posible, proporcione una explicación lo suficientemente simple para personas que no son físicas

Creo que esta pregunta conlleva una ambigüedad potencial en el significado de "audible". La interpretación simple es simplemente "se escuchó un ruido". La interpretación de nivel superior es "se entendió un mensaje". Wolpertinger john-bentin y Farcher se refieren al primero. @stafasu y rob se están dirigiendo a este último. En el primero, las señales se pueden analizar mediante procesamiento de señal lineal. En este último no es así. En particular, cuando stefasu habla de "interferencia constructiva", creo que está hablando del mensaje y no de la señal portadora.
Posiblemente depende de su definición de inaudible, pero una sola abeja es inaudible más allá de una distancia muy corta, pero un enjambre o colmena se puede escuchar a muchas decenas de metros de distancia.
¿Cómo se organizan los susurradores en el espacio, en relación con el oyente? Si algunos susurradores están más lejos que otros, ¿los que están más lejos susurran más fuerte?
Sé que esto es algo serio, pero no puedo creer que nadie haya hecho referencia a "Horton Hears a Who!" del Dr. Suess.
Hubo algunos comentarios verdaderamente valiosos aquí. ¡¿Donde han ido?!

Respuestas (9)

Sí, siempre.

Me gustaría estar en desacuerdo con la respuesta de stafusa aquí, ampliando el comentario de Rod. No se producirán interferencias, ya que para susurrar las fuentes de sonido serán estadísticamente independientes .

Para la demostración, miremos a dos personas. La persona 1 produce un susurro que se puede caracterizar por un campo de sonido que se propaga mi 1 ( r , t ) , dónde r es la posición en el espacio y t es hora. Del mismo modo, la persona 2 produce un susurro mi 2 ( r , t ) . Entonces, el campo general en un punto del espacio es simplemente

mi t o t ( r , t ) = mi 1 ( r , t ) + mi 2 ( r , t )

ya que las ondas de sonido son aproximadamente lineales (al menos para las amplitudes de onda alcanzables por las voces).

Lo que percibes como 'volumen' (lo llamaré yo para la intensidad) es el promedio de tiempo de la magnitud de la señal total

yo = mi t o t ( r , t ) mi t o t ( r , t ) .

Es decir, su oído está promediando fluctuaciones muy cortas en la señal. Luego podemos expandir esto en términos de las señales de las dos personas para obtener

yo = mi 1 ( r , t ) mi 1 ( r , t ) + mi 2 ( r , t ) mi 2 ( r , t ) + 2 mi 1 ( r , t ) mi 2 ( r , t ) .

Hasta ahora, esto es completamente general. Ahora asumimos la independencia estadística de las fuentes, lo que hace que el último término sea cero:

yo = mi 1 ( r , t ) mi 1 ( r , t ) + mi 2 ( r , t ) mi 2 ( r , t ) .

Entonces, la intensidad general es simplemente la suma de las dos intensidades de susurro.

Podemos entender los susurros, lo que significa que no hay fuentes aleatorias. Y supuse que, además de ser audible, se desea que el susurro también sea comprensible.
@stafusa Una señal puede ser estocástica ('aleatoria') y aún así tener estadísticas bien definidas (por ejemplo, en.wikipedia.org/wiki/Ergodic_process ).
Pero, ¿es suficiente una estadística bien definida para transmitir una señal? La correlación entre los susurros de diferentes personas es muy alta, si están susurrando las mismas palabras. No veo cómo podemos modelar eso como fuentes independientes.
Las personas de @stafusa que susurran lo mismo al mismo tiempo tendrán características espectrales similares, pero a menos que susurren exactamente a la misma frecuencia y puedan sincronizar sus susurros con una precisión de 0.01 s (ni siquiera eso es suficiente), sus fases serán estadísticamente independientes . Es más probable que observe interferencias destructivas conectando un altavoz al revés, reproduciendo un sonido mono y girando la cabeza hacia un lado. Y eso es algo que puedes probar en la práctica usando un editor de sonido. Intentalo. Recomiendo usar un tono puro para que puedas captar los nodos laterales si te pierdes el del medio.
@stafusa un susurro es un sonido sordo creado por la turbulencia en el tracto vocal (generalmente cerca de las cuerdas vocales) tan razonablemente modelado como incoherente a pesar de una modulación de amplitud posiblemente coherente introducida por cambios importantes en el tracto vocal.
@StrongBad, es exactamente la modulación de amplitud lo que no es aleatorio, y eso es, por cierto, lo que se reforzará si los susurradores están sincronizados.
@stafusa piensa en la correlación entre ondas sinusoidales de 1 kHz y 2 kHz que tienen modulación de amplitud sinusoidal a 7 Hz o, mejor aún, la correlación entre dos ruidos IID que luego tienen modulación sinusoidal a 7 Hz.
@StrongBad, no estoy seguro de su punto: ¿está sugiriendo que no habrá refuerzo de señal entre esos dos portadores aleatorios / de amplio espectro modulados en amplitud?

La amplitud de la suma de 1000 ruidos no correlacionados igualmente fuertes serán aproximadamente 1000 , o aproximadamente 32 , veces la amplitud de un solo ruido. Eso podría ser suficiente para hacer que un susurro inaudible sea solo audible. Considere los aspectos prácticos, sin embargo. Las personas no pueden ocupar todas el mismo lugar. Si se dispersan, la mayoría de ellos estarán demasiado lejos para escuchar. Incluso si están amontonados, sus cuerpos y ropa serán un medio excelente para absorber el sonido. Probablemente, todo lo que escuchará es el sonido involuntario emitido ocasionalmente por un solo individuo.

Dicho de otra manera: 1000 ruidos no correlacionados de X dB será como el ruido de X + 30 dB (porque nos referimos a potencia, no a amplitud, IIRC). Así que si X está un poco por debajo de la 0 límite de audición de dB, la suma podría ser audible, pero menos que cualquier sonido "normal" de 30 dB
No estoy seguro de que sea cierto para cualquier condición de contorno. En mi respuesta editada, menciono a personas que rezan suavemente en una iglesia, donde parece que no están absorbiendo gran parte del sonido. Pero puedo estar equivocado.
@LordFarquaad Esta respuesta evita hablar sobre la noción de n veces más fuerte, que está mal definida y es en gran medida subjetiva. Lo que sí está bien definido son la amplitud y la densidad de potencia, siendo esta última proporcional al cuadrado de la primera. La escala de decibeles (nota al margen: ¿por qué nadie usa la unidad básica de belios?) es logarítmica tanto con respecto a la amplitud como a la densidad de potencia, pero no de la misma manera: 10 dB (1 belio) corresponde a un factor 10 en densidad de potencia, o a un factor 10 en amplitud.
¿No está esta respuesta en contradicción con la respuesta aceptada que parece sugerir que las intensidades simplemente se suman?
@thermomagneticcondensedboson: la intensidad, o densidad de potencia, considerada por Volpertinger es el cuadrado medio de la amplitud (al que me refiero). Los comentarios de Hagen von Eitzen y Marc van Leeuven son útiles.
La raíz cuadrada es la clave aquí y vale la pena enfatizarla. Suponiendo que todos silben la misma nota en lugar de susurrar, lo harán con fase aleatoria, por lo que la amplitud total será igual a la distancia recorrida en una caminata aleatoria, que es la raíz cuadrada del número de pasos. Por lo tanto, la amplitud aumenta como la raíz cuadrada del número de personas o, de manera equivalente, la potencia linealmente con el número de personas.
@MartinKochanski y John Bertin, gracias. +1 de mi parte.

La respuesta es "tal vez". 1000 susurros inaudibles pueden seguir siendo inaudibles; la pregunta que probablemente quiso hacer es "¿el sonido de 1000 personas susurrando al mismo tiempo sería más fuerte que el sonido de 1 persona susurrando?"

La respuesta a esa pregunta es un rotundo "sí". ¿Cuánto más fuertes serán, y eso resultará en un mensaje audible / comprensible?

Para ello es necesario comprender el concepto de interferencia y coherencia . Dos fuentes (de sonido) son coherentes si producen la misma forma de onda. En el mundo real, la coherencia suele estar limitada en el tiempo: si tengo dos diapasones que producen 440 Hz nominales, uno de ellos podría producir una frecuencia de 440,1 Hz y después de 5 segundos las dos formas de onda se habrían desfasado por 180 grados (esta es la causa de los "golpes"). Cualquier sonido que haga se compone de muchas frecuencias; consulte, por ejemplo , esta preguntay respuestas asociadas, que juntas forman un fonema reconocible (sonido que hace una letra o grupo de letras). Cuando dos personas "hablan al mismo tiempo", estarán produciendo un fonema, pero no en la misma frecuencia. Sin embargo, cuando dos personas dicen "A", nuestros oídos son bastante buenos para captar el hecho de que están diciendo "A", incluso cuando están usando una frecuencia fundamental diferente.

Cuando dos formas de onda son incoherentes (como es el caso de varias personas hablando), podemos sumar la potencia de las voces individuales, que equivale al cuadrado de la amplitud de las voces individuales. Las amplitudes reales a veces se sumarán en fase (el doble de amplitud, cuatro veces la potencia instantánea), en otras ocasiones interferirán destructivamente (amplitud cero, potencia cero). El promedio de tiempo sigue siendo el mismo que la suma de la potencia de las dos fuentes.

Lo mismo es cierto para "muchas" fuentes. Entonces, si tiene 1000 voces susurrando, puede esperar que la amplitud en promedio aumente en aproximadamente 30 x ( 1000 ); si esa amplitud es suficiente para exceder el umbral de audición para usted, es posible que pueda escucharlos; y si sus voces son "bastante similares" en tono, es posible que pueda entender lo que están diciendo. Pero esto último no es del todo seguro: la capacidad de distinguir fonemas se vuelve más complicada cuando hay más frecuencias presentes. De hecho, si cada uno habla "en su propio tono", el sonido resultante será como un ruido blanco y no entenderás lo que se dice.

ACTUALIZAR

Decidí hacer un experimento. Me grabé diciendo una determinada frase 19 veces, aproximadamente con el mismo tempo y volumen. Reduje la amplitud de la grabación y agregué algo de ruido. Esto resultó en un " mensaje inaudible ".

A continuación, corté la pista de sonido en 19 segmentos que alineé con la ayuda de algún procesamiento de señal (había un sonido "th" distinto al comienzo del mensaje). Agregar estas señales (recuerde, son grabaciones "diferentes" del mismo mensaje, un poco como tener 19 personas diferentes tratando de susurrar lo mismo al mismo tiempo), con la misma cantidad de ruido agregado, resultó en un mensaje audible .

Finalmente, me metí con los retrasos. Suponiendo que las personas no estarían a menos de 1 m de distancia, puede suponer que un gran "coro" de personas tendrá cierto retraso relativo en sus susurros; Agregué un cambio de "retraso de 1 m" entre cada una de las 19 señales antes de sumarlas, y aunque la señal se vuelve un poco menos nítida, todavía es claramente audible .

Por supuesto, se organizaría un grupo de 1000 personas para tratar de minimizar este retraso: si organiza un gran grupo de personas en una serie de (semi) círculos concéntricos, el retraso en la llegada de las voces no tiene por qué ser mucho peor que en mi caso. ejemplo.

Si está interesado en el código de Python que utilicé para procesar la imagen (nota: hay una serie de otros experimentos y tramas en este código... siéntase libre de jugar con él):

# read the whisper file
import scipy.io.wavfile as WVF
from scipy.signal import argrelextrema

import numpy as np
import matplotlib.pyplot as plt
import wave

# convert mp3 to wav:
# ffmpeg -i ~/Desktop/170826_0080.mp3 ~/Desktop/longwhisper.wav"

A = WVF.read('/Users/floris/Desktop/longwhisper.wav')
# attenuate the sound wave so I have some dynamic range for adding later
soundWave = 0.1*A[1].astype('float')

N = len(A[1])
timeAxis = np.arange(N).astype('float')/A[0]

# visualize sound wave
plt.figure()
plt.plot(timeAxis, soundWave)
plt.title('original sound wave')
plt.show()

# do some filtering
tt1 = np.linspace(-5,5,1000)
filt1 = np.exp(-tt1*tt1/2)
filt1 = filt1 / np.sum(filt1)

tt = np.linspace(-5,5,50000)
filt = np.exp(-tt*tt/2)
filt = filt / np.sum(filt)

baseline = np.convolve(soundWave, filt1, mode='same')
# high frequencies only:
hf = soundWave - baseline
plt.figure()
plt.plot(timeAxis, hf)
plt.plot(timeAxis, baseline, 'r')
plt.title('after subtracting baseline')
plt.show()

soundPower = hf*hf

soundPower = np.convolve(soundPower, filt, mode='same')
plt.figure()
plt.plot(timeAxis, soundPower)
plt.title('smoothed sound power')
plt.xlabel('time (s)')
plt.show()

# find the actual peaks
pks = argrelextrema(soundPower, np.greater)
pkVals = soundPower[pks[0]]
pkSort = np.argsort(pkVals)

# time points corresponding to the 40 largest peaks... this includes the "pops"
# at the start of each phrase
timePoints = np.sort(pks[0][pkSort[-40:]])

# look at the spacing between pops - we know it should be roughly 82000 samples
makeSense = np.diff(timePoints)

startPoints = []

currentTime = makeSense[0]
lastTime = currentTime
for ii in makeSense[1:]:
    if abs(currentTime - 82000 - lastTime) < abs(currentTime + ii - 82000 - lastTime):
        startPoints.append( currentTime)
        lastTime = currentTime
    currentTime += ii

# shift back a bit - we need to start just before the pop:
startPoints = np.array(startPoints)+timePoints[0]-8000

plt.figure()
for ii in range(len(startPoints)):
  temp = soundPower[startPoints[ii]:startPoints[ii]+78000]
  plt.plot(temp/np.max(temp)+0.1*ii)

plt.title('sound power after aligning')
plt.show()  

# sum the blocks:

# high frequency filter on the noise - make it a bit more "pink":
tt2 = np.linspace(-5,5,20)
filt2= np.exp(-tt2*tt2/2)
filt2 = filt2 / np.sum(filt2)

def addNoise(waveIn, noiseAmp):
    noise = np.convolve(np.random.random_integers(-noiseAmp, noiseAmp, size=np.shape(waveIn)), filt2, mode='same')
    return waveIn + noise

def writeFile(block, fileName):
    pv = block.astype(np.int16).tobytes()
    sound = wave.open(fileName, 'w')
    sound.setparams((1,2,44100, 0, 'NONE', 'not compressed'))
    sound.writeframes(pv)
    sound.close()

def hpFilter(block, f=filt1):
    return block - np.convolve(block, f, 'same')

# for noiseAmplitude in [0, 100, 200, 500, 1000]:
# stagger the sounds: 1 m = 1/300th second = 130 samples
# a crowd of 1000 people could be placed in a semicircle of 50 people, 20 deep
# that makes the delta x about 10 m if they are "optimally aligned"
noiseAmplitude = 500
for spacing in np.arange(0,2,0.5):
 stagger = int(spacing * 44100 / 340.)
 duration = 78000
 start = startPoints[0]-10*stagger
 sumblock = addNoise(soundWave[start:start+duration], noiseAmplitude)
 catblock = np.copy(sumblock)

 # add the shifted samples:
 for ii in range(1,19):
    ti = startPoints[ii] +(ii-10)*stagger
    temp = hpFilter(soundWave[ti:ti+duration])
    sumblock = sumblock + temp;
    catblock=np.r_[catblock, addNoise(temp, noiseAmplitude)]

 writeFile(sumblock,'/Users/floris/Desktop/onewhisper_%d_s=%.1f.wav'%(noiseAmplitude, spacing))
 writeFile(catblock, '/Users/floris/Desktop/evenwhisper_%d_s=%.1f.wav'%(noiseAmplitude, spacing))

plt.figure()
plt.plot(sumblock)
plt.title('sum signal: noise = %d'%noiseAmplitude)
plt.show()

Con un "¡gracias!" a AccidentalFourierTransform quien sugirió usar Archive.org como un posible lugar para alojar los archivos de audio.

¡Guau! Ahora, esa es definitivamente la mejor respuesta.

Creo que depende de lo que quieras decir con "susurrar inaudiblemente". Hay susurros de escenario, que en realidad están destinados a ser escuchados desde lejos, y susurros reales, destinados a ser escuchados por la persona que está a tu lado, pero no por la persona que está a su lado, y susurros inaudibles, que ni siquiera son audibles para la persona. quien los emite.

Acabo de regresar de un ensayo del coro en el que el director hizo que el coro hiciera un estiramiento moderadamente vigoroso, luego tomó un descanso y dijo: "Toma cinco respiraciones profundas". Seguido inmediatamente por "Toma cinco respiraciones profundas para que no pueda escucharlas ". La diferencia instantánea en el sonido en la habitación fue notable.

Ciertamente he estado en multitudes de mil personas donde muchos susurraban y el resultado era audible, pero no puedo recordar una multitud donde todos susurraran "inaudiblemente" lo mismo. Hay un lugar cerca del final de la segunda sinfonía de Mahler donde un gran coro --- como, 100--150 cantantes --- entra lo más silencioso posible , con suerte más silencioso que un solo miembro de la audiencia tosiendo . Puedo decirte por experiencia que la forma de lograrlo es que todos en el coro canten "inaudiblemente", pero eso no es susurrar. Y también he estado en multitudes de más de mil personas donde había un silencio total, donde me sentí obligado a susurrarme "inaudiblemente" solo para asegurarme de que no lo había hecho.

Por lo tanto, mi experiencia anecdótica es que "susurrar de forma inaudible" se define de manera lo suficientemente turbia como para que sea posible que el ruido silencioso corporativo caiga por encima del umbral de audición, y también que permanezca por debajo del umbral de audición, incluso para multitudes muy grandes. . Depende de lo que entiendas por "inaudible".

Sí, y si se hace con cuidado, no sólo audible, sino comprensible.

[ Actualización : de hecho, vea la respuesta de Floris - ¡incluya archivos de audio para probarlo!]

Por ejemplo, deben susurrar exactamente juntos solo si están equidistantes del punto de audición; para un punto elegido arbitrariamente, deben susurrar con pequeños retrasos entre ellos, de modo que el sonido llegue al punto en sincronía, interfiriendo constructivamente.

Editar : eso es así si, además de ser audible, se desea que el sonido también sea comprensible. Como muchos señalaron, incluso el ruido aleatorio susurrado conducirá a un aumento del volumen.

Además, "hecho con cuidado" se puede lograr de formas distintas a las anteriores, que es solo un ejemplo. Otra forma es susurrando/hablando lentamente: como cuando los estudiantes saludan al unísono a un maestro entrante, o las personas en un auditorio responden a la solicitud de un animador.

Y, por último, probablemente realmente tenga que ser solo "algo cuidadoso", ya que el aumento de volumen también ocurre (y las palabras a menudo se pueden entender) cuando el público en concierto, un coro o un grupo de feligreses cantan juntos.

Un ejemplo de un coro susurrando podría convencer a los detractores ;-) https://youtu.be/yaNeIgBZSUE?t=89

Los comentarios no son para una discusión extensa; esta conversación se ha movido a chat .
Para que se produzcan interferencias , las formas de onda deben ser muy similares, en particular en términos de frecuencia. Esto no se cumplirá con susurros (que se basan en formas de onda aleatorias de aire silbando en la garganta), o incluso personas hablando (las frecuencias de las voces difieren). Las energías de las voces se sumarán, pero no producirán ningún patrón característico de interferencia.

Esta es una pregunta interesante que no se puede responder exactamente, pero aquí hay algunas cosas en las que pensar.

Para el oído "estándar" según Wikipedia , el umbral auditivo de audición a una frecuencia de 1 k H z se toma como 0 d B que corresponde a una presión sonora de 2 × 10 5 PAGS a . Así que usaré esta cifra para toda la gama de frecuencias de la voz humana y supondré que este es el susurro de una fuente que llega al oído de la persona que escucha las mil.
Si este es el nivel de sonido del susurro en la fuente, entonces se tendría que hacer una corrección por la reducción en la intensidad del sonido debido a que el sonido tiene que viajar una distancia entre la fuente y el receptor.

Ahora uno tiene que pensar en la naturaleza de los sonidos que provienen de cada una de las fuentes.
Asumiré que la intensidad del sonido debido a cada fuente es la misma.
Si las fuentes de sonido son coherentes, se deben sumar las presiones (amplitudes) y luego elevarlas al cuadrado para obtener la intensidad.

Así que para una fuente 0 d B = 10 Iniciar sesión 10 ( yo 0 d B yo r mi F mi r mi norte C mi ) dónde yo es la intensidad.

Para 1000 fuentes coherentes el nivel de sonido es

10 Iniciar sesión 10 ( 1000 2 × yo 0 d B yo r mi F mi r mi norte C mi ) = 10 Iniciar sesión 10 ( 10 6 ) + 10 Iniciar sesión 10 ( yo 0 d B yo r mi F mi r mi norte C mi ) = 60 d B + 0 d B = 60 d B

que según Wikipedia es el sonido de una televisión o conversación normal.

En el otro extremo está tener las fuentes de sonido completamente no coherentes.
En este caso, son las intensidades las que deben "sumarse" y la intensidad para 1000 de tales fuentes sería

10 Iniciar sesión 10 ( 1000 × yo 0 d B yo r mi F mi r mi norte C mi ) = 10 Iniciar sesión 10 ( 10 3 ) + 10 Iniciar sesión 10 ( yo 0 d B yo r mi F mi r mi norte C mi ) = 30 d B + 0 d B = 30 d B

que según Wikipedia es el nivel de sonido en una habitación muy tranquila que, por supuesto, se podía escuchar.

¿Es probable que la multitud tienda a ser un conjunto de fuentes no coherentes?

Entonces, dependiendo de cómo esté lejos de la multitud, parece que es (¿muy?) probable que escuche un "zumbido" de una multitud de 1000 personas.

En el caso ideal. Creo que @JohnBentin hizo el punto crítico de que, en una multitud de 1000 personas, la atenuación debida a la absorción a través de la multitud y al reflejo de otras superficies produciría un resultado considerablemente más bajo que el caso puramente incoherente de 30dB. Posiblemente todavía audible, por supuesto, pero esto creo que 30dB es más o menos el límite superior teórico.
@J... Gracias por tu comentario. Mi objetivo no era dar una respuesta detallada, sino hacer una especie de cálculo de orden de magnitud para ver si existe la posibilidad de que se escuche a una multitud.
No puedo imaginar cómo el ruido podría ser coherente. Si es inaudible, no pueden escucharse entre sí para coordinarse, incluso si tuvieran la habilidad suficiente para hacerlo.
@LorenPechtel incluso más que eso, si bien la modulación de amplitud de la forma de onda podría estar correlacionada ya que está controlada por movimientos gruesos del tracto vocal, no veo cómo podríamos controlar la estructura fina de los sonidos sordos como un susurro.

Si puede escuchar un sonido depende de varios factores:

  1. Qué tan intenso es un sonido cuando llega a tu oído. Esto, a su vez, también depende de varios factores, entre los cuales de los más importantes se encuentran:

    1. Con qué intensidad radiante se emite el sonido en su dirección por la fuente del sonido,

    2. A qué distancia se encuentra de la fuente del sonido, ya que la intensidad del sonido es inversamente proporcional a la distancia al cuadrado, y

    3. Desde qué dirección se propaga el sonido hacia usted y su composición espectral (es decir, cómo se distribuye la intensidad del sonido en el espectro de sonido), ya que su cabeza y oídos bloquearán o amplificarán una parte específica del espectro de sonido de manera diferente según la frecuencia y la dirección. , como se explica brevemente en este video SmarterEveryDay .

  2. La composición espectral del sonido que ingresa a su oído, ya que su oído captará diferentes partes del espectro de manera muy diferente y requiere diferentes intensidades de sonido para que dos sonidos monocromáticos diferentes con dos frecuencias diferentes se perciban con la misma intensidad (algunas frecuencias son difíciles de escuchar). percibir o no puede ser percibido en absoluto, por ejemplo).

Si el volumen de un sonido excede un cierto umbral , se puede escuchar.

Suponiendo que todas las mil personas susurran aproximadamente con la misma intensidad y con aproximadamente la misma composición espectral en sus voces, y mirando hacia usted aproximadamente en la misma medida, y que el punto 1.3 tiene un efecto insignificante, de los puntos enumerados solo tenemos que considerar el punto 1.2.

Además, como algunas personas señalan, la presión sonora de un sonido (más o menos equivalente al sonido "amplitud" para los sonidos monocromáticos) que consiste en múltiples sonidos será simplemente la suma de las diferentes presiones sonoras aportadas por las diferentes fuentes de sonido.

Dado que se puede suponer que todas las ondas de sonido son paralelas cuando ingresan a uno de los canales de su oído, la velocidad de las partículas de aire será proporcional a la presión del sonido y la intensidad del sonido será proporcional a la presión del sonido al cuadrado.

Dado que la presión del sonido promediada en el tiempo es igual a cero, la intensidad del sonido promedio será proporcional a la variación de la presión del sonido. Si se puede suponer que todos los sonidos de las mil personas que susurran no están correlacionados , la varianza de la suma de las diferentes presiones de sonido es igual a la suma de las varianzas de las diferentes presiones de sonido.

Por lo tanto, la intensidad de sonido promedio del sonido total es igual a la suma de los promedios de las intensidades de sonido de los diferentes sonidos, si eso tiene algún sentido.

O, en otras palabras, el volumen aumenta con el número de fuentes de sonido (no correlacionadas).

Sin embargo, si el hecho de que aumente el número de personas de uno a mil significa que tienen que alejarse más de usted, este hecho adicional disminuirá el volumen del sonido y puede cancelar el efecto de aumentar el número de personas. , o incluso hacer que el sonido sea menos fuerte de lo que sería con una sola persona, dependiendo de cómo se coloquen las personas, ya que la intensidad del sonido será proporcional a

i norte 1 d i 2 = norte d 2 ,

dónde d i es la distancia al i ª persona y norte es el número de personas.

Hay una manera simple de probar esto agregando un montón de ondas sinusoidales con diferentes fases.

Si tomamos un conjunto aleatorio de fases en el intervalo [ 0 , 2 π ] entonces podemos obtener interferencias constructivas y destructivas . Usando Mathematica uno puede configurar esto como:
xx := RandomReal[{0,2 \[Pi]},20]
mysin[t_] := Sum[Sin[t + xx[[i]]],{i,1,20,1}]
Plot[mysin[t],{t,0,2 \[Pi]}]

El resultado neto será la forma de onda ruidosa que se muestra a continuación. Note que las amplitudes exceden ~10 pero la magnitud máxima del seno es 1.0. La mayor amplitud resulta de la interferencia constructiva.ondas sinusoidales con fases aleatorias, ambos tipos de interferencia

Si sólo dejamos que varíen las fases en el intervalo [ 0 , π ] luego obtenemos una interferencia casi completamente constructiva vista como la onda sinusoidal "difusa" a continuación.yy := RandomReal[{0,\[Pi]},20]
mysin2[t_] := Sum[Sin[t + yy[[i]]],{i,1,20,1}]
Plot[mysin2[t],{t,0,2 \[Pi]}]

ondas sinusoidales con fases aleatorias, interferencia constructiva

Si mil personas susurran de forma inaudible, ¿será audible el sonido resultante? (... suponiendo que estén susurrando juntos.)

La respuesta es básicamente sí, precisamente por el efecto visto en el primer ejemplo anterior. Esta es también la razón por la cual un pantano lleno de ranas o grillos puede sonar casi ensordecedor a pesar de que cada individuo no es muy ruidoso.

Creo que la respuesta es "sí" porque las amplitudes simplemente se sumarían y, por lo tanto, alcanzarían un umbral audible. ¿Es esto correcto?

Algunos agregan sí, pero algunos "restan", que es lo que entendí por interferencia destructiva. Esta es la razón por la cual el primer ejemplo de onda sinusoidal anterior parece un desastre.

La forma de onda del segundo ejemplo sería un resultado extremadamente idealizado de una multitud orquestada susurrando al unísono. Sin embargo, el sonido producido al hablar casi nunca es una sola onda sinusoidal agradable como esta, sino muchas ondas sinusoidales que tienen una envolvente modulada .

Piense en ello como altavoces. Si tiene un altavoz a un volumen específico y luego agrega un segundo altavoz en el rango del primero, el volumen del sonido aumentará.

No necesariamente. Ver control de ruido activo en.wikipedia.org/wiki/Active_noise_control
@ user1583209 Traté de interferir destructivamente con los susurros de mi amigo susurrando 180° fuera de fase, pero no funcionó. ¿Puedes mostrarme cómo lo haces?
@Sneftel Supongo que tampoco funcionó el susurro en fase; Lo cual es mi punto exactamente.