Si mil personas susurran de forma inaudible, ¿será audible el sonido resultante? (... suponiendo que estén susurrando juntos.)
Creo que la respuesta es "sí" porque las amplitudes simplemente se sumarían y, por lo tanto, alcanzarían un umbral audible. ¿Es esto correcto?
si es posible, proporcione una explicación lo suficientemente simple para personas que no son físicas
Sí, siempre.
Me gustaría estar en desacuerdo con la respuesta de stafusa aquí, ampliando el comentario de Rod. No se producirán interferencias, ya que para susurrar las fuentes de sonido serán estadísticamente independientes .
Para la demostración, miremos a dos personas. La persona 1 produce un susurro que se puede caracterizar por un campo de sonido que se propaga , dónde es la posición en el espacio y es hora. Del mismo modo, la persona 2 produce un susurro . Entonces, el campo general en un punto del espacio es simplemente
ya que las ondas de sonido son aproximadamente lineales (al menos para las amplitudes de onda alcanzables por las voces).
Lo que percibes como 'volumen' (lo llamaré para la intensidad) es el promedio de tiempo de la magnitud de la señal total
Es decir, su oído está promediando fluctuaciones muy cortas en la señal. Luego podemos expandir esto en términos de las señales de las dos personas para obtener
Hasta ahora, esto es completamente general. Ahora asumimos la independencia estadística de las fuentes, lo que hace que el último término sea cero:
Entonces, la intensidad general es simplemente la suma de las dos intensidades de susurro.
La amplitud de la suma de ruidos no correlacionados igualmente fuertes serán aproximadamente , o aproximadamente , veces la amplitud de un solo ruido. Eso podría ser suficiente para hacer que un susurro inaudible sea solo audible. Considere los aspectos prácticos, sin embargo. Las personas no pueden ocupar todas el mismo lugar. Si se dispersan, la mayoría de ellos estarán demasiado lejos para escuchar. Incluso si están amontonados, sus cuerpos y ropa serán un medio excelente para absorber el sonido. Probablemente, todo lo que escuchará es el sonido involuntario emitido ocasionalmente por un solo individuo.
La respuesta es "tal vez". 1000 susurros inaudibles pueden seguir siendo inaudibles; la pregunta que probablemente quiso hacer es "¿el sonido de 1000 personas susurrando al mismo tiempo sería más fuerte que el sonido de 1 persona susurrando?"
La respuesta a esa pregunta es un rotundo "sí". ¿Cuánto más fuertes serán, y eso resultará en un mensaje audible / comprensible?
Para ello es necesario comprender el concepto de interferencia y coherencia . Dos fuentes (de sonido) son coherentes si producen la misma forma de onda. En el mundo real, la coherencia suele estar limitada en el tiempo: si tengo dos diapasones que producen 440 Hz nominales, uno de ellos podría producir una frecuencia de 440,1 Hz y después de 5 segundos las dos formas de onda se habrían desfasado por 180 grados (esta es la causa de los "golpes"). Cualquier sonido que haga se compone de muchas frecuencias; consulte, por ejemplo , esta preguntay respuestas asociadas, que juntas forman un fonema reconocible (sonido que hace una letra o grupo de letras). Cuando dos personas "hablan al mismo tiempo", estarán produciendo un fonema, pero no en la misma frecuencia. Sin embargo, cuando dos personas dicen "A", nuestros oídos son bastante buenos para captar el hecho de que están diciendo "A", incluso cuando están usando una frecuencia fundamental diferente.
Cuando dos formas de onda son incoherentes (como es el caso de varias personas hablando), podemos sumar la potencia de las voces individuales, que equivale al cuadrado de la amplitud de las voces individuales. Las amplitudes reales a veces se sumarán en fase (el doble de amplitud, cuatro veces la potencia instantánea), en otras ocasiones interferirán destructivamente (amplitud cero, potencia cero). El promedio de tiempo sigue siendo el mismo que la suma de la potencia de las dos fuentes.
Lo mismo es cierto para "muchas" fuentes. Entonces, si tiene 1000 voces susurrando, puede esperar que la amplitud en promedio aumente en aproximadamente 30 x ( ); si esa amplitud es suficiente para exceder el umbral de audición para usted, es posible que pueda escucharlos; y si sus voces son "bastante similares" en tono, es posible que pueda entender lo que están diciendo. Pero esto último no es del todo seguro: la capacidad de distinguir fonemas se vuelve más complicada cuando hay más frecuencias presentes. De hecho, si cada uno habla "en su propio tono", el sonido resultante será como un ruido blanco y no entenderás lo que se dice.
ACTUALIZAR
Decidí hacer un experimento. Me grabé diciendo una determinada frase 19 veces, aproximadamente con el mismo tempo y volumen. Reduje la amplitud de la grabación y agregué algo de ruido. Esto resultó en un " mensaje inaudible ".
A continuación, corté la pista de sonido en 19 segmentos que alineé con la ayuda de algún procesamiento de señal (había un sonido "th" distinto al comienzo del mensaje). Agregar estas señales (recuerde, son grabaciones "diferentes" del mismo mensaje, un poco como tener 19 personas diferentes tratando de susurrar lo mismo al mismo tiempo), con la misma cantidad de ruido agregado, resultó en un mensaje audible .
Finalmente, me metí con los retrasos. Suponiendo que las personas no estarían a menos de 1 m de distancia, puede suponer que un gran "coro" de personas tendrá cierto retraso relativo en sus susurros; Agregué un cambio de "retraso de 1 m" entre cada una de las 19 señales antes de sumarlas, y aunque la señal se vuelve un poco menos nítida, todavía es claramente audible .
Por supuesto, se organizaría un grupo de 1000 personas para tratar de minimizar este retraso: si organiza un gran grupo de personas en una serie de (semi) círculos concéntricos, el retraso en la llegada de las voces no tiene por qué ser mucho peor que en mi caso. ejemplo.
Si está interesado en el código de Python que utilicé para procesar la imagen (nota: hay una serie de otros experimentos y tramas en este código... siéntase libre de jugar con él):
# read the whisper file
import scipy.io.wavfile as WVF
from scipy.signal import argrelextrema
import numpy as np
import matplotlib.pyplot as plt
import wave
# convert mp3 to wav:
# ffmpeg -i ~/Desktop/170826_0080.mp3 ~/Desktop/longwhisper.wav"
A = WVF.read('/Users/floris/Desktop/longwhisper.wav')
# attenuate the sound wave so I have some dynamic range for adding later
soundWave = 0.1*A[1].astype('float')
N = len(A[1])
timeAxis = np.arange(N).astype('float')/A[0]
# visualize sound wave
plt.figure()
plt.plot(timeAxis, soundWave)
plt.title('original sound wave')
plt.show()
# do some filtering
tt1 = np.linspace(-5,5,1000)
filt1 = np.exp(-tt1*tt1/2)
filt1 = filt1 / np.sum(filt1)
tt = np.linspace(-5,5,50000)
filt = np.exp(-tt*tt/2)
filt = filt / np.sum(filt)
baseline = np.convolve(soundWave, filt1, mode='same')
# high frequencies only:
hf = soundWave - baseline
plt.figure()
plt.plot(timeAxis, hf)
plt.plot(timeAxis, baseline, 'r')
plt.title('after subtracting baseline')
plt.show()
soundPower = hf*hf
soundPower = np.convolve(soundPower, filt, mode='same')
plt.figure()
plt.plot(timeAxis, soundPower)
plt.title('smoothed sound power')
plt.xlabel('time (s)')
plt.show()
# find the actual peaks
pks = argrelextrema(soundPower, np.greater)
pkVals = soundPower[pks[0]]
pkSort = np.argsort(pkVals)
# time points corresponding to the 40 largest peaks... this includes the "pops"
# at the start of each phrase
timePoints = np.sort(pks[0][pkSort[-40:]])
# look at the spacing between pops - we know it should be roughly 82000 samples
makeSense = np.diff(timePoints)
startPoints = []
currentTime = makeSense[0]
lastTime = currentTime
for ii in makeSense[1:]:
if abs(currentTime - 82000 - lastTime) < abs(currentTime + ii - 82000 - lastTime):
startPoints.append( currentTime)
lastTime = currentTime
currentTime += ii
# shift back a bit - we need to start just before the pop:
startPoints = np.array(startPoints)+timePoints[0]-8000
plt.figure()
for ii in range(len(startPoints)):
temp = soundPower[startPoints[ii]:startPoints[ii]+78000]
plt.plot(temp/np.max(temp)+0.1*ii)
plt.title('sound power after aligning')
plt.show()
# sum the blocks:
# high frequency filter on the noise - make it a bit more "pink":
tt2 = np.linspace(-5,5,20)
filt2= np.exp(-tt2*tt2/2)
filt2 = filt2 / np.sum(filt2)
def addNoise(waveIn, noiseAmp):
noise = np.convolve(np.random.random_integers(-noiseAmp, noiseAmp, size=np.shape(waveIn)), filt2, mode='same')
return waveIn + noise
def writeFile(block, fileName):
pv = block.astype(np.int16).tobytes()
sound = wave.open(fileName, 'w')
sound.setparams((1,2,44100, 0, 'NONE', 'not compressed'))
sound.writeframes(pv)
sound.close()
def hpFilter(block, f=filt1):
return block - np.convolve(block, f, 'same')
# for noiseAmplitude in [0, 100, 200, 500, 1000]:
# stagger the sounds: 1 m = 1/300th second = 130 samples
# a crowd of 1000 people could be placed in a semicircle of 50 people, 20 deep
# that makes the delta x about 10 m if they are "optimally aligned"
noiseAmplitude = 500
for spacing in np.arange(0,2,0.5):
stagger = int(spacing * 44100 / 340.)
duration = 78000
start = startPoints[0]-10*stagger
sumblock = addNoise(soundWave[start:start+duration], noiseAmplitude)
catblock = np.copy(sumblock)
# add the shifted samples:
for ii in range(1,19):
ti = startPoints[ii] +(ii-10)*stagger
temp = hpFilter(soundWave[ti:ti+duration])
sumblock = sumblock + temp;
catblock=np.r_[catblock, addNoise(temp, noiseAmplitude)]
writeFile(sumblock,'/Users/floris/Desktop/onewhisper_%d_s=%.1f.wav'%(noiseAmplitude, spacing))
writeFile(catblock, '/Users/floris/Desktop/evenwhisper_%d_s=%.1f.wav'%(noiseAmplitude, spacing))
plt.figure()
plt.plot(sumblock)
plt.title('sum signal: noise = %d'%noiseAmplitude)
plt.show()
Con un "¡gracias!" a AccidentalFourierTransform quien sugirió usar Archive.org como un posible lugar para alojar los archivos de audio.
Creo que depende de lo que quieras decir con "susurrar inaudiblemente". Hay susurros de escenario, que en realidad están destinados a ser escuchados desde lejos, y susurros reales, destinados a ser escuchados por la persona que está a tu lado, pero no por la persona que está a su lado, y susurros inaudibles, que ni siquiera son audibles para la persona. quien los emite.
Acabo de regresar de un ensayo del coro en el que el director hizo que el coro hiciera un estiramiento moderadamente vigoroso, luego tomó un descanso y dijo: "Toma cinco respiraciones profundas". Seguido inmediatamente por "Toma cinco respiraciones profundas para que no pueda escucharlas ". La diferencia instantánea en el sonido en la habitación fue notable.
Ciertamente he estado en multitudes de mil personas donde muchos susurraban y el resultado era audible, pero no puedo recordar una multitud donde todos susurraran "inaudiblemente" lo mismo. Hay un lugar cerca del final de la segunda sinfonía de Mahler donde un gran coro --- como, 100--150 cantantes --- entra lo más silencioso posible , con suerte más silencioso que un solo miembro de la audiencia tosiendo . Puedo decirte por experiencia que la forma de lograrlo es que todos en el coro canten "inaudiblemente", pero eso no es susurrar. Y también he estado en multitudes de más de mil personas donde había un silencio total, donde me sentí obligado a susurrarme "inaudiblemente" solo para asegurarme de que no lo había hecho.
Por lo tanto, mi experiencia anecdótica es que "susurrar de forma inaudible" se define de manera lo suficientemente turbia como para que sea posible que el ruido silencioso corporativo caiga por encima del umbral de audición, y también que permanezca por debajo del umbral de audición, incluso para multitudes muy grandes. . Depende de lo que entiendas por "inaudible".
Sí, y si se hace con cuidado, no sólo audible, sino comprensible.
[ Actualización : de hecho, vea la respuesta de Floris - ¡incluya archivos de audio para probarlo!]
Por ejemplo, deben susurrar exactamente juntos solo si están equidistantes del punto de audición; para un punto elegido arbitrariamente, deben susurrar con pequeños retrasos entre ellos, de modo que el sonido llegue al punto en sincronía, interfiriendo constructivamente.
Editar : eso es así si, además de ser audible, se desea que el sonido también sea comprensible. Como muchos señalaron, incluso el ruido aleatorio susurrado conducirá a un aumento del volumen.
Además, "hecho con cuidado" se puede lograr de formas distintas a las anteriores, que es solo un ejemplo. Otra forma es susurrando/hablando lentamente: como cuando los estudiantes saludan al unísono a un maestro entrante, o las personas en un auditorio responden a la solicitud de un animador.
Y, por último, probablemente realmente tenga que ser solo "algo cuidadoso", ya que el aumento de volumen también ocurre (y las palabras a menudo se pueden entender) cuando el público en concierto, un coro o un grupo de feligreses cantan juntos.
Un ejemplo de un coro susurrando podría convencer a los detractores ;-) https://youtu.be/yaNeIgBZSUE?t=89
Esta es una pregunta interesante que no se puede responder exactamente, pero aquí hay algunas cosas en las que pensar.
Para el oído "estándar" según Wikipedia , el umbral auditivo de audición a una frecuencia de
se toma como
que corresponde a una presión sonora de
. Así que usaré esta cifra para toda la gama de frecuencias de la voz humana y supondré que este es el susurro de una fuente que llega al oído de la persona que escucha las mil.
Si este es el nivel de sonido del susurro en la fuente, entonces se tendría que hacer una corrección por la reducción en la intensidad del sonido debido a que el sonido tiene que viajar una distancia entre la fuente y el receptor.
Ahora uno tiene que pensar en la naturaleza de los sonidos que provienen de cada una de las fuentes.
Asumiré que la intensidad del sonido debido a cada fuente es la misma.
Si las fuentes de sonido son coherentes, se deben sumar las presiones (amplitudes) y luego elevarlas al cuadrado para obtener la intensidad.
Así que para una fuente dónde es la intensidad.
Para fuentes coherentes el nivel de sonido es
que según Wikipedia es el sonido de una televisión o conversación normal.
En el otro extremo está tener las fuentes de sonido completamente no coherentes.
En este caso, son las intensidades las que deben "sumarse" y la intensidad para 1000 de tales fuentes sería
que según Wikipedia es el nivel de sonido en una habitación muy tranquila que, por supuesto, se podía escuchar.
¿Es probable que la multitud tienda a ser un conjunto de fuentes no coherentes?
Entonces, dependiendo de cómo esté lejos de la multitud, parece que es (¿muy?) probable que escuche un "zumbido" de una multitud de 1000 personas.
Si puede escuchar un sonido depende de varios factores:
Qué tan intenso es un sonido cuando llega a tu oído. Esto, a su vez, también depende de varios factores, entre los cuales de los más importantes se encuentran:
Con qué intensidad radiante se emite el sonido en su dirección por la fuente del sonido,
A qué distancia se encuentra de la fuente del sonido, ya que la intensidad del sonido es inversamente proporcional a la distancia al cuadrado, y
Desde qué dirección se propaga el sonido hacia usted y su composición espectral (es decir, cómo se distribuye la intensidad del sonido en el espectro de sonido), ya que su cabeza y oídos bloquearán o amplificarán una parte específica del espectro de sonido de manera diferente según la frecuencia y la dirección. , como se explica brevemente en este video SmarterEveryDay .
La composición espectral del sonido que ingresa a su oído, ya que su oído captará diferentes partes del espectro de manera muy diferente y requiere diferentes intensidades de sonido para que dos sonidos monocromáticos diferentes con dos frecuencias diferentes se perciban con la misma intensidad (algunas frecuencias son difíciles de escuchar). percibir o no puede ser percibido en absoluto, por ejemplo).
Si el volumen de un sonido excede un cierto umbral , se puede escuchar.
Suponiendo que todas las mil personas susurran aproximadamente con la misma intensidad y con aproximadamente la misma composición espectral en sus voces, y mirando hacia usted aproximadamente en la misma medida, y que el punto 1.3 tiene un efecto insignificante, de los puntos enumerados solo tenemos que considerar el punto 1.2.
Además, como algunas personas señalan, la presión sonora de un sonido (más o menos equivalente al sonido "amplitud" para los sonidos monocromáticos) que consiste en múltiples sonidos será simplemente la suma de las diferentes presiones sonoras aportadas por las diferentes fuentes de sonido.
Dado que se puede suponer que todas las ondas de sonido son paralelas cuando ingresan a uno de los canales de su oído, la velocidad de las partículas de aire será proporcional a la presión del sonido y la intensidad del sonido será proporcional a la presión del sonido al cuadrado.
Dado que la presión del sonido promediada en el tiempo es igual a cero, la intensidad del sonido promedio será proporcional a la variación de la presión del sonido. Si se puede suponer que todos los sonidos de las mil personas que susurran no están correlacionados , la varianza de la suma de las diferentes presiones de sonido es igual a la suma de las varianzas de las diferentes presiones de sonido.
Por lo tanto, la intensidad de sonido promedio del sonido total es igual a la suma de los promedios de las intensidades de sonido de los diferentes sonidos, si eso tiene algún sentido.
O, en otras palabras, el volumen aumenta con el número de fuentes de sonido (no correlacionadas).
Sin embargo, si el hecho de que aumente el número de personas de uno a mil significa que tienen que alejarse más de usted, este hecho adicional disminuirá el volumen del sonido y puede cancelar el efecto de aumentar el número de personas. , o incluso hacer que el sonido sea menos fuerte de lo que sería con una sola persona, dependiendo de cómo se coloquen las personas, ya que la intensidad del sonido será proporcional a
dónde es la distancia al ª persona y es el número de personas.
Hay una manera simple de probar esto agregando un montón de ondas sinusoidales con diferentes fases.
Si tomamos un conjunto aleatorio de fases en el intervalo
entonces podemos obtener interferencias constructivas y destructivas . Usando Mathematica uno puede configurar esto como:
xx := RandomReal[{0,2 \[Pi]},20]
mysin[t_] := Sum[Sin[t + xx[[i]]],{i,1,20,1}]
Plot[mysin[t],{t,0,2 \[Pi]}]
El resultado neto será la forma de onda ruidosa que se muestra a continuación. Note que las amplitudes exceden ~10 pero la magnitud máxima del seno es 1.0. La mayor amplitud resulta de la interferencia constructiva.
Si sólo dejamos que varíen las fases en el intervalo
luego obtenemos una interferencia casi completamente constructiva vista como la onda sinusoidal "difusa" a continuación.yy := RandomReal[{0,\[Pi]},20]
mysin2[t_] := Sum[Sin[t + yy[[i]]],{i,1,20,1}]
Plot[mysin2[t],{t,0,2 \[Pi]}]
Si mil personas susurran de forma inaudible, ¿será audible el sonido resultante? (... suponiendo que estén susurrando juntos.)
La respuesta es básicamente sí, precisamente por el efecto visto en el primer ejemplo anterior. Esta es también la razón por la cual un pantano lleno de ranas o grillos puede sonar casi ensordecedor a pesar de que cada individuo no es muy ruidoso.
Creo que la respuesta es "sí" porque las amplitudes simplemente se sumarían y, por lo tanto, alcanzarían un umbral audible. ¿Es esto correcto?
Algunos agregan sí, pero algunos "restan", que es lo que entendí por interferencia destructiva. Esta es la razón por la cual el primer ejemplo de onda sinusoidal anterior parece un desastre.
La forma de onda del segundo ejemplo sería un resultado extremadamente idealizado de una multitud orquestada susurrando al unísono. Sin embargo, el sonido producido al hablar casi nunca es una sola onda sinusoidal agradable como esta, sino muchas ondas sinusoidales que tienen una envolvente modulada .
Piense en ello como altavoces. Si tiene un altavoz a un volumen específico y luego agrega un segundo altavoz en el rango del primero, el volumen del sonido aumentará.
craig hicks
floris
largo
usuario2357112
usuario129544
HSA