¿Qué es una explicación intuitiva para la integración?

Nunca he tomado un curso de cálculo formal, sin embargo, conozco algunos conceptos básicos como la diferenciación y los límites. Actualmente estoy leyendo un libro que es matemáticamente intensivo, y me encuentro con la notación de integración con bastante frecuencia, pero me falta una comprensión intuitiva para poder aplicarla al mundo físico o, en este caso, para comprender lo que está sucediendo. He leído explicaciones en línea y parece que tratan de encontrar el área bajo la curva pero carecen de una explicación fundamental. Agradecería si alguien pudiera explicarme la integración para obtener una comprensión intuitiva de la misma y poder aplicarla a los conceptos físicos.

Calcular la masa a partir de la densidad es un buen ejemplo a tener en cuenta. Sería fácil calcular la masa de un objeto si su densidad fuera constante. Así que corta el objeto en pedazos tan pequeños que la densidad sea aproximadamente constante para cada pedazo. Sume las masas de todas las piezas pequeñas.
Puede comenzar leyendo un poco sobre las sumas de Reimann (¿Esp?). Esencialmente, crea rectángulos entre sus dos curvas delimitadoras (generalmente entre el eje x y alguna función de x), encuentra las áreas de los rectángulos y luego suma esas áreas. Esto produce una aproximación del área debajo de la curva. El ancho de cada rectángulo se puede considerar delta x. Tome el límite de estas sumas a medida que delta x se acerca a cero (a medida que sus rectángulos se vuelven muy delgados). Eso es esencialmente, en términos generales, lo que está haciendo con la integración.
Una introducción intuitiva al cálculo que escribí una vez para mis alumnos podría interesarle.
una buena elección es pensar en un proceso de promediación.
Solo por curiosidad, ¿por qué la idea de área no es muy intuitiva? Es algo visual, y lo visual suele ser intuitivo?
Bueno, el área bajo la curva se calcula con rectángulos muy, muy delgados (o trapecios) y la altura de estos depende de la velocidad a la que la curva cambia de valor.
¿No es suficientemente intuitivo el concepto de trabajo? Incluso se utiliza para dar un significado intuitivo a las integrales de contorno en análisis complejos...
Es posible que desee consultar el libro Calculus Made Easy de Silvanus P. Thompson, que se cita con frecuencia aquí.

Respuestas (9)

El "área bajo la curva" solo funciona si ha sido entrenado (o usted mismo) para asociar el área bajo alguna curva con el fenómeno que está tratando de comprender. Esto funciona bien como una visualización de las matemáticas de un efecto electromagnético si ya entiendes ese efecto matemáticamente . Eso parece un poco al revés.

En otras palabras, creo que tienes una excelente pregunta.

Has obtenido al menos una buena respuesta. Lo siguiente es (o debería ser, si lo explico correctamente) completamente consistente con las otras respuestas, solo desde una perspectiva ligeramente diferente.

Considere una propiedad física como la carga en un capacitor. Empezamos con un condensador con una cierta cantidad de carga en cada lado y lo descargamos lentamente a través de algún dispositivo. Mientras se descarga, hacemos un seguimiento de la carga restante en un lado; digamos que elegimos el lado con carga negativa. Como puede imaginar, podemos considerar que la carga es una función del tiempo, que podríamos llamar q ( t ) . La derivada de esa función con respecto al tiempo, d d t q ( t ) , es la velocidad a la que cambia la carga (positiva en este caso, ya que la carga se vuelve menos negativa), es decir, la corriente , I ( t ) , fluyendo hacia ese lado del capacitor en cada instante de tiempo.

Ahora, la integral de una función a menudo se llama antiderivada. Si puedes entender cómo una cantidad física (por ejemplo, q ( t ) ) se relaciona con su derivada (por ejemplo, I ( t ) ), entonces puedes trabajar esa relación a la inversa. en lugar de medir q ( t ) en función del tiempo y la computación I ( t ) de ella, medir I ( t ) en función del tiempo y calcular q ( t ) de eso. Si conoce la carga en todo momento, puede reconstruir la medida de corriente; si conoce la medida de la corriente en todo momento, puede (en cierto sentido) reconstruir la carga. Hablando con más precisión, puede reconstruir cuánta carga se agregó o eliminó desde el instante en que comenzó a medir la corriente.

A veces estás midiendo una cantidad en función de algo distinto del tiempo, pero el principio es el mismo; todo lo que cambia es la variable o dimensión sobre la cual toma su derivada.

Entonces el nombre "antiderivada" es muy apropiado: dada una función, F , que es una derivada de alguna cantidad física, tomamos la antiderivada (integrar F ) para reconstruir (al menos en parte) la cantidad física original, que es en sí misma una función, F .

A veces la integración se realiza sobre un área o volumen. Una vez más, esto es simplemente invertir un diferencial/derivado, pero ahora el derivado se define en múltiples dimensiones en lugar de solo uno, y a menudo se lo considera como algún tipo de densidad.

Y deberíamos esperar que las herramientas de cálculo se apliquen en su mayoría de forma relativamente directa a los procesos físicos, ya que esa es una gran parte de la razón por la que se desarrollaron por primera vez.

la integral

a b F ( X ) d X
representa cuánto de algo se acumula a medida que barres F ( X ) a lo largo de X -eje desde a a b . Acumulación es una gran palabra aquí. Ilustremos con algunos ejemplos:

  • Área bajo la curva — Considerando la gráfica de F , siempre puedes pensar en F ( X ) como la distancia entre el X -eje y el punto ( X , F ( X ) ) . Como X se mueve de a a b a lo largo de su eje, estas alturas F ( X ) están barriendo una región, y a b F ( X ) d X cuenta cuánta área está acumulando en esa región mientras X se mueve de a a b . Tenga en cuenta que las unidades tienen sentido aquí: si X y F ( X ) se miden en metros metro , entonces las unidades de d X debe ser metro , por lo que las unidades de F ( X ) d X debe ser metro 2 . Tomando la integral solo estás sumando un montón de cosas con unidades metro 2 por lo que la propia integral tendrá unidades metro 2 , lo que significa que es un área.

  • Distancia de acumulación de velocidad a lo largo del tiempo : si su función v ( t ) modela la velocidad de algún objeto en el tiempo t , entonces a b v ( t ) d t cuenta la distancia que el objeto ha acumulado como t barre desde t = a a t = b . Nótese de nuevo que las unidades tienen sentido: las unidades de v ( t ) son metro / s mi C y las unidades a tiempo t son s mi C , por lo que las unidades en a b v ( t ) d t debe ser metro .

  • Acumulación de carga con el tiempo integrando la corriente ( respuesta de David )

  • Áreas transversales que barren una región a lo largo de un eje : supongamos que tiene una región R que vive a lo largo de algún eje en el espacio z , y supongamos la función A ( z ) devuelve el área de una sección transversal (rebanada) de R a ese valor particular de z . Como z barre a lo largo del eje desde a a b , a b A ( z ) d z cuenta cuánto volumen acumulamos dentro R . Así que si A ( z ) es precisa a lo largo de todo z -eje, A ( z ) d z es el volumen de R . Midiendo todo en metros, tenga en cuenta las unidades de A ( z ) d z son ( metro 2 ) ( metro ) = metro 3 , las unidades de un volumen.

  • Acumulación de masa mediante la integración de la densidad : suponga que tiene una región R en el espacio tridimensional y quiere pensar en esa región como si tuviera una masa con una función d que devuelve la densidad de masa en la región en ese punto. Entonces la integral R d d R cuenta cuánta masa total tiene la región.

Tenga en cuenta que no hay ninguna mención de cálculo aquí en absoluto. Todos estos ejemplos explican sólo lo que la notación a b F ( X ) d X significa, pero no cómo calcular a b F ( X ) d X . El cálculo de los valores de estas integrales implica la antiderivada de F , y esa es la verdadera magia que obtienes del teorema fundamental del cálculo.

en probabilidad

La integración en probabilidad a menudo se interpreta como "el valor esperado ". Para desarrollar nuestra intuición del por qué, comencemos con las sumas.

Comenzando pequeño

Pongamos que juegas a un juego de dados en el que ganas 2€ si sacas un 6 y pierdes 1€ si sacas cualquier otro número. Luego queremos calcular lo que debe esperar recibir "en promedio". Ahora, la mayoría de las personas encuentran que la práctica de multiplicar el pago por su probabilidad y sumarlas es relativamente sencilla. En este caso obtienes

Pago esperado = 1 6 2 + 5 6 ( 1 ) = 0.5

Ahora intentemos formalizar esto y pensemos en lo que está sucediendo aquí. Tenemos un conjunto de resultados posibles. Ω = { 1 , 2 , 3 , 4 , 5 , 6 } donde cada resultado es igualmente probable. Y tenemos un mapeo Y : Ω R que denota el pago. Es decir

Y ( ω ) = { 2 ω = 6 , 1 demás
Y entonces el pago esperado es
mi [ Y ] = 1 | Ω | ω Ω Y ( ω ) = 1 6 ( 2 + ( 1 ) + . . . + ( 1 ) ) = 0.5
dónde | Ω | es el número de elementos contenidos en Ω .

Introducción al infinito

Ahora esto funciona bien para finito Ω , pero ¿y si el conjunto de resultados posibles es infinito? ¿Qué pasaría si cada número real en [ 0 , 1 ] era posible, igualmente probable, y el resultado sería así?

Y : { [ 0 , 1 ] R ω { 2 ω > 5 6 1 ω 5 6

Intuitivamente, este pago debería tener el mismo pago esperado que el anterior. Pero si simplemente tratamos de hacer lo mismo que antes...

mi [ Y ] = 1 | Ω | ω Ω Y ( ω ) = 1 ( ) . . .

Bien, entonces tenemos que ser un poco más inteligentes con esto. Si echamos un vistazo a un gráfico de su pago Y ,

Gráfico de pagos

podríamos notar que el área bajo la curva es exactamente lo que queremos.

1 ( 5 6 0 6 ) + 2 ( 6 6 5 6 ) = 0.5

Ahora, ¿por qué esto es lo mismo? ¿Cómo se relacionan nuestras sumas con un área bajo una curva?

sumando a uno

Para entender esto, puede ser útil considerar cuál es el valor esperado de una función más simple.

1 : { Ω R ω 1

En nuestro primer ejemplo esto fue

1 | Ω | ω Ω 1 ( ω ) = | Ω | | Ω |

En nuestro segundo ejemplo esto sería

Ω 1 d ω = 0 1 1 d ω

Ahora bien, si recordamos cómo se calcula la integral (área bajo la curva), podríamos notar que en el caso de funciones indicadoras, estamos ponderando la altura de la función indicadora con el tamaño del intervalo. Y el tamaño del intervalo es su longitud.

Del mismo modo podríamos mover 1 | Ω | en la suma y verlo como la ponderación de cada ω . Y aquí es donde tenemos la diferencia crucial:

En el primer caso individual ω tienen un peso (una probabilidad), mientras que los puntos individuales en un intervalo no tienen longitud/peso/probabilidad. Pero mientras que los conjuntos de puntos individuales no tienen longitud, una unión infinita de puntos sin longitud/probabilidad puede tener longitud/probabilidad positiva.

Esta es la razón por la que la probabilidad está estrechamente relacionada con la teoría de la medida , donde una medida es una función que asigna a conjuntos (p. ej., intervalos) un peso (p. ej., longitud o probabilidad).

hacerlo correctamente

Entonces, si reiniciamos nuestro intento de definir el valor esperado, comenzamos con un espacio de probabilidad Ω y una medida de probabilidad PAG que asigna subconjuntos de Ω una probabilidad Una variable aleatoria de valor real (por ejemplo, pago) Y es una función de Ω a R . Y si sólo toma un número finito de valores en R (es decir Y ( Ω ) R es finito), entonces podemos calcular el valor esperado repasando estos valores, ponderándolos por la probabilidad de sus preimágenes y sumándolos.

mi [ Y ] = y Y ( Ω ) y PAG [ Y 1 ( { y } ) ]
Para hacer la notación más legible podemos definir
PAG [ Y A ] := PAG [ Y 1 ( A ) ] y PAG [ Y = y ] := PAG [ Y { y } ]

En nuestro ejemplo finito, el valor esperado es

mi [ Y ] = 2 PAG ( Y = 2 ) + ( 1 ) PAG ( Y = 1 ) = 2 PAG ( Y 1 [ { 2 } ] ) + ( 1 ) PAG ( { 1 , 2 , 3 , 4 , 5 } ) = 2 1 6 1 5 6 = 0.5
En nuestro ejemplo infinito, el valor esperado es
mi [ Y ] = 2 PAG ( Y = 2 ) + ( 1 ) PAG ( Y = 1 ) = 2 PAG ( ( 5 6 , 1 ] ) PAG ( [ 0 , 5 6 ] ) = 0 1 Y d ω = 2 1 6 5 6 = 0.5
Ahora resulta que puedes aproximar cada Y con imagen infinita Y ( Ω ) con una secuencia de mapeos Y norte con imagen finita. Y que el limite
Ω Y d PAG := límite norte Ω Y norte d PAG := y Y norte ( Ω ) y PAG ( Y = y )
también está bien definida e independiente de la secuencia Y norte .

Integral de Lebesgue

La integral que definimos arriba se llama Integral de Lebesgue . Lo bueno de esto es que

  1. La integración de Riemann es un caso especial de ello, si integramos sobre la Medida de Lebesgue λ que asigna intervalos [ a , b ] su longitud λ ( [ a , b ] ) = b a .
    [ a , b ] F d λ = a b F ( X ) d X
  2. Las sumas y series también son un caso especial usando secuencias. ( a ( norte ) , norte norte ) y una "medida de conteo" m en norte que asigna un conjunto A su tamaño m ( A ) = | A | . Entonces

Ω a d m = norte norte a ( norte )

Las implicaciones son, por supuesto, para uno, que a menudo se puede tratar la integración y la suma de manera intercambiable. Demostrar enunciados para integrales de Lebesgue rara vez es más difícil que demostrarlos para integrales de Riemann y, en el primer caso, todos los resultados también se aplican a series y sumas.

También significa que podemos tratar adecuadamente con "casos mixtos" en los que algunos puntos individuales tienen probabilidad positiva y algunos puntos tienen probabilidad cero por sí mismos, pero conjuntos de ellos tienen probabilidad positiva.

A mi profesor de estocástica le gusta llamar a la integración simplemente "suma infinita" porque, en cierto sentido, solo está sumando una cantidad infinita de elementos de una "manera adecuada".

La integral de Lebesgue también hace integrables ciertas funciones reales que no son integrables con la integración de Riemann. La función 1 q no es integrable en Riemann, pero no plantea ningún problema para la integración de Lebesgue. La razón es que la integración de Riemann subdivide el X -eje y y -eje en intervalos sin consultar la función que se supone que debe integrarse, mientras que la integración de Lebesgue solo subdivide la función y -axis y utiliza la información previa a la imagen sobre la función que se supone que se integrará.

Volver a la intuición

Ahora, es posible que el resultado final ya no se parezca a nuestra intuición sobre los "valores esperados". Obtenemos algo de eso con teoremas como la ley de los grandes números que prueba que los promedios

1 norte k = 1 norte X k

de variables aleatorias independientes e idénticamente distribuidas convergen (en varios sentidos) al valor esperado teóricamente definido mi [ X ] .

Una nota sobre las variables aleatorias

En nuestros ejemplos anteriores, solo el pago Y era una variable aleatoria (una función del espacio de probabilidad Ω a R ). Pero como podemos componer funciones encadenándolas, nada nos habría impedido definir las posibles caras del dado como una variable aleatoria de algún espacio de probabilidad desconocido. Ω . Dado que nuestro pago es solo una función de las caras del dado, su composición también sería una función de Ω . Y muchas veces conviene no definir Ω y comenzar con variables aleatorias de inmediato, ya que permite extensiones fáciles de nuestros modelos sin tener que redefinir nuestro espacio de probabilidad. Porque tratamos el espacio de probabilidad subyacente como desconocido de todos modos y solo trabajamos con ventanas conocidas (variables aleatorias) en él. Observe cómo no pudo discernir las caras de los dados { 1 , . . . , 5 } de pago Y = 1 solo. Entonces, las variables aleatorias también se pueden ver como filtros de información.

Mentiras

Si bien nos gustaría que nuestras medidas asignaran cada subconjunto de Ω un número, esto generalmente no es posible sin sacrificar su utilidad.

Si quisiéramos una medida sobre R que cumple las siguientes propiedades

  1. invariancia de traducción (mover un conjunto no cambia su tamaño)
  2. sumabilidad contable de conjuntos disjuntos
  3. positivo
  4. finito en todo conjunto acotado

solo nos queda el 0 medida (asignando a cada medida establecida 0).

Proofsketch: use el axioma de elección para seleccionar un representante de cada clase de equivalencia de la relación de equivalencia X y q En el set [ 0 , 1 ] . Este conjunto de representantes no es medible, porque las traslaciones por números racionales módulo 1 lo transforman en otros conjuntos de representación distintos de la relación de equivalencia. Y dado que son disjuntos y contables, podemos sumarlos y obtener la medida de todo el intervalo. [ 0 , 1 ] . Pero una suma infinita de conjuntos de igual tamaño no puede ser finita si no son todos 0 . Por lo tanto el conjunto [ 0 , 1 ] debe tener medida 0 y por traslación y suma todos los demás conjuntos en R

Por esta razón, tenemos que restringirnos a un conjunto de "conjuntos medibles" (un álgebra sigma) que es solo un subconjunto del conjunto potencia PAG ( Ω ) de Ω . Este enigma también limita las funciones que podemos integrar con la integración de Lebesgue al conjunto de "funciones medibles".

Pero todas estas cosas son tecnicismos que distraen la intuición.

Una respuesta más breve sería más útil.
@MikePierce Estoy de acuerdo, se me fue un poco de las manos. ¿Alguna idea de dónde cortar?
Esta es realmente una publicación increíble, aunque tarde.
¡Buen punto de vista!

La integral es básicamente el cambio total encontrado a partir de la tasa de cambio.

La forma en que me gusta verlo es cuando miro un paquete de papeles de impresión, digamos 500 papeles uno encima del otro, me recuerda el volumen del paquete encontrado por el método de corte, es decir, la integral del área es el volumen.

Está relacionado con el área bajo la curva donde la curva es positiva.

Por ejemplo, si tiene la tasa de flujo de dinero, puede integrar para encontrar el flujo de dinero total.

Si tiene una fórmula para la velocidad, puede integrarla para encontrar la distancia total recorrida o la longitud del arco.

Suponga que tiene algún proceso que, con el tiempo, suma (o resta) a una cantidad física. Por ejemplo, un objeto en movimiento tiene velocidad y, con el tiempo, esa velocidad da como resultado un cambio de posición. O, si aplicas una fuerza [variable] a un objeto a lo largo de una distancia, con el tiempo ejerces más y más trabajo para mover el objeto.

En casos simples, se puede calcular la cantidad total de [cantidad] multiplicando: si la velocidad es constante, entonces d = r t . Si la fuerza es constante, entonces W = F d . Pero, ¿y si el proceso no procede a un ritmo constante? Ese es uno de los problemas que aborda la integración. Entonces, si su fuerza cambia con el tiempo, puede imaginarse aproximando la fuerza en un pequeño intervalo de tiempo por una constante (ya que presumiblemente en un pequeño intervalo, la fuerza no cambia mucho). Haz eso en todo el rango de veces que te interese; sobre cada uno de esos intervalos es fácil aproximar el trabajo, ya que la fuerza es aproximadamente constante. Entonces, el trabajo total es aproximadamente la suma de cada una de esas piezas fáciles de calcular. Ahora deja que los pequeños intervalos se hagan cada vez más pequeños. Al menos si la función de fuerza es razonable, la suma de esos trabajos se acerca cada vez más al trabajo total realizado. Que el trabajo total es la integral de la fuerza en el tiempo,

Solo se entiende como información ***

Quería dejar aquí este enlace para que no se pierda entre los comentarios:

Sumas de Riemann

Comprender las sumas de Riemann y lo que sucede con las sumas de Riemann cuando evalúa el límite cuando delta x tiende hacia 0 es una excelente manera de desarrollar una comprensión más intuitiva de la integración.

Para la intuición desde el punto de vista de la física, probablemente no sugeriría pensar en las integrales como áreas a menos que el problema sea realmente sobre el área. Una interpretación intuitiva obvia de la integración es la diferenciación inversa. Suponga que conoce la velocidad de un automóvil durante un período de tiempo, ¿cómo sabe dónde está ahora? Integre sus datos. ¿Qué pasa con esa molesta constante que obtienes cuando te integras? Bueno, eso corresponde a la necesidad de saber dónde estaba el auto en el momento 0.

Para un ejemplo real, mire los sistemas de guía inercial pre-GPS. Miden la aceleración y realizan una integración doble para calcular la posición. Sistema de navegación inercial

Mida la tasa de energía que ingresa a un sistema, por ejemplo, el voltaje y la corriente de un suministro eléctrico, ¿cómo sabe la energía total? Integrar el poder.

Hay muchas fórmulas de física básica y otras áreas que multiplican dos cosas para obtener una tercera. Como Área = largo x ancho. Fuerza = masa x aceleración. Distancia = velocidad x tiempo. Estas fórmulas son fáciles de aplicar si los dos factores son constantes. Tenga en cuenta que puede representar cualquiera de ellos como el área de un rectángulo.

Pero, ¿qué haces si uno de los factores comienza a variar? Tienes un rectángulo, pero con un lado todo ondulado. Si el rectángulo representa masa x aceleración y la aceleración sigue cambiando, entonces el área bajo la curva ondulada sigue siendo la fuerza.

La integración corta el "rectángulo" ondulado en pequeños rectángulos reales, calcula la aceleración de masa x para cada uno y luego los suma para obtener la fuerza total. Integración significa "totalización".

Las integrales representan el área bajo una curva como ya sabes, pero el área significa muchas cosas. Representa principalmente un área (obviamente) pero también la suma de un cambio (definido por una derivada). Por eso, encontrar una integral de una función f(x) es igual a encontrar una derivada que te dé f(x).